1、MDS3400/FH98-G调度系统故障告警处理、案例分析 客服中心 苟斌 2012年6月系统告警及处理系统告警及处理 MDS3400/FH98-G调度指挥系统网管终端告警按照告警类别分为4种,分别是:设备告警、通信告警、维护告警和电源告警。系统告警及处理系统告警及处理一、设备告警一、设备告警 告警描述:某块电路板出现硬件故障时在该槽位上报硬件故障的告警。 告警原因:某电路板出现硬件故障。 解决办法:更换该硬件单板。系统告警及处理系统告警及处理 单板拔出或掉电单板拔出或掉电 告警描述:某块电路板拔出时或掉电时在该槽位上报该告警。 告警原因:某电路板被拔出或者掉电。 解决办法: (1)重新插牢该
2、单板; (2)更换单板。系统告警及处理系统告警及处理 主备切换失败主备切换失败 告警描述:作为主备双机运行的主控板或其它单板无法进行切换时上报该告警。 告警原因:可能的原因为: (1)备用板故障; (2)主用板故障; (3)背板的主备用跳线设置问题; (4)作为主备的两单板的程序不一致; (5)背板故障。系统告警及处理系统告警及处理 主备切换失败主备切换失败 解决办法: (1)告警源若不是主控板,检查背板的主备用跳线; (2)检查两单板程序是否一致; (3)若以上没有问题,更换备用板。 (4)更换主用板。系统告警及处理系统告警及处理 单板类型不匹配单板类型不匹配 告警描述:某槽位实际所插的单板
3、和数据配置中该槽位配置的单板类型不一致时上报该告警。 告警原因:某槽位插入的单板与配置的数据不一致。 解决办法: (1)检查该槽位所插单板与配置数据是否一致 (2)注意铃流板只能插在15、16槽位。系统告警及处理系统告警及处理 子板类型不匹配子板类型不匹配 告警描述:接口板上实际所插的小插板与数据配置中的小插板类型不一致时在该槽位上报该告警。 告警原因:接口板上插的小插板与数据配置的小插板类型不一致。如:实际插的是环路小插板,而数据中配置的为四线音频小插板。 解决办法:(1)检查该槽位的接口板上所插的小插板类型与配置数据是否一致;(检查办法:可以在网管中“设备配置”“槽位配置”中选中该接口板右
4、键单击选择“子板信息”来查询实际所插的小插板类型,看是否与数据配置的一致)系统告警及处理系统告警及处理 板卡单双机配置冲突板卡单双机配置冲突 告警描述:相邻的奇偶槽位在网管上配置的单双机配置与实际跳线不符时会出现该告警。 告警原因: (1)相邻的奇偶槽位在背板上跳了主备用跳线,但网管上的数据配置成单机; (2)相邻的奇偶槽位在背板上未跳主备用跳线,但网管上的数据配置成双机。 解决办法: 检查背板上的主备用跳线是否与网管上配置的单双机一致。系统告警及处理系统告警及处理 铃流故障铃流故障 告警描述:铃流板出现故障时,影响该插箱的模拟用户或磁石用户的振铃。 告警原因:可能的原因为: (1)铃流板故障
5、。 (2)铃流板未插牢。 解决办法: (1)检查铃流板是否在位。 (2)如果不行,更换铃流板。系统告警及处理系统告警及处理 参考时钟故障参考时钟故障 告警描述:当本系统配置为跟踪外系统时钟,但没有跟踪上的时候会在中继板或数字环板上报该告警。 告警原因:可能的原因为: (1)外时钟丢失; (2)与外时钟系统相连的2M故障; (3)接外时钟的中继板或数字环板故障; (4)主控板的时钟模块故障。 解决办法: (1)检查2M电缆等传输问题; (2)检查接外时钟的中继板或数字环板; (3)若仍不行,切换MPU或更换MPU。系统告警及处理系统告警及处理 网管连接网元失败网管连接网元失败 告警描述:当网管与
6、某设备之间连接不上时会上报该告警。 告警原因: (1)网管本身的IP地址与直连的设备的主控板不在同一个网段; (2)在网管上创建设备时设置的7、8槽位主控IP地址与实际主控板的IP地址不一致; (3)在网管上创建设备时设置的设备类型与实际的设备类型不一致; (4)通过网管通道连接的设备,出现网管通道数据设置不正确,或E1线路中断,或车站DLL拨码开关设置不正确等情况。系统告警及处理系统告警及处理 网管连接网元失败网管连接网元失败 解决办法:在网管主机上通过PING命令,PING 设备主控的IP地址,若能PING通,查看设备类型设置。 若PING不通,考虑以下情况: (1) 查看E1线路是否正常
7、; (2) 查看网管IP是否配置正确; (3) 查看网管的默认网关是否设置为MPU板的浮动IP; (4) 查看MPU的IP地址和浮动IP是否设置; (5) 检查网管通道配置的是否正确; (6) 如果涉及到车站的网管通道配置,则检查拓扑图是否发送,车站号是否设置正确。系统告警及处理系统告警及处理 二、通信告警二、通信告警 主控与插箱间主控与插箱间ICCP通信中断通信中断 告警描述:当主控板与扩展插箱间通信中断时会上报该告警。 告警原因:可能的原因为: (1)扩展板或驱动板故障。 (2)扩展电缆故障。 (3)背板故障。 解决办法: (1)检查扩展层是否掉电。 (2)没掉电考虑更换扩展板或驱动板。
8、(3)如果不行,更换扩展电缆。系统告警及处理 主控与插箱间主控与插箱间ICCP通信中断通信中断 (4)如果不行,更换扩展板槽位,验证控制层对应槽位是否有问题。 (5)更换控制层背板,或扩展层背板。系统告警及处理系统告警及处理 主控与单板间主控与单板间ICCP通信中断通信中断 告警描述:当主控板与各单板通信不上时会上报该告警,此时单板上的com灯不亮。 告警原因:可能的原因为: (1)单板故障或拔出。 (2)主控板或驱动板故障。 (3)背板故障。 解决办法: (1)更换单板。 (2)如果不行,考虑先切换主控板或驱动板,然后更换主控板或驱动板。系统告警及处理系统告警及处理 主备通信链路中断主备通信
9、链路中断 告警描述:主用主控板和备用主控板通信链路中断时会上报该告警。主控板上有两条主备通信链路1和2,当两条都出现故障时,通信链路就会中断,此时会上报该告警。 告警原因:可能的原因为: (1)备用板故障或拔出。(2)主用板故障。 (3)背板故障。 解决办法:(1)对备用单板进行拔插操作,尝试复位备用单板,待备用单板正常启动,尝试主备倒换。 (2)如果不行,更换备用板。(3)如果不行,更换主用板。系统告警及处理 通信链路故障通信链路故障 告警描述:主用主控板和备用主控板通信链路故障时在对应的主控板上会上报该告警。主控板上有两条主备通信链路1和2,有一条通信链路出现故障即会上报该告警,如7:1、
10、7:2,代表7槽位第一条或第二条通信链路出现故障。 告警原因:可能的原因为: (1)备用板故障或拔出。(2)主用板故障。(3)背板故障。 解决办法:(1)对备用单板进行拔插操作,尝试复位备用单板,待备用单板正常启动,尝试主备倒换。 (2)如果不行,更换备用板。 (3)如果不行,更换主用板。系统告警及处理系统告警及处理 E1接口接口LOS 告警描述:当本端E1接收不到信号时会在对应的该单板上报该告警。 告警原因:可能的原因为: (1)M线缆故障。(2)传输故障。(3)两端没共地,时钟不同步。(4)可能接触不良。(5)对端设备故障。 解决办法:(1)对本端进行自环,检测物理连接,检查本端的收和对端
11、的发。 (2)检查E1接口线缆。(3)如果不行,更换电缆。 (4)检查传输设备是否告警。(5)检查对端设备是否故障。系统告警及处理 E1接口远端告警接口远端告警 告警描述:当本端E1的发故障或对端收不到信号时,会在本端对应的单板上报该告警。 告警原因:可能的原因为: (1)M线缆故障。(2)传输故障。(3)两端没共地,时钟不同步。(4)可能接触不良。(5)对端设备故障。 解决办法:(1)对本端进行自环,检测物理连接,检查本端的发和对端的收。 (2)检查E1接口线缆,可用万用表测量故障点。 (3)如果不行,更换电缆。(4)检查传输设备是否告警。(5)检查对端设备是否故障。系统告警及处理系统告警及
12、处理 DSS1二层链路中断告警二层链路中断告警 告警描述:当通过DSS1信令与对端局互通时,链路未建立成功时上报该告警。 告警原因:可能的原因为: (1)数据配置错误,两端都配置成网络侧或都配置为用户侧。 (2)物理通道正常,但链路没建上。 解决办法:(1)检查两端的数据配置,一端设为网络侧,另一端需设为用户侧。 (2)一般都是16TS为信令时隙,但有些设备可以修改信令时隙,查看两侧是否都用同一时隙作为信令时隙。系统告警及处理系统告警及处理 数字环邻站与拓扑图不符数字环邻站与拓扑图不符 告警描述:当数字环上检查到的邻站与拓扑图配置的不相符时,会上报该告警。 告警原因:可能的原因为: 邻站掉电、
13、或关电或DLL板故障。 解决办法: (1)检查网管数字环拓扑图数据和实际连接顺序一致。 (2)确认邻站是否出现掉电或DLL拔出等故障。系统告警及处理系统告警及处理 主站检测不到从站主站检测不到从站 告警描述:当数字环上主系统检测不到某个分系统时,会在主系统上报该告警,表明检测不到哪个分系统。 告警原因:可能的原因为: (1)数字环拓扑图设置和拨码开关的车站号不符。 (2)从站掉电、或关电或DLL故障。 (3)车站上下行M故障。 解决办法: (1)检查网管数字环拓扑图设置的顺序和车站的拨码开关是否一致。 (2)检查M线缆。 (3)更换从站DLL板。 (4)确认是否掉电。系统告警及处理 调度台连接
14、中断调度台连接中断 告警描述:当调度台与后台DSL板/U口板未连接成功时,在对应的单板上报该告警。 告警原因:可能的原因为: (1)与调度台连接的2B+D线缆故障或2M线缆故障。(2)调度台故障。(3)连接调度台的板子(DSL、DTL)故障。(4)后台供电功率不足。 解决办法: (1)检查2B+D线连接,更换2B+D线。 (2)更换调度台。(3)更换连接调度台的板子(DSL、DTL)。 (4)对于键控台,直接外接-48V直流电。对于一体化调度台和KDT调度台,采用220V供电。系统告警及处理系统告警及处理 DSP初始化失败初始化失败 告警描述:当DSP插板未插入或故障时会报该告警。对会议或收发
15、号会产生影响。 告警原因:可能的原因为: (1)DSP小插板未插。 (2)DSP小插板故障。 (3)实际所插DSP小插板与数据配置的类型不一致。 解决办法: (1)检查DSP插板是否在位。 (2)更换DSP小插板。系统告警及处理三、维护告警三、维护告警 单板软件升级失败 告警描述:通过网管给单板升级时,升级不成功会上报该提示。 告警原因:可能的原因为: (1)软件本身问题。 (2)单板故障。 解决办法: (1)更换单板 (2)有条件更换其它软件程序。系统告警及处理系统告警及处理 主备主备MPU数据不同步数据不同步 告警描述:当检测到主备MPU板数据不一致时会在主控板上报该告警。 告警原因:可能
16、的原因为:主备MPU数据不一致,系统并不是实时检测主备数据是否同步。 解决办法:通过网管下载数据来保证主备主控的数据一致。系统告警及处理系统告警及处理 四、电源故障四、电源故障 目前支持艾默生4805、4815型号的电源的管理。当电源出现直流过压、直流欠压、交流停电、交流过压、交流欠压、电源通信故障等情况时,网管上会上报该告警。故障维护案例分析故障维护案例分析 处理故障流程处理故障流程 一、了解故障现象 故障现象反映最直接的应是调度员、值班员或终端用户,他们最了解情况,所以接到故障电话时,应仔细询问现场使用情况。 二、分析故障与处理方法 根据掌握的故障现象分析出故障点在前台还是在后台、是软件(
17、数据)有错误还是硬件(板件)损坏,这样才能有的放矢。根据故障点决定处理方法。 模拟用户板的故障处理模拟用户板的故障处理 例:某一站场用户反映电话不能使用了。 (1)了解故障现象 询问此用户话机是否有馈电。 如果有馈电,能够听到什么声音。 (2)分析故障与处理方法 如果话机没有馈电,则说明是模拟用户板此路有问题,也可能外线连接或话机本身有问题。如果有馈电,则说明此用户板、外线连接没有问题;能听到忙音或没有声音,则是用户数据问题,或是主控板的音源问题。 DSL板(U口板)的故障处理 例:某车站值班员反映KDT值班台不能用了。 (1)了解故障现象 询问值班员前台是否有馈电;如果有电前台通信灯闪烁是否
18、正常;如果正常按某一单呼按键是否有回铃音。 (2)分析故障与处理方法 如果有馈电则说明后台供电没有问题;如果没有则说明后台供电有问题或接线盒有问题,或者前台与接线盒插头有问题。 如果前台通信灯闪烁正常,则说明前台与后台通信正常,不是硬件或硬件连接问题;如果通信灯闪烁不正常(通信灯灭或闪烁速度较快),则说明是2B+D线(前台与后台的通信线路)有问题或数据有问题。 DSL板(板(U口板)的故障处理口板)的故障处理 如果前两条都正常,则按某一单呼按键试验,如果有回铃音但不能呼叫出用户,则说明数据正常,很有可能是外线或对端用户的问题,做相应处理;如果无回铃音或按键按下去绿灯很快就灭了,则是数据问题,应
19、检查数据是否正确。 车站调度台无法呼出车站调度台无法呼出 故障描述: 某车站值班台呼叫其它用户,呼叫不通。 解决方法: (1)车站值班台可以呼叫本地用户 交换机或值班台数据配置错误,需要重新检查并修改数据。 (2)车站值班台所有用户都无法呼出 前台电源指示灯不亮,则电源有问题,需要重新加电或更换设备。接线不良,需要重新接线。该车站有值班台通信告警,则调度台通信有问题,需要作如下操作: (1)网管发命令,重启该单板。(2)本地重新上电。 (3)检查前后台接线。硬件故障,建议更换硬件。 磁石插板的故障处理磁石插板的故障处理 由于此板接口特性为收发铃流,只要收发端能测出铃流,即可正常通信,否则应为数
20、据问题或者硬件问题带磁石插板更换即可。 分系统脱管,电话可以打通分系统脱管,电话可以打通 故障描述: MDS3400设备中,某一分系统脱管,网管无法对其进行配置和管理,但可以呼叫到该分系统中的用户。 解决方法: 用ping该分系统浮动IP,看是否可以ping通,及有无丢包,如能PING通,说明交换机底层连接没有问题,而是网管连接上的问题,此时重启网管服务。 若不能ping通,则交换机底层连接有问题,可以尝试远程复位分系统。 数字环上站间呼叫时通时不通数字环上站间呼叫时通时不通 故障描述: 站间呼叫时有时能呼通,有时呼不通;呼叫调度业务也是时通时不通。 解决方法: 检查数据,除半固定接续、网管通
21、道用到的时隙外,其余时隙是否在中继线配置中都配置上了,并在在中继群中都将这些中继线添加上了(这里说的时隙是主控侧交换网的时隙)。如:网管通道占用了1、2、3、4Ts,半固定接续用到5、6Ts,那么除0、16Ts外,其余时隙应该全部配置为中继线,如果没有配置全,会出现有时呼叫不通的现象。 呼叫某车站听忙音呼叫某车站听忙音 故障描述: 呼叫某车站值班台时,听忙音,而不是回铃音。 解决方法: 有可能是该车站的音源出现问题,如果遇到呼叫某车站时听忙音,或听空号音等不正确的声音,考虑是该车站主控板上的音源有问题。一般系统默认的是远端送回铃音,即被叫侧送的回铃音,如果回铃音不正确,则考虑是被叫侧的主控板音
22、源问题,可以通过切换主控板试验用另一块主控板是否可以。 键控台重启键控台重启 故障描述: DSL板接48/KDT键控台,在用0.5线径电缆接接线盒电源线时,前台距离后台不足300米,在不通话时,台子显示正常,只要一发起呼叫,48键操作台就重起。 解决方法: 测量了一下不发起呼叫时电压为-52V,一发起呼叫就变为-33V,而MDS中给前台供电由DSL板产生输出,这样当外接设备功率大时,DSL板就提供不了所需的功率,这样就导致前台一呼叫就不断重启,因此,解决此问题要么更改设备电路,或者从电源设备直接放一路-48V直流电,解决前台一发起呼叫就重启问题。 FAS与与MSC互通常见案例:互通常见案例:1、FAS用户用车次号拨叫机车,显示用户忙或呼叫没反应。此种现象有可能是机车真的忙或机车台无线信号若或拨叫的号码与机车实际注册的号码不一致所致。重点 检查触摸屏车次位数设置是否对或触摸屏的ISDN号是否设置对。2、FAS用户用ISDN号码呼叫手持台,手持台显示主叫号码不全。可能是网管信令,汇接交换机厂家设置不对 。3、FAS用户用功能号呼叫手持台,手持台显示主叫号码不全。可能是数字环位数设置不对。4、FAS用户只有299紧急呼叫接收的功能,没有发起299的功能。手持台用户发起紧急299组呼,FAS台接收后,若要先释放299的呼入,则输入3个*挂机。 谢谢大家!