1、l传输故障分析方法传输故障分析方法l传输分类故障的处理传输分类故障的处理l掌握掌握OptiX传输设备常用的故障分析方法传输设备常用的故障分析方法l掌握掌握OptiX传输设备典型故障业务中断、误传输设备典型故障业务中断、误码、码、ECC的处理方法的处理方法o 内容内容o 目标目标传输故障分析方法u故障处理对维护人员的要求故障处理对维护人员的要求掌握掌握SDH常用开销字节功能、告警信号流常用开销字节功能、告警信号流(告警告警-帧结构帧结构-逻辑功能块逻辑功能块-单板硬件单板硬件)熟练掌握所维护传输设备的基本操作熟练掌握所维护传输设备的基本操作熟悉所维护局的情况熟悉所维护局的情况(组网拓扑、保护属性
2、、业务分配、命令行配置组网拓扑、保护属性、业务分配、命令行配置)作好现场数据的采集与作好现场数据的采集与u故障定位的确关键故障定位的确关键:将故障点准确地定位到单站将故障点准确地定位到单站由于传输设备站与站之间由于传输设备站与站之间的距离较远,在进行故障的距离较远,在进行故障定位时,首先就应将故障定位时,首先就应将故障点准确地定位到单站。点准确地定位到单站。u故障定位的原则故障定位的原则在定位故障时,要尽可能准确地将故障定位到在定位故障时,要尽可能准确地将故障定位到单站。单站。在定位故障时,应先排除外部的可能因素,如在定位故障时,应先排除外部的可能因素,如光纤断,交换故障或电源问题等。光纤断,
3、交换故障或电源问题等。l先外部,后传输先外部,后传输l先单站,后单板先单站,后单板从告警信号流中可以看出,线路板的故障常常会从告警信号流中可以看出,线路板的故障常常会引起支路板的异常告警,因此在故障定位时,应引起支路板的异常告警,因此在故障定位时,应按按“先线路,后支路先线路,后支路”的顺序,排除故障;的顺序,排除故障;l先线路,后支路先线路,后支路l先高级,后低级先高级,后低级在分析告警时,应首先分析告警级别高的告警,在分析告警时,应首先分析告警级别高的告警,如危急告警、主要告警;然后再分析低级别的告如危急告警、主要告警;然后再分析低级别的告警,如次要告警和一般告警。警,如次要告警和一般告警
4、。u故障定位的常用方法故障定位的常用方法一分析一分析 二环回二环回 三换板三换板一、当故障发生时,首先通过对告警事件、性能事件、一、当故障发生时,首先通过对告警事件、性能事件、业务流向的分析,初步判断故障点范围;业务流向的分析,初步判断故障点范围;二、通过逐段环回,排除外部故障,并最终将故障定位二、通过逐段环回,排除外部故障,并最终将故障定位到单站,乃至单板;到单站,乃至单板;三、通过换板,排除故障问题。三、通过换板,排除故障问题。l通过网管获取告警和性能信息,进行故障定位通过网管获取告警和性能信息,进行故障定位全面性全面性不仅是一个站、一块板的故障信息,而且是全网设备不仅是一个站、一块板的故
5、障信息,而且是全网设备的故障信息;的故障信息;详实性详实性可以知道当前设备存在的告警是什么时间发生的,以可以知道当前设备存在的告警是什么时间发生的,以前曾经发生过什么历史告警。性能不好时,误码、指前曾经发生过什么历史告警。性能不好时,误码、指针调整有多少。针调整有多少。一、通过机柜顶部的告警指示灯查看告警一、通过机柜顶部的告警指示灯查看告警二、通过单板告警指示灯查看告警二、通过单板告警指示灯查看告警设备指示灯仅反映设备当前的运行状态,对于设备曾设备指示灯仅反映设备当前的运行状态,对于设备曾经出过故障,无法表示;经出过故障,无法表示;设备每种告警对应的指示灯闪烁情况,可以通过网管设备每种告警对应
6、的指示灯闪烁情况,可以通过网管软件进行重新定义,甚至于可以将某种告警屏蔽掉。软件进行重新定义,甚至于可以将某种告警屏蔽掉。缺点缺点l通过设备上的指示灯获取告警信息,进行故障定位通过设备上的指示灯获取告警信息,进行故障定位环回法,是环回法,是SDH传输设备定位故障最常用,最行之有效传输设备定位故障最常用,最行之有效的一种方法。的一种方法。支持软件环回的单板操作工具软件环回操作类型环回级别应用线路板网管、尾纤内环回、外环回按VC4通道级别或整个STM-N信号环回将故障定位到单站,且可初步判断线路板是否存在故障支路板网管、自环线远端环回、本地环回按业务通道环回可分离交换机故障还是传输故障,且可初步判
7、断支路板是否存在故障。交叉板网管、命令行线路环回按业务通道环回可定位单站故障中,是线路侧故障还是支路侧故障。1、软件环回是一种不彻底的环回,只能初步定位故障的位、软件环回是一种不彻底的环回,只能初步定位故障的位置。置。2、对远端站点线路板第一个、对远端站点线路板第一个VC4作环回操作时作环回操作时,一定要确一定要确认环回后认环回后ECC通信不会中断,才可进行操作。通信不会中断,才可进行操作。一旦远端站点的一旦远端站点的ECC通信中断,则只能到远端站点现场才通信中断,则只能到远端站点现场才能解开环回,恢复能解开环回,恢复ECC通信。通信。3、“环回法环回法”会导致正常业务的暂时中断,一般只有在出
8、会导致正常业务的暂时中断,一般只有在出现业务中断等重大事故时,才使用环回法进行故障排除。现业务中断等重大事故时,才使用环回法进行故障排除。u采用环回法应注意的问题:采用环回法应注意的问题:4.初步定位单板问题。u“环回法环回法”的步骤:的步骤:1.环回业务通道采样;2.画业务路径图;3.逐段环回,定位故障站点;一、环回业务通道采样:一、环回业务通道采样:1、从多个有故障的站点中选择其中的一个站点;、从多个有故障的站点中选择其中的一个站点;2、从所选择一个站点的多个有问题的业务通道、从所选择一个站点的多个有问题的业务通道中选择其中的一个业务通道。由于自环第一中选择其中的一个业务通道。由于自环第一
9、个个VC4通道,可能会影响通道,可能会影响ECC通信,因此尽通信,因此尽量不要选择第一个量不要选择第一个VC4通道内的业务。通道内的业务。画出所采样业务一个方向的路径图。画出所采样业务一个方向的路径图。在路径图中表示出:该业务的源和宿,该业务所经过的站在路径图中表示出:该业务的源和宿,该业务所经过的站点,该业务所占用的点,该业务所占用的VC4通道和时隙。通道和时隙。二、画业务路径图:二、画业务路径图:例如:例如:依据中断业务的路径图,在依据中断业务的路径图,在1号站第号站第2块支路板的第块支路板的第1个个2M通道外接一个通道外接一个2M误码仪,监测业务好坏。误码仪,监测业务好坏。三、逐段环回,
10、定位故障站点三、逐段环回,定位故障站点“替换法替换法”就是使用一个工作正常的物件去替换一个就是使用一个工作正常的物件去替换一个怀疑工作不正常的物件,从而达到定位故障、排除怀疑工作不正常的物件,从而达到定位故障、排除故障的目的。这里的物件,可以是一段线缆、一个故障的目的。这里的物件,可以是一段线缆、一个设备、一块单板、一块模块或一个芯片。设备、一块单板、一块模块或一个芯片。“替换法替换法”适用于排除传输外部设备的问题,如光适用于排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等;或故障定位纤、中继电缆、交换机、供电设备等;或故障定位到单站后,用于排除单站内单板或模块的问题。到单站后,用
11、于排除单站内单板或模块的问题。该方法适用于没有备板的情况下,初步定位故障该方法适用于没有备板的情况下,初步定位故障类型,并暂时排除故障,恢复业务。类型,并暂时排除故障,恢复业务。“更改配置法更改配置法”所更改的配置内容包括:所更改的配置内容包括:时隙配置、板位配置等。时隙配置、板位配置等。查询、分析设备当前的配置数据,例如:查询、分析设备当前的配置数据,例如:分析以上的配置数据是否正常,来定位故障。分析以上的配置数据是否正常,来定位故障。时隙配置时隙配置复用段的节点参数复用段的节点参数线路板和支路板通道的环回设置线路板和支路板通道的环回设置支路通道保护属性支路通道保护属性如:如:用误码仪测试业
12、务通断、误码用误码仪测试业务通断、误码 用万用表测试供电电压,检查电压过高或过低问题用万用表测试供电电压,检查电压过高或过低问题“仪表测试法仪表测试法”指采用各种仪表(如误码仪、万指采用各种仪表(如误码仪、万用表光功率计、用表光功率计、SDH分析仪等)检查传输故障。分析仪等)检查传输故障。“仪表测试法仪表测试法”分析定位故障,说服力比较强。但分析定位故障,说服力比较强。但需要采用仪表。需要采用仪表。在一些特殊的情况下通过复位单板、单站在一些特殊的情况下通过复位单板、单站掉电重启、重新下发配置等手段可有效及掉电重启、重新下发配置等手段可有效及时的排除故障、恢复业务。时的排除故障、恢复业务。但建议
13、该处理故障的办法尽量少用,因为该但建议该处理故障的办法尽量少用,因为该方法不利于故障原因的彻底查清。遇到这种方法不利于故障原因的彻底查清。遇到这种情况,除非情况紧急,一般还是应尽量使用情况,除非情况紧急,一般还是应尽量使用上面介绍的方法,或请求支援尽可能地将故上面介绍的方法,或请求支援尽可能地将故障定位出来,以消除设备内外隐患。障定位出来,以消除设备内外隐患。1. 排除传输外部设备故障:排除传输外部设备故障:=分离传输问题还是交换机问题分离传输问题还是交换机问题=光纤故障的排除光纤故障的排除=中继线缆故障的排除中继线缆故障的排除=供电电源故障的排除供电电源故障的排除=接地问题的排除接地问题的排
14、除2.故障定位到单站故障定位到单站=将故障定位到单站,最将故障定位到单站,最常用的方法就是常用的方法就是“环回环回法法”。=另外,告警性能分析法,另外,告警性能分析法,也是将故障定位到站点也是将故障定位到站点比较常用的方法。比较常用的方法。3.故障定位到单板并最终故障定位到单板并最终排除排除=故障定位到单站后,故障定位到单站后,进一步定位故障位置进一步定位故障位置最常用的方法就是替最常用的方法就是替换法。换法。故障定位过程常用方法其它方法1.排除外部设备故障替换法、测试法、环回法告警性能分析法2.故障定位到单站环回法告警性能分析法3.故障定位到单板并最终排除替换法告警性能分析法、环回法、更改配
15、置法、配置数据检查法、经验处理法分类故障的处理单板失效或性能不好单板失效或性能不好u常见原因常见原因l外部原因外部原因供电电源故障,如设备掉电、供电电压过低等供电电源故障,如设备掉电、供电电压过低等交换机故障交换机故障光纤、电缆故障。如光纤性能劣化、损耗过高,或光纤、电缆故障。如光纤性能劣化、损耗过高,或光纤损断;中继电缆脱落、损断或接触不良等光纤损断;中继电缆脱落、损断或接触不良等l人为原因人为原因误操作设置了光路或支路通道的环回误操作设置了光路或支路通道的环回误操作更改、删除配置数据误操作更改、删除配置数据l设备本身故障设备本身故障l告警分析法告警分析法l逐段环回法逐段环回法l互换、替换法
16、互换、替换法u常用方法常用方法l检查各站登录是否正常,各站光路上是检查各站登录是否正常,各站光路上是否有危急告警。否有危急告警。l检查业务中断站点支路板上业务通道。检查业务中断站点支路板上业务通道。l逐段环回逐段环回u处理步骤处理步骤(对于网管维护人员对于网管维护人员)u无保护链型组网无保护链型组网图图5-1为四个站组成的一条无保护链,为四个站组成的一条无保护链,1站为网管中心站,集中型业站为网管中心站,集中型业务,即每个站均与务,即每个站均与1站有站有2M业务。业务。4站支路板有站支路板有TU-AIS告警,告警,1站支路板对应通道有站支路板对应通道有LP-RDI告警,告警,1站和站和4站的站
17、的2M业务中断。业务中断。l组网配置组网配置l故障现象故障现象u处理步骤处理步骤1.在在1号站挂一号站挂一2M误码表,监测误码表,监测1号站与号站与4号站的号站的2M业务。业务。2.通过网管对通过网管对4号站的支路板作软件内环回。若仪表显示号站的支路板作软件内环回。若仪表显示业务正常,则说明是业务正常,则说明是4号站有问题,进入第三步。若仪表显号站有问题,进入第三步。若仪表显示业务中断,则说明传输设备有问题,进入第四步。示业务中断,则说明传输设备有问题,进入第四步。3.在在4号站的号站的DDF配线架上,再作一个对传输设备的硬件配线架上,再作一个对传输设备的硬件内环回,若此时仪表仍显示业务正常,
18、则说明传输设备没有内环回,若此时仪表仍显示业务正常,则说明传输设备没有问题。需排除交换机或中继电缆的问题。问题。需排除交换机或中继电缆的问题。4.分别对分别对1号站西向线路板、号站西向线路板、2号站东向线路板、号站东向线路板、3号站东号站东向线路板作内环回。向线路板作内环回。5.若环回若环回2号站东向线路板业务正常,环回号站东向线路板业务正常,环回3站西向线路板站西向线路板业务不通,则可能业务不通,则可能3站有故障或站有故障或2站的东向线路板有故障。站的东向线路板有故障。 6.到达到达2号站,通过尾纤将东向线路板环回,若此时号站,通过尾纤将东向线路板环回,若此时1站挂站挂表测试的业务正常,则说
19、明表测试的业务正常,则说明2站东向线路板没有问题,故障点站东向线路板没有问题,故障点在在3站或光缆有问题站或光缆有问题,直接转第直接转第7步。步。若环回后业务不通,则说明该板有故障。通过更换该板,若环回后业务不通,则说明该板有故障。通过更换该板,排除此处故障,若此处故障排除后,业务恢复正常,则故障处排除此处故障,若此处故障排除后,业务恢复正常,则故障处理完毕。否则继续作逐段环回。理完毕。否则继续作逐段环回。7.到达到达3号站,对号站,对3号站作单站测试,通过尾纤将西向线路号站作单站测试,通过尾纤将西向线路板环回,发现业务不正常,更换板环回,发现业务不正常,更换3号站西向线路板,故障排除。号站西
20、向线路板,故障排除。u复用段环复用段环某日,维护人员发现,某日,维护人员发现,2站、站、3站相连的线路板出现站相连的线路板出现RLOS告警,各站告警,各站交叉板均有保护倒换告警,查询各节点倒换状态正常。但交叉板均有保护倒换告警,查询各节点倒换状态正常。但3号站与号站与1号站的业务中断号站的业务中断(N0.1个个VC4),其它站业务正常。,其它站业务正常。l组网配置组网配置某局某局Optix 622复用段保护环,组网图所示,复用段保护环,组网图所示,1号站为网管中心站。号站为网管中心站。l故障现象故障现象wMSP环 OptiXeeeeewwww32451u复用段保护倒换后业务正常的必要条件:复用
21、段保护倒换后业务正常的必要条件:1、线路板正常监测到告警,正常传递、线路板正常监测到告警,正常传递K1、K2字节。字节。2、主控板正确处理、主控板正确处理K1、K2字节,保护倒换协议正常。字节,保护倒换协议正常。3、交叉板接受主控板发来指令,正常倒换。、交叉板接受主控板发来指令,正常倒换。4、保护倒换的备用通道正常。、保护倒换的备用通道正常。1、中断业务样本采样、中断业务样本采样: 选取选取1号站第二支路板的第一个号站第二支路板的第一个2M通道,即通道,即1站的站的t2:1。2、保护倒换前,样本业务、保护倒换前,样本业务1号站的号站的t2:1走的路径如图所示走的路径如图所示u处理步骤处理步骤3
22、、逐段环回,缩小故障范围、逐段环回,缩小故障范围: 在在1号站第二支路板的第一个号站第二支路板的第一个2M通道上挂表测试然后通通道上挂表测试然后通过网管逐段进行如下的环回操作。过网管逐段进行如下的环回操作。 当站点数较多时,可采用二分法,进行环回操作。当站点数较多时,可采用二分法,进行环回操作。u处理步骤处理步骤4、逐段环回,定位故障站点和单板、逐段环回,定位故障站点和单板: 在对在对3号站的东向号站的东向SL4板板No.3VC4做外环回时,发现业务不做外环回时,发现业务不通,而对通,而对4号站的西向号站的西向SL4板板No.3VC4做内环回时,业务正常,做内环回时,业务正常,说明问题在说明问
23、题在3号站的东向号站的东向SL4板和板和4号站的西向号站的西向SL4板之间。板之间。u处理步骤处理步骤5、更换、更换3号站东向号站东向SL4板,故障仍存在。板,故障仍存在。 更换更换4号站西向号站西向SL4板,故障排除,说明该板不能正板,故障排除,说明该板不能正常穿通常穿通No.3VC4。u处理步骤处理步骤光纤性能劣化、损耗过高光纤性能劣化、损耗过高光纤接头不清洁或连接器不正确光纤接头不清洁或连接器不正确设备接地不好设备接地不好设备附近有强烈干扰源设备附近有强烈干扰源设备散热不好、工作温度过高设备散热不好、工作温度过高l设备原因设备原因线路板接收侧信号衰减过大、对端发送线路板接收侧信号衰减过大
24、、对端发送电路有故障、本端接收电路故障电路有故障、本端接收电路故障时钟同步性能不好时钟同步性能不好交叉板与线路板、支路板配合不好交叉板与线路板、支路板配合不好支路板故障支路板故障风扇故障风扇故障板失效或性能不好板失效或性能不好u常见原因常见原因l外部原因外部原因u常用方法常用方法:l告警性能分析法告警性能分析法l逐段环回法逐段环回法l互换、替换法互换、替换法u处理步骤处理步骤:l分析线路板误码性能事件,排除线路误码。分析线路板误码性能事件,排除线路误码。l分析支路误码性能事件,排除支路误码。分析支路误码性能事件,排除支路误码。u典型故障典型故障(线路板故障导致的误码线路板故障导致的误码)四个站
25、组成的一条无保护链,四个站组成的一条无保护链,1站为网管中心站,集中站为网管中心站,集中型业务,即每个站均与型业务,即每个站均与1站有站有2M业务。业务。u组网配置组网配置:u故障现象故障现象:l1站站2M支路板有支路板有LPBBE误码误码l3站东向光板有站东向光板有RSBBE、MSBBE、HPBBE误码误码l4站西向光板有站西向光板有MSFEBBE、HPFEBBE误码误码l4站站2M支路板有支路板有LPFEBBE误码误码u处理步骤处理步骤:通过对上报的性能事件分析,可判断为通过对上报的性能事件分析,可判断为3站东站东向光板收有问题或向光板收有问题或4站西向光板发有问题。站西向光板发有问题。到
26、达到达3号站,通过尾纤自环号站,通过尾纤自环3站的东向光板,站的东向光板,3站东向光板误码和站东向光板误码和1站站2M支路板误码消失,说支路板误码消失,说明是明是4站西向光板问题。站西向光板问题。到达到达4站,更换西向光板,误码问题解决。站,更换西向光板,误码问题解决。四个站组成的一个复用段保护环,四个站组成的一个复用段保护环,1站为网管中心站,站为网管中心站,每个站均与每个站均与1站有站有2M业务。业务。u组网配置组网配置:u典型故障典型故障(时钟板故障导致的误码问题时钟板故障导致的误码问题)wMSP环eeeewww3241u故障现象故障现象1号站、号站、3号站、号站、4号站相应的号站相应的
27、2M业务通道报业务通道报LPBBE、LPFEBBE误码;误码;2号站东向板、号站东向板、3号站东西向光板、号站东西向光板、4号站西向光板报大量号站西向光板报大量RSBBE、MSBBE、HPBBE以以及及MSFEBBE、HPFEBBE误码,一些光板还存在大误码,一些光板还存在大量指针调整。量指针调整。u处理步骤处理步骤从误码性能事件分析,从误码性能事件分析,3号站的时钟单元故障。号站的时钟单元故障。到达到达3号站,更换交叉板,误码消失,故障排除。号站,更换交叉板,误码消失,故障排除。SDH网元之间传递信息是通过网元之间传递信息是通过ECC通信来实通信来实现现.ECC的物理层就是的物理层就是DCC
28、通道,即通道,即SOH中的中的D1D12字节。字节。OptiX 系列产品使用其中的系列产品使用其中的D1D3字节,即再生段字节,即再生段DCC,速率为,速率为192Kbit/s。注意:网管和网关网元之间通过注意:网管和网关网元之间通过TCP/IP协议传递信息协议传递信息若路由一切正常,走环网上的短路径若路由一切正常,走环网上的短路径若短路径不正常,则走环网上的长路径若短路径不正常,则走环网上的长路径若长短路径皆不正常,则不能登录若长短路径皆不正常,则不能登录:ecc-get-route;:ecc-get-sccinfo(bdinfo);ECC所走的路径为收发一致路由所走的路径为收发一致路由uE
29、CC路由规则:路由规则:uECC故障常见原因故障常见原因l外部原因外部原因供电电源故障,如设备掉电、供电电压过低等供电电源故障,如设备掉电、供电电压过低等光纤故障,如光纤性能劣化、损耗过高,或光光纤故障,如光纤性能劣化、损耗过高,或光纤损断;纤损断;l设备本身故障设备本身故障SCC板故障板故障光板故障光板故障网元间有大量的性能数据传送网元间有大量的性能数据传送u常用方法常用方法l告警性能数据分析法告警性能数据分析法l替换法替换法l经验处理法经验处理法u处理步骤处理步骤1.排除外部因素,如掉电、光纤折断、光纤性能劣化排除外部因素,如掉电、光纤折断、光纤性能劣化等。将故障定位到单站或两个站之间。等
30、。将故障定位到单站或两个站之间。2.对于对于ECC问题,逐段自环不能定位故障;一般根据问题,逐段自环不能定位故障;一般根据从哪一站开始不能登录来判断故障位置。从哪一站开始不能登录来判断故障位置。3.检查检查SCC板。板。4.检查光板。检查光板。u故障案例:故障案例:如图所示的链形组网中,如图所示的链形组网中,1号站为网关网元,连接网管。号站为网关网元,连接网管。各网元间的光纤连接如图所示,各网元间的光纤连接如图所示,“w”代表代表11板位光板,板位光板,“e”代表代表12板位光板。板位光板。u故障现象故障现象现在现在3号站、号站、4号站登录不上。号站登录不上。weweww网管网管1432u处理
31、步骤:处理步骤:第一步:首先排除外部故障。第一步:首先排除外部故障。1、如果、如果3号站断电或低电压,则从网管就不能登录号站断电或低电压,则从网管就不能登录3号号站,而站,而4号站的号站的ECC数据由数据由3号站转发,当然也不能登录号站转发,当然也不能登录4号站。如果号站。如果2号站到号站到3号站之间的两根光纤断,网管也号站之间的两根光纤断,网管也无法登录无法登录3号站、号站、4号站。采用告警分析法可以发现外部号站。采用告警分析法可以发现外部故障。故障。3、如果光纤的传输性能劣化,尾纤头脏或者松动,将、如果光纤的传输性能劣化,尾纤头脏或者松动,将在光路上产生大量的误码,这也会导致在光路上产生大
32、量的误码,这也会导致ECC通信忽通忽通信忽通忽断或完全中断。可以采用性能数据分析法来观察性能。断或完全中断。可以采用性能数据分析法来观察性能。第二步:将故障定位到单站或两个站之间。第二步:将故障定位到单站或两个站之间。对于对于ECC问题,一般根据从不能登录的站点来判问题,一般根据从不能登录的站点来判断故障位置。断故障位置。如图所示,如果如图所示,如果3号站、号站、4号站都不能登录,则故号站都不能登录,则故障基本可以先定位到障基本可以先定位到2号站和号站和3号站。号站。对于对于ECC问题,不但要分析登录不上的站点,还问题,不但要分析登录不上的站点,还要分析其上游站。要分析其上游站。 u处理步骤:
33、处理步骤:第三步:检查第三步:检查SCC板。板。(1)首先检查首先检查3站点的站点的SCC 板是否硬件故障,或在不板是否硬件故障,或在不停复位。停复位。主要是查看主要是查看SCC板的红绿灯闪烁是否正常。板的红绿灯闪烁是否正常。红灯长亮红灯长亮: SCC板硬件故障;板硬件故障;绿灯快闪绿灯快闪: 表明表明SCC在复位;在复位;绿灯长亮绿灯长亮: SCC板死机;板死机;如果有以上情况,按如果有以上情况,按SCC的的“RST”按纽或拔插一按纽或拔插一下,再观察,还不行则须更换下,再观察,还不行则须更换SCC板。板。u处理步骤:处理步骤:(2)如果如果SCC板闪灯正常,也可以尝试复位板闪灯正常,也可以
34、尝试复位SCC板。先板。先复位复位2号站的号站的SCC板,若无效则复位板,若无效则复位3号站的号站的SCC 板。板。 复位方法:复位方法:a.用网管进行软、硬件复位用网管进行软、硬件复位 b.按按SCC板的板的“RST”复位按纽复位按纽 c.拔、插拔、插SCC板板注意:注意:1、在复用段环中,若全环处于倒换状态时不能轻易拔插、在复用段环中,若全环处于倒换状态时不能轻易拔插SCC板,板,可能会导致业务中断。可能会导致业务中断。2、更换、更换SCC板后,应对此网元重新下发配置,因为网元板后,应对此网元重新下发配置,因为网元 配置数据是存放在配置数据是存放在SCC板上的。板上的。u处理步骤:处理步骤
35、:(3)若复位若复位SCC板还无效,可将板还无效,可将SCC板拔出,使板拔出,使ECC通通道在本站穿通道在本站穿通(即从西向光板直接穿通到东向光板,不即从西向光板直接穿通到东向光板,不经过经过SCC板板),检查线路板穿通,检查线路板穿通DCC字节是否有问题。字节是否有问题。 如:将如:将2号站的号站的SCC拔出看能否登录拔出看能否登录3号站、号站、4号站;号站; 将将3号站的号站的SCC拔出能否登录拔出能否登录4号站。如果号站。如果3号站的号站的 SCC拔出后能登录拔出后能登录4号站,则号站,则3号站的号站的SCC板有问题,板有问题,更换即可。更换即可。u处理步骤:处理步骤:第四步:检查光板第
36、四步:检查光板于线路误码的存在及系统工作环境于线路误码的存在及系统工作环境(温度条件等温度条件等)引引起系统光板和起系统光板和SCC间间DCC配合时序混乱及软硬件死配合时序混乱及软硬件死锁,这样会导致系统锁,这样会导致系统ECC单向通或该网元单向通或该网元ECC全断;全断;因此,在很多因此,在很多ECC不通的情况下复位主控板或线路不通的情况下复位主控板或线路板即可解决。板即可解决。u处理步骤:处理步骤:注意:注意: 拔插光板将导致相关业务中断!慎用拔插和复位光板,拔插光板将导致相关业务中断!慎用拔插和复位光板,建议在夜间小话务量时进行。建议在夜间小话务量时进行。四个站组成的一个复用段保护环,组
37、网如下图。四个站组成的一个复用段保护环,组网如下图。1号站为网管中心站,集中型业务,即每个站均与号站为网管中心站,集中型业务,即每个站均与1站有业务。站有业务。开局时在开局时在1站作倒换实验时,发现断掉站作倒换实验时,发现断掉1号站东侧光纤,号站东侧光纤,2号站登录不号站登录不上,断掉上,断掉1号站西侧光纤,号站西侧光纤,3、4号站登录不上,但各站业务正常。号站登录不上,但各站业务正常。wMSP环eeeewww3241u复用段保护环复用段保护环ECC故障故障: 1、根据上述两处拔纤测试,可将故障定位在、根据上述两处拔纤测试,可将故障定位在2号站号站东向光板位和东向光板位和3号站西向光板位之间。
38、号站西向光板位之间。2、对这两个板位分别复位、对这两个板位分别复位,再做倒换测试再做倒换测试,查看各站查看各站登录情况。登录情况。3、对、对2号站东向光板位复位,故障依然。号站东向光板位复位,故障依然。 对对3号站西向光板位复位,故障消除。号站西向光板位复位,故障消除。 说明是说明是3号站西向光板故障,复位即可消除故障。号站西向光板故障,复位即可消除故障。u故障处理步骤:故障处理步骤: OptiX设备可与各厂家的程控交换机、设备可与各厂家的程控交换机、PDH、SDH、ATM交换机、交换机、GSM、电源监控等各种设备、电源监控等各种设备的对接,对接信号有的对接,对接信号有2M、34M、45M、1
39、40M、155M、622M等。等。 传输设备因传送的业务种类较多,与其对接传输设备因传送的业务种类较多,与其对接的设备复杂、各种业务对传输通道的性能要求也的设备复杂、各种业务对传输通道的性能要求也不完全相同,在实际对接过程中也会存在一些问不完全相同,在实际对接过程中也会存在一些问题。题。u对接常见问题:对接常见问题:线缆连接错误。比如光纤或电缆接错位置。线缆连接错误。比如光纤或电缆接错位置。设备接地问题。可能是一方设备接地有问题,设备接地问题。可能是一方设备接地有问题,也可能是双方设备不共地。也可能是双方设备不共地。时钟不同步。比如传输、交换各自的网络内部时钟不同步。比如传输、交换各自的网络内
40、部时钟同步,但两个网络之间不同步。时钟同步,但两个网络之间不同步。SDH帧结构中开销字节的定义不同。帧结构中开销字节的定义不同。信号转接过多。信号转接过多。u设备对接不成功的处理步骤设备对接不成功的处理步骤:l1、检查设备间物理连接的正确性、检查设备间物理连接的正确性主要是检查两个设备之间的电缆、光纤连接的正主要是检查两个设备之间的电缆、光纤连接的正确性,防止电缆的漏焊、虚焊、接触不良,特别确性,防止电缆的漏焊、虚焊、接触不良,特别是要防止电缆的混线。是要防止电缆的混线。备注:备注: 如果交换机的业务是从别的传输设备割接至如果交换机的业务是从别的传输设备割接至OptiX设备,设备,则在割接前每
41、根中继电缆、光纤都应先贴好标签;则在割接前每根中继电缆、光纤都应先贴好标签;l2、检查告警和性能数据、检查告警和性能数据:检查对接设备两侧的告警和性能数据。检查对接设备两侧的告警和性能数据。例如:有时例如:有时OptiX设备的设备的2M口会不断地产生口会不断地产生T_ALOS告警并瞬间结束,这说明对方设备的告警并瞬间结束,这说明对方设备的2M中继板在不停复位,复位的原因可能是对方设备中继板在不停复位,复位的原因可能是对方设备未调好、未调好、OptiX设备提供的设备提供的2M通道质量不好等原通道质量不好等原因。因。u设备对接不成功的处理步骤设备对接不成功的处理步骤:l3. 检查接地检查接地a.对
42、接不成功时请重点检查两设备是对接不成功时请重点检查两设备是否真正共地。有多起对接不成功的案否真正共地。有多起对接不成功的案例,最后的原因都是两个设备未能真例,最后的原因都是两个设备未能真正的共地。正的共地。u设备对接不成功的处理步骤设备对接不成功的处理步骤:l3. 检查接地检查接地: 75欧姆非平衡式同轴端口的外导体欧姆非平衡式同轴端口的外导体(即屏蔽层即屏蔽层)常常规的接地方法是发端接规的接地方法是发端接PGND、收端悬空。、收端悬空。 也有厂商的设备采用收、发端屏蔽层接工作地也有厂商的设备采用收、发端屏蔽层接工作地的。如果对接的设备屏蔽层接地不一致,会由于两个的。如果对接的设备屏蔽层接地不
43、一致,会由于两个地地(BGND、PGND)之间存在直流电位差和交流干扰,之间存在直流电位差和交流干扰,影响信号对接时的波形,导致对接不成功。影响信号对接时的波形,导致对接不成功。b.检查检查PDH同轴端口的屏蔽层接地同轴端口的屏蔽层接地检查对接设备屏蔽层接地的方法:检查对接设备屏蔽层接地的方法: 将对接设备间的信号线全部断开,用万用将对接设备间的信号线全部断开,用万用表交叉测量表交叉测量SDH侧收、发端同轴端口屏蔽层与侧收、发端同轴端口屏蔽层与对方收、发端同轴端口屏蔽层间的电平。如果对方收、发端同轴端口屏蔽层间的电平。如果测试到两点之间有较大的电位差测试到两点之间有较大的电位差(0.5V左右左
44、右),则,则说明两者的屏蔽层接地可能不一致。说明两者的屏蔽层接地可能不一致。l3. 检查接地检查接地:b.检查检查PDH同轴端口的屏蔽层接地同轴端口的屏蔽层接地l4. 检查全网的时钟同步检查全网的时钟同步如果通过如果通过SDH传输网络后,交换机下面的模块局和母传输网络后,交换机下面的模块局和母局的时钟不同步,可能会产生中继滑码、拨号上网用局的时钟不同步,可能会产生中继滑码、拨号上网用户中断等故障,甚至通话经常中断。户中断等故障,甚至通话经常中断。可以适当地调整全网的时钟同步方案,使全网时钟同可以适当地调整全网的时钟同步方案,使全网时钟同步:比如使母局的交换和步:比如使母局的交换和OptiX传输
45、设备都跟踪高精度传输设备都跟踪高精度的的BITS时钟信号。时钟信号。OptiX传输网内时钟是否同步,可以通过网管中的指针传输网内时钟是否同步,可以通过网管中的指针调整性能事件看到。调整性能事件看到。u设备对接不成功的处理步骤设备对接不成功的处理步骤:通常情况下,通常情况下,75欧姆的欧姆的2M中继线缆可传送中继线缆可传送200多米。但多米。但中继电缆距离太长有时会导致业务对接失败,表现为业务中继电缆距离太长有时会导致业务对接失败,表现为业务开不通或者开通的业务经常出现中断。开不通或者开通的业务经常出现中断。这是因为在有些使用场合下这是因为在有些使用场合下,中继距离过长会因阻抗不匹中继距离过长会
46、因阻抗不匹配、受到干扰、对端设备可靠性等原因而导致配、受到干扰、对端设备可靠性等原因而导致2M接口波接口波形产生失真,特别是当干扰变大时更加容易出现业务中断;形产生失真,特别是当干扰变大时更加容易出现业务中断;而且电缆过长,电缆经过的路由则可能较复杂,易引入外而且电缆过长,电缆经过的路由则可能较复杂,易引入外部干扰部干扰(如交流电的干扰如交流电的干扰),使波形产生失真。,使波形产生失真。u设备对接不成功的处理步骤设备对接不成功的处理步骤:l5.检查电缆距离是否过长检查电缆距离是否过长若某一业务要经过多种传输设备或多个厂若某一业务要经过多种传输设备或多个厂家的设备传送、转接,可能会出现因转接家的
47、设备传送、转接,可能会出现因转接过多而导致对接不成功的情况发生。过多而导致对接不成功的情况发生。原因是多方面的,有各厂家传输网络之间原因是多方面的,有各厂家传输网络之间时钟的不同步,多层转接后信号的失真等。时钟的不同步,多层转接后信号的失真等。u设备对接不成功的处理步骤设备对接不成功的处理步骤:l6.检查是否信号转接过多检查是否信号转接过多1、注意、注意OptiX设备与设备与ATM交换机不能在交换机不能在622M光口对光口对接,因为接,因为ATM的的622M 结构为结构为VC4-C(级连结构级连结构),不是,不是SDH的复用结构。与的复用结构。与140M、155M业务可以成功对接。业务可以成功
48、对接。2、OptiX与其它厂家与其它厂家SDH设备设备STM-N光光(电电)口对接一口对接一般般 都没有问题。都没有问题。注意注意:不能实现保护倒换功能的对接。复用段保护功能不能对接,不能实现保护倒换功能的对接。复用段保护功能不能对接,单向通道保护功能也不能保证对接成功。单向通道保护功能也不能保证对接成功。uSTM-N光光(电电)口的对接问题:口的对接问题: 1、本节叙述了常用的故障处理方法:性能、本节叙述了常用的故障处理方法:性能、告警分析法,环回法,更改配置法,配置数据告警分析法,环回法,更改配置法,配置数据分析法,仪表测试法的分析步骤。分析法,仪表测试法的分析步骤。 2、详细论述了几类典型故障的产生原因和、详细论述了几类典型故障的产生原因和处理方法,并通过对故障案例的剖析处理方法,并通过对故障案例的剖析,详细阐述详细阐述了该类故障的分析思路和了该类故障的分析思路和 解决方法。解决方法。