1、HUAWEI TECHNOLOGIES CO.,LTDHuawei Confidential Security Level:Internal Use OnlyOptiX SDHOptiX SDH故障分析与处理故障分析与处理方法专题方法专题熊世荣熊世荣 3113831138O p t i X S D H 故障分析与处理方法专题熊世荣 3 1 1 3 8HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 2前言前言基于OptiX SDH故障维护,开发此课程。本课程旨在通过介绍一些故障定位的方法帮助故障维护人员分析定位故障,通过一些典型的故障来阐
2、述常用故障定位方法的应用。P a g e 2 前言基于O p t i X S D H 故障维护,开发此课程。HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 3课程目标l学习完此课程,您应能:学习完此课程,您应能:p掌握故障定位基本思路及方法p掌握SDH 告警分析(常见导致业务中断告警的原因和解决方法)p了解典型故障的分析处理P a g e 3 课程目标学习完此课程,您应能:HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 4内容介绍l故障处理思路与方法故障处理思路与方法l常见告警分
3、析常见告警分析l典型故障分析典型故障分析P a g e 4 内容介绍故障处理思路与方法HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 5故障定位前的准备掌握专业技能掌握专业技能熟悉SDH原理知识了解传输系统告警信号流及告警产生机理熟悉传输设备和网管的基本操作熟悉常用仪表的基本操作熟悉工程组网信息熟悉工程组网信息p网络拓扑p业务配置p设备运行状态p工程文档做好故障现场数据的采集与保存做好故障现场数据的采集与保存P a g e 5 故障定位前的准备掌握专业技能熟悉工程组网信息HUAWEI TECHNOLOGIES CO.,LTD.Huawe
4、i Confidential Page 6故障定位基本原则将故障准确定位到单站将故障准确定位到单站P a g e 6 故障定位基本原则故障定位的关键是什么?将故障准确HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 7故障定位基本原则先高速部分,后低速部分先高速部分,后低速部分先定位外部,后定位传输先定位外部,后定位传输 先定位单站,后定位单板先定位单站,后定位单板先分析高级别告警,后分析低级别告警先分析高级别告警,后分析低级别告警P a g e 7 故障定位基本原则先高速部分,后低速部分先定位外部HUAWEI TECHNOLOGIES
5、CO.,LTD.Huawei Confidential Page 8故障分析方法环回法环回法替换法替换法配置数据分析法配置数据分析法更改数据配置法更改数据配置法告警、性能告警、性能分析法分析法仪表测试法仪表测试法经验处理法经验处理法P a g e 8 故障分析方法环回法替换法配置数据分析法更改数据配HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 9故障处理方法(告警、性能分析法)通过设备告警指示灯获取告警信息一、通过机柜顶部的告警指示灯查看告警二、通过单板告警指示灯查看告警l设备指示灯仅反映设备当前的运行状态,对于设备曾经出过故障,无法
6、表示l设备指示灯状态只能反映设备告警级别,而不能准确告知具体告警缺点缺点适用于设备维护人员配合处理故障时使用P a g e 9 故障处理方法(告警、性能分析法)通过设备告警指HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 10故障处理方法(告警、性能分析法)通过网管获取告警和性能信息适用于网管维护人员处理故障使用全面性全面性不仅仅是一个站、一块板的故障信息,而且是全网设备的故障信息详实性详实性能够获取设备当前存在哪些告警、告警发生时间,以及设备的历史告警;能够获取设备性能事件的具体数值 P a g e 1 0 故障处理方法(告警、性能分
7、析法)通过网管获取告HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 11故障处理方法(告警、性能分析法)应用举例应用举例ABCDR_LOSTU_AISMS_RDIHP_RDILP_RDI 无无无无分析分析:l 因网元B有R_LOS,从而网元A相应光路有MS_RDI、HP_RDI;l 因网元B有TU_AIS,并且TU_AIS业务是与网元A业务,从而网元A 相应通道有LP_RDI;l 网元B的R_LOS告警会导致TU_AIS;结论:结论:所有告警均由网元B的R_LOS引起,说明A到B传输方向光路故障。P a g e 1 1 故障处理方法(告
8、警、性能分析法)应用举例A B CHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 12故障处理方法(环回法)线路线路线路线路内环回外环回外环回SDH网元设备网元设备支路支路支路支路l 软件环回软件环回/硬件环回硬件环回l 内环回内环回/外环回外环回l 线路环回线路环回/支路环回支路环回l 端口环回端口环回/VC4/VC4环回环回线路环回可能导致线路环回可能导致该线路其他在用业务中断该线路其他在用业务中断部分单板不支持软部分单板不支持软件的件的VC4环回环回,请查请查阅相应的使用手册阅相应的使用手册P a g e 1 2 故障处理方法(环
9、回法)线路线路内环回外环回S DHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 13 4.初步定位单板问题初步定位单板问题“环回法环回法”的步骤:的步骤:1.环回业务通道采样环回业务通道采样2.画业务路径图画业务路径图 3.逐段环回,定位故障站点逐段环回,定位故障站点故障处理方法(环回法)P a g e 1 3 4.初步定位单板问题“环回法”的步骤:1.HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 14故障处理方法(环回法)一、环回业务通道采样:1、从多个有故障的站点中选择一个
10、站点;2、从所选择站点的多个故障业务通道中选择其中的一个业务通道。由于自环第一个VC4通道,可能会影响ECC通信,因此尽量不要选择第一个VC4通道内的业务。举例P a g e 1 4 故障处理方法(环回法)一、环回业务通道采样:1HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 15故障处理方法(环回法)画出所采样业务一个方向的路径图。在路径图中表示出:该业务的源和宿,该业务所经过的站点,该业务所占用的VC4通道和时隙。二、画业务路径图:二、画业务路径图:例如:例如:P a g e 1 5 故障处理方法(环回法)画出所采样业务一个方向的H
11、UAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 16故障处理方法(环回法)依据中断业务的路径图,在3号站第1块支路板的第1个2M通道外接一个2M误码仪,监测业务好坏。三、逐段环回,定位故障站点三、逐段环回,定位故障站点四、根据环回现象初步定位故障单板四、根据环回现象初步定位故障单板P a g e 1 6 故障处理方法(环回法)依据中断业务的路径图,在HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 17故障处理方法(替换法)适用场合适用场合l 排除传输外部设备的问题排除传输外部设备的
12、问题l 故障定位到单站后,怀疑单站内单板或附件有故障定位到单站后,怀疑单站内单板或附件有 问题问题 替换法就是使用一个工作正常的物件去替换一个被怀疑工作不正常的物件,可替换物件包括线缆、光纤、法兰盘、电源、单板、设备等。P a g e 1 7 故障处理方法(替换法)适用场合 排除传输HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 18故障处理方法(替换法)应用举例应用举例业务配置业务配置:2-PQ1板63个2M配置双向业务到5-S16做单站调试,使用设备为2500+。故障描述故障描述:2-PQ1板第40个2M上报T_ALOS告警,其他2
13、M通道正常。通过网管对第40个2M做内环回,T_ALOS消失。DDF架 环回故障依然存在。正常:下一步异常:DDF架接口故障处理步骤:1、把第39个2M线接到DDF架的第40个2M上正常:中继电缆故障异常:下一步3、更换接口板定位故障2、更换中继电缆P a g e 1 8 故障处理方法(替换法)应用举例业务配置:2-PHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 19故障处理方法(配置数据分析法)适用场合适用场合l 故障定位到单站后,用以进一步定位故障故障定位到单站后,用以进一步定位故障l 特定告警,如:特定告警,如:HP_TIMHP
14、_TIM、HP_SLMHP_SLM等等 HP_TIM:J1字节设置 HP_SLM:C2字节设置 TU_AIS/AU_AIS:SDH业务配置 TPS倒换下业务中断:检查TPS保护设置 MSP环倒换下业务中断:MSP节点参数设置 SNCP环倒换下业务中断:通道保护属性设置 P a g e 1 9 故障处理方法(配置数据分析法)适用场合 故障定HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 20故障处理方法(配置数据分析法)ABC应用举例应用举例VC4(开销穿通)(开销穿通)(开销终结)(开销终结)(开销终结)(开销终结)HP_SLM分析:分
15、析:1、HP_SLM告警与C2字节相关,为实收C2与应收C2不匹配;2、网元B开销穿通,对C2字节做穿通处理;处理步骤:1、检查网元C接受方向的应收/实收C2字节;2、检查网元A发送方向的应发C2字节;P a g e 2 0 故障处理方法(配置数据分析法)A B C 应用举例VHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 21故障处理方法(更改配置法)适用场合适用场合l 有空余时隙、通道或槽位有空余时隙、通道或槽位l 一个一个VC4VC4中部分时隙业务中断情况中部分时隙业务中断情况更改时钟配置:时钟告警、指针调整更改板位配置:怀疑单板
16、或是母板槽位故障更改时隙配置:将故障定位到单站 判定线路或支路故障更改单板参数配置:以太网故障、对接故障P a g e 2 1 故障处理方法(更改配置法)适用场合 有空余时HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 22故障处理方法(更改配置法)故障描述:1、网元C收网元A方向所有2M业务中断;2、其他网元业务正常;可能原因:C站PQ1故障A站3-PQ1故障应用举例应用举例ABCD2-PQ1:30E13-PQ1:40E13-PQ1:20E130E11VC4:13040E12VC4:14020E12VC4:4160TU_AISLP_R
17、DIwwwwee如何将故障如何将故障 定位到单站定位到单站?P a g e 2 2 故障处理方法(更改配置法)故障描述:应用举例AHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 23故障处理方法(更改配置法)配置一条从网元A到网元B的E1业务,使用第二个VC4应用举例应用举例ABCD2-PQ1:30E13-PQ1:40E13-PQ1:20E130E11:VC440E12:VC420E12:VC4TU_AISLP_RDIwwwwee网元网元B有有TU_AIS无任何告警无任何告警网元网元A APQ1PQ1板故障板故障网元网元C CPQ1PQ
18、1板故障板故障P a g e 2 3 故障处理方法(更改配置法)配置一条从网元A 到网HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 24故障处理方法(仪表测试法)适用场合适用场合l 排除传输设备外部问题排除传输设备外部问题l 设备对接问题设备对接问题l 设备性能指标问题设备性能指标问题光功率计:R_LOS、R_LOF万用表:接地或是电压问题SDH分析仪:误码等问题P a g e 2 4 故障处理方法(仪表测试法)适用场合 排除传输HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page
19、25故障处理方法(仪表测试法)故障描述:B站收R_LOS可能原因:A到B方向光纤故障A站光板发送故障B站光板接收故障应用举例应用举例ABR_LOSww测试测试A发送光功率发送光功率异常异常A站光板发送故障站光板发送故障测试测试B接收光功率接收光功率正常正常正常正常异常异常B站光板接收故障站光板接收故障A发发B光纤故障光纤故障P a g e 2 5 故障处理方法(仪表测试法)故障描述:应用举例AHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 26故障处理方法(经验法)适用场合适用场合l 仅做为应急处理时使用,临时恢复业务仅做为应急处理时使
20、用,临时恢复业务 复位单板单站重启重新下发配置将业务倒到备用通道 该方法不能彻底查清故该方法不能彻底查清故障原因,除非不得已,障原因,除非不得已,建议使用其他方法建议使用其他方法 P a g e 2 6 故障处理方法(经验法)适用场合 仅做为应急HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 27故障处理方法方法方法适用范围适用范围特点特点告警、性能分析法告警、性能分析法通用全网把握,可预见设备隐患;不影响正常业务。环回法环回法将故障定位到单站,或分离外部故障不依赖于告警、性能事件的分析、快捷;可能影响ECC及正常业务。替换法替换法将故
21、障定位到单板,或分离外部故障简单;对备件有需求。配置数据分析法配置数据分析法将故障定位到单板可查清故障原因;定位时间长。更改配置法更改配置法将故障定位到单板,排除指针调整问题复杂仪表测试法仪表测试法分离外部故障,解决对接问题具有说服力;对仪表有需求。经验处理法经验处理法特殊情况操作简单P a g e 2 7 故障处理方法方法适用范围特点告警、性能分析法通HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 28l本节我们主要学习了:本节我们主要学习了:p故障处理基本思路p故障处理各种方法及其比较小结P a g e 2 8 本节我们主要学习了:
22、小结HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 29内容介绍l故障处理思路与方法故障处理思路与方法l常见告警分析常见告警分析l典型故障分析典型故障分析P a g e 2 9 内容介绍故障处理思路与方法HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 30设备常见告警分析 SDH接口板常见告警接口板常见告警SL64、S16、SL4、SLQ4、SD4、SL1、SQ1、SQE 等单板1.R-LOS告警:接 收 侧 数 据 信 号 丢失,是 最 常 见 的 告警。一 般 是 光 纤 断
23、 或光路衰耗过大。2.R-LOF告警:在 接 收 端 检 测 到定帧字 节 A1 f6H、A228H,说 明 接 收 侧 帧同步 丢 失。一 般 由光板故 障 或 光 路 故障引起。P a g e 3 0 设备常见告警分析 S D H 接口板常见告警S L 6 4HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 31设备常见告警分析SDH接口板常见告警接口板常见告警3.B2-EXC告警:B2 误 码 过 量.检 测到 B2 误 码 块 个 数超过规定值。4.MS-REI告警:线 路 板 所 连 的 对 端站 检 测 到 有 B2 误 码块
24、,向 本 站 传 回M1字 节(M1 字 节 表 示 误码块个数)。P a g e 3 1 设备常见告警分析S D H 接口板常见告警3.B 2-HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 32设备常见告警分析SDH接口板常见告警接口板常见告警5.MS-AI S告 警:检 测 接 收 到 的 复 用 段 开 销字 节K2(bi t6、7、8)=111时,上 报 此 告 警。告 警 含义 是 整 个 STM-N 帧 内 除STM-N RSOH外全部为“1”。一 般 由R-LOS告 警引起或上游站传递过来。6.MS-RDI告警:检 测
25、接 收 到 的 复 用 段 开销 字 节K2(bi t6、7、8)=110。一 般 由 下 游 站 回告 上 来,表 示 下 游 站 接收 到 的 本 站 信 号 有 故障,说 明 本 站 至 对 端 线路板之间有问题。P a g e 3 2 设备常见告警分析S D H 接口板常见告警5.MSHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 33设备常见告警分析7.AU-AIS 告警:某 个AU4 的H1H2H3 为 全1。一 般 由 R-LOS、MS-AIS告警引起,常见业务配置有问题,如前站业务未穿通到本站。8.HP-RDI告警:检测
26、接收到的高阶通道开销字节G1(bi t5)=1。一般由对端复用段或高阶通道故障引起。SDH接口板常见告警接口板常见告警P a g e 3 3 设备常见告警分析7.A U-A I S 告警:某个AHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 34设备常见告警分析9.AU-LOP告警:检测到AU指针H1、H2字节非法。常见的是业务时隙冲突。10.HP-TIM告警:高阶通道追踪识别符失配告警,一般由两端光板的追踪识别符不一致引起。该告警不一定影响业务。SDH接口板常见告警接口板常见告警P a g e 3 4 设备常见告警分析9.A U-L
27、O P 告警:检测到AHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 35设备常见告警分析 PDHPDH接口板常见告警接口板常见告警PQ1、PD1、PL3等单板1.TU-AIS告警:nVC-12和TU-12指针全部为“1”。一般由线路板、交叉板或支路板故障引起,或者业务故障。2.LP-RDI告警:n检测接收到的低阶通道开销字节V5(bit8)=1.一般是TU-AIS告警的对告。P a g e 3 5 设备常见告警分析 P D H 接口板常见告警HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential
28、 Page 36设备常见告警分析 PDHPDH接口板常见告警接口板常见告警3.TU-LOP 告警:检测到TU指针V1、V2字节非法。一般在下时隙配置或新增时隙配置时发生时隙冲突。4.T-ALOS 告警:2M模拟信号丢失,一般是未上交换业务或DDF架2M线接触不良,是最常见的告警。5.PS告警:保护倒换告警。若支路板设置为保护方式,也会出现此告警,一般发生在通道环上(5.0平台一般无此告警)。P a g e 3 6 设备常见告警分析 P D H 接口板常见告警HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 37设备常见告警分析交叉板常见告
29、警交叉板常见告警:1、PS告警:复用段保护倒换告警,或TPS发生保护倒换。2、Hard-Bad:硬件坏告警,需要及时进行更换。3、Temp-Over:工作温度越限告警,影响交叉板正常工作,需及时排除该告警,如清扫防尘网等4、MS-SW:交叉板主备倒换告警(只有2500+设备支持)。5、W_OFFLINE拉手条离位告警(只有10G设备支持)。P a g e 3 7 设备常见告警分析交叉板常见告警:HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 38设备常见告警分析时钟板常见告警:时钟板常见告警:1、LTI告警:如果配置了内部源以外的源,但
30、所有的时钟源都不满足被选条件,时钟工作在保持或自由振荡模式,上报LTI告警。如果是外部命令(强制或人工倒换)倒换到内部源,不上报该告警。2、SYNC_C_LOS告警:同步源级别丢失,在非SSM模式下,若配置的时钟源丢失,产生此告警。3、EXT_SYNC_LOS:外同步时钟源丢失告警如果优先级表中配置了外部源,当外部源失效后,产生外部源丢失告警。4、SYN_BAD:同步源劣化。可能是跟踪的时钟源劣化严重或者交叉时钟板本身故障所致。P a g e 3 8 设备常见告警分析时钟板常见告警:HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 39设
31、备常见告警分析主控板常见告警:主控板常见告警:1、WRG_BDTYPE告警:配置错误告警。实际插的单板与该板位定义的类型不一致。如公务板位定义为OHP类型,实际所插板为OHP2板。2、FAN_FAIL告警:风扇失效或风扇电源未开。需要及时处理。3、MAIL_ERR:邮箱故障。需进一步分析是与那块单板的邮箱通信出现故障,以便及时排除故障。4、NESTATE_INSTALL:网元处于安装态,需要重下配置解决。P a g e 3 9 设备常见告警分析主控板常见告警:HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 40设备常见告警分析复用段相关
32、告警:复用段相关告警:1、APS_INDI:保护倒换指示,说明网络上发生了复用段保护。2、APS_FAIL:保护倒换失败指示,需查询复用段参数、协议状态等信息来进一步定位倒换失败的原因。3、APS_PARA_ERR:ECC复用段校验时,如果节点参数不正确会上报复用段节点参数校验失败。4、APS_TYPE_ERR:复用段协议类型不匹配,需要统一全网复用段协议类型。P a g e 4 0 设备常见告警分析复用段相关告警:HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 41l本节我们主要学习了:本节我们主要学习了:p常见告警的分析(产生原因以
33、及相应的解决方法)小结P a g e 4 1 本节我们主要学习了:小结HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 42内容介绍l故障处理思路与方法故障处理思路与方法l常见告警分析常见告警分析l典型故障分析典型故障分析P a g e 4 2 内容介绍故障处理思路与方法HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 43业务中断类故障l外部原因外部原因p供电电源故障p接地故障p环境异常p光纤、电缆故障l人为原因人为原因p误操作设置了光路或支路通道的环回p误操作更改、删除配置数据,
34、设置业务未装载l设备本身故障设备本身故障p单板失效或性能不好可能原因可能原因P a g e 4 3 业务中断类故障外部原因可能原因HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 44业务中断类故障定位方法定位方法l 告警分析法告警分析法l 更改配置法更改配置法l 逐段环回法逐段环回法l 替换法替换法定位步骤定位步骤l 检查各站登录是否正常l 检查有无设备告警,如BD_STATUS、NO_BD_SOFT等l 检查保护倒换是否正常l 分析故障,通过环回或是更改配置定位到单站l 将故障进一步定位并解决P a g e 4 4 业务中断类故障定位
35、方法 告警分析法定位步骤HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 451234wwwwEETU_AISLP_RDI网络配置网络配置网元1为中心节点,为网关网元其他各点之间没有业务故障描述故障描述网元1和网元4 E1业务中断n 节点 4:TU_AISn 节点 1:LP_RDI其他各站业务正常,无其他告警t2:1t2:12:12:12:1案例案例1 1:无保护链:无保护链业务中断类故障P a g e 4 5 1 2 3 4 w w w w E E T U _ A I S L P _ R D I 网HUAWEI TECHNOLOGIES
36、 CO.,LTD.Huawei Confidential Page 461234wwwwEEt2:1t2:12:12:12:1告警查询告警查询网元网元4有有TU_AIS网元网元4不能收网元不能收网元1业务业务网元网元1、2、3间业务正常间业务正常检查检查1到到4的业务配置的业务配置告警分析步骤告警分析步骤可否做环回可否做环回操作?操作?正确正确业务中断类故障P a g e 4 6 1 2 3 4 w w w w E E T U _ A I S L P _ R D I tHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 471234wwww
37、EE误码仪误码仪t2:1t2:12:12:12:1对网元对网元2东向东向2VC4做内环回做内环回正常正常故障点在网元故障点在网元1、2否否是是故障点在网元故障点在网元3、4在网元在网元3东向对东向对2VC4做内环回做内环回正常正常故障点在网元故障点在网元3否否是是故障点在网元故障点在网元3或网元或网元4用尾纤在网元用尾纤在网元3东向做内环回东向做内环回正常正常故障在网元故障在网元3东向光板东向光板否否是是故障在网元故障在网元4业务中断类故障P a g e 4 7 1 2 3 4 w w w w E E 误码仪t 2:1 t 2:1 2:HUAWEI TECHNOLOGIES CO.,LTD.H
38、uawei Confidential Page 481234wwwwEEt2:1t2:12:12:12:1故障定位到单站故障定位到单站可能可能LU/TU/XC 故障故障业务正常业务正常TU故障,更换故障,更换TU是否XCS主备倒换主备倒换TPS 倒换倒换 业务正常业务正常XCS故障,更换故障,更换XCS是否LU故障,更换故障,更换LU若无若无TPSTPS或或XCSXCS主备怎么办?主备怎么办?业务中断类故障P a g e 4 8 1 2 3 4 w w w w E E T U _ A I S L P _ R D I tHUAWEI TECHNOLOGIES CO.,LTD.Huawei Con
39、fidential Page 49业务中断类故障wSNCP Ringeeeewww3241案例案例2 2:SNCPSNCP 环环网络配置网络配置网元1为中心节点,各点有和网元1的业务 其他各点间无业务往来故障描述故障描述 网元1和网元4间2M业务中断n 网元 1,4:TU_AIS 其他各站业务正常P a g e 4 9 业务中断类故障w S N C P R i n g e e e e w wHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 50告警告警/性能分析性能分析断开网元断开网元1和和4光纤,转化为链处理光纤,转化为链处理wSNCP
40、 Ringeeeewww3241同上一案例同上一案例处理方处理方法法检查配置数据是否正确检查配置数据是否正确业务中断类故障先强制倒换先强制倒换以尽快恢复以尽快恢复业务业务P a g e 5 0 告警/性能分析断开网元1 和4 光纤,转化为链处理HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 51wMSP RingSTM-4eeeeewwww32451案例案例3 3:MSPMSP 环环网络配置网络配置网元1为中心节点,各站均有到网元1的业务其他各站之间没有业务业务均按最短路径配置故障描述故障描述 网元2与网元3之间光纤断n R_LOS网元
41、1与网元3之间E1业务中断n 网元1,3:TU_AIS其他业务正常业务中断类故障P a g e 5 1 w MS P R i n g e e e e e w w w w 3 2 4 5 1HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 52wMSP RingSTM-4eeeeewwww32451R_LOSR_LOSAPS_INDI TU_AISAPS_INDISSPPP查询告警查询告警 检查倒换状态检查倒换状态 正常正常APS协议是否启动?协议是否启动?是否画倒换后的信号流画倒换后的信号流更换故障单板更换故障单板重新下发重新下发MSP参
42、数配置参数配置 倒换状态正常?倒换状态正常?否是重启重启APS协议协议倒换状态正常倒换状态正常否是逐段环回定位故障到逐段环回定位故障到XCS/LU是否启启动动协协议议TU_AIS业务中断类故障P a g e 5 2 w MS P R i n g e e e e e w w w w 3 2 4 5 1HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 53业务中断类故障wMSP RingSTM-4eeeeewwww32451R_LOSR_LOSAPS_INDI TU_AISTU_AISAPS_INDISSPPP倒换前路由倒换前路由倒换后路由倒
43、换后路由对于比较长的链,对于比较长的链,建议采用二分法进行环回建议采用二分法进行环回P a g e 5 3 业务中断类故障w MS P R i n g e e e e e w wHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 54误码类故障可能原因可能原因l外部原因外部原因p光功率问题p接地故障p环境温度p电缆故障p设备外部干扰(瞬时大误码)l人为原因人为原因p时钟配置错误l设备本身故障设备本身故障p单板失效或性能不好(交叉、时钟、线路、支路)P a g e 5 4 误码类故障可能原因外部原因HUAWEI TECHNOLOGIES CO
44、.,LTD.Huawei Confidential Page 55误码类故障是否所有站都有是否所有站都有B1、B2误码误码检查环境温度检查环境温度是是否否时钟时钟/交叉问题交叉问题是否仅本站有是否仅本站有B1、B2误码误码是是光功率问题光功率问题检查本站或上游站检查本站或上游站光纤、光板光纤、光板否否是否有高阶是否有高阶B3误码误码是是本站或上游站线路本站或上游站线路/交叉交叉/时钟故障时钟故障否否是否有是否有V5误码误码是是本站或上游站支路本站或上游站支路/交叉交叉/时钟故障时钟故障否否仪表测试有误码、仪表测试有误码、性能上报无误码性能上报无误码是是DDF/电缆接地问题电缆接地问题定位步骤定
45、位步骤P a g e 5 5 误码类故障是否所有站都有B 1、B 2 误码检查环境HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 56误码类故障1234wwwwEELPBBELPFEBBERSBBEMSBBEHPBBEMSFEBBEHPFEBBE网络配置网络配置网元1为中心节点,其他点均与网元1有业务 其他各点之间没有业务故障描述故障描述网元3东向有大量RSBBE、MSBBE、HPBBE网元4西向有MSFEBBE、HPFEBBE、LPFEBBE网元1有LPBBE案例案例1 1:无保护链无保护链P a g e 5 6 误码类故障1 2 3
46、 4 w w w w E E L P B B E L P FHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 571234wwwwEELPBBELPFEBBERSBBEMSBBEHPBBEMSFEBBEHPFEBBE排除外部故障排除外部故障(电磁干扰、(电磁干扰、温度)温度)性能事件分析性能事件分析LPBBE 为为1收收4误码误码RSBBE/MSBBE/HPBBE 为从为从4到到3光路误码光路误码高阶误码导高阶误码导致低阶误码致低阶误码继续继续故障在故障在3与与4之间之间告警性能分析告警性能分析误码类故障P a g e 5 7 1 2 3
47、 4 w w w w E E L P B B E L P F E B B E RHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 581234wwwwEELPBBELPFEBBERSBBEMSBBEHPBBEMSFEBBEHPFEBBE解决问题解决问题继续继续检查检查3、4风扇和温度风扇和温度正常正常是是否否正常正常是是否否替换光纤、接头、替换光纤、接头、法兰盘、单板法兰盘、单板用仪表测试光功率(通过性能查询)用仪表测试光功率(通过性能查询)告警性能分析告警性能分析替换法替换法误码类故障P a g e 5 8 1 2 3 4 w w w
48、w E E L P B B E L P F E B B E RHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 591234wwwwEELPBBELPFEBBERSBBEMSBBEHPBBEMSFEBBEHPFEBBE在网元在网元1接误码仪接误码仪在网元在网元3东向做光东向做光/电口内环回电口内环回环回、替换法环回、替换法正常正常网元网元4西向光板西向光板/XCS不正常不正常网元网元3东向光东向光板板/XCS网元网元4交叉主备倒换交叉主备倒换网元网元3交叉主备倒换交叉主备倒换正常正常不正常不正常XCS故故障障光板故光板故障障正常正常不正常
49、不正常XCS故故障障光板故光板故障障误码类故障P a g e 5 9 1 2 3 4 w w w w E E L P B B E L P F E B B E RHUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 60l本节我们主要学习了:本节我们主要学习了:p业务中断类故障产生原因以及相关故障分析p误码类故障产生原因以及相关故障分析小结P a g e 6 0 本节我们主要学习了:小结HUAWEI TECHNOLOGIES CO.,LTD.Huawei Confidential Page 61l本课程我们主要学习了:本课程我们主要学习了:p故障定位基本思路和方法p常见告警原因分析p典型故障的分析处理总结P a g e 6 1 本课程我们主要学习了:总结Thank YO p t i X-S D H 故障分析及处理方法专题课件