1、Page 1第第2章章 故障定位的基本思路与方法故障定位的基本思路与方法第第3章章 分类故障处理分类故障处理责任就是成就责任就是成就Page 2知识点回顾知识点回顾链型组网,左边定义成西向,右边定义成东向。环型组网,逆时针方向被定义成主环方向。西东西东东西西东东西Page 31.1 软件环回软件环回1.2 硬件环回硬件环回1.3 单板复位单板复位1.4 清洁光口及连接器清洁光口及连接器1.5 光功率测试光功率测试1.6 更换单板更换单板责任就是成就责任就是成就Page 4软件环回软件环回波分侧客户侧OTU外环回波分侧客户侧OTU外环回l OTU客户侧外环回l OTU波分侧外环回责任就是成就责任
2、就是成就Page 5软件环回软件环回l OTU客户侧内环回l OTU波分侧内环回波分侧客户侧OTU内环回波分侧客户侧OTU内环回Page 6注意:加光衰减器注意:加光衰减器软件环回硬件环回信号发射模块信号接收模块TxRxINOUT波分侧客户侧TxRxINOUT波分侧客户侧l 硬件自环是指用一根尾纤(或者实现和尾纤同样功能的通光器件), 将一块单板上的接收和发送光接口连接起来。 硬件环回Page 7l 复位SCC主控利用网管系统对SCC板进行软复位;按下SCC板上的复位按钮,对SCC板进行硬复位;拔插SCC板,对SCC板进行硬复位。l 复位其它单板利用网管系统对其它单板进行软复位和硬复位;拔插单
3、板,对单板进行硬复位。单板复位Page 8l确认要清洁的光纤与有源器件断开,是完全无光的;l手持光纤连接器 ,用擦纤纸擦拭陶瓷插针的端面 ,慢慢地把擦纤纸向一个; l方向拖过插针端面,该操作可重复2-3次 ;l待插针表面干燥后,利用压缩气体喷射插针表面;l检查连接器端面。清洁光口及连接器Page 9OTM光功率计OTMININOTUOAMUX/DEMUXFIUININFIUOAMUX/DEMUXOTUININININODFODF 光板 光功率计OUTIN测试端口 光板 光功率计MON光功率测试Page 10更换前更换前更换中更换中更换后更换后更换单板检查单板版本;详细的单板信息可以 从条形码中
4、获得。 熟练掌握”通用注意事项”中的各项操作方法;注意单板上跳线、拨码开关的设置;注意光接口板的输入光功率的范围;如果单板的拉手条有纤缆,应先移去;注意拉手条的宽度。 戴防静电手腕;正确拔插单板。 防止短路;避免单板激光对人眼的伤害。 检查单板是否正常工作,并在网管上重新下发配置。 对于SCC板,要将网管上的配置文件备份到SCC板中。 Page 11第第1章章 常用维护操作常用维护操作第第3章章 分类故障处理分类故障处理Page 12l熟悉波分系统及系统告警的产生原因l熟悉波分系统的基本操作l熟悉一般测试工具的使用l了解所维护局的基本情况(组网拓扑,网络保护,波长分配)l平时做好设备数据的采集
5、和保存l良好的心里素质对维护人员的基本要求责任就是成就责任就是成就Page 13基本故障定位原则基本故障定位原则关键:准确地把故障定位到某段光纤或某个单站或某块单板。关键:准确地把故障定位到某段光纤或某个单站或某块单板。为什么会有故障为什么会有故障? ?先定位外部,后定位内部先定位外部,后定位内部 先定位网络,后定位网元先定位网络,后定位网元先分析高级告警先分析高级告警, ,后分析低级告警后分析低级告警Page 142.1 告警和性能分析法告警和性能分析法2.2 仪表测试法仪表测试法2.3 替换法替换法2.4 环回法环回法2.5 经验处理法经验处理法Page 15告警性能分析法 通过网管查询设
6、备当前或者历史的告警和性能事件。 通过设备机柜和单板的运行指示灯、告警指示灯的状态,了解设备当前的 运行状况。111优点优点缺点缺点网管网管全面性全面性 :能够获取全网设备的故障信息 。准确性:准确性:能够获取设备当前告警、历史告警、告警发 生时间和设备性能事件的具体数值。 当网管通信阻塞或ECC不通时无法监控。机柜单板指示灯机柜单板指示灯操作简单直观。缺乏告警详细信息。说明说明: : 某些故障发生时,可能没有明显的告警或性能事件上报,有时甚至查不到任何告警或性能事件。这种情况下,告警、性能分析法是无能为力的。Page 16仪表测试法 仪表测试法一般用于排除传输设备外部问题以及与其它设备的对接
7、问题 。 DWDM系统常用测试仪表有:光功率计、光谱分析仪、SDH测试仪、信 号分析仪等。光功率计 光谱分析仪1、和网管的光功率数据做比较。2、避免业务中断,一般使用“MON”在线检测口,对光功率进行测试。2、测试单板“MON”口输出的光谱,可以直接得到每个通道的信号波长、光功率和OSNR,并可以分析放大器的增益平坦度。 1、和原始数据做比较。 光板 光功率计MONOK责任就是成就责任就是成就Page 17替换法替换法l 替换法就是使用一个工作正常的物件去替换一个怀疑工作不正常的物 件,从而达到定位故障 排除故障的目的。l 这里的物件,可以是一段尾纤、一块单板、一个法兰盘或一个衰耗器。排除OT
8、U故障,可能是尾纤或SDH发送端故障。R-LOSR-LOS责任就是成就责任就是成就Page 18环回法环回法 分段环回法(软件环回或硬件环回)定位故障10dB光衰减器注意:注意:Page 19经验处理法 通过网管复位单板 硬件拔插单板 重新下发配置建议该处理故障的办法尽量少用,因为该方法不利于故障建议该处理故障的办法尽量少用,因为该方法不利于故障原因的彻底查清。原因的彻底查清。Page 203.1 故障概述故障概述3.2 光功率异常光功率异常3.3 误码问题误码问题3.4 业务瞬断业务瞬断3.5 业务中断业务中断3.6 ECC问题问题3.7 其他故障其他故障Page 21故障概述 本章节我们将
9、模拟不同的故障环境,以下系列故障皆采用相同环境, 如图所示:Page 22故障概述 西向OTM1站点硬件配置:400G系统,使用3波。Page 23故障概述 OTM1信号流责任就是成就责任就是成就Page 24故障概述故障概述 中间OADM站点硬件配置,利用MR2从东西向各上下1波。Page 25故障概述 OADM站点信号流责任就是成就责任就是成就Page 26故障概述故障概述 东向OTM2站点硬件配置Page 27故障概述 OTM2信号流Page 28光功率异常 故障分析故障分析1、排除设备外部因素如接地、电压等。2、可能的内部因素光功率问题。排查同端接收侧OTU告警及性能事件是否有类似性能
10、上报分离故障原因是合路信号还是单波信号。通过网管查询各检测点光功率。(告警性能分析法、测试法、替换法)3、以上方法皆不能排除,考虑逐段环回定位到单板。(环回法)故障类型故障类型原因原因外部原因尾纤衰耗过大(弯曲、挤压、绑扎连接头脏) 尾纤连接错误 线路性能劣化 设备原因OTU单板失效或性能劣化 光放大板失效或性能劣化 责任就是成就责任就是成就Page 29光功率异常光功率异常 某日维护人员寻检发现OTM2站点NE816网元4-LWF有大量的FEC纠错事件产生,并且数量不断累加,相应单板没有告警及误码上报。OTM1OTM2OADM站点 A站点 B站点 C责任就是成就责任就是成就Page 30光功
11、率异常光功率异常 故障处理步骤故障处理步骤查询NE816-4-LWF接受端光功率为-14.6dBm趋进输入下门限-16dBm。查询接收端其他OTU光功率都偏低,但没有FEC纠错出现。可能是合路信号问题,查询收端OAU光功率,发现PA模块输入功率过小,通过测量对比发现PA前端光纤老化衰减过大导致故障产生。更换光纤故障解除。责任就是成就责任就是成就Page 31误码问题误码问题 故障分析故障分析误码问题是故障处理之中最难处理的一类告警:告警:B1_EXC, B2_EXC, B1_SD, 和 B2_SD 告警,BEFFEC_EXC 和 BEFFEC_SD 告警性能事件:性能事件:RSBBE, RSE
12、S, RSSES, RSUAS 和 RSCSES ,MSBBE, MSES, MSSES, MSUAS,和 MSCSES责任就是成就责任就是成就Page 32误码问题误码问题 定位技巧定位技巧1、判断误码涉及的通道、判断误码涉及的通道 2、巧用、巧用B1字节字节3、替换法、替换法所有通道出现误码所有通道出现误码个别通道出现误码个别通道出现误码如果系统仅单方向出现误码,而另一方向没有出现误码,建议采用替换法如果系统仅单方向出现误码,而另一方向没有出现误码,建议采用替换法 。 替换的对象可以是光纤,替换的对象可以是光纤,OTU单板或光放大板等等。单板或光放大板等等。DWDM 侧客户端OTUOTUB
13、1字节检测AB DWDM 侧OTUOTUB1字节检测Page 33误码问题 故障排除分析步骤故障排除分析步骤1、排除外部原因如设备温度过高,及接地问题2、逐一排查设备系统原因 光功率大小和平坦度 信噪比OSNR 中心波长漂移(频偏) 非线性效应3、通过环回定位到硬件单板通过性能事件来查看光功率和其它指标,比较标称值进行在线测量,可以测试出平坦度、频偏和信噪比 通过单站信噪比低并不能完全说明问题,最后要通过替换法来解决问题,而且需要观察很长一段时间才能最终确定问题解决。误码数量随机变化不恒定,提高发送光功率,查看接收端的误码情况,如果误码减少,原因是光功率,如果误码没有显著减少,那么就可能是色散
14、。 责任就是成就责任就是成就Page 34误码问题误码问题 某日维护人员发现NE812-4-LWF有误码持续出现。责任就是成就责任就是成就Page 35误码问题误码问题故障处理l本端及对端光功率皆正常;l长时间在线测试OSNR及波长漂移也正常;l采用逐段环回定位为OTU故障,更换解决。Page 36业务瞬断 故障分析及技巧故障分析及技巧 1、排除波分侧以外的问题,如SDH信号问题。 2、检测设备内部线路是否存在故障。 3、检查设备硬件是否存在故障。 业务瞬断是指信号在传输过程出现了秒级的瞬间信号丢失现象业务瞬断是指信号在传输过程出现了秒级的瞬间信号丢失现象 业务瞬断对话音业务影响不大,但是对数
15、据业务的影响很大业务瞬断对话音业务影响不大,但是对数据业务的影响很大 故障类型故障类型原因原因线路原因光纤中断或光纤性能劣化 设备原因单板故障或单板上光模块接触不良 监控通道和主光信道同时出现R_LOS告警 监控通道业务没有出现R_LOS告警,但主光信道双向出现R_LOS告警 监控通道业务没有出现R_LOS告警,但主光信道单向出现R_LOS告警 按照信号流的方向,依次检查各点信号是否有光功率 跳变和瞬断 责任就是成就责任就是成就Page 37业务瞬断业务瞬断 某日网管工程师发现设备业务出现瞬断,对应36波出现R_LOF及R_OOF告警。责任就是成就责任就是成就Page 38业务瞬断业务瞬断 故
16、障处理故障处理l利用告警性能分析法可知,随着NE816-4-LWF客户接收端RX产生OOF对应对端NE812-4-LWF产生OOF及误码;l定位为客户侧SDH设备问题或光纤问题;l对端OptiX 10G交叉板问题。Page 39业务中断 故障分析故障分析根据紧急故障处理流程进行操作先将业务导到冗余的通道上,在进行分析查询各检测点的性能时间及光功率值结合测试法、替换法、环回法进行处理故障类型故障类型原因原因提示提示外部原因电源故障环境异常(温度、湿度)光纤或接头异常 设备出现R_LOS、R_LOF、R_OOF等告警时,说明业务已经中断 设备硬件单板性能劣化或失效 光功率异常光功率异常导致业务中断
17、 误码误码过多导致业务中断 设备对接DWDM设备和其它设备对接异常 Page 40业务中断 某日维护人员发现OTM1站点28波业务中断,出现紧急告警。Page 41业务中断 故障处理步骤 1、此时检查本端LWF单板的性能事件,看是否异常Page 42业务中断2、 查看本端OAU性能是否正常Page 43业务中断3、对端OBU及LWF性能Page 44业务中断 利用告警性能分析法,分析本端OAU及对断OBU、LWF皆正常,怀疑接入 LWF的光纤故障或LWF单板故障; 利用测试法测试LWF收端光功率正常,光纤无故障,更换LWF问题解决。责任就是成就责任就是成就Page 45业务中断业务中断 814
18、站点及816站点多条业务中断,所在OTU上报R-LOS告警。责任就是成就责任就是成就Page 46业务中断业务中断 故障分析故障分析从告警可知合路信号中断,故障点在813站点的OAU板查看OAU性能事件,可知OAU中PA模块良好,BA模块输入为零,可能电可调衰减失效导致故障更换OAU故障解决责任就是成就责任就是成就Page 47ECCECC故障故障 某日发现网络中,OADM站点及后续站点无法登陆。OTM1OTM2OADM站点 A站点 B站点 C责任就是成就责任就是成就Page 48ECCECC问题问题 故障处理故障处理检查相应的配置,查看DCN视图及维护日志,无异常;复位OADM站点NE814-7-SCC,故障消失,恢复登陆。Page 49其它问题故障MR2 connection故障类型故障类型原因原因参数设置硬件配置不合理参数设置错误网管参数设置与硬件不匹配仪表测试仪表未接地测试用尾纤弯曲、连接器不清洁仪表设置不当测试方法不当l 硬件配置l 单板升级l 参数设置l 仪表测试l 远程维护