1、Network Optimization Expert Team常见故障处理流程和案例Network Optimization Expert Team本章学习目标 掌握故障处理流程 掌握故障处理的方法,能解决一些常见故障Network Optimization Expert Team提纲 故障处理流程故障处理流程 故障处理方法 故障分类 故障案例Network Optimization Expert Team故障排除的一般步骤Network Optimization Expert Team故障处理基本原则观察 维护人员到达现场后,首先应仔细查看设备的故障现象,包括:设备的故障点、告警原因、严重
2、程度、危害程度。询问 询问相关操作人员,是否有直接原因导致此故障。查询清楚设备的历史操作、历史告警等。思考 根据现场查看的故障现象和询问的结果,结合自己的知识进行分析,进行故障定位,判断故障点和故障原因。动手 根据前三个步骤,采取相应的操作,例如修改配置数据、更换单板等。Network Optimization Expert Team提纲 故障处理流程 故障处理方法故障处理方法 故障分类 故障案例Network Optimization Expert Team故障定位 故障原因 工程问题 外部原因 硬件问题 人为故障 版本问题 设备对接问题 Network Optimization Exper
3、t Team故障处理方法 常用故障定位方法 观察分析法 测试法 替换法 配置数据分析法 更改配置法 仪表测试法 经验处理法作为故障处理人员,须掌握EPON原理,熟悉设备硬件和组网结构,掌握基本维护操作。Network Optimization Expert Team 故障处理注意事项处理过程中如遇到难以定位解决的问题,需尽快联系厂家进行处理。在紧急故障处理时,要及时、准确记录必要的信息和处理步骤,以供后续分析故障原因所用;需要收集的信息包括:1版本信息,包括系统软件的版本,ONU版本,相关单板版本。2提供现场设备的组网图,且特别说明上联口的情况,光口还是电口,半双工还是全双工,自适应还是强制方
4、式;VLAN划分情况,tagged还是untagged。3描述设备基本配置情况,包括ONU数目,单板类型和数量,VLAN划分,端口tag方式。4详细描述故障现象。5提供相关的告警。Network Optimization Expert Team提纲 故障处理流程 故障处理方法 故障分类故障分类 故障案例Network Optimization Expert Team故障分类 网管类故障 网管ping不通网元 网管能ping通网元,但通过NetNumen管理不到 能管理到,但有些功能使用不正常 业务类故障 所有业务全断 上网速度慢或掉线Network Optimization Expert Te
5、am网管不通时的检查步骤 带外网管:检查网线。检查IP地址设定是否正确。带内和带外网管的IP不能设置在同一个IP地址段 arp内容错误,用ARP D清除arp条目。带内网管:在带外基础上,进一步检查网管VLAN配置Network Optimization Expert Team网管个别菜单无法执行时处理步骤 检查网元版本和网管版本。版本不匹配会出现操作不正常。通过人机命令执行相应的命令,看是否能执行成功。是否操作动作太快,内部处理忙,等一段时间再试。如果是ONU远程管理操作相关命令,确认ONU型号和版本是否支持相应功能。如果ONU支持不同工作模式,检查ONU的工作模式,必要的话重新设置工作模式
6、。重启OLT或相应PON板、网管,看是否能正常。(会造成所有业务中断,需慎重操作)Network Optimization Expert TeamONU无法注册的检查步骤(一)查看PON口工作状态,看是否打开;用光功率计测试光功率。用人机命令查看ZXAN#show onu unauthentication epon-olt_0/5/1(显示相关PON口下未注册认证的ONU)看是所有ONU都无法注册还是个别ONU的问题。查看事件和告警,看是否有异常。在局端PON口直接连ONU,看能否搜索到;注意如果PON口直接连ONU时,可能光功率过强,可以将光纤略为拔出一点。Network Optimizat
7、ion Expert TeamOLT的PON口插入10KM光模块,其输出光功率范围:+4.0-+1.0dB。进入ONU的光功率需控制在-23dB 以上;低于-23dB,网络稳定性变差。Network Optimization Expert TeamONU无法注册的检查步骤(二)接到其它槽位或PON口上,看是否能搜索到。更换ONU,看是否ONU的问题。更换光纤分支,看是否光纤问题。检查OLT和ONU版本是否太老,升级到最新版本。检查EPFC板管理的ONU类型是否设置正确。Network Optimization Expert TeamEPON工程光功率标准 C220光功率光功率:接收:-6-27
8、db 发送:+2+7 终端光功率终端光功率:接收:-8-24 发送:-1+4 插损插损分光器插损:1:2大约3db,每增加一倍增加3db法兰引入插损:0.5db/个熔接头引入插损:0.1db/个 光纤衰减光纤衰减下行 1490nm 光纤衰减系数0.36db/km上行1310nm 光纤衰减系数0.42db/kmNetwork Optimization Expert Team无法上网时的检查步骤(一)首先在ONU管理界面中检查ONU是否能正常注册。如果无法正常注册,请测量ONU接收的光功率,检查光路是否有问题。查看地址表,分析包的转发情况,看是在哪个环节不通 如果可以注册,仍然无法上网,检查OLT
9、和ONU上的VLAN配置是否正确。检查带宽是否设置是否太小,如果太小,改成100M以上试试;将交换板上空余的以太网端口以untag方式加到业务VLAN中,PVID值修改成对应的VLAN号,然后在端口上接一台电脑,测试是否能上网。Network Optimization Expert Team上网速度慢或掉线的检查步骤(一)检查带宽设定是否过小,上行和下行带宽都配大点,例如将上下行都按以下设置:最大带宽设置为100000Kbps,保证带宽设置为50000Kbps,突发包设置为180000。然后看是否正常。检查是否所有VLAN内的PON口都配置成了TAG方式。检查告警记录和通知消息内,是否有ONU
10、掉线的记录,如果有,在PON口直接接一台ONU(光纤拔出一点,否则光功率过强),注册通过后,查看是否还频繁掉线,通过这样判断是否光网络问题。Network Optimization Expert Team上网速度慢或掉线的检查步骤(二)可在交换板上空余的端口接一台电脑,数据按上面介绍的配置,然后测试上网是否正常。如果也不正常,将下连的PON口光纤都断开,再测试是否正常。如果仍然不正常,检查上联网络的问题,看是否丢包。如果ONU下连接的是局域网或多根网线,可断开后单独接一台电脑测试,排除局域网问题。Network Optimization Expert TeamEPON业务不通(一)故障现象 P
11、PPOE拨号无应答可能原因 ONU没有注册上 ONU为开通 ONU用户端口/OLT上联接口连接状态异常 ONU用户端口/ONU虚端口/OLT上联口VLAN配置错误 DBA算法或者带宽参数配置错误 MAC地址/IP地址冲突 网络中存在环回 MAC地址/IP地址被绑定 ACL设置有问题Network Optimization Expert TeamEPON业务不通(二)处理建议 查看接口状态,看是否用户口或者上联口端口是DOWN的 查看ONU状态,看ONU注册上并且认证通过 查看地址表,分析包的转发情况,看是在哪个环节不通 检查VLAN的配置,看和业务规划情况以及MAC地址学习情况是否一致 查看接
12、口统计,看接口进出流量,看广播包和组播包增长情况是否正常 检查带宽配置,将带宽调大看看.如果有空闲的上联电口,在该端口上配置default vlan,接计算机测试上联网络是否正常.如果无法上网,可能是上联网络出了问题。请检查上联口的端口状态,并检查上联交换机VLAN配置是否正确等。如果可以上网,说明上联网络没有问题,在PON口直接接一台新的ONU,注册通过后,设置好ONU的VLAN号,然后测试是否能上网。如果局端单独接一台ONU可以上网,再将网络中的ONU一个个接上,看是不是某一设备接上就有问题;如果某ONU下连接的是局域网或多根网线,可断开后单独接一台电脑测试,排除局域网问题。Network
13、 Optimization Expert TeamEPON业务时通时不通 处理建议 检查ONU状态,看ONU是否不稳定 查看MAC地址表,看是否存在MAC地址迁移,如果有的话,检查地址表中转发端口和实际的设备连接关系是否一致.查看接口流量统计,看是否存在流量异常,对比带宽配置看是否满足流量要求 在不同环节截包,分析业务包中的交互关系是否正常.Network Optimization Expert Team业务丢包(一)故障现象:上网速度慢或掉线可能原因:光路质量差,误码引起丢包 上联光口时钟超标,引起丢包 带宽配置满足不了业务流量丢包 部分业务的突发特性过强引起业务丢包 以太网电口速率模式设置
14、不合适一端为全双工一段为半双工引起丢包 网络中VLAN规划或者配置不合理造成洪泛引起丢包 网络中存在环路形成广播,组播风暴引起丢包Network Optimization Expert Team业务丢包(二)处理建议 查看接口统计,看错包计数是否有增长 查看告警和事件记录,看是否有误码告警 查看接口流量统计,看是否存在流量异常,对比带宽配置看是否满足流量要求 在不同环节截包,看广播包,组播包和未知目的地址的单播包的源头Network Optimization Expert Team提纲 故障处理流程 故障处理的思路和方法 故障分类 故障案例故障案例Network Optimization Ex
15、pert Team案例1(业务类):故障现象:故障现象:上网速度慢故障处理过程故障处理过程:l检查网络配置:OLT通过EC4GM第3口电口连接到百兆光电转换器,通过局方的光纤上网。OLT的EPFC的PON口出光纤直接连接到D400终端。l将EC4GM的第四个电口配置在同一VLAN内,接PC,下载速度可以达到2-3MB/s。l当在网管上把ONU上下行速度改成100Mbit/s,在D400的LAN口(确认是100M全双工)下载,速度只有130KB/s。l分光器到货后,在OLT和D400之间加上1:32的分光器再同样测试速度可以达到2-3MB/s。故障原因分析故障原因分析:l从PON口用光纤直接连接
16、ONU,光功率过强,影响传输速率。Network Optimization Expert Team案例2(业务类):故障现象:故障现象:ONU无法注册无法注册故障处理过程故障处理过程:l检查配置,没有问题。l用仪器测量光功率,发现注册不上的ONU处的光功率很小,已经低于最小值。l检查光纤线路,发现办事处把2个16路的分光器串联在一起了,衰减过大,所以功率不够,导致注册不上来。故障原因分析:故障原因分析:l衰减过大,光功率太低。Network Optimization Expert Team案例3(业务类):故障现象:每次设备断电后,故障现象:每次设备断电后,ONU 必须重新认证必须重新认证故障
17、处理过程故障处理过程:l从故障现象来看,ONU的认证信息保存有问题。l将数据保存后,再次测试,故障解决。故障原因分析故障原因分析:lONU的认证信息没有保存。Network Optimization Expert Team案例4(业务类):故障现象故障现象EPON用户出现许多用户同时反映Internet业务中断的报告,无法上网。故障处理过程故障处理过程 此EPON下的所有用户的Internet业务都已经中断 查看发现第一个光口的ACT1灯已经熄灭;由于第2个光口空闲,将第2口的光模块拔下换到第1口,ACT1灯亮起并闪烁 故障原因故障原因 光口吊死Network Optimization Exp
18、ert Team案例5(业务类):故障现象故障现象某公司用户反应宽带上网不正常。某公司用户反应宽带上网不正常。处理过程处理过程 到到OLT处在处在EC4GM板第四口开启板第四口开启VLAN 3918,测试上网正测试上网正常常;自己在ONU下测试上网下载均正常 经过防火墙以后不正常,确认为用户使用的防火墙故障 故障原因故障原因用户端防火墙故障Network Optimization Expert Team案例6:F401流量故障 问题描述 F401下某用户在下载的时候,发现开始流量正常,然后一直下降,到中断。然后马上恢复流量,又开始下降到中断。如此反复。分析及处理 现场自行测试,确实存在这种问题
19、。更换F401也是故障依旧,光功率也正常。并且同PON下不止一个ONU存在这种问题。同PON下多个用户有此种问题,从现象上来看,有可能是PON口的问题造成。从OLT上看,MAC地址都能正常透传。查看流量,统计流量也基本正常。无意中查询EC4GM上gei端口流量,发现上联口做TRUNK。其中一个端口无任何流量。到机房查看,发现此端口指示灯忽闪忽灭。将此端口shutdown,发现业务正常。经测试,此端口正常。最后排查,乃OLT对端HW的8512上的端口问题造成。Network Optimization Expert Team案例7:EPON数据流环回问题。问题描述某局13端F820在割接后发现,8
20、20业务很不稳定,主要表现是大部分用户拨号难,而且存在拨号上网后会掉线的现象。分析及处理1)我们先是在C200的EC4GM上开了一个端口,用网线直接连PC上网,测试正常,说明上联的交换机和BAS是没有问题的。2)在业务空闲的凌晨,断开PON口的光纤,直接连一台F820,在F820上测试业务,也正常。3)怀疑是环境的问题(光缆或光分路器的问题),于是拿一台F820在小区绕过光分路器直接连到PON板到小区的光纤上,测试业务,也正常;接上原有的光分路器并断开其它F820的光纤后,业务也正常。Network Optimization Expert Team案例7:EPON数据流环回问题4)开始怀疑是F
21、820之间互相影响的结果。5)登录到每一个F820上显示MAC地址时,发现许多的F820上有相同的MAC地址出现,说明出现了MAC地址环回(漂移)。6)关闭出现相同MAC地址的端口,随后发现这些MAC地址又出现在其它的F820上。7)和用户一起检查原来的组网,结果发现了一个严重的问题:该小区替换之前的小区二层交换机之间有些是用网线级连在一起的,而割接以后,这些级连的网线没有拆除,外线人员把每一个站点原有的网线(大部分是到用户家里的,只有一根是用于交换机之间级连的)全部都接到了F820上,这样本来星形组网的F820这时候就成了环形组网,就造成了数据流的环回。总结:如果用总结:如果用EPON设备替
22、换原有的二层交换机,要特别注设备替换原有的二层交换机,要特别注意清理原有的网线,避免造成环回。意清理原有的网线,避免造成环回。Network Optimization Expert TeamPPPOE协议拨号-678错误代码解释【678错误错误】无法连接到远程计算机,远程计算机无无法连接到远程计算机,远程计算机无响应。响应。问题分析:问题分析:不能连接到BRAS(PPPOE接入服务器),可能是从用户端一直到BRAS服务器整个链路中的某一个环节连接不通。解决方法:解决方法:1)检查MODEM是否与局端设备同步上、网卡是否工作正常;2)网络线路(电话线、网线)是否正常连接。Network Opti
23、mization Expert TeamPPPOE协议拨号-691错误代码解释【691错误】由于域上的用户名或密码无效而拒绝访问。错误】由于域上的用户名或密码无效而拒绝访问。问题分析:问题分析:1)可能是用户名密码输入错误。2)上次的拨号连接非正常断线导致服务商后台系统没有收到用户下线信息而没有在用户在线表中将用户删除,造成BRAS认为你的帐号重复拨号。3)该帐号因为欠费、宽带到期,帐号被锁。4)BRAS将此帐号挂死;解决方法:解决方法:1)首先确认用户名、密码是否输入错误,请检查用户名和密码的拼写及大小写;2)等待几分钟或者重启ADSL Modem后再进行拨号;3)致电服务商确认宽带是否欠费
24、;4)联系服务商;Network Optimization Expert TeamPPPOE协议拨号-619错误代码解释【619错误】无法连接到指定的服务器,用于错误】无法连接到指定的服务器,用于此连接的端口已关闭。此连接的端口已关闭。问题分析:问题分析:由于上次的连接出错,且重拨间隔时间过短,造成服务器对您的用户名和密码来不及响应。解决方法:解决方法:建议您间隔一到二分钟后重试。Network Optimization Expert TeamPPPOE协议拨号-769错误代码解释【769错误】无法连接到指定目标。错误】无法连接到指定目标。问题原因:问题原因:电脑的网络连接设备有问题。解决方法
25、:解决方法:打开“我的电脑”“控制面版”“网络连接”,查看本地连接的是否处在“禁用”状态,如果是,双击“本地连接”,将其启用。若是无法找到“本地连接”,重新安装网卡驱动程序。Network Optimization Expert TeamPPPOE协议拨号-718错误代码解释【718错误】验证用户名时远程计算机超时没有错误】验证用户名时远程计算机超时没有响应,断开连接。响应,断开连接。问题分析:问题分析:为局端宽带服务器故障(可能为局端的radius、接入服务器故障引起)。解决方法:解决方法:请等待一段时间后再拨号,如果仍不行,联系服务商。Network Optimization Expert Team谢谢 谢谢