1、Page 1l学习完此课程,您将会:掌握物理层故障排除方法掌握以太网故障排除方法Page 2第第2章章 端口协商以及自环问题端口协商以及自环问题第第3章章 VLAN问题问题第第4章章 以太网故障排除以太网故障排除第第5章章 以太网典型案例分析以太网典型案例分析Page 3物理层故障排除综述(1)l从广义的角度来看,以太网的物理层故障包括以太网交换机本身的硬件故障和连接交换机的物理线路故障l借助设备接口指示灯的状态进行初判 LINK灯灭表示线路没有连通,灯亮表示线路已经连通ACTIVE灯灭表示没有数据收发,灯闪烁表示有数据收发l采用替换法进行判断包括线路、电缆和光纤、板卡、槽位、整机,调换线路收
2、发 l在交换机上配置接口环回进行判断设置以太网端口进行环回测试:loopback external|internal l设备接口之间的工作速率、工作方式(半工/双工)、帧格式协商和匹配问题也会导致现象表现为物理层故障Page 4物理层故障排除综述(2)l设备本身的硬件故障一般包括:设备本身的硬件故障一般包括:接口或者设备硬件损坏;接口Bootrom或者VRP软件版本不正确或者不配套;光模块接口类型不正确;用户PC网卡故障或者配置不正确。l线路故障一般包括:线路故障一般包括:网线或者光纤线路本身物理损坏;网线类型错误(支持MDI/MDI-X自适应除外)或者光纤收发连接不正确;中间传输设备(光电转
3、换器,线路转换器等)故障或者工作不正常;接口线缆所支持的最大传输长度、最大速率等超出使用范围。Page 5常用物理层相关命令 l端口信息显示命令:端口信息显示命令:display interfacelQuidway display interface ethernet0/1lEthernet0/1 current state:UPlIP Sending Frames Format is PKTFMT_ETHNT_2,Hardware address is 00e0-fc00-0010lDescription:aaalThe Maximum Transmit Unit is 1500lMedia
4、 type is twisted pair,loopback not setlPort hardware type is 100_BASE_TXl100Mbps-speed mode,full-duplex modelLink speed type is autonegotiation,link duplex type is autonegotiationlFlow-control is not supportedlThe Maximum Frame Length is 1536lBroadcast MAX-ratio:100%Page 6常用物理层相关命令l端口信息显示命令:端口信息显示命令
5、:display interfacelPVID:1lMdi type:autolPort link-type:accessl Tagged VLAN ID:nonel Untagged VLAN ID:1lLast 5 minutes input rate 229 bytes/sec,2 packets/seclLast 5 minutes output rate 25 bytes/sec,0 packets/seclinput:0 packets,0 bytesl 0 broadcasts,0 multicastsl input:0 input errors,0 runts,0 giants
6、,0 throttles,0 CRCl 0 frame,0 overruns,0 aborts,0 ignored,0 parity errorsl Output:0 packets,0 bytesl 0 broadcasts,0 multicasts,0 pausesl Output:0 output errors,0 underruns,0 buffer failuresl 0 aborts,0 deferred,0 collisions,0 late collisionsl 0 lost carrier,0 no carrier Page 7案例1:路由器相连设备故障导致路由器无法启动
7、l同轴电缆通过一个转接头连接到同轴电缆通过一个转接头连接到RouterB的串口。在路由器的启动过程的串口。在路由器的启动过程中,通过中,通过Console口与口与RouterB相连接的相连接的PC的超级终端上没有任何显示。的超级终端上没有任何显示。路由器各面板灯显示正常。路由器各面板灯显示正常。CC08交换机DTUDTU同轴电缆DDN专线RouterARouterBPage 8案例1:路由器相连设备故障导致路由器无法启动l可能原因分析路由器没有正常起动 路由器本身是故障的;所提供的电源不符合要求;电源线有问题。路由器正常起动但是没有在超级终端上显示 超级终端各参数设置错误;配置电缆故障。Pag
8、e 9案例1:路由器相连设备故障导致路由器无法启动l处理过程处理过程用同一根配置电缆连接到另一台路由器上,超级终端上正常显示。至此定位为路由器没有正常起动。更换路由器,电源线不换,超级终端上正常显示,至此排除电源和电源线的问题,定位为路由器本身或与之相连的设备故障。把与路由器相连的所有不必要的设备拔掉,再起动路由器,发现路由器能够正常起动,超级终端输出正常。定位为路由器相连设备故障导致路由器无法正常起动。一个一个地插上其他设备,发现插上转接头后路由器无法正常起动,更换转接头,路由器正常起动。l建议与总结建议与总结Page 10案例2:电源接地不好导致路由器通信不畅通l现象描述现象描述某局组网如
9、下:变电所A使用Quidway R4001E路由器通过E1链路和中心局的Quidway R3680 路由器组网。R4001E路由器电源连接一个UPS设备以保证不断电。故障现象如下:从R4001E向R3680发送Ping包,丢包率达到30%-40%。R4001E的E1接口的R-LOS灯不断闪烁。通过console口登到R4001E,接口调试显示路由器E1接口不断在Down和Up间转换状态。Page 11案例2:电源接地不好导致路由器通信不畅通l可能原因分析可能原因分析本端路由器硬件故障;对端路由器硬件故障;传输线路故障;软件配置错误;其他原因。l处理过程处理过程硬件故障检查,将两端的路由器分别在
10、本地与其他路由器进行背靠背检测,发现路由器工作正常。将连接R4001E的E1电缆在路由器侧硬件自环,对端使用误码仪测线路质量,两小时误码为零。说明传输线路正常。Page 12案例2:电源接地不好导致路由器通信不畅通l处理过程处理过程仔细检查两端的路由器配置,没有错误。那么可能还会是什么原因呢?由于感觉路由器外壳电压高,首先检查路由器接地电压,经测量,发现路由器侧保护地到公共地排电压差竟高达110V。再仔细排除,定位问题为UPS设备电源有电压泄漏现象,在UPS设备外壳接一电线连接到地排后,路由器工作正常。l建议与总结建议与总结路由器上电启动进行数据配置前,进行如下检查 路由器周围是否有足够的散热
11、空间?所接电源是否与路由器要求电源一致?路由器地线是否连接正确?路由器与配置终端等其他设备的连接关系是否正确?Page 13案例3:RS232线序错误造成路由器异步串口与ATM取款机无法连通 l现象描述现象描述某银行采用华为公司路由器通过异步串口与ATM取款机相连无法连通。使用Show interface命令,发现该串口处于down状态。l可能原因分析可能原因分析双方的介质的连接问题两端的接口问题l处理过程处理过程检查转接线的连接关系,确定线序接反,修改后可正常通信 l建议与总结建议与总结转接线多数是现场制作的,必须保证制作线的连线顺序正确。Page 14案例4:V.35 DTE/DCE电缆问
12、题l现象描述现象描述Quidway R2501路由器同帧中继交换机直连(路由器端采用V35 DTE电缆),因帧中继交换机侧的端口类型为15针串口,故需采用一段转接线才能同2501路由器互连,之后采用了一段两端物理接口都符合对接要求的电缆线(设备自带的V35DTE电缆),完成了两台设备的物理对接。通过show interface s0命令查看,发现物理层已经UP配置了链路层帧中继协议后,通过show interface s0命令查看发现链路层协议始终处于DOWN状态。Page 15案例4:V.35 DTE/DCE电缆问题l可能原因分析可能原因分析双方链路层数据配置有误。此时,需要路由器端设置为D
13、TE,帧中继交换机端设为DCE;设备端口故障;两类设备的互通性存在问题;物理连线有问题。l处理过程处理过程首先怀疑双方的有关链路层数据配置有误,是否双方各设置为DTE,DCE模式,经检查无错误之处。Page 16案例4:V.35 DTE/DCE电缆问题l处理过程处理过程两端设备都更换了不同端口进行测试,故障依旧。检查线缆,发现帧中继交换机提供的转换电缆,虽物理接口相同,但存在DTE,DCE之分,现行组网中帧中继交换机作为DCE设备使用,而我们采用了DTE类型的转接线,故出现了如上故障。把DTE类型转接电缆更换为DCE类型转接电缆 l建议与总结建议与总结当路由器采用广域网协议进行对接时,往往存在
14、DTE,DCE设备之分,不同的设备类型其电缆连接线也存在差异(物理接口并无差别),需正确选择。Page 17软件升级方法lBootrom升级通过计算机串口XModem协议进行升级 lVRP主机软件升级通过计算机串口XModem协议进行升级通过TFTP加载文件进行升级通过FTP加载文件进行升级 lBootrom软件与VRP主机软件关系Page 18案例1:TFTP升级问题l选择下载网口R26xx系列路由器必须选择Ethernet0作为下载网口;R3640路由器以0、2、1、3的槽位顺序查找,找到的第1个槽位的0号以太网接口作为下载网口;R3680路由器以0、2、4、6、1、3、5、7的槽位顺序查
15、找,找到的第1个槽位的0号以太网接口作为下载网口。lPC(TFTP服务器)与路由器直连,按照提示进行升级。注意,随后输入的TFTP服务器地址后面不能有空格。Page 19案例2:VRP主机软件通过TFTP升级失败 l在用TFTP方式对Qiudway R3640进行升级至VRP1.5.6版本,在启用TFTP软件程序,确认进行TFTP方式进行升级后,TFTP无进程显示,无法进行升级。l原因分析原因分析 升级版本不配套;路由器上设置的TFTP服务器的IP地址不正确;其他原因。Page 20案例3:VRP主机软件通过TFTP升级失败l处理过程处理过程升级版本VRP1.5.6与路由器的BootRoM版本
16、配合无问题;在升级界面上对“IP address of the TFTP Boot server to boot from?10.110.200.1”一项进行检查,没有错误;发现VRP1.5.6文件置于4级目录下,将其移到根目录下,结果升级成功。l建议与总结建议与总结将版本文件放在根目录下,使文件的目录简单,防止目录复杂导致无法顺利升级。Page 21内存升级指导l中低端路由器内存配置中低端路由器内存配置Pentium CPU:R3680缺省配置64M,其他型号32M;Motorola CPU:R2600系列包括R2630E、2631E均为64MB;R2620、2621为32MB;R3640E
17、、3680E为128MB。l内存最大配置内存最大配置R2620/2621路由器:有一个内存插槽,可以配置的内存是32MB、64MB或128MB,最大配置是128MB;R2600/3600系列路由器:有两个内存插槽,支持32M+32M,64M+64M配置,不支持32M+64M,因此最大配置是128MB;R2600E/3600E:有两个内存插槽,支持的最大内存配置是128MB+128MB,因此最大配置是256MB。Page 22某些特性对内存的要求 l路由器中主要是路由特性和路由器中主要是路由特性和NAT特性与内存关系最密切特性与内存关系最密切 当路由表条目在2000条以内,需要32M内存;当路由
18、表条目在10000条以内,需要64M内存;当路由表条目在30000条以内,需要128M内存;NAT支持的连接数在1700条以内,需要32M内存;NAT支持的连接数在8000条以内,需要64M内存;NAT支持的连接数在20000条以内,需要128M内存。Page 23第第1章章 物理层故障物理层故障第第3章章 VLAN问题问题第第4章章 以太网故障排除以太网故障排除第第5章章 以太网典型案例分析以太网典型案例分析Page 24端口协商以及自环故障排除综述 l中低端交换机上常见的接口大致分类中低端交换机上常见的接口大致分类 按工作速率有:10M,10/100M,100M,10/100M/1000M
19、,1000M;按工作方式有:全双工,半双工;按接口类型有:电接口,光接口(多模,单模10Km,单模中距40Km,单模长距70Km),堆叠模块。l两端设备端口工作方式等参数的匹配问题两端设备端口工作方式等参数的匹配问题 大多数端口都支持工作参数自动协商功能;有时候由于设备之间协商能力不强或两端设备默认的参数配置不相同导致端口协商不通过,端口工作异常,此时就需要对端口的参数进行手工调整和设置,保证双方参数一致;在Quidway S3026和S2016/S2008交换机上,支持环路检测功能(Loopback-Detection)。Page 25常用的端口配置命令(1)l设置以太网端口速率设置以太网端
20、口速率 设置百兆以太网端口的速率:speed 10|100|auto 设置千兆以太网端口的速率:speed 10|100|1000|auto 百兆以太网电端口支持10Mbit/s、100Mbit/s或自协商工作速率,可以根据需要对其设置。百兆以太网光端口支持100Mbit/s速率,可以设置为100(100Mbit/s)和auto(自协商)。千兆以太网端口可以设置为1000(1000Mbit/s)和auto(自协商)。1000Base-T以太网端口支持10Mbit/s、100Mbit/s、1000Mbit/s三种速率,可以根据需要选择合适的端口速率。但当双工状态设置为半双工模式后,就不能设置为1
21、000Mbit/s速率。Page 26常用的端口配置命令(2)l设置以太网端口网线类型设置以太网端口网线类型 mdi across|auto|normal 该设置只对10/100Base-T、1000Base-T端口有效。l设置以太网端口的链路类型设置以太网端口的链路类型 设置端口为Access端口:port link-type access 设置端口为Hybrid端口:port link-type hybrid 设置端口为Trunk端口:port link-type trunkl其他接口显示命令其他接口显示命令 显示端口的所有信息:display interface 显示Hybrid端口或T
22、runk端口:display port hybrid|trunk 清除以太网端口的统计信息:reset counters interfacePage 27ADSL用户上网异常问题处理l现象描述现象描述 组网如图所示,用户反映上网速度慢,有时打开网页时没有响应。从外网Ping网络中的某台S3026管理IP地址,发现有如下奇怪Ping包:Ping 11.11.10.117:56 data bytes.Reply from 11.11.10.117:bytes=56:icmp_seq=0 ttl=64 time=16 msReply from 11.11.10.117:bytes=56:icmp_s
23、eq=0 DUP!ttl=64 time=33 msReply from 11.11.10.117:bytes=56:icmp_seq=0 DUP!ttl=64 time=33 msReply from 11.11.10.117:bytes=56:icmp_seq=0 DUP!ttl=64 time=50 msReply from 11.11.10.117:bytes=56:icmp_seq=0 DUP!ttl=64 time=50 msReply from 11.11.10.117:bytes=56:icmp_seq=4 ttl=64 time=0 ms5 packets transmitt
24、ed,5 packets received,+4 duplicates,0%packet loss 正常情况应该是回五个Ping,现在却多出四个DUP重复数据包!Page 28ADSL用户上网异常问题处理l信息收集信息收集 可以接收到Ping响应报文,说明网络是通的,但由于多接收到重复数据包,可能是由于网络环路造成。用display loopback-detection察看端口环回检测信息如下:Quidway display loopback-detection Loopback-detection is running Detection interval time is 30 second
25、s Following Port(s)has(have)loopback link:Ethernet0/1 说明E0/1接口连接的网络有环路存在。Page 29ADSL用户上网异常问题处理l处理过程处理过程 检查交换机连线确认为树型结构。因为S3026的新版本增加端口loopback-detection功能,当检测到端口所连接的网络有环路时将该端口处于受控状态,如环路解除,还能自动打开端口。可以使用该功能用来检测环路。将友商DSLAM下面的用户线依次断开,同时用display loopback-detection显示是否有环路。查到某个线路问题后,到用户家检查MODEM配置发现配置了两条相同的
26、PVC,导致形成环路。在该网络中最后查出有四个同样故障的MODEM。修改配置后Ping包恢复正常。Page 30端口配合导致的S3026光模块指示灯不亮问题 l现象描述现象描述 组网:MA5203通过百兆光纤连接S3026百兆多模光模块,S3026下面接入上网用户。故障现象:光纤正常连接后发现S3026光模块Link指示灯不亮,用display interface命令查询e1/1接口状态发现Ethernet1/1 is down。Page 31端口配合导致的S3026光模块指示灯不亮问题 l原因分析原因分析 物理线路问题。调换光纤、改变光纤收发操作,发现指示灯还是不亮。用一个带光模块的S240
27、3F进行替换,连接到光纤发现S2403F工作正常,在S2403F下面可以正常上网,说明物理线路没有问题。设备或者光模块问题。因光路没问题故怀疑S3026的光模块或者SLOT 1插槽有故障,通过替换另一台正常的S3026连接光纤,发现光模块LINK指示灯还是不亮,排除了设备和光模块问题。设备间接口参数协商问题或者接口工作参数不匹配。使用display interface命令详细查看接口参数,并进行对比。Page 32端口配合导致的S3026光模块指示灯不亮问题 l处理过程处理过程 通过查询发现MA5200端口速率为100M,并工作在自协商模式。通过查询发现S3026光模块端口参数如下Auto-d
28、uplex,Auto-speed,100_BASE_FX_MMF,说明接口速率协商正常,但双工/半双工协商不通过。对S3026光接口的参数进行调整,将S3026的光接口设置为全双工后,光模块的LINK灯即亮,并且S3026工作正常。l总结总结 设备与设备之间不能正常通讯,常见的有物理线路故障、端口工作参数不匹配、设备模块硬件故障等几种原因。尤其是两端设备端口均为自协商时,由于不同厂家的设备接口参数不同,或者同一厂家不同设备由于采用的硬件芯片不同而自协商不通过,导致不能正常通讯。通常采用替换法可以快速定位故障。Page 33由于两条物理链路形成环路造成部分业务不通 l现象描述现象描述 S3526
29、E通过NE16E连接Internet,下连S3026和S2016,S3526E和S3026之间通过两条百兆链路相连,S3526E和S2016之间只有一条百兆链路相连。故障现象:S3526E与 S3026之间的两条链路都不连接或者只接其中一条链路时,S2016下的PC可以正常PING通网关和上层接口地址。如果S3526E与 S3026之间的两条链路都连接好,则S2016下的PC机PING不通网关。重新启动S2016与S3526E之间的接口时,S2016下PC可PING通网关20左右个包,后中断;多次操作现象相同。不论S3526E与 S3026之间的两条链路怎样连接,网管都与远端的服务器连接正常;
30、S3526E与NE16E之间的接口也工作正常。Page 34由于两条物理链路形成环路造成部分业务不通l原因分析原因分析 由于S3526E与 S3026之间的两条链路形成环路,与S3026相连的两个端口之间存在大量的无用报文,被同时转发到端口属性为TRUNK的端口,引起广播风暴,使这些端口堵塞,造成端口承载业务异常;连接网管和与NE16E对接的端口属性为ACCESS,可以正常工作。l处理过程处理过程 方案一:把S3526E上与S3026相连的两个端口分别划分在不同的VLAN内,但不能满足设备之间的两条链路成主备份关系的要求。方案二:在S3526E上启动STP协议,问题得到解决。方案三:在S352
31、6E和S3026之间配置链路聚合(link-aggregation),这样既可以增加带宽,实现负载分担,又可以实现链路备份的功能。Page 35第第1章章 物理层故障物理层故障第第2章章 端口协商以及自环问题端口协商以及自环问题第第4章章 以太网故障排除以太网故障排除第第5章章 以太网典型案例分析以太网典型案例分析Page 36VLAN故障排除综述(1)lVLAN技术的引入技术的引入 用于隔离网络风暴,增加网络安全性 早期用路由器进行隔离,但成本高,效率低,应用复杂 增加了4个字节的特殊标注域,用于区别不同用户发送的数据帧,其中VLAN ID占用12个bitlVLAN与端口的关系与端口的关系
32、ACCESS端口:这种端口只能属于一个VLAN,并且从该端口进来的数据包都不包含TAG标记,数据包进入之后,会被加上该端口的VLAN ID(加上TAG标记)。如果有数据需要从这种接口发送出去,数据帧中的TAG标记将被删除。这种端口一般用于连接用户主机或路由器。Page 37VLAN故障排除综述(2)lVLAN与端口的关系(续)与端口的关系(续)TRUNK端口:这种端口可以属于多个VLAN,或者说这种端口可以传送多个VLAN的数据帧。从这种端口发送出去的数据帧都包含有TAG标记(缺省VLAN ID的数据帧除外);从这种端口接收到的报文,如果已经有TAG标记,则直接转发;如果没有TAG标记,则加上
33、带有缺省VLAN ID的TAG标记。这种端口一般用于连接交换机或路由器。HYBRID端口:这种端口可以属于多个VLAN。但是与TRUNK端口不同的是它所传送的数据帧,可以包含TAG标记也可以不包含TAG标记;而TRUNK端口则必须包含TAG标记。其发送数据帧时根据配置信息进行判断是否加上TAG标记;接收数据帧时和TRUNK端口相同。这种端口一般用于连接交换机。Page 38VLAN故障排除综述(3)lPVLAN技术简介技术简介 PVLAN技术解决VLAN ID不足的问题。采用VLAN ID屏蔽的办法,将接入层的用户VLAN ID对汇聚层设备屏蔽起来,在接入层使用VLAN的方法进行用户二层隔离。
34、接入层设备Primary VLAN ID访问汇聚层设备,对于会聚层设备来说,它只知道Primary VLAN ID,数据包返回时,送往Primary VLAN ID所包含的所有Secondary VLAN用户。lVLAN路由技术简介路由技术简介 VLAN路由技术模拟路由器的三层接口,在以太网上创建出虚拟局域网三层接口。这些接口具有三层报文转发的功能。将二层不能转发的数据帧进行数据帧头的剥离,然后根据IP报文头信息进行转发。Page 39VLAN故障排除综述(4)lVLAN故障的分类故障的分类 VLAN用户隔离不成功;VLAN隔离后不能进行任何通信;采用VLAN技术后,无法进行设备管理。lVLA
35、N故障的解决方法故障的解决方法 分析数据帧的转发过程,特别是数据包携带的VLAN ID的变化。看看在整个数据帧转发的过程中何时删除TAG标签,何时增加TAG标签,在删除和增加的过程中是否变化过VLAN ID,特别是PVLAN技术存在的时候。其次分析是否VLAN路由存在问题。Page 40VLAN配置问题导致用户无法上网l现象描述现象描述 S3026下行通过千兆光口接S2016,上行通过100M以太网口上行至友商交换机C。S2016与S3026设定固定的管理IP地址,由设备C对S2016和S3026进行管理,由设备C连接的DHCP服务器为用户分配IP地址。S2016下挂的用户通过PVLAN配置实
36、现二层隔离。故障现象:所有S2016下挂的用户都无法获得动态IP地址,PING不通DHCP SERVER和网关C,S3026下挂的用户却可以获得IP地址。同时,从S2016的终端窗口却可以PING通DHCP SERVER和网关。另外还发现,如果把S2016下挂的用户设置为VLAN 1000用户,则可以通过DHCP SERVER获得IP地址,也可以PING通网关。Page 41l信息收集信息收集 S2016下管理VLAN 1000的用户可以正常上网,而业务VLAN的用户不能上网,说明网络连接正常,问题在设备的配置对不同VLAN的处理上。查看S2016的配置,发现配置了PVLAN,其中Primar
37、y VLAN为30,Secondary VLAN为219,另外配置了管理VLAN 1000。l原因分析原因分析 上行数据分析:VLAN 1000用户 下行数据分析:VLAN 1000用户 上行数据分析:Secondary VLAN用户 下行数据分析:Secondary VLAN用户 结论:Secondary VLAN用户数据配置问题。VLAN配置问题导致用户无法上网Page 42VLAN配置问题导致用户无法上网l处理过程处理过程 避免VLAN ID 1000在S3026和S2016之间的一再透传,同时还要兼顾上面设备能管理到S2016。需要修改配置方案;S3026下行接S2016的端口不再配置
38、TAG VLAN 1000;S2016上把PVLAN直接设置为1000,包含所有用户端口的SECONDARY VLAN,同时做为管理VLAN。经过这样的调整,下行方向的包从S3026出来的时侯,去掉了带有S3026上的PVLAN的头,进入S2016的时侯再加上S2016 PVLAN的头,而S2016的PVLAN既包含用户端口又同时做管理VLAN,通过MAC地址来区别具体用户,达到了兼顾用户上网和管理的要求。Page 43友商交换机三层接口问题导致与S6506互通网络中断 l现象描述现象描述 S6506下挂MA5100接入ADSL用户,S6506上行和友商交换机设备C千兆光口连接,网络正在运行突
39、然中断,用户能ping通S6506网关,S6506到交换机C不能ping通,ADSL用户不能正常上网。l信息收集信息收集 使用命令(display interface)查看S6506和交换机C的千兆接口状态,双方物理接口和链路层都正常UP。使用命令(display arp和display mac-adderss)查看MAC地址表和ARP表,双方都能学到对方的MAC地址,并建立正确的ARP表项。查看S6506路由表,发现接口路由和直连路由正常,也有C交换机的路由信息。查看C的路由表,发现路由信息也正常。Page 44友商交换机三层接口问题导致与S6506互通网络中断 l原因分析原因分析 双方之间
40、互通已经一个多月,可以排除兼容性问题。物理接口UP,可以初步排除物理层问题。接口协议层UP,同时双方都能学到对端MAC地址,双方接口统计信息上都显示有报文收发,也可以排除二层互通问题。双方是通过三层接口互通,可以判断是三层上出了问题,至于哪一方设备有问题,需要进一步定位。Page 45友商交换机三层接口问题导致与S6506互通网络中断 l处理过程处理过程 在C上抓包分析,发现从S6506发的ICMP报文到C后,C没有回应。从C发的ICMP报文到S6506之后,S6506给出回应报文,C收到但没有处理。在C上直接连PC机,该接口属于和S6506互通的VLAN,发现PC机PING自己的网关竟然不通
41、,可以肯定C上这个VLAN接口已经不工作了,有吊死的嫌疑。更改C上相应的VLAN接口,问题解决,问题都是由于这个三层接口吊死导致。l总结总结 多利用抓包工具,对于故障的分析和定位很有帮助。Page 46VLAN TRUNK配置不正确导致业务不通S3026A配置了VLAN 2,3,4,100,GE2/1和GE1/1均为TRUNK MODE,并均配置了port trunk permit VLAN all。S3026B配置了VLAN 5,6,7,100,GE1/1为TRUNK MODE,并配置了port trunk permit VLAN all。VLAN 100为管理VLAN。故障现象:S3026
42、A下的PC机均可以与S8016下的PC互通,而S3026B的VLAN 5,6,7下的PC不能与S8016互通,但VLAN 100下的PC可以与S8016互通。l现象描述现象描述中心交换机S8016的GE1/1/1接口通过光纤下连S3026A的GE2/1接口,S3026A通过千兆电口GE1/1级联一台S3026B交换机的GE1/1口。S8016配置了VLAN 2,3,4,5,6,7,100,并配置了相应的三层接口,GE1/1/1为TRUNK MODE,并配置了port trunk permit VLAN all。Page 47VLAN TRUNK配置不正确导致业务不通l信息收集信息收集 VLAN
43、100下的PC机能够正常通信,说明线路无故障。S3026B的VLAN100下的PC能与S3026A的VLAN100下的PC正常通信,说明VLAN 100的TRUNK能够正常传递,但VLAN 5,6,7的PC为什么不能正常,问题基本定位在数据配置上。查看S3026B的GE1/1的端口状态,发现允许通过的VLAN为5,6,7,100。查看S3026A的GE1/1和GE2/1的端口状态,发现允许通过的VLAN为2,3,4,100,没有VLAN 5,6,7。两台交换机都没有启用GVRP动态VLAN注册协议。Page 48VLAN TRUNK配置不正确导致业务不通l原因分析原因分析 原因在于VLAN在T
44、RUNK接口的注册上,虽然我们配置了port trunk permit VLAN all,但其实是允许本交换机中配置的VLAN通过,而不是允许所有的VLAN通过,这可以通过查看端口的状态发现。这样在级联交换机时,上层交换机不能传递下面交换机的VLAN信息,从而导致下面的交换机用户业务不正常。l处理过程处理过程 在S3026A手工增加空的VLAN 5,6,7,网络正常。另外一种方法是启用动态VLAN配置,在两台交换机上启动GVRP,便可以避免产生类似故障。Page 49VLAN配置问题导致S3526下用户上网速度慢 l组网描述组网描述 组网:友商交换机A下挂二层交换机B,交换机B通过FE下挂S3
45、526,S3526下面接入用户。故障现象:S3526下用户上网速度慢,有时出现网页打不开的现象。而S3526上行口的Active指示灯频繁闪烁,查看其他接口,发现指示灯也频繁闪烁。Page 50VLAN配置问题导致S3526下用户上网速度慢 l信息收集信息收集 S3526交换机上各个端口指示灯频繁闪烁,很有可能是交换机内部形成了广播风暴,通过命令显示接口状态,发现接口统计数据显示收到大量的广播报文,用抓包程序在S3526上捕获报文发现广播包很多,大约10秒内抓包30000多个。检查配置,发现S3526上行端口配置允许所有VLAN通过,断开和交换机B的连接后,广播风暴消失。检查交换机B的配置,发
46、现B作为纯二层交换机使用,Trunk接口上也配置了允许所有VLAN通过。检查网络拓扑情况,发现是树型结构,不存在环路问题。Page 51友商交换机三层接口问题导致与S6506互通网络中断 l原因分析原因分析 很显然大量的广播包来自交换机B,是属于Trunk接口配置不当引起。由于Trunk接口允许所有VLAN通过,导致很多其他VLAN的报文通过交换机B到达S3526上行口,而S3526本身并没有这些VLAN的用户。l处理过程处理过程 在各个交换机上使能GVRP协议,使无关VLAN的信息不能到达S3526。由于使不同厂家的设备,如果不支持同一种协议,可以修改交换机B的配置,取消交换机B上行口TRU
47、NK功能。Page 52在启用GVRP的低端交换机上如何创建所需的VLAN l现象描述现象描述 Quidway低端交换机如S20XX、S30XX系列,在启用GVRP的时候,将接收GVRP协议发送的所有VLAN信息,并在本交换机上创建相应的VLAN。当发送的VLAN数量超过32,将只能够在本地创建序号低的前面32个VLAN。如果交换机上需要其他VLAN ID更高的VLAN,将无法实现。l原因分析原因分析 这是由于低端Quidway交换机如S20XX、S30XX系列,最多只支持32个VLAN。其启用GVRP时,只能够接收低的前32个VLAN ID。如果客户端交换机上需要其他VLAN ID更高的VL
48、AN,而不需要VLAN ID较低的那些VLAN,即使总的VLAN数量不超过32,也不能够实现。Page 53在启用GVRP的低端交换机上如何创建所需的VLANl处理过程处理过程 只需要在交换机上,首先创建所需的、VLAN ID较高的那些VLAN,然后再启用GVRP即可。l建议与总结建议与总结 这个问题是由于低端交换机所支持的VLAN数量规格所限,而GVRP在动态通告VLAN信息的时,是不管对端交换机所支持的VLAN 规格的,当遇到如上问题时,可以使用这个规避措施。Page 54网络用户私自安装配置DHCP服务器导致其它用户上网不正常 Page 55网络用户私自安装配置DHCP服务器导致其它用户
49、上网不正常 l现象描述现象描述 在某住宅小区宽带网中,每单元分配一个VLAN号,组网为中心机房的友商F交换机连接DHCP服务器,并且下接各单元中的S3026,S3026下再接S2403F交换机。同时S3026和S2403F上都接有用户。客户要求S3026往上送的业务报文必须为Tagged报文,且只能包含一个VLAN号,为了符合这个要求在S3026上没有再划分VLAN,而是所有端口都属于一个VLAN。同时2403F各个端口划分在不同的VLAN里,且2403F的上行口是Untagged的。如图所示,在某单元中G区交换机为S3026,L和C区均有一台S2403F接于G区的S3026上。这三台交换机同
50、属于VLAN 982。故障现象:C区下的用户上网正常,但L和G区下面的用户在动态获取IP时,获取的IP地址正确,但获取的IP地址掩码、网关、DNS均错误,用户不能正常上网。Page 56网络用户私自安装配置DHCP服务器导致其它用户上网不正常 l原因分析原因分析 用户动态获取IP地址工作过程:首先发一个DHCP广播报文。当同一VLAN内有DHCP服务器时,用户计算机首先获取的是本VLAN内DHCP服务器回应的DHCP报文,从而获得IP地址(当然这里还需要这个DHCP服务器与用户计算机之间没有三层隔离,因为隔离了DHCP服务器就不能收到用户计算机发出的DHCP广播报文,也就不可能为用户分配IP地