《网络故障诊断》课件第2章.ppt

上传人(卖家):momomo 文档编号:8083510 上传时间:2024-11-23 格式:PPT 页数:55 大小:666KB
下载 相关 举报
《网络故障诊断》课件第2章.ppt_第1页
第1页 / 共55页
《网络故障诊断》课件第2章.ppt_第2页
第2页 / 共55页
《网络故障诊断》课件第2章.ppt_第3页
第3页 / 共55页
《网络故障诊断》课件第2章.ppt_第4页
第4页 / 共55页
《网络故障诊断》课件第2章.ppt_第5页
第5页 / 共55页
点击查看更多>>
资源描述

1、2.1 网络故障诊断模型2.2 诊断问题的方法2.3 网络故障管理2.4 准备进行故障排除2.5 小结 第第2章章 网络故障诊断方法学网络故障诊断方法学2.1 网络故障诊断模型网络故障诊断模型 网络发生故障所造成的损失可能是灾难性的。一般情况下,生产性网络发生故障的平均损失从几万美元每小时至几百万美元每小时不等。对于越来越多的机构来说,长时期的生产性网络中断可能引起机构的倒闭。修复发生故障的网络或者遭破坏的网络给网络工程师和网络管理员带来了难以想象的压力。在这种压力下,使用特殊的专门技术和所掌握的技巧迅速恢复网络的功能是非常有价值的。然而,这些专门技术需要深入、详细、广泛地掌握网络知识。非系统

2、的故障排除方法只会导致在网络故障现象、相互依赖和偶然性的迷宫中浪费时间。相反,系统的故障排除方法经历搜集详细情况、分析可能原因、针对原因采取行动、观测测试结果的过程,这有助于详细地了解网络迷宫。故障排除模型的总体思想是系统地将由故障可能的原因所构成的一个大集合缩减成一个小的子集,或者直接确定故障起因,然后排除故障并恢复网络的功能。问题解决之后,通过记录该事例所形成的系统故障排除方法有助于汲取、保存、交流排除故障过程中所获得的经验。使用这样的系统故障排除模型能够提高机构的专门技术,减少了解决今后类似问题所花费的时间。提高专门技术和协作的这种转变可以减轻支撑关键的、复杂的网络过程中的工作压力。现代

3、网络的复杂性和对至关重要的无故障运行时间的需求,增加了解决连通性和性能问题的压力。处理网络互联问题的最好办法是开发一个标准的故障排除方法学。图2-1提出的故障排除模型是这种方法学的一个范例。故障排除时,有序的思路有助于解决所遇到的问题。模型列出了一系列步骤模块。这些步骤模块可以分成几个故障排除阶段:图2-1 网络故障排除模型(1)确保具有明确的、充分的问题描述;(2)全面搜集相关情况并分析可能的原因;(3)针对可能性最大的原因制定和实施一个操作计划,然后观察其结果;(4)如果故障现象没有消除,尝试另一项操作计划(或者搜集额外的情况);(5)如果故障现象消除了,记录并整理排除故障的方法。故障排除

4、时应采用一种有序的思维模式。这里所描述的模型采取一种由多个步骤模块构成的方法来解决问题。下面将详细分析每个步骤模块,并通过一个故障排除实例,学习如何应用这些步骤模块。2.1.1 详细说明故障详细说明故障分析互联网络故障时,按照一组故障现象及相关原因详细说明故障,以便参照为网络制定的基准指标进行故障描述。做这项工作首先要观察总体故障现象,然后确定可能有哪几类原因会导致这些故障现象。例如,思考图2-2中的网络故障排除情况范例。该网络使用 TCP/IP协议族,而且发生了一个故障。故障现象是主机1和主机2的用户得不到主机A或主机B的任何响应。如何排除这种故障?图2-2 主机1和主机2得不到主机A或主机

5、B的响应在方法学中的这一阶段,应观察相关的总体故障现象并确定可能的原因,以便详细地描述故障。尽量判断可能的原因并记录下来。也许会出现许多答案,但是要注意那些被认为是故障的主要起因的答案。这时,目标就是分析可能的原因。在方法学中随后的步骤是提出问题(即搜集详细情况),如主机3和主机4是否能够得到来自主机A和主机B的响应,主机1能不能与主机2通信,广域网连接是否正常等。下面是主机1和主机2通信故障可能的原因:主机1和主机2安装的网卡有故障;主机1和主机2需要缺省网关,但是没有作配置;主机l和主机2或路由器X中存在错误配置的子网掩码;网络R连接了有故障的设备,它在以太网电缆上导致了太多的冲突;路由器

6、X或路由器Y访问控制表配置不正确,导致来自受影响主机的数据流被阻塞;广域网连接发生故障;路由器没有配置有效的协议映射声明;主机A和主机B没有作识别主机1和主机2的配置。也许还有其他原因,但是首先应该注意那些被认为是造成故障现象的主要原因。2.1.2 搜集详细情况搜集详细情况故障排除的第二个步骤是搜集有助于查找故障原因的详细情况。向受到影响的用户、网络管理员、经理和网络所涉及的其他关键人员提出问题,尽量确定是否有人知道做出改动的地方(提出这个问题而得到的回答却是“没有”,这种现象再现了多少次?),完整地记录获得的全部信息。根据所报告故障现象的性质,从网络管理系统,协议分析仪的踪迹,诸如debug

7、特权可执行命令、show 可执行命令这样的路由器诊断命令的输出,软件发行通知等来搜集情况。可能需要在不连续的时间或相当长的时期内搜集这些信息,如一整夜的数据采集。记录和坚持拷贝主机、路由器、服务器和任何其他可配置网络设备的配置信息是一个好的做法,能够通过比较配置判断有哪些地方发生了改变。回到上面的故障示例,在专注于可能原因的过程中需要搜集详细的情况。分析故障时,假定搜集到了下列情况:主机3和主机4能够与主机A和主机B通信;主机1和主机2能够与主机3和主机4通信;主机1能够与主机2通信;为了识别与主机1和主机2通信,对主机A和主机B进行了正确的配置。2.1.3 分析可能原因分析可能原因利用搜集的

8、数据和所掌握的知识,可以确定一个范围,这有助于查找故障的原因。通过划定范围,只需注意与某一故障或故障情况相关的那一部分产品、介质和主机。系统的故障排除方法所带来的最大好处之一是减少可能的情况,将不相关的网络细节排除在需要检查的项目范围之外。可以一类一类地排除与系统软件和硬件相关的问题,根据故障范例中所搜集的情况能够排除几种可能的原因。分析前面确定的可能原因,参见图2-3。图2-3 能够一一排除可能的故障 主机1和主机2安装的网卡有故障:可以不考虑这个可能的原因,因为主机l和主机2可以通信。主机1和主机2需要缺省网关,但是没有作配置:可以不考虑这个可能的原因,因为主机l和主机2能够与主机3和主机

9、4通信。主机1和主机2或路由器X中存在错误配置的子网掩码:可以不考虑这个可能的原因,因为主机l和主机2能够与主机3和主机4通信。网络R连接了有故障的设备,它在以太网电缆上导致了太多的冲突:可以不考虑这个可能的原因,因为主机l和主机2能够与主机3和主机4通信,而且,主机1和主机2也可以通信。路由器X或路由器Y访问控制表配置不正确,导致来自受影响主机的数据流被阻塞:这仍然是一种可能的原因,可以根据所搜集的任何情况排除这个原因。广域网连接发生故障:可以不考虑这个可能的原因,因为主机3和主机4能够与主机A和主机B通信。路由器没有配置有效的协议映射声明:可以不考虑这个可能的原因,因为主机3和主机4能够与

10、主机A和主机B通信。主机A和主机B没有做识别主机1和主机2的配置:可以不考虑这个可能的原因,因为为了识别与主机l和主机2通信,主机A和主机B进行了正确的配置。搜集情况时我们已经检查了这项内容。故障的范围被缩小为:路由器X或路由器Y中配置的访问控制表可能阻塞了到达/来自主机1和主机2的数据流。2.1.4 制定操作计划根据刚刚确定的几种可能原因,可以制定一个操作计划,实施一个“分而治之”的策略。分析最有可能的原因,确定一个只对一个变量进行操作的计划。这种方法使您能够重现某一故障的解决办法。如果有多个变量被同时改变,而问题得到了解决,那么,如何才能判断是哪一个变量导致了故障的发生?利用区域划分的结果

11、。将故障排除的范围划分成逻辑上彼此隔离的离散区域。用这种办法可以判断划分区域之后哪个区域仍存在故障。判断故障发生在网络中的什么位置。通过一系列测试查明网络故障发生的位置。从一台源设备开始进行一系列的测试,判断从源设备到后续更远的、中间的网络设备是否正常运转。这个办法使测试者能够从源开始沿着路径直至最终目的地一步一步对路径进行跟踪,这就能够分离出路径中发生故障的部分。与其他人协作并共同采纳根据经验制定操作计划的方法。对这些合理的故障排除方法学习得越多,那么所掌握的工具就越多。工具可以帮助测试某一故障情况。随着经验的积累,就能够知道如何更好地将可能的原因和故障排除工具与一个具体的、系统的操作计划结

12、合起来。根据我们对故障范例的分析,已经确定最有可能的原因是某个路由器中访问控制表配置不正确,从而阻塞了到达/来自主机1和主机2的数据流。针对这种原因的操作计划是检查每台路由器当前的配置,判断所出现的访问控制表是否正确(测试者应该知道存在于每个访问控制表末尾的隐含拒绝)。图2-4显示了路由器X中的访问控制表配置。图2-4 路由器X配置的访问控制表2.1.5 实施操作计划实施操作计划具体和明确地制订和实施操作计划是非常重要的。操作计划必须确定要执行的一组步骤,而且每个步骤必须认真地实施。密切地跟踪测试项目。尽量做到不在同一时间更改太多的变量。实施操作计划时,还要尽量做到:(1)确保所实施的步骤不使

13、故障加剧或导致新的故障;(2)严格限制所实施的操作计划对其他网络用户的入侵;(3)实施操作计划期间,将可能发生的安全性失效的范围和持续时间减至最小。制定还原计划(例如,保存一份配置文件)以使网络能够回到先前已知的状态,这一点很重要。对于上述故障范例,连接到一个路由器的命令控制台,如路由器X的命令控制台,并查看其配置。可以使用 Telnet连接,也可以将一台终端连至控制端口,还可以连至路由器的辅助端口。如果认为访问控制表配置不正确,则重新配置访问控制表或者将其最后一行改成no ip,access-group 102以暂时禁用访问控制表。为了保证一次至多只操作一个变量,必须在改变路由器Y或其他任何

14、设备的配置之前观测变量修改的结果。2.1.6 观察操作计划的结果观察操作计划的结果为寻找解决问题的办法而操作了一个变量之后,根据该操作计划,一定要搜集结果。一般应采用方法学第二个步骤中搜集情况所采用的方法。对结果做出分析之后,必须判断问题是否已得到解决。如果问题未得到解决,则必须利用这些结果更好地调整计划,直到获得了适当的解决办法为止。对于上述故障范例,对一个变量进行操作,即重新配置访问控制表或暂时禁用它,并观察操作结果。现在主机1和主机2能够访问主机A或主机B吗?如果能,则问题得到了解决,诊断过程到此结束。如果操作计划是暂时禁用访问控制表,其结果是问题得以解决,那么管理员应该重新配置访问控制

15、表。然而,如果主机1和主机2仍不能访问主机A或主机B,那么必须进行下一步骤。2.1.7 重复故障排除过程重复故障排除过程为了到达模型中问题/解决办法重复过程的退出点,必须努力不断缩小可能原因的范围,直到只有一个原因为止。所以,将可能原因的范围缩小后,针对最新(缩小了或扩大了)可能原因的范围制定新操作计划,并基于此新计划,重复这个故障排除的过程。重复这一过程直到找到解决办法为止。问题的解决可能需要反复修改主机配置、路由器配置或介质。切记,取消所做的任何无效的“修复”是非常重要的。一次只修改一个变量,如果在网络中一次进行太多的修改,将会导致网络性能和策略的降低。这就是制定还原计划以取消修改,并将网

16、络恢复到先前状态的重要原因。对于上面的故障范例,首先想到了路由器X并重新配置或禁用了访问控制表,但问题没有得到解决,所以必须重新进入故障排除的过程。现在应该实施操作计划的下一步骤。检查所做的修改是否生成了正确的访问控制表,从而能够进行所希望的数据流过滤。要考虑的下一轮故障排除过程是路由器Y的配置,如图2-5所示。路由器X上的访问控制表也许工作正常,但是问题在于网络对端的到达访问控制表。必须重复故障排除过程,对路由器Y的配置做必要的修改,然后再一次观察结果。图2-5 路由器 Y配置的访问控制表2.1.8 排除故障排除故障如果找到了故障的真正起因,就可以完成故障的排除并做文字记录。然而,当检修者尽

17、力排除网络故障时,如果针对自己的网络环境分析了所有的常见原因并采取了所有的一般性措施,那么检修者最后寻求的帮助是与自己的路由器技术支持代表联系。检修者应该就故障准备必要的情况报告,这有助于技术支持代表判断故障可能的原因。一旦故障现象不再出现,则故障可能已经排除。2.1.9 记录和整理有关情况记录和整理有关情况无论何时都需要对所做的工作进行文字记录和情况整理,包括以下内容:(1)记录采取了哪些步骤。(2)如果有迹象表明必须取消已采取的行动,则记录还原迹象。例如,如果解决了频带问题,但是不小心引起了某一其他故障。(3)建立历史记录,便于今后参照。2.2 诊断问题的方法诊断问题的方法 在解决网络故障

18、的过程中,可以采用多种诊断问题的方法,包括试错法、参照法、替换法。每一种方法的实施都离不开具体的网络环境,因此在排除故障之前,必须弄清楚以下情况:网络的物理结构;网络中所使用的协议以及协议的相关配置;网络操作系统的配置。2.2.1 试错法试错法试错法是一种通过推测而得出故障原因的方法。网络管理员需要对问题进行评估,依据经验提出解决问题的方案,并对得到的结果进行检验,然后不断地重复这一过程,直到得到正确的解决方案为止。1.采用试错法的条件采用试错法的条件在下列情况下可以采用试错法:(1)在没有解决网络故障之前,每次测试仅做一项改变;(2)确保所做的修改具有恢复性;(3)依据工作经验,可确定产生故

19、障的原因,并能够提出相应的解决方案;(4)与其他故障排除法相比,采用试错法可节约很多时间,大大减少所投入的人力和物力。2.试错法的步骤试错法的步骤(1)故障提出。网络管理员首先应该了解网络故障发生的现象。(2)故障评价。网络管理员根据对网络故障发生现象的分析,评价网络故障发生的原因,并给出需要采取的排除故障的方法。(3)故障定位。根据上面的分析,为故障定位,确定可能的故障原因。(4)实施方案。非常快捷地实施相应的解决方案。(5)测试步骤。判定是否正确地解决了网络故障。如果没有解决,则要从步骤(2)开始重复这一过程,直到问题正确解决为止。(6)解决问题。问题得以解决,记录这种情况下解决问题的方法

20、,为以后解决此类故障积累经验。比如在某单位局域网中,一台工作站以前可以正常地接入互联网,现在突然不能上网了。按单位的要求,工作站的IP地址、子网掩码、网关及DNS服务器的IP地址都设置无误,经过对故障现象的诊断,在浏览器的地址栏内输入IP地址就能上互联网了。据此可以推测,在工作站的DNS服务器增加设置一条有效的DNS服务器的IP地址,这时在浏览器的地址栏内载入网址就可以像以前一样正常上网了。2.2.2 参照法参照法参照法是一种可以比较快速解决网络故障的方法,它并不需要懂得太多的网络知识或具有太多的网络故障排除经验。但前提是只有在故障设备与正常工作设备相近的情况下才可以使用参照法。现在很多单位或

21、部门在购买计算机时,从方便维护的角度,选择成批相同型号的计算机并设置基本相同的参数。只要充分利用这一点,在设备发生故障时,参考相同设备的配置有助于迅速准确地解决问题。当网络故障与操作系统相关联时,问题会变得难以解决。另外,从故障的提出到得到相应的解决方案通常会耗费很长时间。这时,如果拥有一台可以工作的相近设备,便可以采用参照法来帮助解决网络故障。1.采用参照法的条件在下列情况下可以采用参照法:(1)当故障设备与正常工作设备具有相近的条件;(2)不要做出任何可能导致冲突的配置修改;(3)确保所做的修改具有可恢复性。2.参照法的步骤参照法的步骤(1)故障提出。网络管理员首先应该了解网络故障发生的现

22、象。(2)故障评价。网络管理员根据对网络故障发生现象的分析,评价网络故障发生的原因并给出需要采取的排除故障的方法。(3)故障定位。根据上步的分析,为故障定位,确定可能的故障原因。(4)参考相近设备配置。分析相近设备的配置,并做好记录。(5)测试步骤。判定是否正确地解决了网络故障。如果没有解决,则要从步骤(2)开始重复这一过程,直到问题正确地解决为止。(6)解决问题。问题得以解决,记录这种情况下解决问题的方法,为再次解决此类故障积累经验。2.2.3 替换法替换法替换法是一种常用的网络检测与维护的方法。采用这种方法,网络管理员必须明确导致故障发生的原因,并且手边有正常的设备可供选择。替换法的操作步

23、骤比较简单,但这种方法的最大困难在于确定产生故障的原因,并且只有在发生故障的组件存在缺陷的情况下替换法才非常有效。当替换一个不存在缺陷的组件时会浪费人力和物力,因此在更换设备前必须仔细分析故障发生的原因。在下列情况可以采用替换法:(1)故障定位的网络设备限定在12个组件之间;(2)确保有可以更换的正常工作的网络设备;(3)每次只能更换一个组件;(4)如果先前更换的网络设备没有解决问题,则在替换第二个网络设备之前必须把先前更换的设备安装回去。2.3 网络故障管理网络故障管理 既然有网络故障产生,那么就有网络故障管理。网络故障管理一般包括五个方面:(1)对网络进行监测,提前预知故障;(2)发生故障

24、后,找到故障发生的位置;(3)解决故障;(4)记录故障产生的原因,找到解决方法;(5)故障分析预测。网络故障管理的过程大致可分为四步:(1)故障检测。在收集信息之后,按顺序列出可能的原因,第一条是最有可能的原因,最后一条是最不可能的原因。然后逐条测试,判断是否是这种原因造成的问题。例如,如果怀疑计算机中的一个网卡是造成问题的原因,那么就用一个正常工作的网卡来替换它进行测试。(2)故障隔离。(3)设置优先顺序。解决网络问题的一个基本要素是设置优先顺序。每个人都希望自己的系统最早修好,因此设置优先次序并不是一件容易的事情。尽管最简单的方式是根据先到先服务的原则,但这并不总是可行的,因为某些问题与其

25、他问题相比可能更重要。所以,需要判断问题的重要性。(4)故障纠正。2.4 准备进行故障排除准备进行故障排除 为了有效地进行故障排除,检修者必须充分了解待检修的网络,而且能够迅速、有效地与网络管理所涉及的关键人员,以及受故障影响的人员进行沟通。检修者可分析图2-6中的网络并向自己提出下列问题:您持有待检修的网络精确的物理连接图和逻辑连接图吗?待检测网络所在机构或部门是否持有最新的简述网络中所有设备物理位置和连接关系的网络连接图,以及描述网络地址、网络号、子网等数据的逻辑连接图?您持有待检修网络中所运行的全部网络协议的清单吗?对于每一种运行的协议,您是否持有网络号、子网、域、区及与上述数据内容相关

26、的清单?您知道对哪些协议进行路由吗?对于每一种路由的协议,您是否掌握了正确的、最新的路由器配置?您知道对哪些协议进行桥接吗?在这些网桥中是否配置了过滤器,您了解这些配置情况吗?包括至因特网的全部连接在内,您知道与外部网络的所有连接点吗?对于每一条外部网络连接,您知道采用了哪一种路由协议吗?您知道待检测网络既定的基准性能指标吗?待检测网络所在的机构是否记录了网络正常的状态和性能,以便能将当前的故障与基准性能进行比较?网络正常运行时用户所预期的正常基准活动有哪些?自从上一次网络达到基准指标以后,用户对网络做了哪些事情?增加了哪些新设备和软件?重新作了哪些配置?故障涉及了(未涉及)哪些特殊的应用特性和数据流传输需求?过去哪些故障排除事例(如果有)适用于当前的情况或者有所帮助?图2-6 一个复杂的网络系统的故障排除方法能够帮助节省在复杂的、相互联系的网络细节迷宫中浪费的时间。由于网络是机构中的战略性工具,所以寻找捷径是很实际的情况。这些捷径往往出自以前的专门技术,而这些专门技术则可能从系统的故障排除工作中获得。小小 结结 现在网络的复杂性日益增大,多种协议的环境导致越来越多的问题。本章在不涉及具体网络技术背景的情况下,介绍了网络诊断的方法学,使读者能够从大局上了解网络故障的诊断方法。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(《网络故障诊断》课件第2章.ppt)为本站会员(momomo)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|