网络诊断是管好、用好网络,使网络发挥最大作用的重要技术工作。本文简述分层诊断技术,结合讨论路由器各种接口的诊断,综述互联网络连通性故障的排除。
网络故障诊断,从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题的根源,排除故障,恢复网络正常运行。网络故障通常有以下几种可能:物理层中物理设备相互连接失败或者硬件及线路本身的问题;数据链路层的网络设备的接口配置 问题;网络层网络协议配置或操作错误;传输层的设备性能或通信拥塞问题;上三层或网络应用程序错误。诊断网络故障的过程应该沿着OSI七层模型从物理层开始向上进行。首先检查物理层,然后检查数据链路层,以此类推,设法确定通信失败的故障点,直到系统通信 正常为止。
网络诊断可以使用多种工具:路由器诊断命令,网络管理工具和包括局域网或广域网分析仪在内的其它故障诊断工具。查看路由表,是开始查找网络故障的好办法。ICMP的ping、trace命令和Cisco的show命令、debug命令是获取故障诊断有 用信息的网络工具。如何监视网络在正常条件下的运行细节和出现故障的情况,监视哪些内容呢?利用show interface命令可以非常容易地获得待检查的每个接口的信息。show buffer命令提供定期显示缓冲区大小、用途及使用状况。show proc命令和 show proc mem命令可用于跟踪处理器和内存的使用情况。可以定期收集这些数据,在故障出现时用于诊断参考。
故障诊断步骤
第一步,首先确定故障的具体现象,分析造成这种故障现象的原因的类型。例如,主机不响应客户请求服务。可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等。
第二步,收集需要的用于帮助隔离可能故障原因的信息。从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。
第三步,根据收集到的情况考虑可能的故障原因,排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力放在软件原因上。
第四步,根据最后的可能故障原因,建立一个诊断计划。开始仅用一个最可能的故障原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑多个故障原因,试图返回故障原始状态就困难多了。
第五步,执行诊断计划,认真做好每一步测试和观察,每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到故障现象消失。
网络分层诊断技术
物理层的故障主要表现在设备的物理连接方式是否恰当;连接电缆是否正确;Modem、CSU/DSU等设备的配置及操作是否正确。确定路由器端口物理连接是否完好的最佳方法是使用show interface命令,检查每个端口的状态,解释屏幕输出信息,查看端口状态、协议建立状态和EIA状态。
查找和排除数据链路层的故障,需要查看路由器的配置,检查连接端口的共享同一数据链路层的封装情况。每对接口要和与其通信的其它设备有相同的封装。通过查看路由器的配置检查其封装,或者使用show命令查看相应接口的封装情况。
排除网络层故障的基本方法是:沿着从源到目标的路径,查看路由器路由表,同时检查路由器接口的IP地址。如果路由没有在路由表中出现,应该通过检查来确定是否已经输入适当的静态路由、默认路由或者动态路由。然后手工配置一些丢失的路由,或者排除一些动 态路由选择过程的故障,包括RIP或者IGRP路由协议出现的故障。例如,对于IGRP路由,选择信息只在同一自治系统号(AS)的系统之间交换数据,查看路由器配置的自治系统号的匹配情况。