网络故障的分类可以根据网络软硬件结构或网络对象的不同划分。
根据网络软硬件结构划分时候,可以分为物理故障和逻辑故障。
物理故障指的是设备或线路损坏、插头松动、线路受到严重电磁干扰等情况,或者是人为疏忽导致网络连接错误等现象。人为的物理故障通常是在没有搞清楚网络插头规范或者没有弄清网络拓扑规划的情况下产生的。对于物理故障,可以从客户机或网络中心用ping命令检查线路连通情况,确认故障点后进行故障排除。
逻辑故障中最常见的情况是配置错误,就是指因为网络设备的配置原因而导致的网络异常或故障。配置错误可能是路由器端口参数设定错误,路由器路由配置错误以至于路由循环或找不到远端地址,或者是路由掩码设置错误等。比如,同样是网络中的线路故障,该线路没有流量,但又可以ping通线路的两端端口,这时就很有可能是路由配置错误了。遇到这种情况,可以用traceroute命令测试。traceroute可以检测到哪个路由器之前都能正常响应,到哪个路由器就不能正常响应了。这时只需更改远端路由器端口配置,就能恢复线路正常了。
逻辑故障的另一类是一些重要进程或端口关闭,以及系统的负载过高。比如也是线路中断,没有流量,用ping发现线路端口不通,检查发现该端口处于down的状态,这就说明该端口已经关闭,因此导致故障。这时只需重新启动该端口,就可以恢复线路的连通了。此外还有一种现象是路由器的负载过高,表现为路由器CPU温度太高、CPU利用率太高,以及内存剩余太少等,对此类故障的解决方案就是更换性能较好的路由器。
根据网络对象不同划分的时候,可以分为线路故障、路由故障和主机故障。
线路故障最常见的情况就是线路不通,对于这种情况首先检查该线路的物理连接是否畅通。然后检查线路上流量是否还存在,用ping检查线路远端的路由器端口能否响应,用 traceroute检查路由器配置是否正确,找出问题逐个解决。
网络连接设备故障主要是由网络中的集线器、交换机或路由器的故障引起的。一般集线器和普通交换机的故障多为硬件设备损坏或设备性能不足,此类故障比较容易判断,解决方法多为更换相应设备。对于3层交换机及路由器等具有路由功能的设备,排除其故障相对复杂一些。检测这类设备故障,需要检查设备的路由表、端口流量数据、计费数据、 CPU的温度、负载和内存余量等信息。通常情况下网络管理系统有专门的管理进程不断地检测路由器的关键数据,并及时给出报警。而CPU利用率过高和系统内存余量太小都将直接影响到网络服务的质量。解决这种故障,只有对相应设备进行升级、扩大内存等,或者重新规划网络拓扑结构。
主机故障常见的现象就是主机的配置不当。如主机配置的IP地址与其他主机冲突,或 IP地址根本就不在子网范围内,由此导致主机无法连通。主机的另一故障就是安全故障。比如,主机没有控制其上的finger,RPC,rlogin等多余服务。而攻击者可以通过对这些多余进程的正常服务或bug攻击该主机。发现主机故障一般比较困难,特别是网络黑客的恶意攻击。一般可以通过监视主机的流量或扫描主机端口和服务来防止可能的漏洞。安装网络防火墙是解决这种问题最基本的办法。