扫一扫
关注微信公众号

网管直面故障(1)
2008-06-15   中国IT实验室

 作为一个网络管理员,唯一高兴的是完成最后一个任务。这就是这个职业的魅力和生命之所在。以前我们已经许多次精疲力尽,然后放弃。但是,我将在本文尽可能帮助广大网络管理员降低现实的困难。
我愿意和读者们共享自己的经验和秘诀。

窥视网管员的工具包

真正的硬件工具
        每个网管员由于各自实际情况不同,随身携带的真正的硬件工具也未必相同。我的硬件工具包包括:螺丝刀、网卡、牙医镜和微型手电筒、线缆测试仪、录音设备等东西。下面我讲一下这些工具都干什么用。
螺丝刀:这个工具毋庸多言,就是拆开机箱用的。但有些服务器,比如早期的Compaq服务器(现在很少见了,说实话我也几乎没有见到过),这个螺丝刀就必须是Compaq(Toex)螺丝刀,其末端是星形的,普通的十字螺丝刀是不能使用的。
        网卡:用于在工作站或服务器上修复常见的问题,有时候可以用来确认原来的网卡是否有问题。
牙医镜和微型手电筒:这是个组合工具,可以让我在紧急时很容易看到组件的反面和主板。
线缆测试仪:用于网络布线的故障和测试定位,如果线缆测试仪很高级,可对线缆进行周期性检测,确保布线系统的质量。在评估认证后,将电缆测试仪存储的测试结果复制到计算机上并打印出来,作为网络布线基准文档。
        录音设备:相信读者看到这设备肯定惊讶得下巴都掉了……其实,我也是从历次的教训中获取的经验。还记得有多少次在一个复杂的故障检修过程中一次又一次执行相同的步骤和操作吗?就好比在家中丢失了东西以后在已经找过的地方反复搜寻,这合理吗?我是从第一分钟起,将我所采用的每一个步骤口述到录音设备中,这种记录能使我回顾所采用的方法,并决定是否还要遵循检修的路径以及结果的本质。我之所以采用口述的方式,而不是用纸笔来记录故障检修的过程就是因为:厌倦!人们往往可以手写记录下故障检修过程的前面几个步骤,或者前面几个小时所采用的步骤,但会随着时间的推移,厌倦会导致这种工作的中断:所采用的步骤没有记录或者是跳过了记录。而口述是一种相对比较轻松的记录故障检修过程的工作,能记录下自始至终的每一步。
        其他的工具,要视乎你的工具包是否还有额外的空间,以及你实际的情况,比如,昂贵的FLUKE网络测试仪器,并不是每个人都会配备的。

软件工具包
        网管员可以根据自己的习惯、爱好等选择适合自己的软件工具包,软件工具包的形式可以是LiveCD或者集成了维修工具的Windows PE启动光盘,也可以是别的光盘,我用的Windows PE启动光盘是深山红叶工具光盘,很好用,网络上有很多与之相类似的工具光盘。Live Cd我选择的是Knoppix汉化版,Live CD的选择有很多,比如Trinity Rescue Kit等等,都可以作为急救用的Live CD。
现在闪存容量越来越大了,加之现在的新电脑都支持从闪存启动系统,我们完全可以制作成Live USB,在一定程度上比Live CD更为灵活。即使不做Live USB,也可以把常用的工具拷贝到闪存内,以备急需。关于这方面可以参考我在2007年5期《电脑自做》第96-101页刊登的《闪存扩展 随心而动》文章。
还有一些驱动软盘,虽说现在软盘和软驱近乎绝迹了,但有些场合还是需要的,比如RAID驱动程序等等。


杂项
        其他还有一些乱七八糟的东西,我带的就有小门垫、工作服、套衫、休闲鞋、巧克力什么的。很惊讶吧?嗯。我带的小门垫的真实作用是在拥挤的服务器房绕电缆的时候,我跪在上面用来保护我的膝盖。而不是跪下向客户和管理人员请罪,哈哈!
很多公司对员工的着装有很严格的要求,必须穿正式的服装,不能穿休闲的,那么在脏乱的库房和机房里,这一身正式的、严肃的服装是不是很让你为难?我带一套工作服、套衫、休闲鞋就是为了应付这种窘境的。
巧克力是干什么的?不怕各位笑话,我这人有时候有点胆怯,面对未知的故障的时候有时会感到恐惧,这时候吃点巧克力能提高血糖帮助消除恐惧感。

笔记本
        从一定意义来说,它可以说是工作日志。你可以用纸媒介的本子来记笔记,也可以用电子版形式的,只要能达到目的就好,我用的是电子文档。笔记本对于我来说,它的作用就是告诉我:出现问题时,哪些发生了变化。
        当出现一个新的问题时,所要问的第一件事往往就是出现问题之前,是否有什么变化。
任何网络操作系统都是一个有问题的系统,有时因为一些不能解释的原因,甚至大部分无害的变化都有可能变得一团糟。如果你的笔记本,记录了每个服务器、每个设备所有变化的详细日志,能节省你用在故障检修上的数个小时。作为我来讲,我有每个服务器单独的Excel电子表格,记录了安装新软件包、安排重新启动与否、添加新驱动器或者别的软件等等,还有时间、日期、服务器每次变化的属性。
如果在本周对服务器所做的更改,在下周引起了问题,那么你的笔记本就将发挥非常大的作用。
笔记本对于任何故障的成功解决非常重要。一个人对管理机器明晰,而他的同事却什么都不懂,这就毫无意义了。我认为,这是一种非常危险的处境,特别是问题中的任务对网络的安全至关重要。如果一旦这个人发生意外,其余的人该怎么办呢?
        从实践经验来看,随着新过程的发展将其文档化的做法是值得鼓励的。我就有过这种经历:曾经完美处理过一些事情,但仅仅过了一个月之后就遗忘了!这时候我多么希望自己以前就记录到笔记本上啊!这种情况经常会发生。
        实际上,根据我的经验,当出现问题时,不论是打印驱动程序被破坏,还是客户端连不上网络,都应该记笔记。十有八九在开始进行之前,当处理问题之后,回到办公室就会忘记自己做了什么。
想象一下,如果处理问题时和不断升级必须有一段停机时间,回想使用的规程可能没有归档,会怎么样呢?
笔记的归档也很重要。虽然归档的内容有一些可能会过时了,比如Windows NT,但无论什么方法,都要保存起来。一些详细任务可能再次适用于当前的网络。另外,当按照新规程部署或者进行Beta测试时,归档就更为重要。如果坚持这种做法,这样任何人走入服务器机房都可以按照归档的笔记执行任务,这对网络管理工作不是很好吗?
故障检修秘诀
        Hello,现在我们终于到达了文章最重要的部分。

我的心得

热词搜索:

上一篇:交换机和路由器安全设置(4)
下一篇:网管直面故障(2)

分享到: 收藏