网络现状
某高新区房产局最近推出上线一套在线业务信息系统,该房产办证业务系统为C/S架构,客户端需要向服务器上传办证相关的数据和图片。主要是用于在线办理各种房产相关证件,其办理业务的客户端一般分布在各个区县房产办证大厅或行政服务中心。
该高新区房产局办证业务系统网络部署情况如下:首先办公机器通过管委会的政务专网出口与市房产局的业务服务器进行数据交互,而业务客户端通过防火墙NAT访问业务服务器。业务服务器的真实地址为192.168.10.41,但是其通过防火墙的地址映射功能映射成10.XXX.168.197供业务客户端访问。
最近该房产系统出现以下故障问题:业务客户端连接业务服务器正常,但在进行图片上传时,出现“无法连接到服务器”的提示,无法完成图片上传。
故障分析
因为是业务系统故障,非一般的网络故障,而且使用者并不了解业务系统的网络行为特征,因此,除了捕获数据包对业务系统进行分析之外,似乎没有其他更好的方法了。
首先,我们在任意客户端机器上安装科来网络通讯分析系统,开启对数据包的捕获,然后运行房产办证业务软件。通过科来网络通讯分析系统的“数据包”视图可以观察到,房产办证业务软件运行后,便与房产业务服务器10.12.168.197的1521端口建立连接并传输响应的数据。
但是当我们使用办证业务系统准备上传相关图片文件时,通过科来网络通讯分析系统的“数据包”视图发现:客户端尝试与192.168.10.41建立FTP连接,并且有icmp超时差错报文产生。
既然客户端在上传图片时是尝试与服务器的真实地址建立FTP连接,那么客户端业务系统这边肯定存在一个可以设置FTP连接地址的地方。我们在业务软件的界面中未发现相应的设置点,于是便打开业务软件的安装目录,在其安装目录先发现了一个名为house的初始化文件。
根据科来网络通讯分析系统抓取到的数据包进行分析,发现业务客户端与服务器建立了FTP后,服务器尝试以一个随机端口与客户端建立TCP连接,但是该客户端没有响应服务器的请求。为什么客户端没有响应服务器的TCP连接请求呢? 是否是网卡防火墙的原因呢?
随后,我们尝试将客户端网卡防火墙暂停,再次侧试上传图片成功,
故障解决
我们将所有业务客户端的业务软件安装目录下名为house.ini的文件中的“host=192.168.10.41”改为“host=10.XXX.168.197”,并保存。并将其网卡的防火墙关闭,于是图片无法上传的故障解决。
总结
这个网络故障属于应用层的故障,虽然故障本身并不复杂,但是如果不是通过抓包分析,很难定位解决!这告诉我们:在遇到一些看似棘手的故障时,最好的解决入手点就是数据包分析。而站在网络运行的微观层面做数据包分析来建立业务系统网络行为和运行基准,从而了解清楚各种业务系统的网络行为特征,方便我们对业务系统进行相应的优化或改进,提高故障解决的效率,提高我们业务系统的运行效率。