应用交付工程师,这个概念这几年是越来越红火, 但是如何才能算得上一个合格的应用交付工程师呢?
应用交付售后工程师
在应用交付产品出现之前,用户内部通常是网络管理员和应用维护人员的对立,例如:
当一个应用访问出现问题的时候,网络管理员会说,服务器IP能ping通,所以不管我们的事;应用维护人员会说,通过127.0.0.1能正常访问应用,所以也不管我们的事。那如何连接网络和应用?这边是应用交付的由来。
应用交付的意义在于架设网络与应用之间的桥梁,并提升应用的冗余性,稳定性,提高用户访问的体验。对于应用交付工程师,经常遇到的事,莫过于用户打电话来说,在你们设备上做好配置,但是应用访问有问题;或者在你们设备上线之前应用访问正常,而设备上线之后访问出现问题等等。这个时候,和传统网络工程师和应用维护工程师不同的是,应用交付工程师必须找到应用出现问题的具体原因,解决问题,或者至少证明与自身设备无关,这个时候就要要求至少有2个方面的能力要求:
丰富的网络排错知识
其实很多时候,用户反映应用问题,或者设备配置问题,其实都是一些网络层面的问题。我这里有2个例子。
第一个例子:有次渠道工程师在进行一个链路均衡的设备上线,上线以后用户发现上网很慢,就认为是我们设备配置问题,客户一直一直让我们找原因,在后来一次上线的时候,后来经过抓包分析,发现是前端华三设备配置不当,造成了环路,从而影响到链路均衡设备的运行。
第二个例子:在一个服务器负载均衡的项目中,用户反映某一个应用配置以后,一个下属部门始终无法访问应用,怀疑是我们设备故障。通过设备自带的抓包工具发现,当该下属部门发起访问的时候,设备上根本没有抓到相关的请求包,怀疑用户网络路由有问题,导致请求包根本未到达我们设备上,更谈不上访问应用了。后来经过确认,下属部门三层交换机上的网络掩码有问题,导致该部门发起的对应用的请求根本就未通过网络转发到负载均衡设备上,自然谈不上正常访问了。
这种类型的情况我还碰到过很多次,虽然不直接和我们设备相关,但是如果不能帮用户找到具体的原因,就无法证明自己的"清白",所以一定要具备丰富的网络排错经验。
对各种应用协议的熟悉
要处理关于应用的问题,首先需要对需要处理的应用协议有相当的了解,还是举2个例子来说明吧。
第一个例子:有次项目中,对weblogic上的应用做负载均衡,出现一个问题,用户在访问该应用时候,通过门户登录进去以后,大部分页面都正常,但是其中一个选项点进去以后发现无法正确连接数据库,无法显示正常的数据。用户认为是设备问题。后来通过httpwatch抓取http协议包分析有问题的页面,发现打不开页面的原因是因为weblogic建立2次连接的时候,没有访问正确的应用IP,而是访问一个以前配置的IP。将截图作为证据给用户看,用户才接受不是我们设备问题。
第二个例子:在一个链路均衡的项目中,用以替代以前用做出口的防火墙,而原来的防火墙由于有ipsec vpn的配置,所以必须移动内网,同时在出口设备上做映射。但是部署完成后,发现ipsec vpn隧道无法成功建立,经过分析ipsec vpn的协议细节,怀疑是nat修改目标ip后引起ipsec协议的校验错误,后来采用三角传输,对ipsec的包不改变目标ip以后,得以解决问题。
因此,要做一个合格的应用交付售后工程师,需要具备丰富的网络故障排错经验,需要熟悉多种常见的应用协议,且要善于使用4层和7层的抓包工具,这样才能帮助用户定位各种应用的访问问题,且能证明自己应用交付设备的"无辜",毕竟做为应用和网络的桥梁,被“冤枉”是常事。