在很多人眼中,网络分析是一个高深的技术,是一项很难的任务。而在实际的网络管理中,也常常是在发生故障和问题的时候才想到网络分析。如何看待网络分析?如何善用网络分析?带着这些疑问,记者采访了科来软件技术总监高彦刚先生。
科来软件技术总监高彦刚先生
记者:为什么需要网络分析,它对于在网络管理的意义是怎样的?
高彦刚:网管的概念十分广泛,所做的工作繁多,网络分析是这个过程中很关键的一部分。要做好网络管理,首先要知道怎样去管理,要有一个明确的管理目的以及自己需要为实现管理所做的工作内容,而分析恰恰是解决这个环节非常重要的部分。
如果不能把问题产生的原因分析清楚,就没办法做到有效、科学的管理,这也是网络分析是网络管理过程很重要的一部分的原因。所以说,数据分析应该含盖在整个网管的过程里。
记者:现在的网管工具也可以监测到网络数据,是否就不需要网络分析了?
高彦刚:网管工具一般监测的是诸如交换机、路由器等设备的运行状态,而网络分析并不局限于数据包级的分析。分析是一个过程,其中最核心的部分还是人,即最终做分析的是人,而不是设备。人只是借助于各种工具和系统进行分析,网管工具就是其中的一种工具。
做为一个大企业用户的网管,需要用到多种多样的网管工具,这些工具和系统都可能提供一些数据依据,这些都作为网管员分析判断的依据,最终靠人来作出分析的结论。正如医生诊病,通过化验、B超、CT等一系列的手段来分析,这些手段给医生提供的都是数据依据,但是层面不一样,有些反映的是表面的问题,有些则反映底层问题,不同工具反映的深度不一样。有些管理人员可能通过一些表面现象,比如某台设备运行缓慢,根据自己的经验判断就可以做一定的分析,但这些分析有可能并不完全准确。如果能深入地看到网络中正在传输的数据,他的判断可以更准确,效率也更高。
记者:网络分析在国外发展得比较好,在国内发展到什么了程度?
高彦刚:从科来的感觉,这两年这个市场的发展还是非常快的,越来越多的用户在重视这方面的管理。现在的网管本身是维护用户业务正常运行的一个基本的需求,因此网络分析这一业务的发展也是很迅速的。
然而就行业来讲,国内仍然有大量的大型企业客户在网络分析这方面是一片空白,但我觉得这是一个逐渐发展的过程,核心还是人的技术水平提升的过程。以前的网管,更多地只是流于表面性的网管,并不具备更高的技术能力去管理维护好一个网络,甚至说很多用户都没有专门的人去管网络,这一点是问题的关键。
然而,这个问题正在很快地进行着改变。现在越来越多的客户都设置了专门的人去管理网络,甚至有专门的人来分析网络。认知到必须有一个良好的网络分析才能实现良好的网络管理,真正地使人在水平上得到提高,管理水平的提高归根结底还是人的水平提高。
这是一个逐步发展的过程。因为诸如美国等发达国家的网络管理,经过多年的发展积累了众多的技术人员,一些老的技术人员可能从事了几十年的网管工作,而我们国内很多用户的网管还是比较年轻的技术人员,所以这是一个不断积累的过程。网管员的需求量会越来越大,因为用户的网络对业务的影响越来越关键,网管也会越来越重要。以前往往很多技术人员不愿做网管,因为他们不是真正的业务人员。例如法院也会有相应的网络,但是人们都更愿意去当法官审理案件,从事业务相关工作,而不是去管理网络。然而现在人们认识到了网络越来越重要,因为现在的很多业务都是在网络上运行的,网络出现了问题就会影响业务的正常运行。所以,慢慢地随着网络地位的提升,人的认知也在提升,技术也在提升。
记者:在取得网络分析数据之后,如何让用户知道在哪里出现了问题,需要怎么解决?
高彦刚:网络分析涵盖的范围很广泛。作为一名网络管理人员,可能更关注以下两方面:一是网络有没有设备的损坏、故障,这里面的数据可以通过网管工具得到;二是分析网络中有没有丢包、拥塞、时延等网络服务质量问题,这就需要通过数据包级的分析工具去取得相应的分析,来确定网络的状态。
一些应用的管理人员,可以通过分析整个交易处理的数据包的交互,看出应用当前的响应时间、处理能力有没有异常,并且可以把详细的应用处理做记录,如果有问题就可以进行追溯。安全管理人员也一样,可以通过分析网络中的网络行为,发现有没有攻击、病毒、木马等。这些都可以通过网络分析的手段来获取,虽然不同职能的管理人员利用的信息并不完全一样,但他们都是通过提取底层的数据包来实现,最终解决出现的问题。
记者:回溯分析是一种什么样的技术?它的应用范围是怎样的?
高彦刚:现在有很多产品可以提出告警,但是告警并不能作为确切的依据。我们的回溯分析系统具有完整的通讯数据包记录,这些数据就可以当做分析问题的依据,尤其是现在很多网络问题、应用问题都如此。回溯分析系统实现了快速历史数据回溯分析功能,使网络分析突破时间的限制,在数据挖掘、追踪定位以及安全取证等方面更精确、高效。
回溯分析系统可以应用于各种类型的网络,取决于用户网络的关键程度或是网络的价值程度。有些用户虽然网络规模很小,但是他的业务很关键,那么他对网管的要求就会非常高,本身也就需要做追溯。回溯分析系统具备出了问题可以进行追溯的特点,尤其是对于一些对网络安全要求很高的用户来说十分关键。
记者:现在数据中心的结构越来越复杂,虚拟化应用也越来越普遍,网络分析产品对虚拟化的支持怎么样?
高彦刚:我们的软件就可以装到虚拟机上。此外,现在不管是云计算也好,虚拟化也好,实际上是对网络的依赖性更强了,因为要有云的话,首先要有网络把各个节点连接起来,各个节点之间的通讯可以很容易通过分析手段来进行分析。现在比较通用的云技术,一个客户端访问过来,会有一些设备做负载均衡和分配,有可能分配到不同的服务器上。而对于客户来讲,他看到的只是一个应用服务,但这个应用服务可能是多台计算机多个节点来提供的,对客户来讲它是透明的,但是在服务器端是相对复杂的。它有相应的负载分配技术、服务器的支持技术,在出现问题时,要分析出问题的所在也相应地比较复杂。
就用户的感知来讲,出现问题就一定是服务器端的问题,但是在基于云技术的数据中心中找到问题到底出在哪是很复杂的,这时候就需要进行网络分析。利用我们产品的分析手段是不错的选择,因为我们的产品可以看到所有数据的交互过程,包括服务器和服务器之间的交互过程。只要是通过网络,我们就可以分析到,为确定哪个环节出现异常提供非常明确的数据依据。否则的话,这个问题很难解决,因为现在的设备太繁多,其中一个交换机出现异常都有可能导致整个服务的异常。此外在用户端的体验,比如100台服务器中只有一部分有问题,那么就有可能影响到了部分客户的访问体验,遇到这种情况该如何解决呢?利用我们的网络分析产品,就可以快速地对所有的服务器会话进行分析,挑拣出有异常的服务器,将结果很直观地呈现出来。