获取信息的速度快慢已经成为制约互联网发展的重要因素。如何在现有的网络资源下提高用户获取信息的速度,已成为困扰众多数据中心、ISP和企业的一大难题。以负载均衡器为代表的互联网加速产品应运而生。它们将成为未来互联网上不可或缺的一部分。
为了不再看到“Server Too Busy”
上网过程中用户最不满意的是什么?来自CNNIC的最新调查报告表明,用户认为上网过程中最不能令人满意的地方是速度太慢。
电子商务逐步走入众多传统企业时遇到的最大阻力是什么?网络平台的性能和服务水平仍不可靠显然是重要的因素之一。
由于用户急剧增长,获取信息的速度快慢已经成为制约互联网发展的重要因素。尤其随着电子商务的迅速发展,企业的信息中心已经从侧重计算与数据处理的计算中心和侧重网络与数据通讯的网络中心发展成为一个将计算中心与网络中心功能平衡优化的集成一体的数据中心。作为企业电子商务网络的基础核心,数据中心将汇集高性能计算、数据通讯、语音通讯等处理功能于一体,成为支持企业未来电子商务系统应用的必然平台。
但是,作为企业网的心脏,数据中心面临着众多的挑战。扩展性、灵活性、高性能、可靠性、高密度和安全性无一不是数据中心不可或缺的要求,尤其是在数据流急剧增长的时候还要进行持续稳定的运行。很难想象用户会在屡次遇到“Server Too Busy”后还能再次访问这个网站;更难以想象正在进行信用卡支付时遇到掉线会有多么严重的后果。那么,如何解决这个瓶颈问题呢?如何才能切实提高网络的服务质量呢?
显然,传统的网络结构已经不能满足这种高质量的需求。在仅靠不断增加带宽的方式提高访问速度收效甚微的情况下,想切实提高网络服务质量,就需要在现有网络层次结构中专门增加一层,以专门用于提高网络的响应时间。
目前这种用于加速互联网络的产品有许多,代表技术有负载均衡、高速缓存、SSL/XML加速、流量与带宽管理等。目前,此系列产品已经越来越普遍地被各数据中心、ISP、企业网站使用。他们往往分布在应用服务器和路由器/交换机之间,有人称之为“前端基础设施”。
所有这些技术都能改善网络速度、提高服务质量,但机理不同,适用的范围也不尽相同。以下详细介绍各个技术的特点和适用范围。
负载均衡技术
现在互联网上有多少客户?十分钟后客户数目会增长吗?这些问题恐怕谁也回答不了。互联网的快速增长已经使网络服务器面对的访问数量大大增加并且更加不可预知。如今,服务器必须具备提供大量并发访问服务的能力,其处理能力和I/O能力已经成为提供服务的瓶颈。如果客户的增多导致通信量超出了服务器能承受的范围,那么其结果必然是——宕机。
显然,单台服务器有限的性能不可能解决这个问题,一台普通服务器的处理能力只能达到每秒几万个到几十万个请求,无法在一秒钟内处理上百万个甚至更多的请求。但若能将10台这样的服务器组成一个系统,并通过软件技术将所有请求平均分配给所有服务器,那么这个系统就完全拥有每秒钟处理几百万个甚至更多请求的能力。这就是负载均衡最初的基本设计思想。
最早的负载均衡技术是通过DNS来实现的,在DNS中为多个地址配置同一个名字,因而查询这个名字的客户机将得到其中一个地址,从而使得不同的客户访问不同的服务器,达到负载均衡的目的。DNS负载均衡是一种简单而有效的方法,但是它不能区分服务器的差异,也不能反映服务器的当前运行状态。
其实,这种负载均衡的基本设计思想只能算是负载均衡技术的最初应用。现代负载均衡技术除了可以做到合理、平均、实时地均衡系统负载外,还能够确保系统正常运行的高可用性和高可靠性。
负载均衡服务能够平衡服务器群中所有的服务器和应用之间的通信负载,根据实时响应时间进行判断,将任务交由负载最轻的服务器来处理,以实现真正的智能通信管理和最佳的服务器群性能。
假设每个服务器能响应的请求为每秒10万个。如果不采用负载均衡,那么该系统就只能达到每秒 10万个的响应,即使采用三台服务器,也有可能在不到每秒30万个响应的时候就会出现某台服务器由于访问量过大而宕机;如果某台服务器出现故障,则可能导致数万个请求不能得到正确的响应。但如果采用负载均衡,不仅当服务器出现故障时可以自动将指向该服务器上的响应分担到其他服务器,还可以在数据量不太大时也将任务分配到各个服务器中,避免出现有些服务器数据量很小而有的已因数据量接近极限导致性能急剧下降的现象。如果数据量超出了服务器的响应能力,只需增加服务器数目就可以平滑升级。也就是说,负载均衡技术不仅可以维持网络系统中负载的均衡分配,还能够维护网络系统的高可用性运行,因而是保证网络系统高性能的重要技术。
现代负载均衡技术通常操作于网络的第四层或第七层。负载均衡器可以根据实际的响应时间制定优先级交付决策,从而实现高性能、智能化流量管理,达到最佳的服务器群性能。采用第七层应用控制还可以减少通信高峰期的错误讯息,因为差错控制和流量管理技术可以侦测到一些错误信息并透明地将会话重定向到另一个服务器,使用户顺利地进行使用。例如,图一中服务器A不可用或者数据库出现错误,错误信息将会返回到负载均衡器上,然后会将客户的访问指向服务器B或者将消息重放到其他数据库中去,整个过程对用户是透明的。
由于采用了负载均衡技术,自动故障恢复得以实现,服务的时间可以延长,24×7可靠性和持续运行成为可能。另外,负载均衡器一般也支持路径外返回模式,即绕过流量分配器,为那些焦急等待大量数据文件请求响应的客户提供更快的响应时间。
在最新的负载均衡产品中,智能化越来越明显。一些智能化的负载均衡器能够侦测到像数据库错误、服务器不可用等信息,从而采取措施使会话恢复和重定向服务器使电子商务能够得以顺利进行。多址负载均衡器可以对客户发来的访问请求进行解析,计算出最佳地址,然后将该地址返回客户,使客户自动连接到对其请求来说最佳的数据中心。
负载均衡技术解决了出现大流量数据时服务器的智能化分配,但统计发现,在网络应用的需求中存在着许多冗余的内容,这些重复的需求占用了大量的网络资源。具体地说,在互联网上80%的用户都在访问20%的热门网站,而在这些热门网站中又有一些热门的内容吸引了绝大多数访问者的注意;对于企业局域网而言,员工所发出的网络指令也存在着很大的重复。以上的情况造成了计算机执行的指令具有很高的重复性,这是仅用负载均衡技术不能解决的。
缓存技术就是基于以上的情况产生的。缓存设备会监视Web请求,检索它们,然后存储为它的对象。后来的用户将直接从本地的缓存设备而不是真正的目标站点获取该对象,从而达到提高响应性能,减少带宽压力的目的。
有效放置的缓存设备可以及时向最终用户传送Web网页,提高Web站点的效率,减少WAN访问费用,甚至可以建立起一道抵御外部黑客攻击的安全防线。因此,不仅对于那些能够迅速地从缓存技术节省下来的费用中盈利的ISP和电信公司,而且对于企业而言,缓存技术也同样具有着越来越大的吸引力。
缓存技术的基本概念是:由于从网络的边缘索取对象比从Internet中索取的速度更快、费用更低廉,因此将Web数据靠近最终用户保存,可以使服务提供商保留带宽,节省费用。缓存设备工作在比路由器更高的层次上,能够把用户所要访问的网络信息 “抓”到本地,在最短的时间内将信息连续、完整、实时地传递给最终用户,不仅大大缩短了访问响应时间,而且极大地提高了高峰时间网络所能承受的访问容量。可以说,缓存技术降低了目前广域网通讯带宽成本,是提升互联网访问性能的最好方法。
早期的缓存技术可用来节省带宽以减少网络拥塞,但它们不可避免地引起了以下问题:一是用户有可能得不到网页的及时更新,因为缓存区不可能自动跟踪网页的变化;二是为得到最新网页,用户访问时需要首先查询真正的服务器上的内容,这将导致访问速度的降低。
目前使用最多的缓存技术产品是Web Cache。一提Cache,大家自然会想到计算机里面的高速缓存,实际上,Web Cache的功用远不止存储和提供数据这么简单。Cache是作为基于软件的代理服务器的一部分或专门的硬件(appliances,容器)出现的,本文主要谈后者。与前者相比,它可以提供更好的性能。不同的生产商提供的产品在许多方面存在着差异,其中包括配置和设置的难易程度、使用的协议、安全性能、远程管理、能够用于缓存的Web传输的类型以及价格、售后技术支持等。
Cache设备可在用户端储存最常浏览的网页内容,随时提供给用户存取,还可同时监控内容的来源,以测知网页是否已更新,并同步更新储存的内容。一般来说,在配置了互联网加速设备后,由于很多用户浏览的内容可以从高速缓存中直接调出,网络效能会有明显的大幅提升:网页响应时间最多可以减少90%以上;频宽使用率将增加30%~50%。
SSL/XML加速
解决了服务器分配和缓存的问题之后,在网络传输的内容上,由于SSL和XML仍占用相当的服务器资源,仍然会影响网络的传输速度。它们能加速吗?
SSL(加密套接字协议层)是一种应用极为广泛的WEB信息安全传送协议。最初由 Netscape开发以提供Internet上的安全连接和传送,目前,98%的Web上的安全传送都运用SSL。SSL已经成了安全互联网交易中数据加密的工业标准,采用SSL的网站在1998年和1999年间增加了两倍。由于SSL运用加密算法和密码,其加密/解密过程需大量占用服务器的CPU资源,使CPU利用率接近100%,从而大大降低了服务器性能。当网络用户大大增加后,网络性能将急剧降低,很可能用户会因网络响应欠佳而失去耐心离开网站。
电子商务时代,服务器反应速度至关重要,为根本解决SSL给服务器运行带来的不利影响,必须采用专门设备处理SSL协议,以使服务器CPU从繁重的加密/解密过程中解脱出来。
当使用SSL加速器时,所有非SSL数据流可以未受任何改变地通过加速器;但是当由SSL加密过的数据流经过SSL加速器时,进入的SSL数据流被解密并干净地传给服务器,而外流的SSL数据流被加密并传向客户。这样服务器只需简单地处理SSL 请求,原本消耗众多计算资源的HTTP/SSL现在被专用的SSL加速设备负责处理。使用了SSL加速器之后,系统每秒处理的安全连接数可由原来几十个增长到数百个。当然,如果需要最大限度地利用服务器,也可以卸载SSL处理工作。
此外,SSL加速器可以实现灵活的动态堆叠,实行自动的“任务分担”以得到最大的扩展能力。一般SSL加速器可以自动与所有类型的服务器协同运行,并可以支持一台或多台服务器。
XML(扩展标识语言)是SGML(标准通用标识语言)的一个子集,它已经快速取代EDI (电子数据交换)成为B2B网上交易的统一格式。事实已经证明,XML所采用的标准技术最适合Web开发。XML支持结构化的数据,可以更详细地定义某个数据对象的数据结构,例如,描述产品,详细定义该产品的生产厂、产品名、产品号、产地等信息,这种定义不仅为标记该产品提供方便,而且这种XML数据很容易按生产厂、产品名等排序,使用户的查询变得更方便。
XML加速器可以将XML交易进行分类,如按照商业合作伙伴名称或类型、交易价值或数量以及时刻或时区为依据,配置业务优先级,从而提高响应速度,解放服务器资源,更快地处理交易。
智能化的XML加速器可以使用多变量分类包括与、或,以满足复杂业务的优先级要求。还有的XML加速器自身提供服务器的负载均衡,以达到快速、安全的目的。
带宽的重要性对网络来说不言而喻。但在实际应用中,由于众多数据流同时使用带宽却无法按照任务的关键性和时间的敏感性分级,所以关键应用带宽往往未被高效使用,带宽的使用效率低下,成为网络传输的瓶颈。
例如,与Web浏览相比,电子邮件的任务关键性要高一些,但对时间的敏感性并没有过高的要求;而实时的游戏等,对时间非常敏感,但任务的关键性并不大。如果对这些数据流不加分析地传输,必然会影响网络传输的效率。
带宽管理器使用户可以高效地管理网络通信、提供差别服务并控制广域网络带宽分配。由于使用带宽管理器可以赋予带宽优先级,因此可以加大关键业务的带宽,限制非关键或大容量应用的带宽,提高众多应用和服务的功能。
带宽管理器适用于高速局域网和广域网的交界处,是所有数据流的唯一路径。它根据定制的带宽计划进行网络分析,进行精确的流量控制,智能地将通信进行分类。在大容量数据流的情况下,关键应用得以保证,带宽获得高效应用。由于各种应用、多种服务级别都能得到高质量服务,带宽使用效率达到了最大化。
带宽管理器不仅可以分析网络通信状态,还可以提供网络报告,使服务提供商可以根据具体数字进行容量规划并评估配置变化所产生的影响。
值得说明的是,以上谈到的负载均衡、高速缓存、SSL加速和带宽管理等各项技术既可以单独使用,也可以相互结合,或者集成到交换机或服务器中去。目前许多厂家已经生产了集合两种或两种以上加速技术的产品。也许几年以后,我们可以看到更为集成的 “互联网加速器”或者已经集成所有加速技术的新型互联网服务器。
选择适合自己的加速产品
随着电子商务开始真正腾飞,网络加速设备的重要性越来越明显,渐渐从服务器中分离出来,成为网络环节中的重要部分。从全球市场上看,从1995年市场开始启动,到目前已经进入快速增长期。预计从明年起到2003年,网络加速市场将进入成熟期。在中国,目前几乎所有的数据中心、大型ISP/ICP都已经采用了一种或数种网络加速设备。相信随着市场的竞争加剧和互联网的进一步发展,此类产品将被越来越多的企业网站和ISP、ICP采用。
如前所述,网络加速系列产品种类较多。目前市场上此类设备的主要厂家有Intel、 Alteon WebSystems(已被北电收购,现称北电网络内容传输部,下仍简称耀腾公司)、CacheFlow、ArrowPoint Communications(已被Cisco收购)、F5 Networks、Foundry等公司。
负载均衡产品、流量管理和宽带管理产品主要用于数据中心等数据量非常大的场所,对动态的电子交易尤为重要。国内市场Intel、Cisco和耀腾公司都有相当的份额,如世纪互联、263、中国万网等都采用了他们的产品。此类产品种类较多,从基本的基于响应时间的负载均衡,到可以提供智能会话恢复和服务器错误恢复的智能负载均衡器,以及DNS多址负载均衡,都有相应比较成熟的产品。用户选择负载均衡产品时,需要考虑自己的流量、服务器负载能力和数目等情况,根据自己的需求选择适当的产品。宽带管理器目前产品还不太丰富,许多被集成在其他产品中。
Intel公司拥有网络流量管理的全套解决方案,有以上介绍的各种类型的负载均衡产品。耀腾公司的系列Web交换机提供服务器负载均衡和带宽管理,尤其是其防火墙的负载均衡技术被许多数据中心采用。Cisco公司将ArrowPoint的产品更名为Cisco11000系列内容服务转换器,采用负载均衡技术避免服务器的超负荷工作。
高速缓存技术可以适用于企业用户、服务提供商和信息提供商,具体说来,DDN用户、有众多分支的单位(如银行、石油、电力、证卷、政府、学校等)以及ISP、ICP(如教育网、科技网、各大型网站等)和电子商务站点都可以从高速缓存中受益。
Cache的性能指标有很多,如同时支持的连接数、每秒钟的供应对象数、吞吐量以及平均对象命中率(用户从Cache中取到的对象数与所获得的总对象数——包括从Internet上获取的对象数和从Cache中获得的对象数——的比值)和平均字节命中率(用户从Cache中获取对象的平均字节数和从网上获取的全部对象的平均字节数的比值)等。连接的数目是选择适当容量、确定产品种类的依据,用户可以根据自身环境选择支持数百个连接或者几万个连接的产品;吞吐量是影响性能的另一个重要因素,如果选择不好,Cache反而会成为网络中的瓶颈;对象命中率和字节命中率则显示了Cache的效果,例如某个Cache的命中率是50%,就意味着Cache可以满足一半的数据请求,而另外一半数据则需要通过 Inernet得到。目前大多数Cache的命中率都在30%左右,容量大一些的Cache通常可以达到60%到65%。根据性能的不同,用户可以选择适合自身环境的Cache设备。
目前市场有CacheFlow、Cisco、耀腾、Intel、联想等数十家厂商提供 Cache产品。CacheFlow提供了从入门级到顶级的各种产品。Alteon的系列内容智能交换机能对进入的客户端请求具备智能过滤能力,避免将不可缓存的请求传递给高速缓冲服务器。Cisco、Intel也都有数款系列缓存器。联想iCache是硬件和软件组合的解决方案,它借助Novell公司的高速缓存文件系统,拥有面向各级各类企业、ISP、ICP的产品。
由于SSL一般适用在互联网交易中,所以SSL加速产品广泛应用在商业网站服务器上。但这并不意味着其他场合不需要进行SSL加速。在企业的内联网,随着越来越多的资源和工具都开始面向因特网,对潜在的敏感性数据(如工资表或个人信息)进行加密的需求使公司内部网络也在逐渐采用SSL技术。另外远程公司与公司合作伙伴之间的安全通信也通常采用SSL来加密HTTP文件传输。
目前在SSL加速器市场上Intel和耀腾都有自己的产品,CacheFlow公司也于今年推出了SSL加速设备。
作为一种完整的解决方案,Cicso提出了全面的CDN(内容传播网络)解决方案,包括内容分发和管理、内容路由、内容交换、内容边缘交付、智能的网络服务等。其中Cisco CSS(Content Smart Switch)系列交换机是整个体系结构的重要组成部分。除了高速智能Web内容交付、防火墙负载均衡功能、高质量的Cache服务外,Cisco CSS系列还配备了Cisco WebNS软件,它知道用户是谁、希望干什么以及如何在一个全球性的Web网络内最佳地服务于用户的请求,能使Web和应用服务供应商、Web内容供应商以及参与电子商务的企业为电子商务和Web内容交付建立优化的全球Web网络。
负载均衡产品
Intel NetStructure 网擎7175/7185
英特尔网擎7175网络应用负载均衡器使用有效的第七层应用进行智能内容决策的制定,对交付进行优先级划分,从而平衡了通信负载并优化了服务器群的性能。该产品可进行第四层至第七层应用/内容流量控制,使用基于实际响应时间的负载均衡进行通信管理,还可检测HTTP400、500和600系列错误,并透明地将通信重新导向至另一台服务器。自动服务器故障切换和冗余特性可以让通信绕过故障点,从而使站点始终保持开放状态。
英特尔网擎7185网络智能负载均衡器可以实现安全快速的流量管理并提供SSL加速。它采用机架安装式设计,可以被轻而易举地安装在路由器和服务器群之间。支持安全交易的智能管理技术,同时支持内容驱动处理与优先级划分的第4层到第7层识别。该产品支持SSL环境中的cookies,确保交易安全;可以将处理速度提高到每秒钟多达1200个SSL连接,提高安全交易的响应速度。
Alteon ACEdirector
ACEdirector可同时支持第2、3以及4至7层上的交换。与传统数据包交换机不同, ACEdirector 在高性能以太网交换机内结合了独有的流量管理服务,为每秒转发数十万个Web会话而进行了优化。本地和全局服务器负载平衡、应用程序重定向、SSL负载平衡、基于URL的重定向和负载平衡以及高级 TCP/IP 过滤功能等,都集成在同一个ACEdirector中。ACEdirector能够以惊人的速度转发Web会话,每秒可处理高达200,000个会话的负载平衡。
高速缓存产品
联想 iCache 2000
联想iCache是系列产品,拥有从入门级到高端的各级产品。iCache2000定位于中端产品,面向用户为中型企业、中型ISP/ICP、科研机构等,它所能承载的每秒点击数是800次。iCache使用简单,借助Novell公司特有的高速缓存文件系统,可以很大程度上加速在企业中或ISP基础设施中、在Internet上向员工和商业合作伙伴及客户提供Internet和 Intranet内容的访问速度,一方面提高用户网上交易的效率,同时也极大地降低了用户的上网费用和ISP、ICP的运营成本。
CacheFlow 5000
CacheFlow拥有针对从中小企业到ISP的各级互联网加速器,其中CacheFlow 5000是电信级互联网加速器。它最高可以支持到T3或OC3的流量,同时也是目前系列中扩展性最强的高速缓存设备。CacheFlow 5000内置有CacheFlow公司专为互联网加速设计的操作系统CacheOS,可以保证用户在现有网络条件下以最快的速度获取到最新、最即时的网上信息。
SSL加速产品
Intel NetStructure 网擎7115
英特尔网擎7115 SSL加速器每秒能处理多达600个安全连接,提高了SSL处理能力。可以使用串行连接端口直接管理设备或通过Telnet或SSH进行远程管理。可利用事件监视功能察看主要的设备指标,如SSL每秒连接速率,并接收时间告警,如加密状态改变、被拒绝的SSL连接、阈值告警、过载告警及网络链接。随着商业网站通信量的增长,该产品还支持多个单位级联在一起进行扩充。故障切换直通技术使英特尔网擎7115 SSL加速器能够自动关闭服务,并根据情况切断SSL功能,使与之连接的其他单元或服务器接替其工作,以实现不间断的服务。
Alteon iSD-SSL
iSD-SSL是业界性能较高的安全套接层处理引擎,一台Alteon Web交换机和一个或多个iSD-SSL单元成对组合在一起,能每秒钟完成400到12,000个安全套接层的会话,这种处理量是一台HTTP-S服务器所能处理的5到250倍。能在本地服务器卸载SSL处理,从而能智能地对安全的电子交易加速,最终在同一个数据通路中对其它的流量没有耽搁。
带宽管理器
Intel NetStructure网擎7370
英特尔网擎7370应用带宽管理器支持关键应用,调整非关键应用,以使性能满足应用服务级协议(ASLA)的要求。针对每应用、基于政策的带宽分配与通信调节使用户能够监视、测量和跟踪应用及网络性能。服务分界点减少了用于诊断非服务提供商负责问题的时间。基于Web的界面可以使用户利用标准互连网浏览器即可从任何地方配置、控制和监视SLA和应用性能。
综合
Cisco CSS-11000系列
Cisco CSS系列交换机可以根据完整的URL、Cookie及资源可用性信息选择最佳的站点和服务器,提供高速智能Web内容交付;具有防火墙负载均衡功能,可为后台数据库和应用系统提供可伸缩的安全保护。透明Cache代理、反向Cache代理及智能Cache旁路功能可使Web高速缓存效率提高400%。 Cisco CSS配备了Cisco WebNS软件,在分配Web站点资源和实现最佳电子商务等方面为企业提供完善的解决方案。
Cisco CSS系列交换机有CSS11050、CSS11150、CSS 11800多种型号,可满足各级数据中心、电子商务网站的需要。
Internet Appliance Enterprise Stack
IA公司的INTERNETpro Enterprise Stack系列是面向互联网数据中心的低成本Web服务基础设施解决方案。其中的企业指导堆栈(EDS)具有负载均衡、系统和应用故障接替、状态监视等功能。企业缓存堆栈(ECP)具有两个内置的10/100M以太端口和透明的代理服务器,可充分利用带宽,加速内容传递。缓存堆栈将经常访问的网页存储在网络边缘(POP),使原本遥远的内容更接近用户,从而大大提高了Web冲浪的速度。