近日,洲际酒店集团(InterContinental Hotels Group)首席信息官汤姆·科诺菲(Tom Conophy)介绍了该公司应用云的情况。
洲际酒店集团在全球100个国家拥有4500家以上的酒店。通过把存储和内部移动应用程序迁移到云中的多个数据中心,洲际酒店集团改善了用户体验并降低了运营成本。洲际酒店集团的这个举措非常成功,以至于现在这个团队现在正在为迁移到云中重新建立自己的订房系统。这个系统每天处理3.45亿个交易。
但是,科诺菲称,如果洲际酒店集团不把重点放在人们经常容易忽略的带宽方面,一切都无从谈起。
科诺菲称,如果企业员工和企业用户不能足够快地访问数据,那么,这个云不过是一个白日梦。在洲际酒店集团这个案例中,这意味重新设计网络架构以便发送数据库,迅速访问数据和保持数据中心同步。
在讨论云时,人们很容易忘记除了安全之外它还有其它的风险。已经适应局域网的速度和质量的用户如果遇到性能和延迟问题,他们将会抵制这个服务。目前的许多应用程序都是相互依赖的。如果这些应用程序必须远程沟通,如数据中心与数据中心之间的沟通,那么,速度减慢甚至网络中断都是可能发生的。此外,如果存储和备份遭遇太多的跳点,他们可能会拖延时间和失败。
位于俄勒冈州波特兰的独立研究公司Voke的创始人特丽莎·兰诺维茨(Theresa Lanowitz)说,尽管有这些潜在的灾难性的后果,许多企业在云计算战略中并没有考虑带宽的问题。
测试云应用是关键
兰诺维茨说,大多数企业并不是在集成的环境中测试自己的基础设施。因此,他们没有办法保证应用程序、备份和存储满足规定的服务质量要求。
互联网通道中充满了流视频和音频等各种各样的通信。这些通信可能对数据库的性能产生不利的影响。此外,许多应用程序没有为云服务进行压缩,也就是压缩代码以减少传送的数据量。当离开局域网的时候,这些应用程序可能会崩溃。
兰诺维茨建议在把应用程序永久性地放在云中之前要使用仿真工具,如Spirent Communications和Ixia等公司的工具,以此发现潜在的带宽瓶颈。洲际酒店集团这样的公司可以仿真典型的高峰期状况,如通过云应用程序进行的早上退房结账。
兰诺维茨表示,这不再是提供一个好应用程序的问题,而是关于那个应用程序在野外是否能够存活的问题。你必须最大限度使用这个基于云的应用程序并检查在这种情况下这个网络承受这种应用的能力。
让合适的人员参与
企业管理协会的研究主管吉姆·弗雷(Jim Frey)同意兰诺维茨的观点。他的研究显示,IT部门并不总是让恰当的人负责预测和解决带宽瓶颈问题。熟悉网络并且能够在发生故障之前就采取措施解决问题的人通常不会参与云存储和应用的问题解决。
弗雷在2011年2月发表的题为“网络管理与虚拟化云的负责人”的报告称,在调查的151位IT专业人员中,62%的受访者正在使用某种形式的云服务。66%的受访者在服务性能、质量监视和保证方面依靠内部云或者虚拟化支持团队。在许多企业中,其他负责云服务的人员来自于存储或者数据中心管理、数据中心/服务器运营和安全部门。
只有54%的受访者表示,负责人中包括网络工程师和网络运营人员。这个比例低于2009年的62%。弗雷说,令人遗憾的是由于负责人员脱离网络工程,使最基本传统的最佳做法都靠边站了。
弗雷在报告中称,云服务和部署虚拟服务技术通常使企业很难管理网络的方方面面。有一些虚拟网络单元应该采用同样的监视和管理网络的最佳做法,就像网络连接通道上的其它单元一样。
弗雷后来说,需要关注的主要的网络虚拟属性是带宽。
按照弗雷的观点,许多IT部门对整个通信传输的健康关注不足。例如,只有28%的受访者认为,为了监视和排除故障而收集虚拟机之间的数据包是绝对必要的。只有32%的受访者认为,为了监视和排除故障而收集有关通信的数据,也就是收集来自虚拟交换机的NetFlow信息,是绝对必要的。而这两个任务都能够让IT部门了解网络及其通道的性能如何。
拥有这些知识,企业就会发现他们需要额外的帮助以缓解瓶颈和改善最终用户体验。这些帮助包括广域网优化控制器和应用交付控制器等。为了防止多次复制同一个数据引起网络阻塞,IT部门可以使用物理的或者虚拟的广域网优化控制器中的删除重复数据功能。IT部门还可以在本地缓存数据以便减少来回传送的通信量。
为数据备份优化网络
位于华盛顿的International Justice Mission (IJM)公司负责信息系统的副总裁约翰·莱克斯(John Lax)认为,广域网优化控制器能够让面临带宽挑战的全球非盈利组织向云中迁移。
从性交易和性奴役中挽救儿童的人权组织IJM在全球10个国家拥有500名员工和14个现场办公室。莱克斯称,许多员工承受着三项挑战:超低带宽(例如,每秒512KB)、频繁掉线的脆弱连接和昂贵的费用(例如,在乌干达的一个每秒256KB的链路每个月1200美元)。
向边远地区推出云服务必须考虑到这些问题并认真制定计划。他解释说,这个组织要最大限度保持线路通常,不中断。
莱克斯确定边远地区的员工使用云的最佳方式就是备份。他说:“我们不再需要人工干预变化和跟踪磁带。每一样现场的办公室都已经安装Riverbed的Whitewater云存储设备。这些设备连接到IJM在弗吉尼亚州里士满的数据中心中的其它Whitewater设备上。”
关于儿童的敏感文件数据是必须加密、删除复制和压缩的,以便加快传送。这个数据中心的Whitewater设备还与一个Whitewater虚拟设备一起使用以便在亚马逊的S3云服务中备份和存储文件。
莱克斯称,这个设备会使通信量减少到原来的六分之一,由此会减少带宽成本和保证更短更准确的备份窗口。此外,如果用户意外删除一个目录,他们能够在12秒之内从内置缓存中提取这个目录,而不像以前那样需要36个小时才能从磁带中恢复。总之,IJM能够向云中备份5.5TB数据以保证这个组织工作的安全和完整性。
在数据中心之间实现同步
虽然优化设备只是一步,解决带宽瓶颈还有很长的路要走,但是,洲际酒店集团的科诺菲采取一个不同的策略。同莱克斯一样,科诺菲必须设计其云网络以支持遥远地区的用户。该公司在佐治亚州、弗吉尼亚州和加利福尼亚州有三个主要的数据中心。在迪拜、上海、新加坡和悉尼有备用的数据中心。科诺菲称,这些数据中心接近用户以便优化和加快用户体验。
虽然在没有大量投资的情况下,保持所有数据中心的数据完全同步是不可能的,但是,科诺菲要接近实现同步。依靠包括智能手机、平板电脑和网站等各种资源的客户在未来10年里每年将做500亿次交易。科诺菲说,我们的客人通过多种渠道和设备联系到我们。我们的挑战是保持客人预订房间的数据和用户个人简介等数据的同步,同时满足日益增多的交易量的挑战。
使用Terracotta企业套装软件,洲际酒店集团迅速和有效地同步Java虚拟机。缓存分布到各个数据中心。科诺菲解释说,它基本上是一个库,让我们的数据从主数据库转向多个节点。这个结果是比传统方式的访问速度快50至100倍,从一个数据中心到另一个数据中心的更好的索引和完整性。
查看内部
科诺菲说,有时候,你创建自己的数据风暴。如果企业把一个必须频繁地访问一个内部数据库的应用程序放在云中,这个事情就可以发生。来回传送数据可迅速增加通道的负担并且引起性能问题。
为了避免这种事情,企业管理协会的弗雷建议使用一些工具描绘应用程序的相互依赖关系并且制定云策略以容纳这些应用程序。得到应用程序相互依赖的指标,你就可以让这些应用程序相互之间更接近一些,从而减少延迟。
很像一个内部网络,更大的带宽有时候是解决阻塞的唯一的解决方案。如果你突然把所有的用户放在谷歌应用等基于云的服务中,你就需要你的办公楼和远程办公室有更多的带宽。当决定向云中迁移的时候,这个现实必须要考虑。
虽然对于云相关的考虑来说,带宽一般都放在次要的位置,分析师兰诺维茨说,现在是解决这个问题的时候了。失败的风险正在增加,因为现在,公司的品牌效益与技术不可分割地联系在一起。这就是说,企业不能把带宽质量控制交给外部的提供商。带宽质量控制是必须保留在企业内部的。