IT运维管理,创造商业价值!
中国IT运维网首页 | 资讯中心 | 运维管理 | 信息安全 | CIO视界 | 云计算 | 最佳案例 | 运维资源 | 专题策划 | 知识库 | 论坛

怎样才能完善灾难恢复计划

2008年05月22日
IT专家网/
CIO们常常思考怎样改善灾难恢复计划,提高整个商业安全水准。

  总部位于飓风多发区密西西比州的百年机构汉考克银行常常自夸道,就算恶劣天气影响了正常业务,它们也会是最后一个关闭并且是首家开放的机构。这一说法在2005年卡特里娜飓风席卷密西西比海岸时得到了最严峻的考验。“我们损失惨重,”银行IT服务董事Ron Milliet说。

  分布于4个站点,覆盖全国150多个网点的汉考克IT部门受到了巨大损伤,当然,可能还会更糟。事后,银行发现一小部分虚拟化服务器(卡特里娜袭击时该项目刚刚开始),可以在数小时内恢复,而物理服务器则需要数天,Milliet说。许多重要服务器在24小时内开始正常工作。

  至此以后,虚拟化渐渐成为人们关注的焦点,但它对于重新思考灾难恢复和业务连续性战略计划的企业CIO们而言只是一个创新的工具。包括WAN优化和基于电子邮件备份的应用技术都能够降低恢复时间、减少成本、最重要的是提高大灾后业务继续发展的信心。虽然高质量的旧磁带依然是备份材料的主要媒介,但是CIO们还是在寻找可以克服老媒介局限性的新型技术。

  CIO们不仅仅要采取新的灾难恢复技术,“他们还要自己摸索怎么样的灾难恢复方案能够改善整个商业构架,”Forsythe解决方案集团业务连续性解决方案主任Michael croy说。这就可能意味着,例如,分配IT资产能源,将产能过剩工作与备份或镜像站点合并,或将过剩的资源作为军事灾难恢复的一部分。

  因为有丰富的新型灾难恢复策略可用,用户处在一个能够最大限度降低开支、灵活选择非现场恢复服务提供商等状态的前所未有的自主地位,例如:SunGard数据系统公司、IBM公司等,Croy说。

  虚拟化解决方案

  如果从赌徒的目光去看一家赌场,看到的仅仅是老虎机、赌轮、酒吧和餐厅。但是对于IT工作人员来说,同样的赌场则变成一条数据和应用程序的河流,因为它必须保持每天24小时数据轮转,没有任何推托借口。

  位于大西洋城的Borgata酒店赌场和水疗中心一直使用一种传统的磁带备份系统,它“缓慢而不一致”,娱乐中心副总裁John Forelli说,“我们位于一个劳动力密集型的手动世界中”。

  此外,这款磁带系统需要备份大量的网络资源,由于这家2000间客房的酒店需要24小时营业,很难找到合适的时间,在不影响酒店整体工作表现的前提下来进行服务器数据备份,Forelli说。

  2006年,在娱乐中心开张3年后,管理层决定利用VMware虚拟化其Windows服务器,并且利用Double-Take软件公司的备份软件提高系统备份和恢复任务效率。

  Double-Take备份软件通过77个虚拟生产机器恢复某个单一物理受灾目标或者在断电等情况下自动保存数据(自动切换至备份系统)。一旦储备制度被激活,相应的应用服务就开始工作在某个相关的虚拟机灾难恢复站点,当然,用户也可以自动定义其工作流程,Forelli说。

  此外,由于该款软件着眼于数据的字节水平以及逐步的复写,对网络频宽要求较小。“这是一款自动、快速、可控软件,”他说。

  简单是虚拟化在灾难恢复应用中如此受欢迎的原因之一。“ Windows系统则很难恢复,” Gartner的分析师公司Donna Scott说。

  对于汉考克银行来说,卡特里娜的教训就是虚拟化等同于快速恢复、减少企业硬件和电力的开支。可以推测该公司的许多构架都将面向虚拟环境(除一个基于大型机的银行体系)。银行采用5台运行VMware构架的刀片服务器取代了原有的55物理服务器,此举单从成本上来说就节省15万美元的服务器硬体开支,Milliet说。一个潜在的缺点,“我们把许多鸡蛋放在了同一个篮子里,一个坏主板可以在同一时间拖垮大量的虚拟机,”他说。为了避免这种灾难,汉考克采用的是一旦发现危险,能够将VM工作自动切换到另一个物理服务器的软件。

  智能WAN技巧

  目前,众多公司都在寻求能够在网络中提供大量数据的解决方案, WAN优化就是他们最明智的备选技术。它可以用来提高系统日常性能以及备份和恢复操作速度。

  Cubist制药公司过去采用的传统灾难恢复方式,需要将数据备份到磁带上,为此他们需要一天或者更多的工作时间才能恢复网站----等待可用机器、重复累赘的恢复。 “沉闷、呆板、不灵活,”位于马萨诸塞州的列克星敦公司高级电脑操作经理Michael Geldart评价道。

  Geldart不仅仅关心他的灾难恢复策略,他还要留心公司总部与意大利分部之间的大量数据传输。

  此外,公司管理层还需要利用相同的WAN线路召开电视会议以及IP语音通话。这些都需要较大带宽,Geldart说“然而,这是一个非常昂贵的工程”。

  现在,Cubist公司已经采用了虚拟化,“我们最希望获得的就是 [虚拟]机器和其他复制网站之间的快速映射过程,”他说。

  此外,公司还决定与Riverbed科技公司一起推进steelhead WAN的优化、加速实施应用。而与意大利连接的主要应用中,它需要加速的是Exchange 2003、微软网络/CIFS、灾难恢复连结、FTP和NFS,Geldart说。如果还有位于外地的第三方供应商提供设备备份,那么灾难恢复时间将会大大减少。这是因为现在的数据复制和烧录都采用现场磁盘阵列,去除了从磁带再存储需求,这是之前灾难恢复最费时的一个部分,Geldart说。

  纵然如此,磁带还是非常有用的。他补充道,它提供的检索历史数据能力,也应当作为复写失败的备份。

  有趣的是,由第三方运营商提供的简易非现场灾难恢复计划在厂商部署各自设备时还引起了一些争执。“厂商的初步反应是大脑一片空白,”Geldart说。但是接下来,“他们彻底打破了原有模式”。 (出于安全考虑,Cubist公司没有透露恢复站点供应商名称)。

  Forsythe公司的Cory对以上所述表示赞同。这个领的供应商,例如SunGard公司,正在变得更加灵活、更具竞争力,他说。不过,这些公司仍然需要降低成本,变得更加灵活,并且扩大产品线“更好的满足业务需求”。

  电子邮件应用提供

  多年来,灾难发生后的电子邮件备份一直是一个费时费力的项目,Gartner分析公司Scott说。但是现在一项应用正在使它变得与其他主要邮件服务器更容易复制交流。

  位于巴尔的摩的Miles & Stockbridge PC律师事务CIO Ken Adams说,他的公司曾试图将Exchange服务器聚合在一起,但是后来发现这项策略对于工程师来说太过复杂,它涉及繁杂的人事管理以及硬件、授权的大幅支出。“我们只是一家律师事务所,而不是一个技术公司,”他说。

  尽管如此,该公司还是将600个左右的电子邮件账户制定成关键任务,所以完善的解决办法不得不有。Adams最终跳槽到设计连续性备份Exchange服务器的Teneros公司。该公司的设备都是基于IP,并且在生产或者灾难恢复站点均易于安装,Adams说。

  公司的调整之一是:Blackberry和Good Link服务器市场逐渐下滑。由于Teneros还需监测和保持其用具,Adam的IT小组还是面临挑战。

  预算安排规则

  尽管灾害规划需要你的高度重视,这并不意味着要你破产。卡特里娜飓风过后,汉考克“为DR打开了支票簿,” Milliet说。“但是现在,我们要合理化开支,使其具有更高的商业价值”。

  方法之一,在日常行动中整合灾难恢复需要,Cubist公司就是通过优化其WAN网络。

  对于大规模调整,汉考克的管理层意识到,在飓风多发地带,仅有一个单一、集中的呼叫中心是非常不明智的,因此它架设了第二个呼叫中心。因此它在灾难恢复中获得良好口碑,能够提供完善的客户服务:新设施还减少了正常运作期间顾客的来电等待时间。

发表评论请到:http://bbs.cnitom.com

相关阅读

图文热点

大佬发话 Intel为超极本制定SSD新规范
大佬发话 Intel为超极本制定SSD新规范英特尔正在为 超极本 制定SSD新规范。英特尔目前正在寻求与PC厂商和NAND公司合作...
数据治理,不仅仅是技术问题
数据治理,不仅仅是技术问题毋庸置疑,数据已成为企业的重要资产,也是企业竞争力的重要武器。企业业务的成功...

本类热点