企业成功实现灾难恢复的十三项原则_中国IT运维网www.cnitom.com

9.11灾难性事件的教训是新的灾难性事件发生得太频繁了。如果你的公司的运营依赖于存储在计算机中的数据，你就不能忽略灾难恢复准备的原则。如果你的数据没有备份到距离灾难发生地足够远的地方，你的公司也许就不能避开灾难。在某些问题上，在灾难恢复的讨论中，维护股东的价值和满足管理规定的要求是最重要的。我归纳了灾难恢复的十三条基本原则。你可以使用这些原则作为一个检查对照表来判断和改善你的灾难恢复计划的有效性。

　　原则0--找出重要的商务流程和应用程序、以及硬件、软件、业务和使用这些东西的IT技术支持人员和把这些连接到最终用户的局域网和广域网。你的业务恢复和IT恢复计划必须包括你已经找出的每一个项目的行动计划。

　　规则1--每天完整复制(在硬盘或者磁带上)一次“数字三项”。数字三项包括:

你的应用程序运行的操作系统和你的生产环境中使用的当前的补丁。
运行在使用最新的补丁的操作系统上的重要应用程序。
数据。

　　联邦灾难恢复指南要求“没有数据损失”。逐个字节地备份数据是昂贵的，因此，你必须解决最后一笔交易的问题。如果你现在能够处理器的全部事情是昨天关闭的业务，在发生不利的事件之后，你的业务也许不会中断。但是，恢复一天的业务记录是一件头疼的事情，你会因此希望IT部门不间断地进行数据备份。

　　规则2--拥有直接访问用于运行数字复制品的“副本”硬件的权限。当需要把数字三项快速恢复到新的或者待命的设备上的时候，具体的硬件能够完成这个任务。如果你没有这种硬件，全世界最好的备份磁带也没有价值。

　　规则3--对于如何在副本硬件设备上恢复数字复制品，应该制定一个一步一步的书面程序。把这个文件保存在站点以外的地方。令人遗憾的是，在发生不利的事件之后，你不能指望你目前的IT技术支持人员能够在现场。

　　规则4--经常测试一切。你能够容忍的可以接受的“最近的”测试应该是水平比较低的。在你完成测试之后，每一个星期都会增加复制的数据、硬件和文件在某些方面失效的可能性。数据源为企业盈亏底线增加的价值有助于定义对于你的公司来说，“最近的”测试应该是在什么时候。

　　规则5--每天运营的站点与存储数据复制品、恢复硬件和文件的站点应该保持最大限度可行的或者经济上可承受的分开距离。在同一个城市的备份站点是不充分的。应该考虑你的备份线路战略支持的通信方式的极限。

　　规则6--对增强的风险状况立即做出反应。如果说飓风凯特里娜提供了什么教训的话，那就是“现在就离开市区!”。当发现不利的事件有可能很快在你运营的站点发生时，你要立即派遣经过训练的技术和商务流程人员到替代的工作站点。关键的问题是当你的邻居的DHS威胁等级升级到了橙色或者红色，或者另一个凯特里娜级别的气象灾难正在向你袭来，你的人力资源应该在什么地方？

　　规则7--拥有(或者至少能够找到)替代的连接、数据传输路由和电源。根据你的公司所在的位置，你的替代的多种路由和资源也许是有限的。研究你的每一个站点的选择，如果你的公司或者分支机构在数字线路的边缘，你可以决定像卫星上行链路这种极端的措施是否值得投资。

　　规则8--应用“诺克斯堡”原则。也就是说在一个或者更多的复制站点应用加固的物理安全措施。如果这个数字资产非常有价值，那么，卫兵、安全围墙、锁定程序、防火和防气象灾害以及防地震的结构都是合理的。

　　规则9--制定和演练总体业务恢复计划。测试、计划和回答这个问题:在不利的事件发生后或者在不利的条件下，当IT人员已经做了恢复工作之后，你的商务流程人员能不能有效率地工作？

　　规则10--拥有和使用你自己的替代的可持续的发电设备。考虑使用多种燃料的发电机。电网发生的停电事件，如2003年8月14日在俄亥俄州发生的那起停电事件，和地区炼油厂出现问题的事件同时发生之后，在第一箱燃料用完之后，只能使用汽油或者柴油的发电机就没有用了。

　　规则11--建立和测试在隔离状态下继续运营的方法。“白色粉末”的风险或者一种高度传染的疾病关闭一个大楼、一条高速公路或者一个城市的情况并非是不可想象的。

　　规则12--在重要的应用程序的整个生命周期内，要应用资源去获得或者保持上述0至11的规则。

　　过一段时间，我们将会看到一个类似于Sarbanes-Oxley法案的法规性措施。这种可能性是存在的。目前的美国政府提议的灾难恢复指南将成为所有上市公司必须遵守的严格的和可以审计的法规。但是，即使没有这个规定，保护股东的数字资产的价值也需要努力执行所有这些基本的灾难恢复原则。