网络是企业的主要基础设施,因此构建网络灾难恢复计划至关重要,可以在指定的时间内使关键任务服务恢复工作。
灾难恢复计划已经存在几十年的应用历史。然而,必须经过精心设计来改变和适应新的体系结构和业务用例。现代灾难恢复计划包括云计算、远程劳动力和软件定义的网络。
以下将介绍企业可以遵循的六个实际步骤,以帮助企业为其网络构建成功的灾难恢复计划。这些步骤可用作构建适合其恢复目标的网络灾难恢复计划类型的框架。
1.指定任务关键型与非关键型网段
在网络中构建自动冗余性和弹性是一个昂贵、耗时且复杂的过程。而在网络的这些部分中,可以证明创建自动故障转移的额外成本和复杂性。通常在数据中心、广域网连接和对云计算资源的网络访问中发现真正的自动恢复能力。
通常实现完全弹性的领域并不包括无线局域网和大多数终端用户连接的访问层。对于这些不太重要的网段,可以制定恢复计划,使用符合指定周期的替换硬件和软件服务级别协议(SLA)将网络重新连接。
2.在任务关键型网段中建立弹性
一旦企业指定哪些网段可以完成建立弹性的关键任务,下一步就是设计和构建。企业正在处理的网段将确定哪种弹性技术最有效。
大多数数据中心都使用动态路由协议和虚拟覆盖网络技术来提供跨硬件和链路的实时故障转移。而广域网弹性通常通过软件定义的广域网技术来处理。
最后,云计算弹性可以通过多种方式实施,其中一些方式依赖于企业与之合作的公共云服务提供商设计和维护的快速故障转移技术。无论如何,在选择适合企业的选项之前,了解所有选项非常重要。
3.配置备份
随着网络继续从以硬件为中心的基础设施向以软件为中心的基础设施转变,正确的网络配置管理变得越来越必要。对于传统网络来说,维护配置目录通常包括使用远程登录到每个网络组件的自动备份应用程序,并将配置复制并粘贴到文本文件中。然后,在硬件或虚拟化组件丢失的情况下,可以组织、存储、检索这些配置文件。
或者采用更新的网络架构从集中位置配置整个网络。这个中心位置可以在本地或在公共云中。无论采用哪种方式,从中央位置创建和存储备份变得更加容易。
4.冷备件、快速硬件更换——或两者兼备
从长远来看,创建灵活的灾难恢复计划将为企业节省大量时间。
在发生灾难时更换硬件方面有两种选择。第一种是购买相同的硬件组件,并在发生硬件故障时进行替换。这些组件称为冷备件,在企业需要最少的网络停机时间进行替换,其效果非常理想,这也是成本最昂贵的选择,因为必须购买更多的硬件。
另一种选择是根据企业的需要与制造商签署适当的硬件替换服务等级协议(SLA)。在某些情况下,制造商提供硬件终身保修服务。也就是说,这个选项的硬件更换时间可能需要几周。
大多数组织选择为网络分购买冷备用硬件,并与硬件服务商签定硬件更换合同。同样,企业选择正确的选项可归结为硬件组件在发生中断时的重要程度以及业务功能是否丢失。
5.设定恢复预期、责任和沟通渠道
一旦制定了处理网络灾难的计划和流程,下一步就是记录恢复预期、责任、沟通渠道。期望通常围绕着网络每个部分的服务恢复时间。职责规定了个人、部门、第三方实体的角色,以及他们负责执行的详细职责。
最后,应该创建沟通渠道文档,详细说明正在解决问题的网络技术人员和渠道之间的最佳沟通流程,以便将进展情况更好地传达给企业的其他部门。
6.中断的根本原因分析
如果没有步骤来评估发生的情况、发生的原因以及如何在下一次网络灾难发生时更好地恢复,那么任何一个网络灾难恢复计划都不是完整的。在这一点上,团队的表现将得到详细的评价,以确保流程得到正确的遵循。此外,如果评估确定当前流程不理想,则应使用这个根本原因分析更好地改进或更改流程的步骤。
构建灵活的网络灾难恢复计划
在构建网络灾难恢复计划时,最终建议是假设主要的技术和架构变更将很快发生。因此,企业必须以这样的方式开发流程和程序,使其易于修改并与必要的利益相关者沟通,而无需从头开始。从长远来看,创建灵活的灾难恢复计划可以节省大量时间。