医疗行业的信息化建设经过了几个阶段的发展,逐渐形成了his(医院信息管理系统)、lis(实验室信息管理系统)以及pacs(医学影像系统)等众多内容丰富、功能强大的应用系统。随着这些系统的运行时间逐渐延长,功能逐步增强,医院数据的价值越来越高,系统一旦停机造成的损失也越来越大。
另一方面,随着“9.11”等事件的爆发,“容灾”这个词汇逐渐成为人们谈论最多的焦点之一。记者在与医院的信息技术人员接触中发现,他们对医院数据存储系统的可用性十分关心,希望了解到医院部署数据容灾方案的必要性和可行性。本次记者就想从医疗行业的容灾系统应用谈起,对重庆医科大学附属第一医院容灾系统的特点进行剖析,并与读者朋友们交换意见。
医院要不要容灾?
医院信息科的人员常常会遇到这样的问题:“医院的信息系统需要容灾吗?需要什么样的容灾系统?”面对这样的问题,很多为医院做系统集成的工程师也许会一头雾水。
实际上,很多时候用户是否要选择应用容灾解决方案,选择什么样的容灾解决方案,是要根据用户具体的应用情况而定。医疗信息系统同样如此,在做出最终的决定之前,我们需要对医院的需求进行深入的分析,而不仅仅是简单地回答“要”或者“不要”。
目前,在已经应用网络技术环境的医院中,绝大多数用户都采用了群集技术(也就是通常人们所说的“双机热备份”)来保证服务的持续运行,或者在用户可以容忍的时间之内,自动进行服务恢复。
群集技术在应对服务器故障方面有着显而易见的效果,这一技术已经得到了国内大多数用户的认可,并已经得到很大程度上的普及。但是,随着群集技术运用的普及,很多用户也不约而同地发现群集所存在的一些非常明显的不足:
由于传统的群集解决方案多采用“2+1”(即两台服务器间配一台磁盘阵列)的“双机热备份”模式,这个为了在两台服务器之间共享数据而存在的独立磁盘阵列,往往就成为了核心系统一个突出的故障点:一旦磁盘阵列发生故障,整个系统就会停机。作为7×24营业的医院来说,这种意外的停机对业务的影响可想而知。
寻找一条适合的容灾途径
记者了解到,很多用户还存在这样一种误解?D既然存储系统已经是“双机热备份”了,那么数据也不需要再进行单独备份了。正因为有这样的误解存在,很多用户往往忽视了数据备份的重要性,整个系统只有磁盘阵列中的一份数据,一旦磁盘阵列发生故障,导致数据丢失的时候,才发现悔之晚矣!
目前国内的医院用户大多数还没有认识到“容灾”的必要性。系统建设的时候,对数据和应用的容灾考虑得非常少,一旦发生火灾、地震等灾难性事故,整个系统将毁于一旦,数据将一去不复返,医院将遭受无法估量的巨大损失。
由于医院通常都没有与大型企业类似的各地分支机构,往往就是集中在一个园区之内,所以要为医院特地构建一个容灾中心,对医院来说其实很不容易。有一些专业的isp可以为企业用户提供数据容灾的服务,但对医院来说有两个比较明显的劣势:
1、收费非常昂贵;
2、只能解决数据的容灾,由于医院的应用基本上都集中在医院园区内部,并对网络带宽要求较高,所以很难解决应用的高可用问题。
从以上分析可以看出,isp的容灾服务更适合网站类型的企业应用,而不适合医院的应用。
园区级容灾落户医院
什么才是适合医院信息系统应用的容灾解决方案呢?
这个问题曾经困扰着国内众多医院的信息建设部门。而不久前,重庆医科大学附属第一医院解决了这一困扰,率先部署了一套园区级别的异地容灾备份系统,取得了令人满意的收效。
医院的雷院长谈到:“现在看来,一个园区级别的,包括数据和应用在内的热切换容灾系统,才是医院真正想要的容灾解决方案!”
据雷院长介绍,重庆医科大学附属第一医院作为重庆市规模最大的医院之一,同时也是当地增长最快的医院,在西南地区,乃至全国都具有相当的影响力。
医院在信息系统建设方面非常重视。随着全国医疗信息化的不断展开,重庆医科大学附属第一医院做了多方面的深入调查,同时对自己的信息系统建设也提出了相当高的要求。
“容灾系统当然也不利外。如何规划、建设好这个容灾系统,医院的信息科真的是绞尽了脑汁。好在,从目前的运行状态来看,新部署的这套容灾系统还是令人满意的,这也验证了当初我们采用园区级容灾方案的思路是正确的。”雷院长表示。#p#副标题#e#
部署“2+2”模式
为了了解到医院容灾方案的具体实施情况,记者与重庆医科大学附属第一医院信息科王主任取得了联系,请他介绍了这个方案的组成以及实现过程。
王主任告诉记者,为了区别于以前的群集模式,医院把这个方案通俗地称为“2+2”群集模式。从功能上来讲,这套方案突破了系统全冗余、无任何单点故障点,以及数据和应用的园区范围的容灾,使系统的运行真正没有了后顾之忧。
所谓“2+2”,意思就是“两个运算节点+两个存储节点”。王主任介绍,“2+2”群集模式是在原来的“2+1”群集模式的基础上,增加了一台磁盘阵列,院方将每一台服务器定义为一个“运算节点”,而将每一台磁盘阵列定义为一个“存储节点”。
这套灾备系统的关键就在于控制系统。王主任介绍说:“我们采用了veritas volume manager管理软件,实现了两台磁盘阵列之间的镜像关系。每一次i/o的写入都分别通过两条主机通道到达两台磁盘阵列的控制器,并当两个i/o都返回正确的结果之后,操作才算完成。”
这样,两台磁盘阵列中的数据完全保持实时同步,不用担心任何的数据一致性问题。
方案实施
不过,“2+2”群集模式的部署对于网络数据的传输距离也会有一定的限制。王主任表示:“由于我们采用的是同步传输的方式,两个节点之间的距离不能相隔太远,最远距离为50公里,如果超过50公里的距离限制,就会明显地影响业务系统的运行性能。”
“对于超过50公里距离限制的应用环节,我们则采用了异步的传输方式,因为异步方式不会造成在线业务系统性能的下降。”王主任补充道。
不过50公里这个距离限制已经基本可以满足医院的园区级别的容灾要求,像重庆医科大学附属第一医院这样的大医院,也少有超过50公里的距离限制的应用。
而对于两个运算节点之间的群集关系,方案是采用veritas cluster server系统。王主任告诉记者,这除了实现基本的群集功能之外,主要还是考虑到这一系统还有很多突出的功能,如:最多支持32个节点的超大规模群集、简单易行的节点退出和加入操作、跨平台管理群集服务器系统,以及与volume manager软件的兼容性等。
因此,对于一个应用来说,只要任意一个运算节点和一个存储节点运行正常,那么,整个系统就能够正常运行。(如图1所示)
据王主任介绍,这一方案结合综合布线的变化,将中心机房和容灾机房两个节点分别部署到了医院内不同的位置。这样,即使其中某一节点所在的位置发生意外或事故,医院的应用仍然能够继续正常运行,也不会有任何数据丢失的情况发生。(如图2所示)
此外,整个方案的架构也具有非常好的可扩展性,不仅可以将传统的“2+1”群集模式升级为“2+2”,还可以根据做到“2+n”,甚至“n+n”群集模式。(如图3所示)
当谈及对这套容灾方案的感受时,王主任不无感慨地说:“医院以前也采用群集技术来提高服务器的可用性,但磁盘阵列的单点故障始终令我非常担心,一旦磁盘阵列发生故障,我们医院的系统就会突然停机,医院的损失是无法估量的,那个时候信息科的压力也非常巨大。现在实现了‘2+2’模式之后,我们真的可以高枕无忧了。数据的安全性、系统的持续运行、系统管理的简单易行,这是我所感受到的切身体会。”#p#副标题#e#
“2+2”群集模式相比“2+1”群集模式的几点优势
1、全冗余连接,无任何单点故障点。系统中任意一个部件的损坏都不会影响系统的正常运行;
2、镜像的存储节点为系统关键的在线业务数据提供了双重保护;
3、结合综合布线系统实现了数据和应用的容灾;
4、当应用san存储网络架构时,可保留san架构自身的优势,如高速备份以及良好的可扩展性等。
记 者 观 点:为数据滋补,不可忽视
如果仅从方案的物理结构来看,重庆医科大学附属第一医院的这套“2+2”数据容灾备份方案只是“2+1”模式的升级,并无新奇之处。但方案中第二个存储节点的采用,不仅为医院整体信息系统的运行提供了有力保障,更使医院数据存储方案的部署更为灵活、实用。
随着医院信息化水平的不断提高,his已从初期的以财务为主发展到现在以病人为中心,从单纯的文本数据扩展到有声音和图像等多媒体数据,存储的数据量逐年迅速增加。特别是x光片、ct和mr等大容量的数字图像,造成了医学信息量的急剧膨胀。
曾经有人统计,一家三级甲等医院一天的数字影像数据容量大约为10g左右,数据备份10g,合计存储容量为20g,这样一年下来