与其他行业的需求相比,教育存储采购有其独特之处。而不同的学校在采购存储设备时,也各有各的酸甜苦辣。采访中记者发现:如何选择合适的存储架构,是广大高校及中小学共同关注的首要问题。
通过对主流存储架构的总结,学校应该针对不同的应用,采用最佳的方案。
DAS:日落西山
“早期的各种信息管理系统只是实现了基于计算机技术的电子化管理,从架构和产品看只涉及了服务器和计算机,数据存储以服务器内直接存储为主。在今天,很多学校再做信息管理系统规划的时候,会考虑通过加强在存储方面的投入来提升信息管理系统的整体性能,同时使得系统更加健壮,并具备更好的可扩展性。”浪潮电子信息产业有限公司存储产品部产品经理张忠民说。
一些学校在选型之初,选择了DAS。相比之下,这种直接连接存储的方式成本较低,不需要额外设备,一些饱受资金困扰之苦的学校对此情有独衷。北京大学在早期存储建设中,即使用了DAS架构。
作为较早期的存储方式,DAS渐渐难以应付日益复杂的应用环境,它的缺点也暴露出来。传统的DAS直接将存储设备连接到服务器上,一方面,当存储容量增加时,这种方式很难扩展,因此对大容量存储以及存储容量的升级来说是一个巨大的瓶颈;另一方面,由于数据的读取都要通过服务器来处理,必然导致服务器的处理压力增加,网络性能大大降低;此外,当服务器出现宕机等异常时,也会波及到存储数据,使其无法使用。
到如今,各种存储架构已经越来越丰富,它们针对不同层次的应用,也赋予了大家根据自身实际情况选择的可能性。在DAS之后,更为专业、高效的存储架构大行其道,真正迎来了存储的春天。
SAN:渐成主流
SAN已经成为当前使用最广泛,也最为主流的存储架构。对高校而言,绝大多数厂商也均以SAN架构来部署面向高级用户的存储解决方案。这也是我们所要介绍的重点内容。为此,我们走访了北京大学,了解该校的存储建设情况。
北京大学信息网络数据中心(SAN)建设
1999年,北京大学在考察了香港六大高校之后,开始关注存储。2002年,在北京的一次存储会议上,香港城市大学电算中心负责人介绍了该校的存储策略。作为较早关注存储的高校,北京大学的存储规划借鉴了香港城市大学的做法。
2003年前,北京大学的存储一直是手工磁带备份,对人工的需求较高,而且效率低,于是开始考虑如何从原有的DAS架构转入SAN架构。在考察新的技术及其应用时,北京大学最初的规划是存储容量3T,磁带库容量2T。在选型时,遇到了211工程二期中公共服务体系建设的起步,同时设备成本逐步下降。北大存储一期工程建设正是在这样的背景下开始的。
在设计之初,北京大学只是想做数据的备份。2002年,北大计算中心经历了几次事故,主营业务机器接二连三地出现问题,损坏了一部分数据。这些事故使相关人士改变了思考的方向:在设计时,要重点考虑数据的安全性问题。经过了解和调研,大家一致认为光纤存储是一个发展方向。SAN架构对灾备、数据安全存储和扩容、性能的提升都是很好的解决方案。并且,SAN盘阵对安全考虑周到,结构体系也专门为此而设计,充分考虑到了系统的冗余。
自此北大明确了自己的存储建设目标:一是关键数据的集中存储,二是重点数据的备份,三是数据的容灾备份。
北京大学选择了EMC、IBM、HP、富士通等六家厂商的SAN产品进行测试。令工作人员吃惊的是,新存储设备无论在性能还是安全方面都有了显著的提高,管理上也越发方便快捷,并且能够很好支撑系统的业务切换。测试结果促使北京大学下了决心:选用SAN专业存储设备。
2004年3月,经过近两个月的国际公示招标,北京大学数据中心项目开标。根据投标商提供的产品和报价,经过对标书进行严格评分,最初选择DELL-EMC的方案作为第一中标方案。但由于中标商与DELL都不同意标书中关于暂留10%保证金的要求,在北大参与协调两月未果的情况下,中标商宣布退标,最终北京大学选择了第二中标商使用的方案。
北京大学的存储体系是从应用角度进行考虑和设计的,目前应用涉及图书馆的部分资源和发布数据,如古籍拓片;电子校务的应用数据,如教务数据、财务数据;电教系统课件、Email服务器等。在一期建设逐步到位后,北京大学把许多关键应用的数据迁入到集中存储中。
在2005年启动的二期工程中,北京大学开始了远程容灾备份和扩容的建设。北大本部的存储容量35T(裸容量),带库容量20T。远程容灾点选址在北京大学昌平校区,目前已经验收完毕,存储容量(裸容量)达5T。经过一、二期建设,北大基于校内关键业务应用的存储和容灾备份体系已经基本建设完成。
关于图书馆的数据,关键数据备份在二期工程中将迁入集中存储:目前图书馆已使用了7T的实际存储容量,磁带备份了2TB的数据,存储馆藏目录、古籍拓片、音像等数据。目前图书馆的数据年增长量达到8T,只能满足其部分需求;现代教育技术内容主要是网络课件,目前电教课件系统规划了3T的容量。
与规划的信息量相比,目前的存储基本可以满足需求。在今后,将在业务的接入上有新的扩展,如档案馆、学生毕业信息等。随着需求的增加,在容量上将会进一步扩充。
关于SAN架构的讨论
2005年底的统计数据显示,清华大学图书馆数据总量为15T左右,其中期刊数据量最大,达10T;学位论文近1T;全文电子书2T左右,其他如ACM索引、IEEE索引等也占据了一定的空间。加上图书情报领域对网页的长期保存问题的关注,对存储建设有较大的需求。从图书馆的角度来看,对数据的需求逐年增加,因为资金有限,清华大学图书馆在2001年购置过一套容量仅为2T的SAN架构存储设备,显而易见,这套存储设备远不够用。目前,清华大学图书馆的数据存储比较分散,原因是自身的存储容量不足。以往的做法是根据现实需求购置,目前则计划分步骤购置20T~30T的SAN架构存储服务器。
“我接触的大学里SAN架构应用比较广泛。SAN的特点是性能高、稳定性强、价格高。在一些需要集中存储的数字图书馆、容灾备份等应用中可以大显身手。” 富士通存储产品经理蔡源源说。这一说法得到了清华大学图书馆系统部工程师陈武的认同,“SAN是主流的技术。”但他也表示,集中存储存在一定的风险,比如在2004年春节,某高校使用了SAN存储的数字图书馆停电,造成了硬盘损坏,数据丢失。后来通过磁带备份进行数据恢复,但是数据恢复的过程前后花去了一个月时间。出现这样的问题,如果是对实时服务要求高的业务,给用户造成的损失将难以弥补。因此,清华大学图书馆与计算中心、网络中心正在进行校园内的同城异地备份工作,对关键数据进行互为备份。但异地备份又将使得存储投入有较大幅度的增加。
作为高端存储架构,SAN的投资成本较高。但在采访中,《中国教育网络》发现,由于SAN存储的性能较高,它还是获得了广大高校的认可。基于对存储要求的提升,相当多的高校在关键环节的存储中,都选用了SAN架构。
NAS:与SAN互补
NAS一直被认为是与SAN相对立的一种存储架构。业内普遍认为,NAS一般作为SAN的补充出现,更适用于对存储性能要求并不十分强烈,较为低端的存储。它价格便宜,易于实施,因此也得到了不少用户的支持。
“在存储应用中,需要集中存储的高端应用只能由SAN来承担,基于文件的小规模应用由NAS承担更合适。”蔡源源说。张忠民也认为,在偏向于边缘的应用中,选择基于NAS的架构平台比较合适。
南开大学网络中心即采用了NAS架构,购买了3T容量的存储设备。最初的选型考虑主要是基于应用。网络中心目前的应用主要是邮件和对外的Web页面备份,属于文件存储,对实时访问的速度要求不高;另一方面就是性价比,因为这一架构在短期内(至少是两年内)够用,而目前电子产品的淘汰太快,SAN、SCSI架构大行其道,IP存储又异军突起,因此,考虑到目前学校的资金情况,没有必要花费较多的资金配置超出目前应用需求的设备。
北京师范大学图书馆在存储方面的考主要基于两点,一是使用者角度,二是技术层面。
从使用的角度来看,目前北师大有两个方面的问题,一是数据量大,需要以T为单位,速度要快;二是安全性问题,这是存储管理系统的问题。
从技术层面上看,北师大基本不再考虑直接存储方式。在选型中,考虑到图书馆的数据调用中,文件方式和记录方式都存在,于是采用了NAS和SAN结合的架构进行整个图书馆的存储建设。类似北师大这种将SAN与NAS结合使用的存储方式,在高校中也比较流行。
一般来讲,厂商也会把NAS的推广重点放在中小学中。中小学的学生数量一般较少,对数据存储的性能要求、容量要求都相对高教用户要低,对文件存储的要求更迫切一些,相对而言,采购资金也较少,因此较适合选用NAS产品。