基于文件的主数据存储正在不断推动三项技术——横向扩展式网络附加存储(NAS)、对象存储和云NAS层——成为疲于应对非结构化数据的IT部门的救命稻草。
横向扩展式NAS系统可以将额外的存储节点或x86服务器像专用的运行系统和存储一样提升存储容量、性能和可用性。具有最大可扩展性的集群式存储系统可以跨100个以上的节点管理PB级别的数据,而其又可以通过分布式文件系统或全局命名空间像单个系统一样进行访问管理。
对象存储系统是另一种具有前景的方式,以取代传统的NAS。对象存储完全区别于传统的文件系统,没有容量和管理方面的缺陷。相反,这种系统在每个文件的元数据上增加了一个唯一的识别符,或者数据指纹。该识别符隐含了物理存储位置信息,并且提供了海量的扩展性。
使用云技术作为NAS层是IT部门应对海量非结构化数据的另一种选择。尤其是广受关注的基于文件的新兴网关设备可以将数据迁移至云服务供应商处。这种网关可以是硬件实体或虚拟化的设备,其同时可以解决安全和数据访问方面的问题,使得IT部门更易于使用公有云。
以下列出了你在计划使用这三种类NAS技术实现文件存储时所要了解的地方:
横向扩展式NAS
一个传统的纵向扩展式的NAS设备一般都配置固定数量的处理器、缓存和驱动器插槽。当其配置满以后,用户需要购买额外的设备。横向扩展式NAS系统则提供企业更大的文件存储,其具备几乎无限的可扩展性,并且在管理方面和单独的存储资源一样。
横向扩展式NAS也被称为集群式NAS,其最初旨在满足要求高吞吐量和高带宽的应用程序,诸如媒体和娱乐行业、高性能计算、生命信息学,以及石油勘探方面的应用。
不过这类的横向扩展系统通常很难在典型的企业级应用中发挥良好的功能,EMC和NetApp的传统NAS设备仍在这些应用方面占据绝对优势。
Terri McClure是ESG的资深分析师,他表示横向扩展式的NAS在较少数量的超大文件环境中性能卓越,而在通常企业大量的小文件环境中则表现平平。这使得这种方案在诸如流媒体等应用中成为一种极佳的方案。不过随着横向扩展式产品供应商开始将其系统调优来满足对I/O敏感的企业级应用,他们的系统也逐步开始应用到IT部门之中。
横向扩展式NAS在去年下半年取得了重大突破,当时EMC收购了Isilon系统公司,该公司有三条产品线:S系列旨在提供高I/O敏感性的小文件应用,X系列针对少量的大文件应用,以及其NL系列适用于大容量而慢速的数据存储。
Isilon的72000X可以在单个文件系统中应用144个集群节点存储高达10.4PB的数据容量。该公司的配置固态存储驱动器的S200最大容量略低,可达2PB,不过能够在单文件系统中以144集群节点数提供85Gbps的高吞吐量以及1,200,000 的网络文件系统IOPS。
Isilon声称其分布式文件系统集中系统完全为横向扩展存储而设计,反之利用全局命名空间的系统则要求一个软件层来实现横向扩展的NAS。
不过Teneja集团资深分析师兼验证服务部门总监Jeff Boles表示,对于最终用户而言体系架构上的细微差别并不重要,而系统扩展方式的便捷性以及是否可以通过单个存储系统管理多存储节点则更为看重。
“横向扩展技术仍旧属于创新性的技术,大多时候属于封闭专属的系统,”Boles说,“其并不像在一堆盘阵之前增加一个控制器那样简单,你很难找到某一在各方面技术都是最佳的产品。”
除了Isilon的产品,其他横向扩展产品还包括了BlueArc公司的Mereury和Titan系列服务器(日立数据系统公司将其作为日立NAS平台转售),Dell公司的PowerVault NX3500和其从Exanet处收购得到的集群文件系统,HP公司的X9000产品家族(基于从Ibrix购得的技术),还有IBM的SONAS。NetApp在其Data Ontap 8 操作系统中有一种集群模式的版本(不过这不是集群文件系统)而昆腾公司的StorNext和Symantec公司的FileStor属于可以运行在硬件设备上的集群文件系统。
Greg Schulz是位于斯蒂尔沃特StorageIO集团的创立者和资深分析师,其表示一些横向扩展的NAS产品增加了节点数量以提升并行性能或连续的大数据流,而其它的则在并发访问大量的小型随机文件或访问页面方面进行优化。有一些集中在数据存储容量方面,而另一些则致力于集群文件系统或集群式节点。
已经有越来越多的横向扩展产品。以Dell为例,其企业级存储资深总监Scott Sinclair表示Dell计划使用Exanet技术来增加其EqualLogic和Compellent的SAN系统的横向扩展能力。
NetApp的Brendon Howe是NetApp的副总并兼NAS事业部的总经理,其在邮件中补充说公司下一代的Ontap 8集群模型以独特的体系架构设计成横向扩展的版本,可以用于企业级应用和虚拟化数据中心。
“我们发现离开了横向扩展单独谈论‘NAS’对用户的意义不大”Howe说。
Randy Kerns是Evaluator集团公司的资深战略师,他说虽然有些情况下横向扩展NAS非常适用,但仍有许多用户环境中仍要使用简单的传统NAS。
“这或许要归结为这些不同的应用场景”Kerns说,“我认为横向扩展NAS和传统NAS都会在各自领域应用很长一段时间。”
对象存储
对象存储并不是很新的技术。EMC在2002年就在其Centera产品线上推出这种技术,当时EMC试图打造一种新的市场概念相联存储(CAS)。不过在使用CAS用于归档很少变动的数据信息,比如医疗影像时会普遍地产生性能问题。
新的对象存储应用浪潮利用了相似的协议,诸如代表性状态传输(Representational State Transfer,简称REST),并且在近线存储和主数据存储上得以试用,尤其是在云技术中。
“在使用对象存储作为主存储的过程中并没有技术上的限制,”Andrew Reichman,剑桥Forrester研究中心的首席分析师说,“一些主存储并不对性能非常敏感,尤其是对于文件而言。”
出于这种考虑,目前EMC推出了Atmos。其它的对象存储产品包括Caringo公司的CAStor和DataDirect Networks Web Object Scaler,Dell的DX对象存储(使用了Caringo的技术),NetApp的StorageGrid(之前为Bycast的产品),以及像Amplidata、Cleversafe公司、Mezeo软件及Scality这些新兴的产品技术。
“从长期的角度看,我们会发现对象存储,作为一种更佳的文件存储方式,将会取代文件存储”Reichman说。
由于其出众的扩展性和可共享,可租赁的特性,对象存储对于云存储供应商而言相当具有吸引力,尤其是和普通的基于文件或基于数据块存储相比。
“对于每块数据你都有这么多的元数据,你可以很简便地追溯这些数据,基于策略进行数据迁移,或者变更冗余度”Reichman说,这也解释了为什么这么多云供应商对其如此有兴趣。
云NAS
使用公有云作为主存储的NAS层,而非将其用于备份或归档,这对于绝大多数IT部门而言还较难接受。不过这些新兴技术中的网关技术,作为混合云存储的设备,使得这种应用场景更具可操作性。
这种设备提供了一种本地缓存,存储最常用到或访问频率最多的数据,这样减少网络或云中断所导致的延迟对用户的影响。不同的算法会判断哪些数据应当驻留在缓存中。
许多这种设备同时提供数据精简技术,比如重复删除或压缩技术来减低带宽的使用,并减少在云端传输数据所需要的成本。其同时在发送离线数据之前会进行加密,并且提供一些额外的特性,比如快照技术,以此降低备份系统的工作负载。
一些新兴的公司目前在推进NAS混合云空间,并且和主要的云存储供应商开展合作。其中包括有Ctera Networks公司,Nasuni公司和StorSimple公司。Nasuni提供一种软件方式的虚拟化NAS设备,可以安装运行在虚拟机上。
另一种选项是Nirvanix公司的CloudNAS产品,可以将Linux或Windows服务器转化成NAS网关,连接公司的Storage Delivery Network(SDN)加密离线存储。Nirvanix使用标准的协议,如NFS、CIFS和FTP来访问其服务。
Rick Villars, IDC公司存储系统部门的副总和执行战略师,预言主要的NAS供应商,诸如EMC或NetApp最终将在SSD、SATA和SAS驱动器之外,为云层提供额外的协议支持。“我们认为这天很快会到来。可能不是今年,但或许就可能是明年,”对各NAS供应商业务模型方面的困难心知肚明的Villars说,“这是这些供应商还没有做的最后一件事情,不过并没有什么明确的原因限制他们不这样做。或许这需要一些软件和链接,但无论如何这些供应商都是可以实现这种功能的。”