IDC预测2009到2014年,新增文件类型存储的总量将要达到160.35 EB,是同期其他类型数据量的总和的300%,这其中包括数据库文件和电子邮件文件类型。暂不论它所能需要的防护措施,这类型的文件增长有很多负面的影响。仅就其庞大的文件类型存储而言, 传统的数据备份方式也已不再适用。
在很多案例中,因为不希望将备份数据组过于庞大,IT业者不会创建大于2TB的文件系统。 这就意味着如果有1PB的NAS存储,你将至少有500个文件系统需要备份。很多的公司都拥有成千上万个文件系统;随着时间的推移,这种情形就变得越来越普遍。
尽管市场往往习惯于吹嘘和追捧大型文件系统,但其往往很难被有效的防护。如果你有一个100TB的文件系统,那么备份整个系统将会变的极其的困难。同样,这也适用于基于对象的存储系统。 基于对象的存储系统使用的是扁平命名空间。提供这类产品的供应商往往都会推荐使用硬盘备份的方法。尽管如此它却不能提供一种有效的数据恢复方法。 其中的难点在于,大多数的基于存储系统的复制,都是建立在块层面的。因此实际上并没有一种有效方法进行文件层面地数据恢复。哪怕有些系统真的可以提供文件层面的数据复制,但他们并没有提供给用户任何实用的软件,来搜索和查找需要的文件。随着文件存储的增加,这也将使这种海底捞针般的工作越来越难。
基于块的复制从来不是,将来也不会是一种有效地替代数据备份的方法。这其中有很多 原因。 基于存储系统的解决方案是建立于不同厂商基础上地,因此并没有通用的数据保护方法。另外, 这些解决方案都往往被限制于单一的存储系统;各自为政。如果你有100个NAS系统,管理那些远程镜像无疑将是一场噩梦。就这种方案需要支付的费用而言,它也非常昂贵:他一方面增加了维护成本,另一方面数据必须被复制到同一厂商的存储系统中去,显然这远不是一种低成本解决方案。 或许最重要的是,恢复特定的文件即使很难但并非不可能。远程镜像并不适用于精细恢复;它更适用于文件系统地恢复任务。
更好且更巧的方法应该是一种智能地基于文件层面的复制方案,并拥有以下的能力:
•能从任何文件系统导入导出来复制数据
•能基于文件级别,复制整个系统,单独文件系统、目录以及子目录
•必不可少的是它可以提供搜索和恢复的能力,以便用户可以高效地进行查找
•可以扫描文件系统并在文件中查找出更改过或新建的部分,并只将这部分复制到系统
•必须可以扫描PB级环境,包括高性能的恢复、复制和搜索
有一家名叫Digital Reef的公司可以做到以上全部几点。但是,更重要的是找到一种低成本的和简单的方法用来管理存储系统层,并复制这些数据。有一些可以规模扩展的文件存储系统满足这方面要求,包括HP Ibrix 和 IBM SONAS。 EMC Isilon并不算低成本方案,但就价格而言,他所拥有的配置还是要比高端NAS设备更吸引人。Dell Exanet也应算这个级别的备选方案之一。Symantec的文件系统似乎也开始被跟多人关注,至少就纸面的规格来讲。 还有一些开源的文件系统,包括Gluster和Hadoop,不应该忽略 ZFS – 它虽不是规模扩展系统, 但一旦将其前端配备上GLuster后,它也能拥有同样的性能。但是,无论何时在采用开源系统时,用户端的配置总是不可缺少的。
投资回报也是巨大的。在一些案例中,你甚至可以再不必备份整个文件系统。请考虑一下对于基础设施的影响以及剔除文件备份的所节约的资源。你可以减少你对于基于存储系统的镜像的依赖,降低这些方案的管理成本。只对于重要的文件部署远程镜像,促使文件复制向更低成本,可扩展的存储系统级别的方向发展。
世界已经改变,可我们还在沿用同样的方法管理我们的文件数据。这既不现实也不合理。 当然,除非你有无限的预算,无限的地面空间和很多技术人员储备并且他们也不介意单调的工作和没完没了的灭火。
原文地址:http://www.searchstorage.com.cn/showcontent_53897.htm