社交网站、网上银行、话费详单查询、视频监控、企业人事管理系统、企业ERP……,我们生活和工作所遇到的种种电子化应用都和现代数据中心有关,复杂多变的应用和庞大的数据量使得现代数据中心在电力和能源方面的消耗增长显著,严重的电力不足,使得数据中心机房凸显能耗危机,如同一场风暴的酝酿,绿色数据中心的概念已经从“起点”升至“沸点”。
那么用户对于绿色数据中心主要关注哪些方面?哪些技术和产品可以实现绿色数据中心的构建?建设绿色数据中心时面临的主要障碍是什么?用户又会为哪些绿色节能的技术和产品买单呢?IT168隆重推出绿色数据中心大型专题,将为您梳理各个领域绿色节能技术的发展现状,并为您推荐实现绿色节能的产品和技术。
实际上,数据中心的组成包括多个方面,本文将从数据存储与保护的角度来阐述一些有助于绿色节能的新技术,并介绍一些绿色节能的实用窍门。
SSD:成本与节能之间的尴尬
尽管固态硬盘(SSD)暂时还面临价格高昂和容量有限的双重尴尬,但其高性能、低功耗等诸多优点使其成为存储领域的近年来的热点关键词一直受到人们的瞩目。
固态存储(Solid State Disk,SSD)是摒弃传统磁介质,采用电子存储介质进行数据存储和读取的一种技术。由于突破了传统机械硬盘的性能瓶颈,因而拥有极高的存储性能。由于没有旋转磁头与盘体间的旋转摩擦,因此固态硬盘发热量小,散热速度快,其能耗仅是传统硬盘的1/5。根据国外专家的报告,通常情况下,在笔记本电脑中,固态硬盘的能耗只有容量相当的传统硬盘的一半儿。而作为企业环境中的存储解决方案,一个固态硬盘能够取代多块传统硬盘,预期节能效果会更显著。
大幅度的性能提升与高昂的成本,是企业对比数据中心内使用固态盘和硬盘驱动器所得出的两个结论。目前,由于可用性和价格高等因素,市场中固态盘产品的数量还比较有限。尽管存在诸多障碍,不少企业业经开始部署固态盘系统,虽然还远远不算完美,但结果证明是非常具有吸引力的。今天,固态硬盘已经开始向存储主流中渗透。包括Compellent、EMC、Fusion-I/O、HDS、IBM、Intel、NetApp、希捷、三星、Sun和Verari等厂商,如今,基本所有的主流存储厂商都已经推出了支持固态硬盘的企业存储系统。
固态硬盘在性能方面的优势不言而喻,绿色节能方面的优势也是固态硬盘极具吸引力的另外一个原因。随着IT部门的数据需求不断增长,电力开支也越来越高。因此,存储系统需要更高的能源效率。由于固态硬盘的突出优势和企业存储的市场需求,固态硬盘市场呈现了快速的发展势头。据Gartner统计,2009年厂商总共出货280000部固态盘设备,总收入4.5亿美元,并预计到2013年出货量和收入将分别达到530万部和19亿美元。
因为固态硬盘的成本太高,一般来说,企业没有必要在整个存储架构中都部署固态硬盘。而更多的作为传统磁盘存储的补充,Tier 0正是用来描述固态硬盘在企业存储架构中的位置的一个术语。因此,企业必须针对他们的阵列进行调节来利用潜在的性能好处。这个过程要求监控他们的信息流、将更新最频繁的数据保存在闪存中、将其他数据保存在硬盘中。除此之外,应用和操作系统也需要调整,让企业可以最大限度地利用闪存的优点。
还有一个问题是可靠性。固态硬盘从消费市场中兴起,这个市场的工作负载和可靠性要求相对企业系统来说比较低。新驱动器的损耗要比硬盘驱动器快,这就带来了不少问题。首先,企业需要完善的管理工具,采取措施确保驱动器故障不会导致所有应用离线。而且,额外的维护需求也会给企业带来更多人力和硬件成本。
不过长远来看,固态硬盘目前的这些局限性都将得到解决,对一些系统在IO方面压力较大,且希望绿色节能的企业,可考虑在固态硬盘方面有所投入,在改善系统IO性能的同时,率先尝试绿色节能的数据中心。
重复数据删除:给数据瘦身
由于磁盘技术近年来的快速发展,一些企业和用户越来越倾向于采用磁盘进行备份或者归档,由此带来的能耗问题也是突出的。传统的备份策略往往会在用户的磁盘空间里面产生大量的冗余数据,由此消耗了大量不必要的磁盘空间,带来一系列的能耗和冷却的问题。有什么办法能够消除掉这些多余的数据,从而避免不必要的能源消耗呢?
重复数据删除技术会深入到组成文件的数据块,分析文件由哪些数据块组成,并删除相同的数据块,只保留单一的副本。就像不同的房子可能都是由相同的木材、砖头、水泥等组成,不同的文件经过拆分后,也会出现很多的重复数据块,删除这些重复的数据块,就能大幅度缩减缩需要的存储空间
重复数据删除最大的优势在于节约用户数据存储所需要的存储空间,因而能够节约数据存储所需要的能源损耗。基于磁盘的备份归档方案与传统磁带库相比在性能、稳定性方面都有很多优势,但是一个突出的不足之处就是,磁盘介质是在线存储,需要一定的能耗,而磁带则是离线存储,本身不需要耗能。
重复数据删除能够大大减少数据存储与备份所需要的空间,因而减少存储与备份的能耗。大家知道厂商宣称的重复数据删除比根据不同的数据能够达到1:30或者1:20,无论对存储空间的节约方面和能耗节省方面都是有着突出意义的。
一般人往往容易混淆重复数据删除与数据压缩的概念,二者看起来的确有一些相似之处。但实际上,数据压缩技术通过对数据重新编码来降低其冗余度(redundancy);而重复数据删除技术则着眼于删除重复出现的数据块。前者属于文件级别,后者根据不同厂商的技术特点,既可以是文件级别的,也可以是数据块级别的。
尽管关于重复数据删除的实现方式,业内还存在“预处理模式”和“后处理模式”的纷争,不过重复数据删除在节约空间方面的显著效益已经使其成为企业采购备份设备时所必须考虑的因素之一。
重复数据删除可以在数据写入到存储目标前进行操作,称为预处理(Preprocessing)或在线处理(Inline);也可以在数据存储到目标设备后进行操作,称为后处理(Postprocessing)。如果希望数据快速备份,更关注缩小备份窗口,那么,后处理方案比较合适;但如果你“有的是时间”,又需要节省备份磁盘,降低成本,则不妨考虑预处理方案。
自动精简配置:按需分配
除了重复数据删除、数据压缩等等的技术能够通过减少数据容量减少磁盘数量,从而进一步减少能耗,存储领域还有一些其他的新兴技术,尽管并不能够减少数据量,但是也同样能够减少系统所需要配备的磁盘数量,起到节省能耗的作用。自动精简配置就是其中之一。
自动精简配置是从去年开始进入我们视野的,简单来说,自动精简配置就是一种容量分配计划的优化技术。在传统的存储系统中,当服务器端的某项应用需要一部分存储空间的时候,往往是预先从后端存储系统中划分出一部分足够大的空间预先分配给该项应用,即使这项应用暂时不需要使用这么大的存储空间,这部分存储空间也已经被预留了出来,无法给其他的应用提供存储空间。这就在系统中造成了无法利用的存储空间,不仅仅浪费了大量的采购成本,还产生了不必要的能耗。
自动精简配置技术的原理解析图
采用自动精简配置的系统则不会一次性的划分过大的空间给某项应用,而是根据该项应用实际所需要的容量,多次的少量的分配给应用程序,具体的分配方式每个厂商有不同的特点,但是都保证了每个应用程序不会一次性的占用过多的存储空间。当该项应用程序所产生的数据增长,分配的容量空间已不够的时候,系统会再次从后端存储池中补充分配一部分存储空间。
自动精简配置听起来很简单,但是我们却不能小看这种容量分配方式的改进。原因在于,在自动精简配置出现以前,我们往往习惯于预测过多的容量空间分配给应用程序,这样每个应用程序都占用了过多的存储空间,导致整个存储系统的容量利用率变得非常低,很快我们就需要采购新的存储空间,而我们在采购的时候也同样习惯于预先采购大量的多余的存储空间以作备用,这种应用模式带来采购成本上、能源上很多不必要的浪费,也增加了管理的复杂程度。
另外,一些厂商的自动精简配置的实现方式是通过虚拟化从存储资源池分配存储资源到逻辑卷,所以比传统方法,往往可能有更多的物理磁盘来支持每个逻辑卷。这将减少输入输出列队次数,而且也将减少某一个“热点”在同一块磁盘发生过多次的可能性,多块磁盘替代一块磁盘完成了以往的任务,性能比传统方法也有显著的提升。
在“绿色存储”蔚为潮流的今天,自动精简配置也受到了越来越多的追捧。数据中心的能耗问题直接与磁盘相关,而自动精简配置能够帮助用户在不降低性能的情况下,减少磁盘购买数量,从而降低系统的整体能耗、冷却成本、以及二氧化碳排放量,因而也具有不可忽视的绿色意义。如今,自动精简配置已经成为“绿色存储”概念下的一个重要的关键词。
目前各个厂商的存储精简技术都可以减少存储磁盘的容量需求,容量大约有60%的缩减。也就是说,60%的能源和二氧化碳排放能够通过自动精简配置技术被裁掉。因为用户对于未来磁盘的需求数量降低了很多,而全球磁盘价格自然也是不断走低,这样当然也就大幅削减了资本开销。而且由于磁盘空间的减少,相应的电力成本、制冷成本、空间成本都相应缩减。
总的来说,使用自动精简配置后的磁盘需求削减,确实很大程度上缩减了TCO。减少的TCO意味着延迟未来的添加磁盘的需求。但如同虚拟化、重复数据删除等等新兴的技术一样,任何一项技术从诞生到逐步完善再到在应用中普及都还需要一定的过程,就这项技术而言,目前成功的应用案例尚不十分普遍,用户在决定部署时多少需要担一些“第一个吃螃蟹”的风险。但毫无疑问,自动精简配置是存储未来的发展方向,并且逐步成为存储系统的必备的主流配置。