MAID磁盘降速:有空就歇歇
暨服务器产品成为数据中心绿色节能的核心环节之后,存储设备也开始成为数据中心机房省电议题中不可缺少的关键。相关以绿色节能为重要诉求的技术开始受到瞩目,例如MAID(Massive Arrays of Idle Disks)技术,一些厂商宣称采用MAID技术可为磁盘阵列节省20%-30%的能源消耗。
简单来说,MAID技术能够仅在需要进行数据存取时才开始启动硬盘,硬盘不必随时处于活动的在线状态,从而达到省电效果。主要应用在近线存储(Nearline Storage)设备,尤其适用备份、归档等领域的应用。
MAID技术可让磁盘在不同的工作压力状态下处于不同的转速,压力较大的时候转速较高,压力较小时转速较低,很长时间不访问时,磁盘停转
目前厂商多是将MAID用于近线存储设备,如虚拟磁带库(Virtual Tape Library,VTL)或SATA磁盘阵列,但也有少量是应用于在线存储系统。在MAID的运作机制上,有些是以RAID为单位,有些则是以一台设备为单位,让这台设备上的所有硬盘同时进入省电的状态。
采用MAID能获得的省电效果则根据不同的系统和作业型态而有所差别,不同的厂商宣称了不同的省电百分比,通常都在20%-30%范围内。
一般来说,省电模式又会分阶段性进行,以Nexsan的AutoMAID为例,可分为三阶段,而各个阶段的时间间隔可由企业自行定义。
举例来说,在2分钟内没有读取数据时,读取头就会自行停留至没有存取数据的地方,以节省读写头的功耗;过了10分钟后若仍没有读取,就会进入第二阶段,硬盘会降低转速至4000rpm;若过了15分钟后仍没有读取数据,就会进入第三阶段,硬盘于是会停止运转,等到系统呼叫时再启动,但由于硬盘仍处于通电状态,因此还是在“准备状态”。根据Nexsan方面的技术人员表示,磁盘再启动的时间约为10~15秒。
尽管目前已经有诸多的产品支持MAID技术,但关于MAID技术仍然有一定的争议性,一些对该项技术抱怀疑态度的人认为,MAID技术要求定时的启动磁盘,频繁的停转或者启用磁盘,本身更容易对磁盘造成损坏,磁盘启动之后如果保持一定的转速能获得更高的效率。这个技术目前是否足够成熟,还需要进一步在应用中检验。
存储整合:鸡蛋放到一个篮子里
前面我们已经介绍了以绿色节能为重要诉求之一的一些新兴技术,这些技术也许并非是完全为了绿色节能而被开发出来,但都因为其绿色节能特性在今天格外受到关注。但是存储系统要节能省电,仅仅利用一条或者几条新兴技术是不够的,若企业要进一步节省存储设备所消耗的电力,还需要从整体的系统架构层面去考虑。
事实上,由于中国存储应用现状的局限,一些企业仍然倾向于采购DAS系统来满足存储需求,而当企业业务发展较快,数据爆炸式增长的时候,原有的系统很快不能满足新的业务需求,导致企业需要采购新的设备,如果新的设备无法和以前的设备较好的整合,就很容易在企业内部形成了大量的分散的存储孤岛。这些存储孤岛不但导致大量闲置的存储空间无法充分利用,同时也导致了企业存储系统不必要的能源消耗。
存储整合方案示意图
据业内估计,普遍企业IT系统中的存储利用率只有25%-40%,即大约有60%-75% 的存储容量还没有被使用,却在不停地消耗能源。合理的存储整合的方案能有效解决这个问题,通过共享存储,让所有磁盘都可以存取数据,平均存储利用率可高达60%。从而有效减少了不必要的能耗。
毫无疑问,一个统一的存储网络在单次采购的成本上完全无法与简单的DAS设备相提并论,实际上,这是很多企业仍然优先考虑DAS系统的重要原因之一。对此,一些业内专家给出了如下建议:
1. 存储采购不能仅仅比较单次采购成本,设备维护成本、管理成本、未来扩展成本、以及运营的风险成本等等都应该计算在内。企业应根据自身对存储系统的性能、容量、增长趋势等多方面要求进行评估后,再选择合适自身的存储架构。
2. 进行DAS系统采购的时候,企业也应该充分考虑未来扩展的问题。一些DAS系统能够平滑的升级到SAN系统,这样能够节省未来升级的投资。例如一些带有光纤主机接口,后端同时支持多种磁盘接口的存储系统,这样即使未来需要升级到存储网络架构,也可在原有系统的基础上进行升级。
实际上,存储整合是一项较为基础的工作,我们此前提到的一些其他的节能举措,有些也需要在存储整合的前提下才能起到更好的效果,例如分层存储等等,合理的存储整合解决方案并综合应用一些有效节能的新技术,能够实现高效存储数据,减少机器及磁盘数量,解决急速增长的能源消耗问题。此外,这个策略还可以减少系统的复杂性,降低成本,还可以改善网络效率和性能表现,从而对新的业务需求能做出更好的反应。
节能妙招:大容量磁盘替换多块小容量磁盘
在磁盘驱动器类型不改变的情况下,需要达到同样的存储容量的时候,我们可以选择通过选择大容量规格的磁盘来满足容量需求,从而降低磁盘数量,减少能耗。
此外,目前的SATA磁盘驱动器可以提供最高的磁盘驱动器可用存储密度,最大容量达到1TB,而很多其他类型的磁盘驱动器目前还做不到如此大的单盘容量。因此,采用大容量SATA磁盘替代一些小容量规格的SAS或者光纤磁盘,在节省能耗上同样相当有效。
即使在磁盘容量规格相同的情况下,典型的SATA磁盘驱动器,与光纤通道 (Fibre Channel) 磁盘驱动器相比,可以节省大约一半的能源。同时,一些具有磁盘修复及数据保护技术的SATA磁盘正日趋流行,已经成为很多企业应用的理想选择。
但是企业采用这一举措进行节能降耗同样需要谨慎:
1. SATA磁盘驱动器的数据存储量比光纤或者SAS通道主磁盘驱动器更大,但我们不能因此而忽略了数据可靠性。当前流行的 (Dual-parity) RAID-DP以及RAID6技术,能够提供更高的存储利用率和错误容忍度,可同时修复两个故障磁盘驱动器的数据。但是如果企业对数据安全性要求较高的时候,则应该以性能需求优先,选择光纤或者SAS通道的磁盘驱动器。
2. 当企业采用大容量规格磁盘驱动器替代小容量规格磁盘驱动器的时候,磁盘通道的数量变少,总体带宽和吞吐量都会变小。实际上,存储系统的总带宽和总吞吐量就是后端磁盘总带宽和总吞吐量的总和,在容量没有改变的情况下,用大容量磁盘替换多块小容量磁盘,相当于总带宽和吞吐量都变小了,对系统性能的影响不容忽视。因此,这个节能降耗的招数在实际使用中并不常用,仅能在一些对吞吐性能要求不太高的系统中使用。
分层存储:好钢用在刀刃上
所谓的分层存储是指的将不同类别的数据分配到不同类型的存储介质上,目的是提高存储效率,减少总使用成本(TCO)。以一个大学校园的具体应用为案例,学校里面可能存在着“一卡通”系统,学生可以通过一张通用的卡实现银行储蓄、学校管理、校内和社会消费支付功能。除了一卡通系统,可能还存在财务系统、学生档案以及电子课间等等一些其他的业务应用。
实际上,这些不同的业务应用对数据读取性能、数据安全水平的要求是完全不同的,例如“一卡通”系统往往要求系统7*24小时连续运营,对数据响应时间要求高,同时还要求较高的数据安全性;财务系统同样要求较高的响应时间和数据安全,但对连续运营方面要求较低,一般5*8小时运营即可;学生档案和电子课件往往对存储空间有较高的需求,但是相对而言并不要求较高的读取速度。
因此,作为这家大学的IT主管,我们完全可以把“一卡通”系统、财务系统等应用所产生的数据保存在读取性能最好、安全性最高、但相对较为昂贵的光纤硬盘上,而其他对读取速度和安全性要求相对较低的应用,例如电子课件,则可以放在存储成本相对便宜,但性能也偏低的SATA磁盘上。
这种透过分层式存储将存取较不频繁、数据安全相对较低的数据搬移到转速较慢的硬盘上,将有助于节省耗电量。以73GB、15,000转的硬盘来说,其单位容量耗电量是750GB、是7,200转硬盘的11倍。
此外,如果这家大学校园还有备份系统,为了获取最高的备份和恢复的性能,那么无疑磁盘备份将有更多的优势,但是综合考虑成本和能耗,磁带则具有更多的优势。采用合理的分层的多级的备份策略也同样是这家大学的IT主管需要考虑的重要问题,数据可以先备份到磁盘上,再从磁盘备份系统备份到磁带介质上,这样最终在节能、成本和性能三方面得到均衡。
与分层存储一起出现的通常还有信息生命周期管理的概念(ILM,Information Lifecycle Management)。信息生命周期管理是一种信息管理模式,它认为信息如同人、生态系统和企业,有自己的生命周期,有一个从产生、保护、读取、迁移、存档到回收的过程,在不同的时期,信息的价值会有所变化。针对这种价值变化,将自动化网络存储基础设施与综合服务和解决方案结合在一起,并根据信息和应用对企业的价值对其分类,然后制定相应的策略和技术手段对信息进行贯穿其整个生命过程的管理,从创建、使用到归档、处理,帮助企业确定最优的服务水平和最低成本。
通常来说,信息生命周期管理是一种新的信息管理策略,其目的在于帮助客户在信息生命的各个阶段以最低的整体拥有成本获得最大的价值。综合考虑应用信息生命周期管理的思路,合理应用分层存储,在获得性能与成本的折中平衡的同时,在节省能耗上也能起到不小的作用。
原文链接:http://storage.it168.com/a2011/0127/1155/000001155263_all.shtml