在短短的几年之内,存储虚拟化已经证明它在大企业中是值得的并且走过了从价格昂贵的精品解决方案到价格适中的商品的老路。作为大多数中层的存储阵列的一个标准功能,存储虚拟化为中小机构解决了广泛的存储管理难题。同时,一流厂商的专门的解决方案为管理拥有密集型数据可用性需求的大型存储局域网的大型企业提供了最大的投资回报。
存储虚拟化在主机和物理存储之间创建了一个抽象层,掩盖了单个存储设备的特性。当在一个存储局域网中实施的时候,它为所有的块级存储提供了一个单一的管理点。简单地说,存储虚拟化把多个多种多样的网络存储设备集中在一起,提供一组虚拟存储卷供主机使用。
除了创建有不同阵列的物理硬盘组成的存储池之外,存储虚拟化以一致的方式提供广泛的服务。这些服务是从基本卷管理开始的,包括LUN(逻辑单元号)屏蔽、串联、卷分组和分段、精简配置、自动卷扩展、自动数据迁移、数据保护和灾难恢复功能(包括快照和镜像)。简言之,虚拟化解决方案可用作强制执行存储管理政策和实现更高的服务级协议的一个中央控制点。
也许块级虚拟化实现的最重要的服务是不会产生混乱的数据迁移。对于大型机构来说,移动数据几乎是不变的生活事实。随着老设备结束租赁和新设备上线,存储虚拟化能够实现从一台设备向另一台设备的块级数据迁移而不中断服务。存储管理员很容易进行例行性的维护或者更换陈旧的存储阵列,而不会干扰应用程序和用户。生产系统将保持运行。
四种架构方法
在一个虚拟化的存储局域网结构中,有四种提供存储虚拟化服务的方法:带内设备、带外设备、称作分离路径虚拟化架构的混合方法和基于控制器的虚拟化。不管什么架构,所有的存储虚拟化必须做三个重要的事情:保持一个虚拟磁盘和物理存储以及其它配置元数据的镜像;执行配置改变和存储管理任务的指令;当然还有在主机和存储之间传送数据。这四种架构在输入 /输出结构中处理这三种不同的路径或者数据流(元数据、控制和数据路径)的方法是不同的。这种差别对于性能和伸缩性的意义是不同的。
一台带内设备处理元数据、控制和数据路径信息都是在一台设备中进行的。换句话说,元数据管理和控制功能共享这个数据路径。这在一个繁忙的存储局域网中会产生潜在的瓶颈,因为所有的主机请求必须经过一个单一的控制点。带内设备厂商通过为自己的设备增加高级的集群和缓存功能解决这个潜在的伸缩性问题。许多这种厂商可以指出大型企业存储局域网部署显示了他们的解决方案的伸缩性和性能。带内方法的例子包括 DataCore SANsymphony、FalconStor IPStor和IBM存储局域网卷控制器。
带外设备把元数据管理和控制操作从数据路径分离开来,把这些任务交给另一个独立的计算引擎。这个问题是软件代理必须安装在每一台主机上。这个软件代理的工作就是把元数据和控制请求从数据流中摘出来并且发送到带外设备进行处理,让主机把重点专门放在向存储设备传送和接收数据方面、带外设备的唯一的提供商是LSI Logic。这家公司的StoreAge产品能够适应带外设备或者分离路径应用。
分离路径系统利用一台智能交换机的端口级处理能力从数据路径中卸载元数据和控制信息。同带外设备不同,在带外设备中,路径是在主机分开的,分离路径系统在智能设备分离在网络上的数据和控制路径。分离路径系统把元数据和控制信息发送到带外计算引擎进行处理并且把数据路径信息传送到存储设备。因此,分离路径系统不需要主机级代理。
一般来说,分离路径虚拟化软件将在一台智能交换机或者一台专用设备上运行。分离路径虚拟化控制器提供商有 EMC (Invista)、Incipient和LSI Logic (StoreAge SVM)。
阵列控制器一直是最常用的层。虚拟化服务一直部署在这里。然而,控制器一般都仅仅虚拟化存储系统内部的物理硬盘。这种情况正在变化。这种老方法的一个变化是在一个够虚拟化内部和外部存储的控制器上使用这种虚拟化智能技术。同带内设备方法一样,这个控制器处理所有三个路径:数据、控制和元数据。这种新的基于控制器的虚拟化的新方式的一个主要例子是日落通用存储平台。
文件虚拟化
就像块虚拟化简化存储局域网管理一样,文件虚拟化消除了与企业网络附加存储有关的复杂性和局限性。我们都认识到非结构型数据量正在爆炸式增长。IT对于这种数据没有可见性和控制。文件虚拟化提供了一个答案。
文件虚拟化提取了物理文件服务器和网络附加存储的底层细节,并且创建整个这些物理设备的一个统一的命名空间。命名空间是一个很好的词汇,是指目录层次结构和文件以及与他们相关的元数据。一般来说,采用NTFS等标准的文件系统,一个命名空间与一台机器或者文件系统有关。通过把多个文件系统和设备置于一个命名空间之下,文件虚拟化可提供一个查看目录和文件的窗口,为管理员管理那个数据提供一个单一的控制点。
许多好处听起来是类似的。同存储虚拟化一样,文件虚拟化能够实现文件数据从一台设备向另一台设备的迁移和不产生的移动。存储管理器能够对网络附加存储设备进行例行性的维护,在不中断用户和应用程序的情况下替换旧设备。
当与集群技术结合在一起的时候,文件虚拟化还能够显著提高伸缩性和性能。一个网络附加存储集群还能够提供比一台单个的网络附加存储设备快许多倍的吞吐量(每秒MB)和每秒输入输出(IOPS)。高性能计算应用程序,如震波图分析、视频渲染和科学研究模拟,都主要依赖文件虚拟化技术提供有伸缩性的数据访问。
三种架构方法
文件虚拟化仍然处在早期阶段。同以往一样,不同的厂商的方法是为不同的使用模式优化的,没有一个规格适合所有的应用。广泛地说,你在目前的市场上将发现三种不同的文件虚拟化的方法:集成平台的命名空间、集群的存储派生的命名空间和在网络上的虚拟化的命名空间。
集成平台的命名空间是主机文件系统的扩展。他们提供一种具体平台的方法,提取在一台具体的服务器平台上的跨机器的文件关系。这种命名空间非常适合多站点协作,但是,他们往往缺少丰富的文件控制。当然,他们肯定是一个文件系统或者操作系统。这种例子包括 Brocade StorageX、NFS v4和微软分布式文件系统(DFS)。
集群存储系统把集群和高级文件系统技术结合在一起创建一个模块化扩展的系统。这个系统能够为日益增加的 NFS卷和CIFS请求服务。这些集群系统的一个天然的产物是涉及到这个集群全部组成部分的一种统一的、共享的命名空间。集群的存储系统非常适合高性能应用程序和把多台文件服务器整合为一个单个的高可用性的系统。这方面的厂商包括Exanet、Isilon、Network Appliance (Data ONTAP GX)和惠普(PolyServe)。
网络上的虚拟化的命名空间是由位于客户机和网络附加存储设备之间的安装在网络上的设备(通常指网络文件管理器)创建的。这些设备实际上作为路由器或者交换机的文件级协议,是在后台的各个文件服务器上的虚拟化的命名空间,在客户机和存储设备之间传送所有的 NFS和CIFS通讯。NFM设备可以部署在带内(F5 Networks)或者带外(EMC Rainfinity)。网络上的虚拟化的命名空间非常适合分层次的存储部署和其它需要不间断的数据迁移的情况。
文件和块存储虚拟化也许是IT部门缓解与目前正在发生的数据海啸有关的痛苦的最佳机会。通过虚拟化块和文件存储环境,IT能够得到管理和实施集中的政策和控制各种各样的存储系统的更大的效益。采用这些解决方案的道路一直是长期和困难的,但是,这些技术最终将满足我们的需求。你将发现当前有许多文件和块虚拟化解决方案是非常值得期待的。