扫一扫
关注微信公众号

集中式存储在基于云的“敏态”架构下还有市场吗?| 趋势观点
2022-07-04   twt企业IT社区

本文来自twt企业IT社区,作者/康建国,某农信存储工程师。目前主要负责小型机、存储、数据库等方面的运维及管理工作。银行从业13年,参加过省农信核心系统架构升级、主机下移、开放平台存储架构优化等项目,对存储双活、数据库高可用等方面有着深入的见解。

在过去的20多年时间里,企业数据中心的IT架构经历了封闭式、开放式和混合式三个发展阶段。现在的混合式架构主要指“稳态”和“敏态”相结合的混合双模式IT架构。对于金融行业,尤其是银行客户而言,“稳健”依然是整个企业平稳发展的基石,任何没有建立在稳定基础上的行业创新,都像是无根的浮萍。另一方面,互联网、云计算等新兴技术的创新性让很多金融机构有机会通过差异化业务进行创新,并获得更多的用户的青睐。因此“稳态”和“敏态”的IT架构成为大多数银行客户的选择。

数据是企业最重要的核心资产,数据的存储任何时候都是用户最为关心的。在“稳态”IT架构中,基于SAN架构的集中式存储凭借其高吞吐低延时的优越性能以及突出的稳定性和可靠性备受用户青睐。在“敏态”架构中,分布式存储凭借其良好的扩展性成为主流存储选择。那么集中式存储在以云技术为基础的“敏态”架构下是否依然有市场呢?本文将进行这一话题的谈论。

一、集中式和分布式存储的区别

集中式存储和分布式存储特点显著分明,集中式存储具有稳定可靠性好,数据服务丰富,有良好的数据一致性及存储容灾解决方案,接口标准兼容性广泛,性能强等优点。同时集中式存储存在着扩展性等方面的限制。当然随着技术的发展,集中式存储目前处于第五代存储阶段,存储性能和时延提升到了相当高的水平,同时在扩展性上主流品牌产品均支持横向集群扩展以应对单一的大规模应用场景。

分布式架构的存储,扩展集群规模大,硬件成本低廉,另一方面也存在着单节点性能低,延时高,数据弱一致性,标准不统一且非常依赖网络环境和带宽,如果网络发生抖动或者故障,都可能会影响分布式存储系统运行。

分布式存储和集中式存储的使用主要区分可在业务类型上,分布式存储主要的特点在扩展性和高并发下的聚合带宽上,集中式存储主要特点在IO处理能力和延迟上,所以需要根据自身的业务特性对存储进行选择。数据增长快、复用要求高、架构要求灵活扩展的采用分布式存储。业务重要性高、数据规模稳定、需求场景相对单一,对IO时延要求高的业务采用集中式存储。

二、数据中心建设模式的变化

传统数据中心建设方式采用三层架构部署,存储架构为SAN,前端应用环境主要包括两类:服务器虚拟化和数据库应用。这两类主要应用对存储的要求为低延迟、高并发,对存储性能(IOPS和Throughout)和存储可靠性要求极高。

随着现代应用架构(电子商务、云原生、微服务、分布式应用、DevOps)的流行,用户开始将越来越多的传统应用进行改造和重构,迁移到云端部署。相应地,数据存储采用云分层存储技术,或直接采用云存储。数据中心建设模式的这种变化也可以成为云化。

那么在云化环境下,在云平台的基础架构层该使用什么样的存储技术呢?目前国内的主流云平台产品大都是基于OpenStack开发的,通常会采用基于Ceph开发的分布式存储作为云平台的主要后端存储。

Ceph是一种为优秀的性能、可靠性和可扩展性而设计的统一的、分布式文件系统。性能主要是通过放弃传统集中式存储元数据寻址的方案,采用CRUSH算法,数据分布均衡,提高并行度。可靠性主要通过设置多副本,支持故障域隔离等技术实现。高可扩展性主要体现在架构去中心化,扩展灵活。Ceph的统一体现在可以提供文件系统、块存储和对象存储三种存储接口。

如今商用市场上的OpenStack+Ceph的配合打得很好,造成了大家都认为云平台就该挂分布式存储。其实不然,云平台也可以使用集中式存储,而且在某些特定场景下集中式存储反而更有优势。

三、集中式存储对接云平台的可行性

作为目前目前最流行的IaaS框架,OpenStack在Folsom版本开始,将之前在Nova中的部分持久性块存储功能分离出来,独立为新的组件Cinder。Cinder是OpenStack中提供存储服务的API框架,用来为后端不同的存储结构提供统一的接口使其与OpenStack进行整合。不同的块设备服务厂商在Cinder中实现其驱动支持。后端的存储可以是DAS、NAS、SAN、对象存储或者分布式文件系统。由于在云计算领域OpenStack受欢迎度非常高,因此众多存储厂商如NetAPP、IBM、EMC和众多开源快存储系统均提供了对Cinder的支持,这也为在云平台基础架构层使用SAN存储提供了技术基础。那么实际部署时需要提前考虑哪些因素呢?

当用户规划是否可以在云平台下使用集中存储时,需要首先考虑两个方面。

第一,自己使用的云平台是不是基于OpenStack开发的,如果不是,那可能都没有SAN的接口。国内的主流云平台产品大都是基于OpenStack开发的,但也存在少量的自研云平台。大多数国内供应商都是基于OpenStack架构开发的产品。所以,我们所说的集中存储和云平台对接,大都会演变为和OpenStack的某个版本进行对接。

第二,基于Openstack的云平台通过使用Cinder来对接FC-SAN集中式存储,Cinder只提供框架,需要通过调用FC-SAN设备厂商提供的Driver来使用和管理。这方面需要云平台厂商配合。如果确实计划使用集中存储作为云平台底层存储池但又遇到云平台厂商不支持和该品牌或者型号存储驱动对接时,可以采用在云平台的存储节点挂载FC盘,然后再以lvm、filesystem或ceph osd的方式来对接云平台Cinder接口,但这样有着不可避免的性能损耗,并非最佳选择。目前国内大部分基于OpenStack开发的云平台产品中已经集成主流存储厂家的FC驱动,可以让Cinder与存储底层对接,得到更高和更稳定的性能表现。

四、集中式存储如何在云环境下部署

上文提到由于国内的主流云平台产品大都是基于OpenStack开发的,所以我们所讨论集中存储和云平台的对接,其实演变为和OpenStack的某个版本进行对接。在OpenStack部署集中存储主要有两种部署组网方式,分别为IP-SAN和FC-SAN。

1.IP-SAN

顾名思义,在云平台底座通过IP-SAN方式部署集中存储也就是云平台的存储节点通过IP网络连接集中存储。架构图如下:

QQ截图20211119092508.png

由于OpenStack架构是运行在IP组网中的,因此这种方式更接近于客户希望点。当然目前都建议使用10Gb甚至更高速率的以太网。使用IP-SAN方式的优点在于无需在客户网络环境中部署两套网络,网络成本更低。另一方面由于存储网络是基于IP网络,无需协议转换,节省性能。同时可以借助集中存储成熟的双活和复制的功能实现两地三中心高可用架构。IP可达,灾备可达。

2.FC-SAN

由于集中存储的使用场景通常是FC方式,在云平台中使用FC-SAN方式接入集中存储是集中存储厂商更希望看到的。

架构图如下:

QQ截图20211119092508.png

使用这种方式接入的优点是FC-SAN的传输稳定性和安全性高于IP-SAN。缺点则有两个方面,一是除IP网络之外,必须再部署一套基于FC协议的SAN网络,增加了网络管理的复杂度。二是SAN网络的部署成本较高,服务器的HBA卡和SAN交换机价格不菲,尤其是在集群规模较大的云平台环境中,FC的开销可能会相当高。

两种部署方式特点鲜明,IP-SAN方式更适合规模较大、业务特点小而多的云平台场景,FC-SAN则更适合云规模相对不大,但云上业务重要性较高的业务场景。

五、集中式存储在云环境下特定场景的优势

现代数据中心的建设模式不论如何发展,无论是传统集中式架构还是云化等分布式架构,用户的数据始终是最重要的核心资产,数据安全和存储系统的可靠性始终是用户最为关心的。在这方面集中式存储凭借其特性占有先天优势,主要体现在以下几个方面。

1、便于迁移,实现利旧

如果用户原来的数据就在集中存储里,上云后数据依然存储在原来的存储里,可避免数据迁移的麻烦和迁移过程中数据丢失的风险。另一方面也降低再次采购存储的成本,保护了用户的原有投资。

2、性能可期、扩展可靠

SAN存储性能优异,表现稳定,数据访问有可靠性、实时性、一致性保证。同时,现在主流品牌SAN存储产品均支持横向集群扩展,可实现控制器节点和磁盘柜灵活在线扩容,存储性能和存储容量可独立按需线性增长。

3、云可变、数据安全

作为用户的核心资产数据,如果存放到某云厂商的云平台中,其业务今后就被其彻底绑定,后期维护、业务调整、扩容及灾备建设等,都只能依托这家云厂商来运作。因此用户在规划云平台架构时,可以将核心资产数据与业务分开规划。数据存储在开放、标准的SAN存储中,只有业务上云。核心数据资产解除与云平台厂家之间的绑定关系。

4、数据可靠性管理简单高效

业务上云后,放在存储中的数据根据用户对数据可靠性、实时性要求,可以做双活、全闪、快照、复制、备份等专业存储的特色功能,比在云上实施简单、灵活,效率高,数据恢复时间受控,后期建设及维护成本也低。

热词搜索:存储 数据中心

上一篇:打破AI算力瓶颈,河北人工智能计算中心夯实算力底座
下一篇:报告丨2022中国“东数西算”行业简析

分享到: 收藏