如果你有10台Web服务器,每台的 CPU和内存使用率只有15%至20%,那么从实际应用情况来看,这些系统是处于空闲的,在白白浪费着数据中心的资源。这些低负载的服务器实际可以用两台 高可用的服务器进行整合,将平均利用率维持在65%至75%,对于数据中心而言具有很多的好处:降低服务器数量、降低能耗、降低维护管理开支等等。
下面有五个参考步骤,可以帮助你将负载整合,提高数据中心的应用效率:
1、收集数据
第一个步骤是需要收集系统性能数据,这个步骤需要较长的时间来执行,因为我们不能用 某一时间点的性能数据作为参考,而需要了解性能趋势的全貌。我们需要收集足够的数据来观察每小时的趋势、每天甚至每个月的趋势,一年的数据收集时间是更加 合适的。如果之前已经有了这些数据,那么可以进入到下一步:数据分析。
如果还没有收集系统性能数据,那么就需要从现在开始来进行这个关键的步骤了。现在有很多工具可以用来收集数据,比如免费、开源的Orca,是这类工具中 比较好的一个。如果时间允许,在进行下一个数据分析的步骤前,至少要进行两周的数据收集工作。
2、数据分析
在收集了足够的数据后,然后需要进行的是数据的分析。同样,这些工作可以通过工具进 行,如Orca提供了一个强大而形象的分析工具,每小时、每天、每周、每月、每季度、每年的系统性能数据可以清晰用图表显示,非常之观,你不再需要用计算 器来计算上升还是下降的趋势。
我们需要关注四个主要的性能方 面:CPU、内存、网络和磁盘。对于CPU利用率,需要检查用户和系统进程使用的CPU总量,以及特定时间段内的空闲时间。内存统计在不同的操作系统间有 很大的不同,很难一概而论,Pages in和Pages out,加上Swap in和Swap out,可以对内存性能进行快速的概览。网络性能衡量网络数据的进出能力,即吞吐量。对于大多数系统来说,磁盘性能要远比磁盘空间更重要,因为磁盘空间可 以轻易的扩充。察看磁盘每秒的读写能力,特别对于磁盘密集型应用,如数据库,可以告诉你是否需要更换更快速的硬盘,比如更改RAID策略,或采用基于 SAN的存储来改善存储性能。
- CPU-用户、系统和空 闲
- Memory-Pages in/out和Swap in/out
- Network-输入/输出(bits /sec)
- Disk-每秒读写能力
如果系统利用率有0至50%的空闲,就可以考虑整合,空闲在50% 至70%之间,如果负载兼容的话,就应该实施整合了。兼容的负载表示负载可以互补,比如,高CPU利用率的负载可以和高磁盘读写的负载相配合,就像一台 Web服务器和一台数据库服务器整合为一台单独的服务器。
3、 起草计划
通过数据的分析可以明确哪些负载 的系统可以进行整合,系统可以运行多个Web服务的实例、多哥数据库和网络服务、以及多用户存储应用等等。负载整合中有两个基本原则是需要遵循的:一组相 似的负载或者互补的负载。
整合相似负载是将尽可能多的空闲负 载集中到一台系统上,当然,还需要一台系统进行容错。整合互补负载,如Web/database,也是为了充分利用系统资源。
4、实施计划
将现有负载拷贝到新的整合系统,并保持双方并行运行一段时间,这样可以发现计划中的 问题,并避免整合系统出现问题导致业务失效。
5、 评估结果
在整合系统上安装性能收集软件来 评估整合的效果,当然,可以想象的是,相比之前的利用率,现在的整合系统利用率会更高,可以接受的利用率数字可以超过80%,峰值接近100%。注意系统 的等待状态和过长的交换等待,这可以指出一些性能问题。如果遇到了性能问题,需要扩展配置或重新配置负载整合。
负载整合可以提高数据中心效率、降低能源消耗和维护的复杂度,这项工作可能会推迟将 基础设施转移到虚拟化架构的时间。降低服务器数量,将负载整合,对于降低数据中心预算也很有意义。当然,要建立更高能效的数据中心还需要很多步骤,这五个 步骤也仅仅是个开始。