前言 :
目前主流的服务器外形从架构上来说无非就是塔式和机架两种。塔式服务器专为需要卓越性能的企业精心设计,塔式服务器充足的空间可以安装更多的CPU、内存,可以安装各种全高的扩张卡、存储阵列所用的大量硬盘,以及配备更多的冗余单元。而机架式服务器则占据更小的空间,使用标准的机架外形,单位体积内可以提高更多的计算能力,从而降低了成本。因为主机托管费用根据体积来计算的,托管塔式服务器非常昂贵,所以选择一款机架式服务器是非常必要的。对于企业内服务器,使用塔式则可以取得更好的性能。
498)this.style.width=498;" border=0>
机架式服务器也有多种规格,例如1U(高4.45cm)、2U、4U、6U、8U等。通常1U的机架式服务器最节省空间,但性能和可扩展性较差,适合一些业务相对固定的使用领域。服务器通常用于托管,因此选择信息服务企业(如ISP/ICP/ISV/IDC)就显得尤为重要,特别是机房是否具备严密的保安措施、良好的冷却系统、多重备份的供电系统等成为了考量一个机房优越的重要标准;但是带宽则算是所有资源里最重要的一项。
498)this.style.width=498;">
价格仅供参考
由于中国电信拥有了绝大部分的带宽,将服务器托管在电信的机房当然是首选。但电信机房的承重压力也使得其“门槛”愈来愈高,不是简单托管费可以解决。
据了解,由于广州本地电信的机房托管的机器数目不断增加,供电负载已经不能满足服务器数目的需求,服务器用电和机房散热用电产生冲突。在还没扩建好更强供电系统前,电信机房方面从功耗方面下手,对托管的机器开机运行的时候都进行功耗的测试,对于电流需求大于0.8A即功率大于180W左右的服务器拒绝供托管服务。
498)this.style.width=498;" border=0>
以单核心的处理器为例,AMD的Opteron以及Intel的Xeon目前单个处理器的满载功耗已经接近100w,而AMD由于内核的设计优势,其满载功耗相对会低一点。若一个2U的服务器,两个处理器加上硬盘以及其他散热系统,180W这个门槛实在太高,很多的机器功耗都大大高于该要求。我们今天就利用相关的测试仪器对Intel跟AMD的2U服务器平台进行一次详细的功耗测试对比。在本次的测试中,我们会利用专用的仪器配合有负载功率显示的电源进行测试,确保测试数据的准确性。我们选用了两款价格定位完全一样,并且其实际的效能也相对接近的机型进行测试。
致荣 ZR Power D7C :
498)this.style.width=498;" border=0>
在这次测试中,我们采用了国内著名的服务器供应商致荣所提供的设备来完成我们这次的测试。Intel的平台方面,我们采用的是致荣 Power D7C的2U服务器,服务器的面板提供了6个可热插拔SCSI硬盘托架,有面板的右侧则为CDROM以及软驱设备。
致荣 Power D7C | |
CPU |
Intel Xeon Nocona 2.8G 2m Cache x2 |
主板 |
Intel E7520BD2S |
内存 |
Infineon PC3200 ECC Registered 1G x2 |
硬盘 |
Maxtor ATLAS 10K V 73G x1 |
软驱 |
Floppy 1.44m x1 |
光驱 |
24x CDROM x1 |
显卡 |
Integrated ATI RAGE XL SVGA PCI video controller |
网卡 |
Integrated Intel 82541PI Gigabit Ethernet Controller Integrated Marvell Yukon EC88E8050 PCI-Express Gigabit Ethernet Controller |
其他 |
Integrated Silicon Image SI3114 SATA RAID Controller |
电源 |
510watt(MAX) Power Switch x1 |
首先来看看这款机器的具体配置,这款机型采用了Intel支持64位功能的Nocona核心Xeon处理器,新核心的Nocona Xeon处理器采用90纳米制程技术制作,前端总线提高至800MHz,二级缓存升级为2m,它整合Demand Based Switching (DBS)技术,使得处理器能做到在空闲时自动降低处理器的倍频、前端总线频率和电压,来达到节能和降低发热量的目的,但需要主板的配合才能支持该功能。 Nocona具备Intel Extended Memory 64技术(,提供64位的内存寻址能力,让用户体验64位的运算能力,同时又能高效率地执行现今市面上所有的32位应用程序,带来更高的应用程序弹性。此外,英特尔超线程技术的改良能提升多重线程程序的性能,而Streaming SIMD Extensions 3指令集则针对媒体与游戏等应用改进线程的同步运作效率,提高系统的响应速度。
498)this.style.width=498;" border=0>
此外,和老至强一样,Nocona也支持Hyper-Threading技术。超线程技术通过在处理器上复制体系结构状态,同时共享一组处理器的执行资源,可实现线程级并行处理。因为通常的CPU的执行单元并不是任何时候都100%满负荷运转的,总有一些资源处于空闲状态,Hyper- Threading的本质就是提高CPU执行单元的利用效率,并将其转换为实际运算能力的提高。超线程技术增强设计用于改进多线程应用的性能,同时扩展的 SIMD流指令扩展3能够显著改进线程同步性能,从而可为诸如媒体和游戏等应用带来出色的系统响应能力。Nocona同时支持2个CPU SMP对称多处理,在系统内最多可以模拟出4个处理器。若还需要更多的处理能力,则需要使用更加昂贵的Nocona MP,可以实现4路或者更多路的SMP。
498)this.style.width=498;" border=0>
我们从硬件上的额定功率粗略地统计一下整机的功耗水平。由于两颗处理器的发热并不少,加上机房的散热条件比较恶劣,因此机箱内部的散热系统并不可马虎了事,这款机型配备了4把电流为0.66A的机箱风扇,也就是这把风扇加起来的峰值功率已经达到31W左右,而处理器的两个散热风扇电流为0.78A,因此这两个风扇的峰值功率18W左右,由于CPU的散热器支持温控功能,因此其实际的功耗会相对低一点。单个Xeon处理器满载时候的峰值功率约为85W左右,而两个加起来则约为170W。而单个的万转SCSI硬盘加上热插拔模块的功率约为20W左右。Intel的服务器主板功耗约为30W左右。两条容量为 1G的DDR400内存功耗约为20W。软驱加上CDROM驱动器的功耗约为15W左右。统计起来,整机的峰值理论功耗达到了304W,远远超出了电信机房所限制的180W水平。
致荣 ZR Power K8222D :
498)this.style.width=498;" border=0>
再来看看AMD的平台,我们采用的是致荣的型号为Power K8222D的2U服务器,服务器的面板结构和Intel的D7C较为类似,同样提供了6个可热插拔SCSI硬盘托架,有面板的右侧则为CDROM以及软驱设备。
致荣 Power II K8 | |
CPU |
AMD Opteron 242 SledgeHammer 1m Cache x2 |
主板 |
TYAN Thunder K8S Pro (S2880) |
内存 |
Infineon PC3200 ECC Registered 1G x2 |
硬盘 |
Maxtor ATLAS 10K V 73G x1 |
软驱 |
Floppy 1.44m x1 |
光驱 |
24x CDROM x1 |
显卡 |
Integrated ATI RAGE XL SVGA PCI video controller |
网卡 |
Integrated Broadcom BCM5704C dual-channel GbE LAN |
其他 |
Integrated Promise PDC20378 SATA/SATA RAID |
电源 |
510watt(MAX) Power Switch x1 |
这台致荣的Power K8222D 2U服务器采用的为AMD Opteron 242处理器,该处理器的核心代号为SledgeHammer,该核心相比起目前Athlon64的制作工艺相对落后一点,仍然采用0.13微米的工艺制作,二级缓存的容量为1m。其发热量相比起先前几款Opteron略小,这就允许CPU能够搭配较为便宜的铝制散热器,而先前的几款Opteron处理器必须使用厚厚的铜底座散热器才能稳定工作,与此对照的是Intel Xeon处理器必须使用的纯铜制散热片加上大功率的风扇才能控制其较大的发热,这也从另外一方面反映出Intel相比起AMD的功耗要大一点。
498)this.style.width=498;" border=0>
AMD强调TPI(True Performance Initiative)有助于用户注重系统的整体性能,而不再仅仅把CPU的时钟速度作为衡量计算机性能的唯一标准,因此AMD的处理器实际频率相比起 Intel的要低得多,而实际得效能表现却并不落后。每块Opteron处理器都具有属于自己的内存控制器,都可以管理自己的内存bank,这意味着多块 CPU不用再为争夺前断总线或内存容量而苦苦争斗,也就是说, Opteron 系统的可伸缩性非常大。在多Opteron 处理器系统中,由于每块CPU拥有自己的内存带宽,从理论上说,两块CPU将拥有两倍的内存带宽(10.6 GB/s),四块CPU将拥有四倍的内存带宽(21.3 GB/s),依次类推。
498)this.style.width=498;" border=0>
我们再来从硬件上的额定功率粗略地统计一下整机的功耗水平。该箱体得内部结构与我们刚才接受的Intel平台较为类似,机箱内部的散热系统同样配备了4 把电流为0.66A的机箱风扇,也就是这把风扇加起来的峰值功率已经达到31W左右,而处理器的两个散热风扇电流为0.68A,因此这两个风扇的峰值功率 16W左右,由Opteron的处理器发热较少,因此其对散热风扇的要求也低一点。单个Opteron处理器满载时候的峰值功率约为80W左右,而两个加起来则约为160W。而单个的万转SCSI硬盘加上热插拔模块的功率约为20W左右。TYAN的服务器主板功耗约为30W左右。两条容量为1G的 DDR400内存功耗约为20W。软驱加上CDROM驱动器的功耗约为15W左右。统计起来,整机的峰值理论功耗达到了292W,同样也是远远超出了电信机房所限制的180W水平。关于这两款机器的实际功耗表现,我们接下来会做更为详细的测试。
测试说明 :
498)this.style.width=498;" border=0>
我们采用了AcBel 550W的电源代替机器原配的电源进行测试,主要是由于AcBel的这款电源提供了可视化的LCD面板,该面板采用数字化设计,玩家可通过液晶显示屏读取电源供应器里的各项数据,当然包括了我们最主要的功耗数值读取了。而由于电源内部的散热风扇以及面板也需要电力的支持,我们把电源内部风扇的转速调至最低的水平,这部分的功耗约为5W左右,因此测试的数据约有5W左右的误差。
498)this.style.width=498;">
Intel双Xeon运行4个SuperPI时满载的截图
498)this.style.width=498;" border=0>
498)this.style.width=498;">
AMD双Opteron运行4个SuperPI时满载的截图
除此之外,我们也采用了另外一种方式对服务器的功耗进行检测。我们利用上图的交直流钳型测试表直接对连接电源插座与主机电源的导线电流进行测试,该测试仪器实际上就是一个电流表,对单根导线内通过的电流进行量度,如上图所示,量度出来的数据为0.85A安培,也就是说此时电源消耗的功率为 220V*0.85A=187W。
测试数据列表 :
测试平台 比较 |
Power D7C Intel Xeon |
Power K8222D AMD Opteron | ||||||
测试状态 |
风扇全开 |
关闭机箱风扇 |
风扇全开 |
关闭机箱风扇 | ||||
测试方式 |
电流表 |
电源 |
电流表 |
电源 |
电流表 |
电源 |
电流表 |
电源 |
开机状态 |
1.02A |
218W |
0.83A |
194W |
0.94A |
208W |
0.89A |
197W |
系统空闲 状态 |
0.77A |
182W |
0.68A |
158W |
0.91A |
192W |
0.78A |
168W |
文件复制 状态 |
0.81A |
194W |
0.76A |
170W |
0.94A |
204W |
0.84A |
180W |
CPU满载 状态 |
1.20A |
254W |
1.05A |
230W |
1.06A |
216W |
0.94A |
192W |
整机满载 状态 |
1.25A |
266W |
1.13A |
242W |
1.09A |
218W |
0.96A |
197W |
而由于两款机型的散热系统所耗费的功率甚大,4把机箱风扇理论的峰值达到了31W,因此我们在功率测试中会划分为两部份比较,分别是风扇全开以及关闭机箱风扇两组数据。而在测试中,我们会对机器的5种情况进行功耗的测试,分别为开机状态、进入系统后空闲的状态、在系统中仅进行文件的复制状态、在系统中模拟CPU满载的状态以及模拟整机满载的状态。在开机的一瞬间,对电源要求的功耗是最大的,因此这也是我们的测试对比重点;而在系统空闲的状态下,我们可以比较一下拥有DBS动态节电技术的Xeon处理器相比起这款由于主板不能提供支持而不能实现Power Now技术的Opteron有何优越性;在系统进行单一的文件复制,也就是模拟服务器最频繁的动作,对数据的读取与写入时功耗的比较;而模拟CPU满载,我们利用到4个SuperPI进行运算;而整机满载的模拟,我们通过4个SuperPI加上文件的复制与写入进行测试。
从测试数据我们可以了解到,在开机状态、进入系统后空闲的状态以及在系统中仅进行文件的复制状态中,Intel的Xeon平台功耗都有着一定的优势,功耗相比起AMD的Opteron要少5~10W左右。实际上主要是由于在这三个状态之下对CPU的占用率都几乎等于零,而Intel Nocona核心的Xeon所拥有的Demand Based Switching (DBS)技术的功效也因此而体现出来,DBS技术可以根据CPU的实际使用情况有效地减少CPU的功耗以及发热。而这款Opteron 242处理器由于主板无法提供Power Now技术的支持,因此我们也无法开启AMD的Power Now节电技术,因此在这部分AMD的Opteron 242功耗明显较大。
498)this.style.width=498;" border=0>
能源利用率,谁压着谁?
而在系统中模拟CPU满载的状态以及模拟整机满载的状态下,也体现出了Nocona核心的Xeon处理器缺点,当处理器全速运行之后,其功耗以及因而带来的发热问题十分严重,由于Nocona核心与桌面平台Prescott核心的Pentium4处理器架构十分类似,只是Prescott的核心被屏蔽掉某些功能而已。在我们熟悉的桌面平台上,Prescott核心的Pentium4处理器由于发热以及功耗的问题也因此而走到了尽头,而回到服务器领域上同样采用NetBurst架构的Nocona核心Xeon也存在同样的问题。较高的工作频率并没有为Intel带来更多的性能优势,其性能与我们这次对比的 Opteron 242好不到哪里,而从测试的数据我们可以了解到,AMD Opteron平台的功耗要比效能相仿的Intel Xeon平台低40~50W左右,发热也相对地减少很多。
在目前的服务器市场上,AMD的Opteron处理器与Intel的Xeon 之间的竞争已经转移到双核心的架构之上。双核心的处理器可以用于1到8路服务器和1到4路工作站解决方案。适于采用这款处理器的行业有跨国企业,中小企业,以及政府/教育机构;希望提高数据库处理事务的速度,或者通过电子商务式应用支持更多用户的企业;需要迅速的图形响应(例如CAD和DCC)的客户;需要为金融建模和科学应用执行大运算量任务的行业等。作为一个服务器方案,双核心的处理器通过内部的调整其性能也得到了接近两倍的提升。换个角度说,就是一台服务器使用两个双核的处理器则可以对抗4路的服务器,当然实际上也会有一点的性能损失,但其性能已经是十分接近。AMD在Intel的双核心Xeon 到来半年前向服务器市场推出了双核心Opteron处理器,同时AMD凭借其处理器的性价比,无遗会为其带来更多的客户。无论怎样,可以看到AMD跟 Intel未来的双核处理器发展计划中对功耗的控制都十分注重,在性能提升的情况下,处理器的功耗却有所降低,尤其是Intel方面,采用了全新的架构设计的处理器,其性能也是值得我们期待的。