成立于1963年的东安格利亚大学(University of East Anglia,UEA)位于诺里奇(Norwich),是英国老牌重点大学,也是世界公认的拥有一流研究水平的大学。高质量的教学与高水平的研究为东安格利亚大学带来了极高的国内和国际学术声誉,该校近90%的研究成果被认定为具有“国际卓越”水平,在最新的研究成果评审中超过50%的研究成果被列为“世界领先”。在环境科学研究方面,东安格利亚大学一直处于世界领先地位,2007年,该校20多名环境研究科学家因在环境科学研究领域的杰出成就与美国前副总统戈尔共同获得了诺贝尔和平奖。
HPC应用需要拓展
作为一所注重研究的大学,高性能计算平台对确保UEA各项研究的顺利进行至关重要。在过去十多年中,高性能计算(HPC)一直是UEA的重要组成部分,专用的HPC系统支撑着气候和环境研究以及化学、计算机科学和数学学科研究。但随着研究需求的不断增长,UEA对计算能力的需求也在增长,原有HPC系统已经不能满足研究工作的需求。搭建绿色HPC平台不仅对经常使用数据中心处理研究数据的气候研究人员,而且对UEA来说都是非常重要的,因此,UEA开始寻找方便用户使用、合适的HPC解决方案,一方面拓展HPC的应用范围,支撑跨学科的艺术和人文科学等研究;另一方面能以有效的方式增加计算能力,使之可以根据任务调度自动控制开启和关闭系统,在让HPC系统更快、更易于管理、提供的功能更强大的同时,满足减少碳排放和降低功耗的严格要求。
为了建立绿色HPC中心,UEA经过仔细比较,选择了与系统集成商Viglen合作,并采用Platform HPC解决方案。
“我们希望能找到比Sun Grid Engine和Cluster Vision解决方案更加智能和拥有更多特点的解决方案。Platform HPC解决方案在提供了先进的集群管理和调度功能的同时,降低了IT部门的管理负担,让管理员能在用户需要时第一时间协助他们解决问题。”UEA计算机专家兼UEA气候研究所(CRU)所长Collins先生说。
让新的HPC能为更多的学科研究提供支撑也是UEA选用Platform HPC解决方案的一个重要原因。Viglen HPC产品经理David Power说:“需要用到HPC资源的用户形形色色,应用也多种多样,这就要求新的HPC解决方案能支持各种不同的应用。Platform HPC解决方案允许多个操作系统在同一时间在同一个集群上运行,从而拓展了HPC应用范围,用户群超越了传统的HPC学科,整个大学的用户都能受用。”
Platform HPC解决方案易于使用的Web界面是UEA决定采用Platform HPC解决方案的另一个重要因素。“易于使用的Web界面为用户带来了巨大的好处,如果非HPC用户需要使用该系统,他们可以通过Web界面来使用,而无需使用命令行接口。”Collins说。“利用Platform HPC解决方案,我们不必化费太大的力气或者做大量的编程工作,就能发布一个新的应用。”
Viglen的CEO BordanTkachuk先生说:“Viglen非常重视计算中心的绿色节能,特别是在传统的高计算能力和高功耗的HPC领域。UEA成功部署Platform HPC解决方案说明,利用领先的HPC技术,可以在保证充足的计算能力的同时,降低能耗。”
BordanTkachuk先生进一步补充说:“UEA需要一个更快、更容易管理、拥有更多能力的管理系统。计算能力的增加使UEA进行研究时可以跨更大的数据集,并可以在比以前更细的粒度级别进行研究。UEA新的HPC平台是卓越的高性能研究平台,可以满足UEA世界领先级研究的需要。”
计算能力翻番
UEA新的HPC平台拥有2032内核和168个计算节点。UEA也在集群上增加了GPU节点以增加处理能力。新HPC系统投入使用后,短短几个月的内,就为UEA增加了一倍多的计算能力,从9万亿次浮点的运算能力增至21.5万亿次浮点,计算能力显著增加。
数据中心是UEA电力消耗最大的部门,如今,Platform HPC解决方案正在帮助UEA减少碳排放和降低能耗,从而节省资金。“这在很大程度上得益于可根据需要量和使用量自动开启和关闭电源系统。实施Platform HPC之前,UEA无法优化能耗,因为即使没有运行工作负载,系统仍然消耗能源。现在,UEA可以关闭不使用的节点,显著减少能源浪费和成本。” Collins说。
迁移更简单、安全。“我们需要不断地将新用户迁移到HPC平台上。迁移和链接应用是繁琐的过程。在此之前,我们必须区分哪些节点的应用是可以运行的。采用Platform HPC解决方案后,利用Platform MPI,我们可以在Ethernet和Infiniband上为应用提出请求,并轻松地将它链接到Platform MPI。” Collins说。
Platform HPC解决方案提供的丰富的管理功能让Collins和他的团队受益匪浅。“借助Platform HPC,主节点能感知作业队列的资源需求量和每个节点的进程,及时关闭暂时不需要的节点。当资源使用量增加时,主节点可以在一两分钟内开启相应的节点以满足需求。“Collins说。
Platform HPC还带来了以下好处:
•根据特定任务对硬件的需求,智能地分配工作负载,帮助UEA提高计算资源的使用率;
•更有效地使用软件许可,最大限度地提高吞吐量,并利用Platform HPC降低管理难度;
•通过Platform MPI简化对并行作业的管理。
Collins对Platform HPC解决方案非常满意。UEA目前正计划购买更多的Platform HPC软件许可,争取在未来一年内将系统的规模再次翻番,从而让整个UEA都能利用HPC环境进行高性能计算,继续保持其世界领先的研究水平。