IT运维管理,创造商业价值!
中国IT运维网首页 | 资讯中心 | 运维管理 | 信息安全 | CIO视界 | 云计算 | 最佳案例 | 运维资源 | 专题策划 | 知识库 | 论坛

高效制胜、扩展无限 戴尔高性能计算最佳实践

2012年06月12日
中国IT运维网/企业网D1Net

 戴尔在高性能计算领域一直处于世界领先地位,不论在生命科学、石油天然气、可再生能源、航空、医疗、学术机构、金融、制造业还娱乐传媒都能看到戴尔高性能计算的身影。就在不久前放映的3D影片《非常小特务4》中,戴尔PowerEdge服务器执行了大量的特效渲染任务,使这部妙趣横生的故事科技、现代感十足。然而,建立一个基于高可靠性、开放架构、可扩展性的高性能计算系统才是戴尔产品的精髓。

高可靠性

F1是一个风险性极高并聚集了大量科技要素的体育赛事——生命与速度、科技与荣誉贯穿始终。车手的生命不仅系于他手中的方向盘,更与整个赛车团队对车况、路况的分析与决策密不可分,正如凯特汉姆F1车队(Caterham F1 Team)的首席技术官Mike Gascoyne所说:“在F1赛场上,没有比对数据分析更关键的事情了,因为0.1秒的差距也能在赢与输之间做出决定。”而IT系统每一个微小的误差都可能造成车毁人亡,毁掉的不仅仅是一场比赛、一部赛车,而是宝贵的生命。

\

凯特汉姆采用了戴尔产从服务器、存储、笔记本电脑到移动终端一整套的品和解决方案。从着手准备2010年赛到一切IT环境就绪,在不足22周的时间里,戴尔为凯特汉姆构车队建了一个高性能计算(HPC)集群、网络架构、赛道用IT基础系统、设计环境以及存储系统。并且戴尔企业级计算环境一直伴随着凯特汉姆征战全球各地的F1赛场。

位于凯特汉姆伦敦总部的高性能计算环境主要应对于流体力学方面的计算,具体而言就是在高性能计算环境中精确地模拟风洞,从而改进对赛车的设计。车队使用了Intel Cluster Ready HPC系统,配置有预先测试好的戴尔硬件及ISV应用程序,整套HPC系统采用了186个基于英特尔至强5570系列处理器的戴尔PowerEdge M610刀片服务器,并与戴尔PowerVault MD3200和MD1200存储阵列相连。在供电和散热方面,使用了APC的数据中心解决方案,为关键部件提供高能效的供电和散热。

位于F1比赛现场的赛道IT环境则是车队取得更好成绩的重要保证。根据现场比赛条件对赛车和路线进行优化,在比赛过程中,车队则完全依赖于赛道IT环境,它包括:四台戴尔PowerEdge R710服务器与一套EqualLogic PS6000S SAN存储阵列(一台工作,一台用于备份)相连,并配有固态硬盘和两个高密度UPS。这套系统即便在高温等恶劣条件下,也最终经受住了考验。

高性能

娱乐的消费是迅速的,一部90分钟的电影背后需要上百万分钟的辛勤制作。但人们对高品质的画面追求的脚步从来没有放慢过,从标清到高清、从3D到4D,人们永远不认为他看到的是最炫的画面,还在期待更炫的。快速提高制作效率是每一个制片人所追求的市场与社会效益。

北京师范大学对戴尔高性能计算产品大加赞赏,将在6月20日北京悠唐假日酒店举办的戴尔高性能计算行业应用实践交流会上会分享他们的应用体验。但早在2009年,中国传媒大学高性能计算中心就与戴尔公司合作,还为北京信息职业技术学院打造了一个高性能的动漫渲染平台。该平台包括112片戴尔PowerEdge M610刀片服务器,2台戴尔PowerEdge R710机架式服务器作为管理节点,7台戴尔PowerEdge R710机架式服务器作为I/O节点以及1套光纤SAN存储阵列。其中中国传媒大学高性能计算中心负责提供完整的应用和管理软件以及整个项目的实施和技术服务。该平台建成后,项目负责人胡永先生不无感慨的介绍说:“以往我们渲染一个高清标准的1000帧动画,往往需要几周的时间,而且还得夜以继日。现在我们只需要1个多小时就可以完成相同的渲染任务,这对于我们来说是一个质的“飞跃”。戴尔提供的高性能服务器在该平台近三年的满负荷运转中体现出了优异的质量品质,在经历了多次突发性的停电、UPS故障等问题后依然能够正常的启动和使用。用户高度认可戴尔产品的可靠性和稳定性,对戴尔产品的环保和节能也是大加赞扬。

可扩展性

可扩展性成为企业争取最优拥有成本的最佳实践。可扩展性包括单机扩展性、存储扩展性、网络扩展性以及新老产品的平滑衔接。

单机扩展性要求要有较强的CPU、GPU以及内存的扩展。例如,在GPU计算方面戴尔提供了灵活的扩展方式:一种是直接把GPU安装在机箱里,另一种是通过PCI卡来与GPU互连,第三种是提供专门的GPU服务器。而GPU在并行计算的优势越来越不可忽略,在20日北京举办的戴尔高性能计算行业应用实践交流会上Nvidia将向您详细讲解GPU在高性能计算的应用趋势。

网络扩展方面,与本地的机器相比,其使用的万兆以太网延迟太大,采用Dell Force10万兆网的延迟,仅有700ns,而基于万兆以太网上的云平台的延迟达到了40-50微秒,这对于那些对I/O延迟很敏感的应用来说体验将是相当糟糕的事情。并且戴尔正在开始迅速向40G以太网这一新领域进军。

\

深圳华大基因研究院在基因的测序能力及基因组的分析能力上处于世界领先地位,曾先后完成国际人类基因组计划“中国部分”(1%)、国际人类单体型图计 划(10%)、水稻基因组计划等多项具有国际先进水平的科研工作。我们为华大基因打造的高性能计算集群成为了进行基因研究工作的重要平台,可以帮助该院的研究人员进行基因测序、数据处理、对比分析和结果提取等多项关键工作。华大基因表示,在引进戴尔M605服务器以后,华大基因的计算能力提升了两倍,有力地推动了各项研究项目的顺利开展。

 

高性价比

在结构生物学领域清华大学走在了科技的最前沿。清华生命学院决定采用戴尔高性能计算群集方案(HPCC-High Performance Computing Cluster)为结构生物学研究提供一个更为高效的研究平台,创造更为良好的研究环境。

2010年初,清华生命学院经过广泛考察、慎重选型、反复测算最终决定引进1套大规模的44计算节点的戴尔HPCC系统,该系统由“计算节点”、“管理节点I/O节点”、“存储后台”“计算与管理网络”4个主要部分构成:其中HPCC系统的计算节点由11台戴尔PowerEdgeTM C6100机架式服务器担任,每台C6100机箱内配置有4台刀片服务器,每台刀片配置了两颗2.4GHz英特尔R至强R5645 六核处理器、24GB内存(6x4GB)、1块3.5英寸7.2K RPM SATAII硬盘,2块Broadcom 10/100/1000Mbps 自适应以太网卡(支持TOE offload 引擎技术)

“戴尔C6100服务器+Infiniband网络”为核心的HPCC系统于2010年3月完成组装和调试,目前已运行了1年多的时间,整体运行状况非常平稳。清华大学生命学院崔野老师是这套HPCC系统的主要管理者,他对系统的表现给予了充分的肯定。崔野老师介绍说:“目前,生命学院结构生物研究的主要计算任务均由这套HPCC系统来完成。该系统的上线,有效地保障了我们在大分子研究方面的计算效率,与传统的机架式服务器组成的HPCC相比,采用戴尔C6100服务器我们可以节省50%的空间,节省30%以上的电力消耗,这可以让我们的运营成本得到有效的控制。”

崔野老师接着介绍说:“从实际效果看,戴尔HPCC运行稳定,数据处理速度很快,完全能够满足我们开展大规模科学计算的要求。我们当前工作的重点是利用HPCC系统进行大分子蛋白质结构的研究计算,这种研究时效性强,紧迫性高,任务繁重,要求HPCC系统必须具有超强的计算能力,而戴尔HPCC的浮点运算速度峰值可以达到每秒五万亿次(5TFLOPS),我们对这样的计算能力感到十分满意。此外从发展的角度来看,戴尔HPCC系统的高效性为日后结构生物学研究工作的深入打下了非常扎实的基础。”

发表评论请到:http://bbs.cnitom.com

相关阅读

图文热点

ARM架构能否撼动x86的地位成为处理器主流?
ARM架构能否撼动x86的地位成为处理器主流?2012年10月29日,AMD宣布除了原有的x86处理器之外,该公司将设计面向多个市场的64...
第三季度服务器市场盘点:思科和戴尔是赢家
第三季度服务器市场盘点:思科和戴尔是赢家根据Gartner和IDC的数据显示,在第三季度服务器市场中,戴尔营收和出货量双双上涨...

本类热点