能够在云环境中获得高性能吗?答案是肯定的。
过去,高性能计算(HPC)并不需要云资源。IT部门经常根据摩尔定律来预测处理器速度的快速提升,但如今摩尔定律已陷入停滞,导致单核(单线程)的速度在3GHz左右徘徊。显然,仅靠通过增添计算资源来提高计算能力已经不可行了。在这种情况下,需要高性能计算的机构必须购置额外的物理基础架构或找到一条通向云计算的可行之路。
IT预算短缺以及数据中心面临的电力和冷却等问题促使企业必须合理地规划资源的使用。通过额外购买物理基础架构虽然能满足峰值工作负载,但可能会造成非峰值期资产的闲置不用,因为高性能计算工作负载具有突发性,即大型项目在短时间内需要很多计算资源。如果企业并不想为峰值工作负载构建系统,其结果又可能不能随时有充足的计算资源可用。
精心设计的高性能计算环境可以充分利用云基础架构,并获得高性能、高利用率以及动态扩展集群规模以处理峰值工作负载的能力。一些高性能计算企业云计算实践结果有力地证明了HPC云应用既在技术上切实可行,又能带来经济效益,是可以实现既定目标的。
Platform提供的一系列强大而灵活的HPC云解决方案,使用户可以通过配置HPC数据中心,来满足云风暴的需求。Platform可以帮助用户提高在云基础设施中运行的HPC应用程序的利用率。Platform提供的工具包括提供动态主机功能的Platform LSF、Platform MultiCluster协调工具和用于基础设施共享的Platform ISF,为创建满足高性能计算应用程序需求的云环境提供方便。
工作负载调度。使用云环境下的Platform LSF动态主机功能,云资源在运行时就像是拥有本地IP地址和主机名称的现场HPC数据中心。任务提交后,内置在软件中的Platform LSF守护程序可让云资源识别映像请求,并通过添加有效映像来准备好处理工作负载的资源。发送到云的工作负载可进行完善,只要允许用户标记某任务,确保应用程序、数据和云资源经配置后,就可在云中运行。
多集群管理。使用结合Platform LSF的Platform MultiCluster协调工具解决方案,用户就能开始与任何云或主机托管提供商一起建立新的集群,而不需要专用链路。云集群变得可用,用户可以使用MultiCluster来处理工作负载在内部HPC集群与基于云的外部集群资源之间的分配。当然,还必须考虑安全、监管、服务级别协议/服务级别目标(SLA/SLO)等因素驱动。
云管理。Platform ISF拥有处理多种不同类型系统的资源工具包,其中包括物理或虚拟系统;Linux/Unix/Windows系统;VMware、XEN、Hyper-V和KVM等虚拟机;亚马逊和Rackspace等云资源。
通过结合使用Platform ISF和Platform LSF,用户能够自动向上或向下扩展集群。Platform ISF可以管理物理资源和虚拟化资源,同时还能向外扩展到其他服务器——或者扩展到企业内部的基础设施,或者扩展到企业外部的云托管提供商、云计算公司或其他类型的服务提供商。物理资源还可以根据需要,自动重新配置,以满足应用程序的需要,比如操作系统的特定要求。
此外,Platform ISF具有政策管理功能,可用于专门针对处理任务、满足服务级别协议(SLA)所要求的虚拟资源类型,为不同的应用程序量身制定政策;可以根据应用程序动态向企业内部扩展、向企业外部的云环境扩展,也可不扩展而用于独立定义工作。