全球虚拟化和云基础架构厂商VMware公司今天公布了最新开源项目——Serengeti,支持企业能够在虚拟和云环境中快速部署、管理和扩展Apache Hadoop。此外,VMware与Apache Hadoop社区共同合作研发扩展功能,让主要组件可以“感知虚拟化”以支持灵活扩展,并进一步提高Hadoop在虚拟化环境中的性能。
VMware公司云应用服务副总裁陈志璋表示:“通过支持企业充分利用超大型数据而获取竞争优势,Apache Hadoop具有带来业务变革的潜力。它代表了应用正在发生根本性变化的一个方面,而企业也在寻求把这些新技术融入其产品家族的方式。VMware与Apache Hadoop社区合作,支持企业IT部门能够在虚拟和云环境中轻松部署和管理Hadoop。”
Apache Hadoop事实上正在成为大数据处理的标准,但部署和运营的复杂性、特定的硬件需求、安全上的顾虑和服务水平保障让很多企业无法充分发挥Hadoop的威力。通过把Apache Hadoop节点从底层物理基础架构剥离,VMware可以将云基础架构的优势带给Hadoop,包括快速部署、高可用性、最佳资源利用率、灵活和安全多租户。
拥有Apache 2.0许可证的用户可以免费下载Serengeti,它是一键式部署工具包,支持企业能够利用VMware vSphere®平台在几分钟内部署高度可用的Apache Hadoop集群,包括Apache Pig和Apache Hive等常见的Hadoop组件。通过使用Serengeti在VMware vSphere上运行Hadoop,企业可以轻松享受到值得信赖、广泛部署的全球虚拟化平台的高可用性、容错性和现场迁移能力,从而实现Hadoop集群的可用性和可管理性。
OVUM首席分析师Tony Baer表示:“要想成为企业IT基础架构中的佼佼者,Hadoop必须符合企业IT部门的技术和实践需求。大数据集群的资源密集性使得Hadoop必须支持虚拟化。VMware参与Apache Hadoop项目和VMware最新Serengeti Apache项目都是非常重要的举措,为企业提供了在Hadoop原型开发和部署时所需的灵活性。”
VMware与Cloudera、Greenplum、Hortonworks、IBM和MapR等领先的Apache Hadoop分销商合作,从而进行广泛分销。
虚拟化扩展、Spring更新帮助企业构建和运营大数据应用
为了简化并加速企业使用Apache Hadoop,VMware与Apache Hadoop社区合作更新Hadoop分布式文件系统(HDFS)和Hadoop MapReduce项目,使其能够感知虚拟化,从而支持数据和计算工作在虚拟基础架构中可以进行最佳分布。这些改变支持企业能够实现更灵活、更安全且高度可用的Hadoop集群。
VMware还发布了Spring for Apache Hadoop(2012年2月首次发布的开源项目)的更新,让企业开发者能够轻松利用Apache Hadoop开发分布式处理解决方案。上述更新支持Spring开发者能够轻松开发可以与HBase数据库、Cascading库和Hadoop相集成的企业应用。Spring for Apache Hadoop可以免费下载,目前可以通过开源Apache 2.0许可证获取。
上述项目和新功能旨在加速Hadoop使用,并支持企业充分利用Cetas等大数据分析应用从海量数据中获得实时的智能洞察力。VMware在2012年4月收购了Cetas,Cetas分析服务目前可以在www.cetas.net网站获得。