2007年,对于国产服务器厂商而言,是举步维艰的一年,面对市场的强大压力,国产服务器厂商如何杀出重围?曙光给了我们答案。
历军认为,国产服务器未来必须在体系和技术实现上不断创新才能占领市场。
498)this.style.width=498;"> |
曙光总裁历军:国产服务器"超越竞争"时代来临 |
6月21日,中国计算机报社执行总编辑刘保华与曙光信息产业股份有限公司总裁历军就国产服务器发展进行了一次深入交流,围绕国产服务器在面临市场激烈竞争的条件下如何突出重围,国产服务器未来的发展方向等问题展开了研讨。
2007年,国产服务器厂商艰难爬坡,日子并不好过。与此同时,刀片服务器日渐成熟,泛高性能计算在各行各业的广泛使用又给这一市场带来了利好消息。面对国际品牌在高中低端和三、四级市场的重压,以及通信、主板等领域的新闯入者,国产服务器进入关键一年。如何制胜?曙光信息产业股份有限公司(以下简称“曙光”)给出的答案是不争一时一地之利,创新与标准并重,抢占至高点。
“蓄水”以求超越
2007年,曙光动作不断,从以TC2600为代表的双核、四核刀片服务器的推出到4月份与Intel公司的高调合作,到牵头成立中国电子标准化协会高性能计算机标准工作委员会,再到采用16个运算核心的“龙芯”处理器的自主知识产权的高性能计算机曙光5000A,曙光总裁历军认为,在国内市场竞争国际化的今天,这都是在服务器领域水到渠成之前的“蓄水”。
刘保华:今年上半年曙光推出了新一代的刀片服务器,拥有很多自主知识产权;4月份跟Intel高调合作,牵头成立了中国电子标准化协会高性能计算机标准工作委员会。动作比较多,与以往有很大的不同,这些动作在曙光未来两三年的发展中会产生什么样的影响?
历军:这一两年来,曙光最主要的精力都放在服务器领域的研发上,就是为了练好内功。
在服务器领域,竞争态势也正在发生变化,一个突出的特点是国际竞争国内化,要和国际、国内的对手竞争,光靠打品牌、炒市场已远远不够,现在用户都变成了专家。对企业而言,最重要的是要把内功练好,才能在市场上获得竞争力,让用户感受到真正适合他的应用,企业也才能发展壮大。
相对而言,我们在市场上做的事情比较少,因为曙光憋了一股劲,要跨越当前的竞争层次,当你提供的价值远远高于市场上以低价取胜的对手时,这个竞争就会上一个台阶。现在,市场竞争已经与当年的情形相去甚远,不是给用户讲一大堆的高性能,而是要靠你的产品和技术以及建立在这一基础上的差异化。业界都认为,刀片服务器是未来的发展方向,曙光就是要从头做起。实践证明,曙光推出的刀片服务器的竞争力相当强,样子可能和国际竞争对手差不多,但在很多方面已经超过他们,在另外一些方面旗鼓相当。
可以说,曙光做的这些工作都是在蓄水。对于曙光而言,目前最重要的不是争取多大的市场份额,而是把这个水池蓄得足足的,然后一下子释放出去。一直以来,曙光都在布这个局。
刘保华:其实曙光一直在和包括IBM和Sun在内的国外竞争对手合作,相互借鉴,未来曙光如何创新,如何超越?
历军:曙光和国内的很多企业一样,都是后来进来的。国外企业其实也摔过跟头,才积累了经验,我们是边学边超越。中国的企业要想全面超越这些巨头需要很长的时间。超越的关键在于两个方面:一个是战略选择,另一个是企业的运作水平。当然还有技术、产品和服务等多个方面。
在刀片服务器上,曙光也一直在看。到今天为止,IBM进入刀片服务器领域已经有三四年的时间,投入了大量的资金。其实IBM开始决定研发刀片服务器的时候,曙光就一直在观察但并没有轻举妄动。因为如果那个时候进入对曙光来说,无论是资金还是其他方面挑战都确实太大。两年以后刀片相对成熟了,曙光也进来了。
当时IBM的14路刀片服务器研发出来的时候,由于散热和动力不足,只能插12路,出货不太好。两年之后逐步稳定,达到了国际领先的水平。我们就在这个水平上发展,并做了一些适合中国国情的改动。比如在硬盘的热插拔上,很多国外厂商不支持,对中国用户来说很不方便,限制了将来的扩展。如果用户非要扩展,就得买这家国外厂商的板卡,价格很贵,不符合工业标准。同时,只能继续买同一家公司的产品,也造成了企业对其依赖性太强。
曙光不是这样。从刀片的角度来说,首先体现了兼容性和工业标准,很多用户买了曙光的刀片的机箱,将来还可以买联想或者其他品牌的产品。其次,中国市场对刀片的需求往往有一些特殊性,例如需要刀片里面有千兆网卡接口,国外很多品牌要么不支持,要么扩展起来很贵,大概在2000美元左右。而用曙光的刀片服务器,到中关村只花2000元人民币买一个PCIE、PCIS就可以插上。
Intel公司也在研发这样的刀片,对曙光取得的成果和达到的国际水平感到很惊讶。
集群依然是高性能计算的方向
在高性能计算机体系的发展上,曙光是国内为数不多的集群路线的拥趸和坚持者之一。在未来,曙光服务器的发展战略仍然与集群高度耦合,这不仅基于其对未来发展方向的清晰判断,更得益于坚持“从牙缝里挤出钱来做研发”的坚定信念,以及多年来的技术、产品和服务能力的积淀。
刘保华:曙光高性能服务器冲击TOP500强时靠的是集群系统,几年来也一直在大力发展。现在曙光提出做刀片服务器,技术策略是不是发生了变化?未来在集群系统发展上会怎样做?
历军:目前在高性能计算领域,TOP500强里面300多台都采用了集群方式。未来三五年的时间里,集群架构依然是HPC的主流,而且应用也会越来越成熟,大量的应用都会在集群平台上有很好的优化。
坦率地说,集群架构进入的门槛相对较低,但维持的门槛很高,这就是集群系统的一个特点。集群的体系结构天生造成了使用、维护以及应用优化上的复杂性,这也是为什么很多国内同行虽然高调进入,但却很难往上走的原因,曙光就是要在集群非常精细的地方用功。
去年一年间,曙光一共卖了500套集群,这在管理上就是一个难题。比如国家气象局全国有36个单位的机器需要维护,曙光就开发了一套软件把所有的机器全部都管理起来。解决这样的问题,没有三五年的功夫根本不可能。另外,应用软件的调优也非常关键,不仅能提高硬件的使用效率,充分发挥技术效益,更能提高用户的业务效益。可以说,用户看中的不光是你的产品,更是你的服务,而服务并非一天之功。
所以,集群在未来市场上的长远发展和曙光的战略紧紧耦合在一起。
目前来看,还没有一种架构比集群更好。MPP(基于大规模分布式并行计算机)系统也很好,但的确是太昂贵了,也很专用,要想处理其他的计算需要进行大量的软件改动,任何一个高性能计算机厂商都不愿意因为这个原因而帮你改写软件。MPP在针对一些应用上,性能要远落后于集群系统。
在未来五年的时间之内,在没有一个能拿诺贝尔奖的大科学家把新体系重新设计出来之前,集群架构还会存在相当长一段时间,只不过会经过变异和演进。
创新深入芯片级
一直以来,曙光就把发展之路定义在创新之上。随着高性能计算领域技术、市场等竞争要素的不断升级,曙光一方面兼容现有的x86体系,一方面把目光放在了具有自主知识产权的芯片体系的设计、研发和创新上。
刘保华:去年,Intel公司研发出具有与超级计算机相似性能的可编程处理器,能够在指甲盖大的芯片上做到80个内核,提供万亿次级的计算速度,曙光在这个方面做了哪些准备?
历军:其实,半导体技术不仅能做到80核,也能做到100乃至更多的内核,计算速度的提高永远赶不上人需求发展的速度,今天有80内核的产品出现,明天就有160个内核的需求。举例来说,目前应用于天气预报的高性能计算模式能做到的是每两个平方公里一个隔点,但未来人们一定有这样的需求,比如落在自家院子里雨水在什么时间下,下多长时间,下多少。应用的需求在逐步增长,计算机是个计算工具而已。
面对这样的体系结构的变化,我们也有类似的计划。2008年龙芯就能批量生产。但如果一台机器到了千万亿级的计算能力,而应用提交上去使用效率只有5%的话,那计算就失去了意义。超级计算机跟现在计算机最大的一个不同就是前者朝专业化方向发展,并不是一台计算机什么都能做——药物分析也行,矿产勘察也行,天气预报也行,气象预报也行,未来一两千万亿次的计算能力只做一件事情。专业计算就需要专用CPU。
刘保华:按照曙光的计划,5000A将在2008年推出,龙芯16核是否代表着曙光在技术上的一个储备?
历军:更准确地说曙光5000A是百万亿级运算速度,密度比4000A提高了,且一部分采用了刀片结构,因此体积比4000A还小;另外一部分则完全采用龙芯16核的CPU和全新的架构,密度、精细化、工艺等方面的问题全部解决了,有较强的扩展性和兼容性。
可以保证的是,曙光5000A出来的时候通用水平和工艺水平都可以达到国际上的领先水平,应用也会非常容易管理。实际上曙光5000A是为下一代曙光6000A做技术储备。
刘保华:龙芯面临的最大的挑战是什么?中国自主研发这种芯片未来的突破口到底在哪?
历军:一个是龙芯本身如何定位,第二个是如何把龙芯和现在的应用软件的适用性做得很好。由于采用的是工业标准, x86体系的机器和软件的适应性是100%,它贯通了整个产业链。龙芯的将来也是如此。
依靠曙光一家公司之力拉通整个产业链条几乎是不可能的任务,我们的办法是把龙芯进行改进和设计,以适应应用软件。
其中一个核心问题是如何与现有的通用标准兼容,下一代龙芯是要兼容X86体系的。我们采用的方法是靠硬件隔离、屏蔽兼容性的问题,这必然带来软件运行效率的降低。这就需要在指令级的转换上下功夫,过去指令集的转换是通过软件形式,龙芯采用的是硬件的转换,比如软件的转换器,甚至把指令的转换器集成到芯片内部。
要差异化竞争,中国的企业和国际半导体企业竞争,优势并不多,需要的是从体系结构上面创新。AMD这么多年走的就是这条路,K7、K8都采用了很好的结构,而不是从主频上竞争。我们也一样,不会和别人拼内核数量。
龙芯在体系结构上做了很大的创新,尽管目前的核还比较少,但它最大的优点是功率非常低,而且在核里面进行了多方面的集成,各个核之间以及与CPU外面的交换机制、体系和计算模式也有很大的创新和变化,实现了全局的统一编制。未来仍然有更大的改进空间,基于龙芯的机器可能做到10000或者20000个核,编程更容易,性能也会更好。
这些创新是要在系统厂商强有力的支持下做,如果龙芯出来之后没有人按照这个体系推广,就很难发挥效用。
高性能计算机标准不是窄轨铁路
3月28日,中国电子标准化协会高性能计算机标准工作委员会正式成立,并发布了《刀片式服务器管理模块技术要求》和《集群操作系统远程监控技术要求》两项电子行业标准,并准备逐步将标准覆盖到操作系统、安全、应用、高性能交换各个领域,从而建立一个比较全面的覆盖高性能计算主要领域的综合性标准集。这在国外服务器厂商中引起了很大震动。
刘保华:目前有很多企业作为会员参与到标准工作当中来,但也有很多厂商都在观望,并不太积极,高标委下一步工作路线图是怎样的?
历军:7月份高标委的会员就会正式加入。高标委将参照国外惯例做法,分为三类会员:第一类会员是核心会员,可以进行提案、表决;第二类只能提案不能表决;第三类是观察会员,只能参与旁听,跨国公司基本属于这一类。
今年底前我们就可能有一两个标准成为行业标准,是国家推荐标准,未来进一步成熟的时候上升为国家标准。我们的目标就是在高性能计算这一领域有自己的话语权,尤其是涉及国家安全相关领域、涉及到未来有可能被国外厂商所垄断的市场,不再重蹈DVD、彩电行业的覆辙。
对曙光来说,目前的工作之一是制定出一些具有国际水准的标准提案,这是必须的。在这些标准的制定过程中,需要注意的是不能做成“窄轨铁路”,既要有自己核心的东西,又要跟国际在一定程度上接轨,可以相互授权,找到可行的办法。
记者手记:坏日子 好日子
在与历军的交流中,他一方面表现得比较悲观,另一方面又比较乐观。
悲观的是,国产服务器厂商在国外厂商的夹缝中生存。在生产制造方面,国产服务器不再有优势;与此同时,国外服务器厂商对中国市场更加了解,无论是从产品、价格、渠道还是服务,形成的立体攻势让国内厂商倍感压力,甚至于籍借品牌效应大打价格战。
乐观的是,近几年来,市场上出现了很多“边打市场,边研发”的企业。以曙光为例,几年来坚持把“自己的事情自己做主”作为一个战略,在兼顾工业标准和高端应用的同时,积累技术、应用上的经验,不断朝上走,并通过制定自己的标准来提升竞争力。
在竞争格局变得不再泾渭分明的时候,更多的企业需要重新审视未来之路。
曙光的战略与企业路线选择固然与其背景和文化有关,也与其在不同的时间和空间上实现的梯次创新的策略有关。从观察到学习,从借鉴到自我判断,从模仿到突破,在体系和技术实现上不断创新,最终到确立高性能服务器的标准,曙光在自我可以把控的尺度内进行循序渐进的创新,不断提高竞争的门槛,积累自身能力。
过惯坏日子的人总是励精图治,想尽办法过上好日子,过惯了好日子的人也习惯想象有一天会过上坏日子。我们把后者叫做居安思危。