近日,主题为“芯里有数,智慧金融”的2019华为全球金融峰会在上海举行,华为与2000多位海内外金融客户、伙伴及行业专家畅谈智慧金融的未来,并携手伙伴重磅发布了联合创新成果,旨在通过共同构建领先的技术和解决方案,帮助金融行业客户构建市场领导力,携手迈向智慧金融时代。
比特管理瓦特华为用AI使能数据中心智能化
在金融行业数字化转型的进程中,ICT基础设施发挥了重要的推动作用。华为网络能源产品线数据中心能源领域总裁何波告诉记者,基于全栈数据中心的“云+AI”大平台,华为持续创新,将领先的i³@AI技术,深入智能模块化数据中心内核,使能数据中心更智能更可靠更节能,全生命周期最优。以此赋能金融科技,加速金融行业数字化转型。
华为i³@AI技术,驱动数据中心能源变革
在数据中心能源领域,华为每年有10%到15%的销售收入投入到研发中,而且2千多名研发工程师分布在德国、瑞典、中国深圳、西安、上海等地方,实现了研发资源和投入的全球化布局。在何波看来,华为在数据中心能源领域最大的创新就是比特管理瓦特,通过引进信息技术,比如云、AI等,和传统领域的电力电子、热力学技术相结合,给行业带来变革。
特别是在AI方面,华为成立了专门研究人工智能的诺亚方舟实验室,实验室拥有大量的人工智能专家,他们有一个课题就是持续研究怎么样用人工智能的技术把数据能耗PUE降下来。“华为iCooling@AI智冷技术,通过对整个数据中心基础设施各种参数的调优、提取、训练、推理,优化到最佳状态,我们自己的数据中心能耗下降了8%~15%,这是非常惊人的,对于一个10MW规模的数据中心来说,直接带来的收益就是我们每年可以节约数百万的电费。”何波说。
华为在廊坊的数据中心由于建设比较早,所以PUE居高不下,后来经过AI的加持,PUE降低0.1(廊坊数据中心三期12MW的数据中心),一年节省的电费高达数百万,在节能减排方面取得了一定的经济效应。如果说同样的AI技术,用在一个新的数据中心,PUE可以再降低10%。如果引入自然冷却技术,PUE甚至可以降低到1.1以下。
在供配电方面,华为持续不断创新。何波表示,华为把电源技术和智能化管理技术结合,使得主打的模块化UPS通过智能化的手段更可靠。“华为iPower通过供电全链路监测,可实现毫秒级的故障检测,毫秒级的故障隔离,分钟级的故障恢复,可提前消除事故隐患,大大提高数据中心能源基础设施可靠性和可用性。”
举例来说,在配电系统中,电池的重要程度不言而喻。为了预防供配电系统中电池失效的现象,华为iPower融入AI技术,可以精确预测电池的寿命和健康度,为用户提前提供维护决策依据,及时排除有失效隐患的电池组,变事后补救为事前预防,变被动响应为主动维护,大大提高数据中心供配电安全等级。华为的模块化UPS结合iPower技术,可以在电池出现温度快速升高等极端情况下,自动切断该组电池,从而避免出现起火等恶性事件,大大提升了数据中心的可靠性。
iManager通过把人在工具、运维的流程、经验等固化到工具中,从而使得数据中心运维摆脱对人的经验等方面的依赖,让数据中心更加智能化、易管理。此外iManager能对资产进行盘查,保证设备的完整性,保护重要数据;iManager还可以对资产匹配最适宜的供电、制冷、空间、带宽等资源,实现资源的最佳利用,利用AI技术,可协助对资产上下架和运营进行智能化的管理,提升运营效率和效益。通过AI实现数据中心能源管理的智能化,华为也获得了客户的认可,比如说某银行与华为联手打造智能运维管理平台,使得数据中心能够更加智能化。
双轮驱动,打造最懂客户需求的数据中心解决方案
我们知道华为的驱动力是“双轮驱动”,一个是客户需求,一个是技术发展。所以,华为做任何的技术或者产品都离不开客户的需求,一定要匹配客户的需求。何波说,“华为开发一个关键的产品和技术之前,都要和主要的行业客户进行对标,看看客户存在哪些问题,有什么痛点,然后华为再通过技术手段帮他们解决这些问题。”
众所周知,金融行业对于数据中心的可靠性会非常高,那华为是如何保障的?何波说,这种可靠性有几个层面,一个是部件设计的可靠,包括硬件和软件的设计。第二个层面是架构,比如说智能化的架构、智能化的切换,出了问题能够及时地自修复,通过技术手段实现架构上的可靠。第三,设备或者数据中心投入运行以后的运维管理易维护带来的可靠,减少人工的干预。
在部件可靠性方面,模块化数据中心、UPS、智能温控等产品是经过华为多年以来形成的一套可靠性管理体系做出来的产品。在这样的流程体系里面,华为对所有潜在的风险进行识别,转化为在实验室里进行模拟测试,每个产品都经过几千项的测试,包括自动化测试,保证产品本身的可靠性。
除了部件的可靠性,最重要的是采用智能化的技术手段使得架构更可靠。好的架构是一个部件坏了而不影响整个集体的运行,通过可自动切换、可实时监测或者提前预警,提前识别隐患。华为把AI技术运用到产品里面,通过对大量关键器件参数的采集和分析,提前识别到可能会出现的隐患,提醒用户采取措施。这就实现了自行修复和优化,甚至不需要人工干预,这就实现了最高层面的可靠性。比如UPS里面的易损件——电池、电容、风扇都要大量采用这样的技术,提前识别、预警,使得它的薄弱环节得以加强。
第三个层运维管理的可靠,华为通过免维护、免人工干预或者自动化的运维管理手段来强化可靠性。“设备的运行维护使用的过程中,越少的人工干预,越减少对人的依赖,让它自运行、自优化,我认为可靠性更高。”何波如是说。
业界很多人认为产品上市的时间越长就越可靠,这是一个错误的观念。在何波看来,可靠性应该是随着各种先进技术的发展而发展的。同时,为了保障华为的公信力,产品的可靠性通过第三方专业机构进行论证,比如说华为模块化数据中心通过了TierIV-Ready认证,证明产品架构设计是可靠的。该认证是UPTIME颁发的全球首个TIER-Ready认证,同时也是最高级别的可靠性等级认证。
对于已经建成的客户的数据中心,能不能通过i³@AI技术进行技术改造呢?
何波表示,这要视具体情况而言,它具不具备自动化的根本基础,首先是要数字化,数字化之后再网络化,之后才能实现智能化。如果设备都是“哑设备”,没有数字化,那改造的难度就更大。所以最终还是根据不同的场景,采用不同的解决方案。“有些金融行业还在使用早期的UPS,其控制方式都是模拟化的,非常依赖人的经验,技术比较落后。在改造为数字技术控制的产品后,智能管理就显得非常重要。”
所以,在网络能源领域,首先要突破的就是传感技术,使得所有的设备能够数字化。比如说蓄电池,其实是一个“哑设备”,怎么样让它数字化,知道它的健康状态,这是很重要的。还有很多的元器件都是非数字化的,华为要突破传感技术,有了传感技术,通过采集设备数据,集成本地能力,以及云端算力能力,这样才能实现云端的训练和本地推理能力相结合,华为目前就在进行这样的工作。
数据中心是承载信息化非常重要的载体,但是数据中心本身依然有大量的部件处于非智能的状态,运用新的技术,使其工作状态、数据能够获得可视并且可管理、可应用,构建多数据中心的集中管理、远程管理、客户端管理等等,这会使数据中心更加智能。
谈及未来的规划,何波表示,数据中心是智能世界的底座,任何的智能化都离不开数据中心,但网络能源很多没有实现数字化,所以这有大量的工作可以去做,我们致力持续创新,引领这个行业的变革。
华为已经成立了瓦特实验室,通过与优秀的专家、大学、科研机构进行合作,专门研究功率等方面的技术。华为本身在ICT方面具备非常强的优势,在云、IT和网络等拥有丰富的经验,这点很重要,只有懂服务对象才能把服务做好。华为在人工智能领域有AI芯片、AI服务器,加上华为自己研发的部件的数字化,围绕整个产业同盟,已在数据中心能源领域积累了大量数据,加上AI算法和算力,可以为数据中心能源领域带来巨大改变。
未来,华为将利用AI进一步提升数据中心的可靠性,实现故障的自发现、自愈、自优化,减少对人工经验的依赖,华为正在探索这件事情。比如在供配电领域,通过对机器进行声音的采集、图象识别等综合起来,以及设备本身的其他参数相结合,就能识别出来这个设备是否存在隐患或者有什么样的故障,借助自动识别提前预防,实现这个设备更可靠。
得益于在数据中心能源领域的持续投入和技术积累,华为的数据中心能源业绩稳健增长,模块化UPS、预制模块化数据中心多年保持全球市场份额第一,模块化数据中心连续四年全国市场份额第一。目前华为已在全球部署了800+数据中心解决方案,覆盖了交通、政府、运营商、ISP、金融、制造等多个行业。未来华为将持续创新,为全球客户提供简单、高效、可靠的数据中心解决方案。