扫一扫
关注微信公众号

数据中心面临电力约束挑战,推动GenAI终端发展
2025-04-24   网络安全和运维

  作者:Gartner研究总监 曹梦琳

  生成式人工智能(GenAI)和大语言模型(LLM)的迅猛发展催生了空前的算力需求。随着AI模型复杂度不断提升,支撑其运行所需的能源已对数据中心造成巨大压力。Gartner预测,到2027年,数据中心运行新增AI服务器所需的用电量将达到每年500太瓦时(TWh),是2023年的两倍以上。GenAI不断攀升的电力需求为数据中心运营带来了成本、性能和可持续性等多重挑战。

  Gartner预测,到2027年,40%的数据中心将因电力供应问题而面临运营限制。这种情况不仅会影响数据中心自身,还会对其客户和终端用户产生连带效应,导致成本上升、服务性能下降等问题。

  对于IT部门而言,GenAI日益增长的电力需求正成为关键制约因素,限制其部署GenAI相关产品和应用的能力。

  GenAI处理向终端转移

  数据中心电力消耗所带来的运营风险,将迫使产品负责人考虑将更多AI推理工作负载转移至终端设备。目前,更高的响应速度和更好的数据隐私保护是终端GenAI的两大优势。如今,为应对数据中心电力限制的压力,终端GenAI正在成为更具吸引力的解决方案。

  Gartner预测,到2026年,终端GenAI查询量将超过云端,这标志着AI战略的重大转向。

  终端GenAI处理需重新设计关键技术

  随着行业格局演变,产品负责人必须重新评估其AI战略以适应这一转向。评估如何优化推理方式,在终端分配GenAI工作负载至关重要。采用终端GenAI,企业不仅能缓解数据中心电力约束带来的风险,还能提升整体用户体验。这一战略转向不仅可以帮助企业解决当前的电力挑战,也让企业在快速演进的AI环境中更好地应对未来需求。

  受改善用户体验(如增强数据隐私、降低延迟、加快响应速度)的需求驱动,GenAI正加速向智能手机、个人电脑(PC)、平板电脑、XR头显、可穿戴设备、车辆、机器人和物联网设备等终端设备转移。由于终端设备外形尺寸的限制,其搭载的GenAI处理需要极高的能源效率,同时不应因新增的GenAI功能而影响终端设备的续航时间和电池寿命。终端GenAI的发展需要半导体、电池以及AI模型开发领域的显著协同创新。

  ·半导体:高效节能芯片是实现实时处理和低延迟的关键。专为终端GenAI设计的专用AI处理器、低功耗存储芯片,以及集成神经处理单元(NPU)的应用处理器和微控制器单元(MCU)成为首选方案。氮化镓(GaN)等宽禁带半导体在快充电源转换中至关重要,可显著提升用户体验。由于本地GenAI处理可能快速消耗电池电量,快充技术对于智能手机、PC等电池供电的终端设备至关重要,是保障其GenAI功能用户体验的关键因素。

  ·电池:智能手机、PC、XR头显、可穿戴设备等大多数终端设备都依赖电池供电,而终端GenAI处理将消耗更多电量。固态锂离子电池这类更高能量密度的电池,将成为支持更长续航时间的关键。

  ·AI模型:终端设备的本地处理需要参数规模更小的定制化AI模型。参数更少的轻量化大语言模型适用于特定任务和行业,可降低计算需求,使其适合部署在无法运行标准“重型”LLM 的终端设备上。

热词搜索:数据中心 GenAI

上一篇:Gartner:2025年全球GenAI支出将达到6440亿美元
下一篇:最后一页

分享到: 收藏