登录

有模型厂商CPU需求提高5倍!计算设备迎来非人类用户:智能体


速读:此前常被定位为GPU霸主的英伟达已看到这一趋势,准备在秋季拿出一款为智能体设计的个人电脑芯片。 业界近期判断,以CPU需求增长为代表的数据中心计算硬件变迁只是开始,智能体将更加彻底地改变硬件的运行方式乃至形态。 现在,真正为智能体设计的个人计算设备也开始出现了。 而在数据中心,智能体带来的冲击已经开始,CPU成为承接智能体计算的主要平台,逐渐站回数据中心“C”位。 Arm边缘AI事业部执行副总裁ChrisBergey告诉记者,很多智能体依托专属CPU驱动,还有大量与AI工作负载相关的数据库操作用于管理上下文及整个运行过程,同样是高度依赖CPU的计算密集型任务。
2026年06月12日 21:2

智能体需要什么样的硬件?这是硬件行业近期思考最多的问题之一。

第一财经记者近日参加的一场行业论坛上,一名物联网公司技术负责人说,智能硬件正迎来人类之外的第二类用户,即智能体。

此前常被定位为GPU霸主的英伟达已看到这一趋势,准备在秋季拿出一款为智能体设计的个人电脑芯片。而在数据中心,智能体带来的冲击已经开始,CPU成为承接智能体计算的主要平台,逐渐站回数据中心“C”位。

业界展望,给智能体“使用”的计算设备,可能会与人用的设备截然不同。为抢夺新的用户,处理器厂商开始了新一轮竞速。

CPU需求井喷

很多业内人士近期开始讨论,数据中心CPU的数量相比GPU,要如何从1:8向1:1演进。

近日一场采访中,英特尔数据中心集团副总裁兼中国区总经理陈葆立谈到CPU需求增大,称业内CPU需求短期存在供应紧张,英特尔已在尽量提升产能,但市场非常火爆,需求是所有供应商都无法快速满足的。他表示,国内某家大模型厂商反馈,从去年至今,该公司的CPU需求提高了5倍。

智能体应用爆发是CPU需求迎来拐点的原因。Arm边缘AI事业部执行副总裁Chris Bergey告诉记者,很多智能体依托专属CPU驱动,还有大量与AI工作负载相关的数据库操作用于管理上下文及整个运行过程,同样是高度依赖CPU的计算密集型任务。

而据腾讯云计算产品运营总监周驰观察,涌入云平台的很多自动化任务用于处理日常琐事,不需要很多GPU,更需要CPU的调度、高并发执行大量小脚本能力。

一些业界人士认为CPU需求会倍数增长。Arm CEO Rene Haas近日表示,按出货量计算,CPU需求增长比原本预想的更快,他无法预计增长倍数是4、6还是8,但数字在变大。陈葆立认为,目前还难以定论未来CPU和GPU的比例是不是1:1,但基本逻辑是给AI更多任务,多数任务执行者是CPU。

数据中心的“C位”也在悄然变化。资本市场上,英伟达的股价自2022年底ChatGPT面世后经历了暴涨。CPU厂商AMD、英特尔以及与CPU关系密切的IP设计厂商Arm,股价迅猛提拉的时间点则在年内,这三家厂商年内股价都翻倍增长。

业界近期判断,以CPU需求增长为代表的数据中心计算硬件变迁只是开始,智能体将更加彻底地改变硬件的运行方式乃至形态。

Chris Bergey告诉记者,为支撑AI产业变革,芯片硬件层面配套算力与存储组件的设计复杂度、研发成本大幅攀升,同时产品还要面临严苛的功耗限制。随着AI成为核心工作负载,系统内每一类计算单元,都要尽可能强化AI任务的运行能力。因此,市场将会出现全新的计算硬件。

智能体呼唤什么样的硬件?

一些业界人士认为,面向智能体,CPU将变得与以往截然不同,新的工作负载对CPU的效率、能力、核心数都提出新要求。

智能硬件基础设施厂商云尖信息副总裁张欢军表示,运行智能体时,要解决的核心痛点是“单颗CPU处理业务的能力”,即单台设备能否承载更多智能体、每个智能体的运行成本和效率是否足够好。

要承载更多智能体,一种方式是增加CPU的核数(一种计算单元),以增强并行计算能力。陈葆立认为,智能体需要更高的CPU核数,一些智能体适合使用核数极多、单核性能要求不太高的轻量核处理器。目前英特尔至强6+可以在单个CPU核心上同时运行3到4个用于处理简单日常工作的智能体。

上周Arm与英伟达合作推出的RTX Spark个人电脑芯片则搭载了20颗Arm处理器内核,是目前采用统一内存架构的PC类产品中CPU核心数最多的产品。“我们在云端和边缘侧都看到对更多CPU、对更高性能的强烈需求。大家真正需要的是更高的CPU密度,也就是更好的能效比 (performance per watt)。”Chris Bergey告诉记者。

智能体在边缘硬件运行还面临一个难以回避的挑战:内存空间有限。创通联达CTO黄小严在近日高通与极视角主办的端侧AI开发者技术开发日上表示,智能体开始成为硬件的核心用户,智能体场景涉及多轮对话,需要长时间记忆,但移动端的内存容量受成本约束,内存紧缺且有算力约束,容易导致上下文溢出,由此形成AI智力鸿沟。

芯片厂商已在探索更多方法,让边缘硬件的存储空间能被更好地利用。

英伟达与Arm合作开发的RTX Spark采用了Grace CPU、Blackwell RTX GPU及统一内存紧密耦合的方式。Chris Bergey告诉记者,行业迈入智能体阶段,用户需要高性能GPU与CPU之间的紧密结合,统一内存是为了让CPU和GPU能完整调用全部DRAM(动态随机存取存储器)及带宽资源,并让系统设计不再依赖PCIe或CXL等传统传输接口,提升CPU与GPU间的传输带宽。统一内存技术正在推动边缘计算变革。

应对显存和闪存资源紧缺,英特尔则采用QAT(快速辅助技术)和IAA(内存分析加速)技术。

陈葆立表示,AI运行时,海量KV Cache(一种大模型优化技术,通过缓存向量避免冗余计算)需要存,100万上下文约等于10G以上KV Cache,是一大笔闪存开销,而通过QAT技术可以让压缩比达到50%,节省闪存成本。多个智能体运行时,IAA则能实时性压缩内存数据以节省内存。

除了内存问题,黄小严还提到,智能体在移动计算设备上不停歇运行,设备需要在省电、高唤醒率之间找到平衡。传统物联网软件架构失效,设备必须重构,以便智能体理解和调用,智能体安全也需要新的保障。为解决这些问题,他所在的公司使用了高通开发工具链等,在软硬件和系统平台层面进行了设计,搭建了端侧智能体中间件运行平台等。

智能体专用硬件平台兴起

今年初,OpenClaw爆火带动了Mac Mini这类计算设备销售,人们买Mac Mini更多是为了让智能体在本地运行,而不是自己上手操控电脑。这是智能体专用设备的雏形。现在,真正为智能体设计的个人计算设备也开始出现了。

今年秋季将上市、搭载了RTX Spark芯片的笔记本和台式电脑,将由联想、华硕、Microsoft Surface等厂商推出。对这款芯片,英伟达CEO黄仁勋形容为“重新发明了个人电脑的工作方式”。

Arm也看到,个人电脑行业将发生巨大改变。“PC需求分化为两种,一种是电池好、随处可连接网络,就像一个大号手机加一个键盘,能用来工作;另一种需要有非常极致的性能,能运行智能体、模型或做开发工作。”Rene Haas上周表示。

Chris Bergey向记者进一步解释,以往的PC从入门级向高性能产品延伸演进,整体产品架构相对一致,高端机型靠提升主频、扩充核心数、选用更强性能内核来实现迭代。而随着智能体专用硬件平台兴起,现在对PC市场的区分已截然不同。

“用户对此类设备有明确需求:PC能7×24小时不间断运行智能体;设备依托高性能硬件,以高吞吐规格运行各类大模型;除了支出设备采购、供电及网络接入成本,不产生额外算力费用,模型本地运行,用户隐私数据留存本机。”Chris Bergey说,传统PC一天内只使用一小部分时间,新一代硬件作为本地token(词元)生成引擎,则要全时段输出算力。

Chris Bergey告诉记者,当下人们正在使用的传统PC还会继续迭代,整机趋于轻薄紧凑,主打便携属性。另一类可供智能体使用的设备便携性偏弱,可留在家中不间断运行。两种产品在外观、摆放结构等物理设计层面也有差异。

高通技术公司(中国)资深产品市场经理朱元堃则认为,个人用户使用AI的方式也会发生改变。以往人们以手机为核心使用AI,耳机、眼镜、手表等穿戴设备作为附属连接,未来将转向以AI和用户为中心的多终端体验,AI不再绑定某个具体的设备,而是通过多设备灵活协同服务用户。

主题:智能体|硬件|数据中心|ChrisBergey告诉记者