有模型厂商CPU需求提高5倍！计算设备迎来非人类用户：智能体

速读：此前常被定位为GPU霸主的英伟达已看到这一趋势，准备在秋季拿出一款为智能体设计的个人电脑芯片。业界近期判断，以CPU需求增长为代表的数据中心计算硬件变迁只是开始，智能体将更加彻底地改变硬件的运行方式乃至形态。现在，真正为智能体设计的个人计算设备也开始出现了。而在数据中心，智能体带来的冲击已经开始，CPU成为承接智能体计算的主要平台，逐渐站回数据中心“C”位。 Arm边缘AI事业部执行副总裁ChrisBergey告诉记者，很多智能体依托专属CPU驱动，还有大量与AI工作负载相关的数据库操作用于管理上下文及整个运行过程，同样是高度依赖CPU的计算密集型任务。

2026年06月12日 21:2

智能体需要什么样的硬件？这是硬件行业近期思考最多的问题之一。

第一财经记者近日参加的一场行业论坛上，一名物联网公司技术负责人说，智能硬件正迎来人类之外的第二类用户，即智能体。

此前常被定位为GPU霸主的英伟达已看到这一趋势，准备在秋季拿出一款为智能体设计的个人电脑芯片。而在数据中心，智能体带来的冲击已经开始，CPU成为承接智能体计算的主要平台，逐渐站回数据中心“C”位。

业界展望，给智能体“使用”的计算设备，可能会与人用的设备截然不同。为抢夺新的用户，处理器厂商开始了新一轮竞速。

CPU需求井喷

很多业内人士近期开始讨论，数据中心CPU的数量相比GPU，要如何从1:8向1:1演进。

近日一场采访中，英特尔数据中心集团副总裁兼中国区总经理陈葆立谈到CPU需求增大，称业内CPU需求短期存在供应紧张，英特尔已在尽量提升产能，但市场非常火爆，需求是所有供应商都无法快速满足的。他表示，国内某家大模型厂商反馈，从去年至今，该公司的CPU需求提高了5倍。

智能体应用爆发是CPU需求迎来拐点的原因。Arm边缘AI事业部执行副总裁Chris Bergey告诉记者，很多智能体依托专属CPU驱动，还有大量与AI工作负载相关的数据库操作用于管理上下文及整个运行过程，同样是高度依赖CPU的计算密集型任务。

而据腾讯云计算产品运营总监周驰观察，涌入云平台的很多自动化任务用于处理日常琐事，不需要很多GPU，更需要CPU的调度、高并发执行大量小脚本能力。

一些业界人士认为CPU需求会倍数增长。Arm CEO Rene Haas近日表示，按出货量计算，CPU需求增长比原本预想的更快，他无法预计增长倍数是4、6还是8，但数字在变大。陈葆立认为，目前还难以定论未来CPU和GPU的比例是不是1:1，但基本逻辑是给AI更多任务，多数任务执行者是CPU。

数据中心的“C位”也在悄然变化。资本市场上，英伟达的股价自2022年底ChatGPT面世后经历了暴涨。CPU厂商AMD、英特尔以及与CPU关系密切的IP设计厂商Arm，股价迅猛提拉的时间点则在年内，这三家厂商年内股价都翻倍增长。

业界近期判断，以CPU需求增长为代表的数据中心计算硬件变迁只是开始，智能体将更加彻底地改变硬件的运行方式乃至形态。

Chris Bergey告诉记者，为支撑AI产业变革，芯片硬件层面配套算力与存储组件的设计复杂度、研发成本大幅攀升，同时产品还要面临严苛的功耗限制。随着AI成为核心工作负载，系统内每一类计算单元，都要尽可能强化AI任务的运行能力。因此，市场将会出现全新的计算硬件。

智能体呼唤什么样的硬件？

一些业界人士认为，面向智能体，CPU将变得与以往截然不同，新的工作负载对CPU的效率、能力、核心数都提出新要求。

智能硬件基础设施厂商云尖信息副总裁张欢军表示，运行智能体时，要解决的核心痛点是“单颗CPU处理业务的能力”，即单台设备能否承载更多智能体、每个智能体的运行成本和效率是否足够好。

要承载更多智能体，一种方式是增加CPU的核数（一种计算单元），以增强并行计算能力。陈葆立认为，智能体需要更高的CPU核数，一些智能体适合使用核数极多、单核性能要求不太高的轻量核处理器。目前英特尔至强6+可以在单个CPU核心上同时运行3到4个用于处理简单日常工作的智能体。

上周Arm与英伟达合作推出的RTX Spark个人电脑芯片则搭载了20颗Arm处理器内核，是目前采用统一内存架构的PC类产品中CPU核心数最多的产品。“我们在云端和边缘侧都看到对更多CPU、对更高性能的强烈需求。大家真正需要的是更高的CPU密度，也就是更好的能效比 (performance per watt)。”Chris Bergey告诉记者。

智能体在边缘硬件运行还面临一个难以回避的挑战：内存空间有限。创通联达CTO黄小严在近日高通与极视角主办的端侧AI开发者技术开发日上表示，智能体开始成为硬件的核心用户，智能体场景涉及多轮对话，需要长时间记忆，但移动端的内存容量受成本约束，内存紧缺且有算力约束，容易导致上下文溢出，由此形成AI智力鸿沟。

芯片厂商已在探索更多方法，让边缘硬件的存储空间能被更好地利用。

英伟达与Arm合作开发的RTX Spark采用了Grace CPU、Blackwell RTX GPU及统一内存紧密耦合的方式。Chris Bergey告诉记者，行业迈入智能体阶段，用户需要高性能GPU与CPU之间的紧密结合，统一内存是为了让CPU和GPU能完整调用全部DRAM（动态随机存取存储器）及带宽资源，并让系统设计不再依赖PCIe或CXL等传统传输接口，提升CPU与GPU间的传输带宽。统一内存技术正在推动边缘计算变革。

应对显存和闪存资源紧缺，英特尔则采用QAT（快速辅助技术）和IAA（内存分析加速）技术。

陈葆立表示，AI运行时，海量KV Cache（一种大模型优化技术，通过缓存向量避免冗余计算）需要存，100万上下文约等于10G以上KV Cache，是一大笔闪存开销，而通过QAT技术可以让压缩比达到50%，节省闪存成本。多个智能体运行时，IAA则能实时性压缩内存数据以节省内存。

除了内存问题，黄小严还提到，智能体在移动计算设备上不停歇运行，设备需要在省电、高唤醒率之间找到平衡。传统物联网软件架构失效，设备必须重构，以便智能体理解和调用，智能体安全也需要新的保障。为解决这些问题，他所在的公司使用了高通开发工具链等，在软硬件和系统平台层面进行了设计，搭建了端侧智能体中间件运行平台等。

智能体专用硬件平台兴起

今年初，OpenClaw爆火带动了Mac Mini这类计算设备销售，人们买Mac Mini更多是为了让智能体在本地运行，而不是自己上手操控电脑。这是智能体专用设备的雏形。现在，真正为智能体设计的个人计算设备也开始出现了。

今年秋季将上市、搭载了RTX Spark芯片的笔记本和台式电脑，将由联想、华硕、Microsoft Surface等厂商推出。对这款芯片，英伟达CEO黄仁勋形容为“重新发明了个人电脑的工作方式”。

Arm也看到，个人电脑行业将发生巨大改变。“PC需求分化为两种，一种是电池好、随处可连接网络，就像一个大号手机加一个键盘，能用来工作；另一种需要有非常极致的性能，能运行智能体、模型或做开发工作。”Rene Haas上周表示。

Chris Bergey向记者进一步解释，以往的PC从入门级向高性能产品延伸演进，整体产品架构相对一致，高端机型靠提升主频、扩充核心数、选用更强性能内核来实现迭代。而随着智能体专用硬件平台兴起，现在对PC市场的区分已截然不同。

“用户对此类设备有明确需求：PC能7×24小时不间断运行智能体；设备依托高性能硬件，以高吞吐规格运行各类大模型；除了支出设备采购、供电及网络接入成本，不产生额外算力费用，模型本地运行，用户隐私数据留存本机。”Chris Bergey说，传统PC一天内只使用一小部分时间，新一代硬件作为本地token（词元）生成引擎，则要全时段输出算力。

Chris Bergey告诉记者，当下人们正在使用的传统PC还会继续迭代，整机趋于轻薄紧凑，主打便携属性。另一类可供智能体使用的设备便携性偏弱，可留在家中不间断运行。两种产品在外观、摆放结构等物理设计层面也有差异。

高通技术公司（中国）资深产品市场经理朱元堃则认为，个人用户使用AI的方式也会发生改变。以往人们以手机为核心使用AI，耳机、眼镜、手表等穿戴设备作为附属连接，未来将转向以AI和用户为中心的多终端体验，AI不再绑定某个具体的设备，而是通过多设备灵活协同服务用户。

主题：智能体|硬件|数据中心|ChrisBergey告诉记者