华为抢走了英伟达的剧本

速读：6月5日，在“华为云创想者峰会”上，华为公司董事、华为云CEO周跃峰公布了华为云的开放战略。周跃峰来源：受访者。一位资深投资人告诉《中国企业家》：华为云与华为计算，未来对标的是英伟达。虽然华为云没有披露盘古大模型训练的最新进展，但周跃峰表示：强化学习与企业数据，是行业落地非常关键的一个步骤。

2026年06月12日 07:58

　　 “华为云不追逐Token数量，也不在乎收入总量。”

　　文 | 《中国企业家》记者闫俊文

　　见习编辑 | 李原编辑 | 何伊凡

　　头图来源 | 视觉中国

　　今年5月，英伟达CEO黄仁勋对媒体坦言：“很大程度上，我们已经把中国AI芯片市场，让给华为了。”

　　事实的确如此，华为正从Plan B选项跃升为至关重要的AI算力支撑平台，并吸引了一批互联网大厂主动“迁移”至华为云。

　　《中国企业家》获悉，小红书大模型基建部门披露，目前，小红书MaaS规模已达日均万亿级Token规模，约有40%的Token计算在昇腾系列芯片上运行。未来3个月，小红书计划将昇腾的推理产能提升至60%，长期目标是让昇腾成为其AI推理底座。

　　除了小红书，华为云的客户名单上还有美团、B站、DeepSeek、月之暗面和更多互联网大厂。

　　华为基于910C芯片的A3超节点，以及将在不久后推出的950芯片系列超节点，也被大厂抢先下单。一家计算服务器公司的高层告诉《中国企业家》：“在推理需求的带动下，2026年，互联网大厂对超节点的需求猛增，订单已经排到了两年后。”

　　字节、阿里围绕MaaS、Token消耗激战正酣之际，华为却不准备进入热战中心，而是将注意力投向to B和产业落地。

　　6月5日，在“华为云创想者峰会”上，华为公司董事、华为云CEO周跃峰公布了华为云的开放战略，拥抱“百模千态”——开源模型即日可部署，上线“智果园”智能体平台，提供包括智谱、Kimi、DeepSeek在内的开源模型接入。

　　周跃峰来源：受访者

　　会后，周跃峰告诉《中国企业家》等媒体，华为云不追逐Token数量，也不在乎收入总量。“我们看重每一个Token给生产力带来的价值，尤其是落地to B行业带来的价值。”

　　周跃峰以金融举例：“我们要看防范了多少金融风险，提升了个人多少工作和信贷业务的效率等。不能简单说，产生了多少Token，模型被调用了多少次，这是没有意义的。”

　　一位资深投资人告诉《中国企业家》：华为云与华为计算，未来对标的是英伟达。

　　除了直接卖GPU算力，“华为云+华为计算”也仿效英伟达，搭建起算力集群、超节点与高规格基础设施。“价值导向”而非“规模导向”的定位，也让华为将主攻方向锁定在公共云赛道，重点服务政企、金融、汽车等领域。

　　在行业AI解决方案上，英伟达布局了工业孪生、汽车智驾芯片、机器人大脑模型等领域；华为则推出了具身智能、智慧医疗、智能制造、科学发现等4类行业AI工厂。

　　黄仁勋将英伟达的故事描述为“Token工厂”，追求高吞吐，低成本。最近，华为半导体业务部总裁何庭波宣布了韬（τ）定律，提出了芯片的逻辑折叠技术。

　　华为云峰会上，周跃峰也提出了一个新公式：Agentic Infra新范式=高效Token工厂+持续学习+通智一体化调度+安全自治。

　　摄影：闫俊文

　　不过，华为还需要补齐大模型一块关键拼图。采访中，周跃峰没有太多提及自家“盘古”大模型。

　　上一次盘古大模型版本更新还是在2025年6月。2026年3月，华为诺亚方舟实验室主任、华为盘古大模型负责人王云鹤宣布离职。而《中国企业家》获悉，华为自研的盘古大模型正在推倒重来，预计下半年会推出新版本。

　　不追逐Token数量

　　Token消耗和销售的战事，还在不断升级。6月8日，阿里宣布合并通义大模型事业部和未来生活实验室，成立Token Foundry事业部，由集团CEO吴泳铭直接负责。

　　豆包则是在6月内测推出专业版，一脚踏进订阅付费领域。媒体报道称，字节负责模型研发的Seed团队今年的重点是：世界模型、视频模型、Coding和办公场景的商业化。

　　华为云则选择从三个层面与对手实施差异化竞争：开放模型、AI Coding与RL（强化学习）的产业落地。

　　一位华为云前置销售告诉《中国企业家》，友商对卖MaaS和Token给予了超额激励，华为云也给了销售人员卖Token一定的压力。

　　但考虑到华为盘古大模型“目前不是主推模型”，该销售表示，华为考核的是客户在华为云上对第三方模型的Token消耗。但面对未来，该销售仍然乐观。AI发展还在初期，“用户就像流水一样，他们会随着价格、模型能力等流动” 。

　　用周跃峰的话说，在智能体时代，华为云要成为一朵最开放的云。6月5日的大会现场，华为云携手智谱、DeepSeek、MiniMax、月之暗面、阶跃星辰、百度、美团LongCat、讯飞星火、爱诗科技、生数科技等20余家头部AI厂商，发布了“百模千态，云聚共赢”的生态合作计划。

　　华为云也在强化销售体系，华为高级副总裁、华为云全球营销服总裁杨友桂在演讲中说，加强与伙伴的合作永远不动摇。未来华为云50%的收入将来自华为直销，50%来自伙伴销售。华为云要让伙伴：更信任、更挣钱、更简单、更好成长。

　　除了行业大客户，华为云还推出了OPC（超级个体）创新支持计划，提供包括算力与AI Coding等工具的支持。在AI Coding战场，华为云上线了AI编程智能体“码道”（CodeArts）。周跃峰表示，华为云将以“范佛里特弹药量”（不计成本）来打造这一能力。

　　虽然华为云没有披露盘古大模型训练的最新进展，但周跃峰表示：强化学习与企业数据，是行业落地非常关键的一个步骤。“调整模型参数已经解决不了行业落地问题，必须结合企业私有数据进行强化学习。比如需要分钟级创建万级沙箱，并且RL过程要可观测、可存储。”

　　点击封面订阅全年杂志

　　软、硬、芯协同，瞄准公有云

　　华为云一位高层在演讲中判断，云计算已经跨入了“Token工业时代”。

　　这意味着Token大基建时代正在到来。头部大模型公司DeepSeek、月之暗面、智谱、MiniMax仍在通过上市或持续融资储备更多的弹药，投入AI基础设施建设——主要是Infra层。

　　但周跃峰告诉《中国企业家》等媒体：不可能每一个机构和公司都打造万卡集群，公共云才是承载超大规模通用大模型的最优解。“通过机密推理和训练，平衡安全和资源高效共享。”

　　公共云是华为云主攻的市场，也是阿里、百度、腾讯等厂商集中炮火的领域。对华为云来说，其核心优势在于软、硬、芯的协同：

　　其中软件层指模型路由、Agent运行环境等Infra工具，实现硬件与模型的最优配合。华为云已上线“模型路由”能力，让智能体自主选择适配模型，运行成本可下降20%以上。

　　硬件层指超节点产品以及各类算力集群，华为的灵衢智算集群支持10万卡集群规模，单一集群达到200EFLOPS算力，并可将Token生成时延降低到10毫秒以内，千卡每秒吞吐高达500万Token。

　　芯片层则是华为自研昇腾（AI）、鲲鹏（CPU）等芯片，可以提供算子优化、计算加速等各类支持。

　　更具前瞻性的是对Agent时代基础设施的重新定义。华为公司Fellow、云系统首席专家余洲提出，传统计算机关注算力与内存的资源堆积，而Agent时代的计算机应关注“任务如何被拆解、调度、执行、访问状态，以及从错误中恢复”。

　　“未来的基础设施将以Token作为最小单位去考量，”余洲说，“不必暴露底层资源组成，重要的是如何高效生产、执行任务。”

　　业界普遍担忧，内存而非计算才是Agent时代的“卡脖子”环节——KV Cache（键值缓存）大小与模型生成序列长度成正比，文本越长，缓存的Key和Value向量越多，显存占用越大。

　　为此，华为云推出AMS Agentic（记忆存储解决方案），依托昇腾NPU，构筑PB级超大上下文记忆空间，规模优于业界1倍；全新盘级存储架构与三合一芯片实现TB级记忆极速读取，整体性能领先业界50%。

主题：华为云|英伟达|周跃峰|超节点