华为抢走了英伟达的剧本
“华为云不追逐Token数量,也不在乎收入总量。”
文 | 《中国企业家》 记者 闫俊文
见习编辑 | 李原 编辑 | 何伊凡
头图来源 | 视觉中国
今年5月,英伟达CEO黄仁勋对媒体坦言:“很大程度上,我们已经把中国AI芯片市场,让给华为了。”
事实的确如此,华为正从Plan B选项跃升为至关重要的AI算力支撑平台,并吸引了一批互联网大厂主动“迁移”至华为云。
《中国企业家》获悉,小红书大模型基建部门披露, 目前,小红书MaaS规模已达日均万亿级Token规模,约有40%的Token计算在昇腾系列芯片上运行。未来3个月,小红书计划将昇腾的推理产能提升至60%,长期目标是让昇腾成为其AI推理底座。
除了小红书,华为云的客户名单上还有美团、B站、DeepSeek、月之暗面和更多互联网大厂。
华为基于910C芯片的A3超节点,以及将在不久后推出的950芯片系列超节点,也被大厂抢先下单。 一家计算服务器公司的高层告诉《中国企业家》:“在推理需求的带动下,2026年,互联网大厂对超节点的需求猛增,订单已经排到了两年后。”
字节、阿里围绕MaaS、Token消耗激战正酣之际,华为却不准备进入热战中心,而是将注意力投向to B和产业落地。
6月5日,在“华为云创想者峰会”上,华为公司董事、华为云CEO周跃峰公布了华为云的开放战略,拥抱“百模千态”——开源模型即日可部署,上线“智果园”智能体平台,提供包括智谱、Kimi、DeepSeek在内的开源模型接入。

周跃峰 来源:受访者
会后,周跃峰告诉《中国企业家》等媒体,华为云不追逐Token数量,也不在乎收入总量。“我们看重每一个Token给生产力带来的价值,尤其是落地to B行业带来的价值。”
周跃峰以金融举例:“我们要看防范了多少金融风险,提升了个人多少工作和信贷业务的效率等。不能简单说,产生了多少Token,模型被调用了多少次,这是没有意义的。”
一位资深投资人告诉《中国企业家》:华为云与华为计算,未来对标的是英伟达。
除了直接卖GPU算力,“华为云+华为计算”也仿效英伟达,搭建起算力集群、超节点与高规格基础设施。“价值导向”而非“规模导向”的定位,也让华为将主攻方向锁定在公共云赛道,重点服务政企、金融、汽车等领域。
在行业AI解决方案上,英伟达布局了工业孪生、汽车智驾芯片、 机器人 大脑模型等领域;华为则推出了具身智能、智慧医疗、智能制造、科学发现等4类行业AI工厂。
黄仁勋将英伟达的故事描述为“Token工厂”,追求高吞吐,低成本。最近,华为半导体业务部总裁何庭波宣布了韬(τ)定律,提出了芯片的逻辑折叠技术。
华为云峰会上,周跃峰也提出了一个新公式:Agentic Infra新范式=高效Token工厂+持续学习+通智一体化调度+安全自治。

摄影: 闫俊文
不过,华为还需要补齐大模型一块关键拼图。采访中,周跃峰没有太多提及自家“盘古”大模型。
上一次盘古大模型版本更新还是在2025年6月。2026年3月,华为诺亚方舟实验室主任、华为盘古大模型负责人王云鹤宣布离职。 而《中国企业家》获悉,华为自研的盘古大模型正在推倒重来,预计下半年会推出新版本。

不追逐Token数量
Token消耗和销售的战事,还在不断升级。6月8日,阿里宣布合并通义大模型事业部和未来生活实验室,成立Token Foundry事业部,由集团CEO吴泳铭直接负责。
豆包则是在6月内测推出专业版,一脚踏进订阅付费领域。媒体报道称,字节负责模型研发的Seed团队今年的重点是:世界模型、视频模型、Coding和办公场景的商业化。
华为云则选择从三个层面与对手实施差异化竞争:开放模型、AI Coding与RL(强化学习)的产业落地。
一位华为云前置销售告诉《中国企业家》,友商对卖MaaS和Token给予了超额激励,华为云也给了销售人员卖Token一定的压力。
但考虑到华为盘古大模型“目前不是主推模型”,该销售表示, 华为考核的是客户在华为云上对第三方模型的Token消耗。但面对未来,该销售仍然乐观。AI发展还在初期,“用户就像流水一样,他们会随着价格、模型能力等流动” 。
用周跃峰的话说,在智能体时代,华为云要成为一朵最开放的云。6月5日的大会现场,华为云携手智谱、DeepSeek、MiniMax、月之暗面、阶跃星辰、百度、美团LongCat、讯飞星火、爱诗科技、生数科技等20余家头部AI厂商,发布了“百模千态,云聚共赢”的生态合作计划。

华为云也在强化销售体系,华为高级副总裁、华为云全球营销服总裁杨友桂在演讲中说,加强与伙伴的合作永远不动摇。未来华为云50%的收入将来自华为直销,50%来自伙伴销售。华为云要让伙伴:更信任、更挣钱、更简单、更好成长。
除了行业大客户,华为云还推出了OPC(超级个体)创新支持计划,提供包括算力与AI Coding等工具的支持。在AI Coding战场,华为云上线了AI编程智能体“码道”(CodeArts)。周跃峰表示,华为云将以“范佛里特弹药量”(不计成本)来打造这一能力。
虽然华为云没有披露盘古大模型训练的最新进展,但周跃峰表示:强化学习与企业数据,是行业落地非常关键的一个步骤。“调整模型参数已经解决不了行业落地问题,必须结合企业私有数据进行强化学习。比如需要分钟级创建万级沙箱,并且RL过程要可观测、可存储。”

点击封面订阅全年杂志

软、硬、芯协同,瞄准公有云
华为云一位高层在演讲中判断,云计算已经跨入了“Token工业时代”。
这意味着Token大基建时代正在到来。头部大模型公司DeepSeek、月之暗面、智谱、MiniMax仍在通过上市或持续融资储备更多的弹药,投入AI基础设施建设——主要是Infra层。
但周跃峰告诉《中国企业家》等媒体: 不可能每一个机构和公司都打造万卡集群,公共云才是承载超大规模通用大模型的最优解。“通过机密推理和训练,平衡安全和资源高效共享。”
公共云是华为云主攻的市场,也是阿里、百度、腾讯等厂商集中炮火的领域。对华为云来说,其核心优势在于软、硬、芯的协同:
其中软件层指模型路由、Agent运行环境等Infra工具,实现硬件与模型的最优配合。华为云已上线“模型路由”能力,让智能体自主选择适配模型,运行成本可下降20%以上。
硬件层指超节点产品以及各类算力集群,华为的灵衢智算集群支持10万卡集群规模,单一集群达到200EFLOPS算力,并可将Token生成时延降低到10毫秒以内,千卡每秒吞吐高达500万Token。
芯片层则是华为自研昇腾(AI)、鲲鹏(CPU)等芯片,可以提供算子优化、计算加速等各类支持。
更具前瞻性的是对Agent时代基础设施的重新定义。华为公司Fellow、云系统首席专家余洲提出,传统计算机关注算力与内存的资源堆积,而Agent时代的计算机应关注“任务如何被拆解、调度、执行、访问状态,以及从错误中恢复”。
“未来的基础设施将以Token作为最小单位去考量,”余洲说,“不必暴露底层资源组成,重要的是如何高效生产、执行任务。”
业界普遍担忧,内存而非计算才是Agent时代的“卡脖子”环节——KV Cache(键值缓存)大小与模型生成序列长度成正比,文本越长,缓存的Key和Value向量越多,显存占用越大。
为此,华为云推出AMS Agentic(记忆存储解决方案),依托昇腾NPU,构筑PB级超大上下文记忆空间,规模优于业界1倍;全新盘级存储架构与三合一芯片实现TB级记忆极速读取,整体性能领先业界50%。