昆仑芯交付多个万卡智算集群，256卡超节点6月上市

速读：在2025年11月，百度曾披露，包括视频生成模型“百度蒸汽机”在内的三款多模态模型，是在5000卡或6000卡的昆仑芯集群上完成训练。

昆仑芯交付多个万卡智算集群，256卡超节点6月上市 _ 东方财富网

2026年05月13日 15:06

　　国产 AI芯片厂商昆仑芯谋求港股和科创板IPO之际，背后控股股东百度披露多项昆仑芯的商业化进展。

　　在5月13日的Create 2026 百度 AI开发者大会上，百度集团执行副总裁、百度智能云事业群总裁沈抖介绍，目前昆仑芯P800已完成规模化验证，2025年至今已交付多个基于P800的万卡集群。

　　据其介绍，在昆仑芯全国产集群上，已成功完成对文心5.1重要版本的训练，整个集群的有效训练率达到97%。“昆仑芯国产集群已经可以满足前沿大模型大规模训练，对计算精度、算子稳定性、框架适配、长周期运行的要求。”沈抖表示。

国产 AI芯片涉足前沿大模型训练

　　在2025年11月，百度曾披露，包括视频生成模型“百度蒸汽机”在内的三款多模态模型，是在5000卡或6000卡的昆仑芯集群上完成训练。百度当时称，会在昆仑芯P800芯片集群上尝试最先进模型的训练。

　　长期以来，前沿大模型通常首选英伟达的GPU开展预训练，国产 AI芯片一般只用于后训练微调和模型推理环节。如何基于国产智算集群预训练国产模型，成为业界着力攻克的重点任务。4月下旬，DeepSeek-V4模型展示了其与华为昇腾 AI芯片生态的密切协作关系，进一步提升了外界对国产AI芯片应用突破的期待值。

　　超节点方案，是国产AI芯片公司弥补单颗芯片性能短板的解决方向。百度在2025年11月的百度世界大会上曾预告，基于昆仑芯P800芯片，百度将在2026年上半年上市最高支持256张卡互联的“天池256超节点”，紧接着在2026年下半年推出“天池512超节点”。

　　沈抖于5月13日透露，天池256卡超节点已经在4月完成“点亮”，将于6月正式上市。其吞吐性能较上一代提升25%，并完成包含文心、DeepSeek、GLM、MiniMax等主流模型的适配，推理效率提升50%，支持按需搭建数十万卡乃至百万卡超大集群。

　　Create 2026百度AI开发者大会上展出的百度“天池256/512卡超节点”

　　有了性能先进的算力基础设施，才能支撑智能体运行对Token（词元）的大规模消耗。在3月的GTC大会上，英伟达创始人兼首席执行官黄仁勋将未来数据中心的角色，重新定义为“生产Token的工厂”。“Token工厂”受电力限制，因此每瓦的Token吞吐量是成本关键。

　　沈抖也强调，要提升AI算力的每瓦性能和性价比，让每一次训练和推理都能转化成更好的智能体效果。“AI云的下半场，不是比谁消耗了更多的Token，而是看谁能把每一个Token用得更好。”

Token无法衡量AI经济的繁荣？

　　Create 2026百度AI开发者大会上，百度创始人李彦宏对当前行业以Token消耗来衡量 AI应用繁荣度的做法表达了质疑。他认为，Token只是代表成本，并不代表收益；它衡量的是投入，而不是产出。

　　李彦宏提出，可以借用移动互联网时代的DAU（日活用户数）指标，用Daily Active Agents（日活智能体数，DAA）来衡量一个平台和生态的繁荣。所谓“日活智能体数”，关注的是有多少Agent在给人类干活，并交付结果，“这比无谓的Token消耗，更接近价值，也更接近本质。”他预测，未来，全球“日活智能体数”很容易会超过100亿。

　　5月13日，百度发布和升级通用智能体“DuMate（百度搭子）”、代码智能体“秒哒”、数字人智能体“百度一镜”、自我演化决策智能体“伐谋”等系列智能体产品。

　　在李彦宏看来，聊天机器人和通用智能体将成为两类入口：以ChatGPT为代表的聊天机器人是第一代入口，主要解决信息获取问题；第二代入口是通用智能体，解决的是任务完成问题——比如，处理合同、完成深度研究报告、做一款应用等。每一个任务都有清晰的价值交付。任务越复杂，价值越高。他判断：“通用智能体的价值天花板比聊天机器人更高。”

　　李彦宏还提出，在智能体时代，AI将倒逼企业的运行方式发生变化。企业组织的运行，需要更多授权、更少管控，因为过度企业管理往往不是降低风险，而是在压制创造力；此外，减少汇报层级，信息直达、即时决策对AI时代的组织来说至关重要，“迭代速度才是企业竞争的护城河。”

　　他进一步表示，AI时代不是靠“人海战术”来提高成功率，而是依靠更优秀的人、更强的AI能力和更高密度的人才配置，来做出更漂亮的结果。

（文章来源：南方都市报）

主题：新股|基金|256卡超节点6月上市|美股