昆仑芯交付多个万卡智算集群,256卡超节点6月上市
昆仑芯交付多个万卡智算集群,256卡超节点6月上市
2026年05月13日 15:06
国产 AI芯片 厂商昆仑芯谋求港股和科创板IPO之际,背后控股股东 百度 披露多项昆仑芯的商业化进展。
在5月13日的Create 2026 百度 AI开发者大会上, 百度 集团执行副总裁、百度智能云事业群总裁沈抖介绍,目前昆仑芯P800已完成规模化验证,2025年至今已交付多个基于P800的万卡集群。
据其介绍,在昆仑芯全国产集群上,已成功完成对文心5.1重要版本的训练,整个集群的有效训练率达到97%。“昆仑芯国产集群已经可以满足前沿大模型大规模训练,对计算精度、算子稳定性、框架适配、长周期运行的要求。”沈抖表示。
国产 AI芯片 涉足前沿大模型训练
在2025年11月,百度曾披露,包括视频生成模型“百度蒸汽机”在内的三款多模态模型,是在5000卡或6000卡的昆仑芯集群上完成训练。百度当时称,会在昆仑芯P800芯片集群上尝试最先进模型的训练。
长期以来,前沿大模型通常首选 英伟达 的GPU开展预训练,国产 AI芯片 一般只用于后训练微调和模型推理环节。如何基于国产智算集群预训练国产模型,成为业界着力攻克的重点任务。4月下旬,DeepSeek-V4模型展示了其与 华为昇腾 AI芯片生态的密切协作关系,进一步提升了外界对国产AI芯片应用突破的期待值。
超节点方案,是国产AI芯片公司弥补单颗芯片性能短板的解决方向。百度在2025年11月的百度世界大会上曾预告,基于昆仑芯P800芯片,百度将在2026年上半年上市最高支持256张卡互联的“天池256超节点”,紧接着在2026年下半年推出“天池512超节点”。
沈抖于5月13日透露,天池256卡超节点已经在4月完成“点亮”,将于6月正式上市。其吞吐性能较上一代提升25%,并完成包含文心、DeepSeek、GLM、MiniMax等主流模型的适配,推理效率提升50%,支持按需搭建数十万卡乃至百万卡超大集群。
Create 2026百度AI开发者大会上展出的百度“天池256/512卡超节点”
有了性能先进的算力基础设施,才能支撑智能体运行对Token(词元)的大规模消耗。在3月的GTC大会上, 英伟达 创始人兼首席执行官黄仁勋将未来 数据中心 的角色,重新定义为“生产Token的工厂”。“Token工厂”受 电力 限制,因此每瓦的Token吞吐量是成本关键。
沈抖也强调,要提升AI算力的每瓦性能和性价比,让每一次训练和推理都能转化成更好的智能体效果。“AI云的下半场,不是比谁消耗了更多的Token,而是看谁能把每一个Token用得更好。”
Token无法衡量AI经济的繁荣?
Create 2026百度AI开发者大会上,百度创始人李彦宏对当前行业以Token消耗来衡量 AI应用 繁荣度的做法表达了质疑。他认为,Token只是代表成本,并不代表收益;它衡量的是投入,而不是产出。
李彦宏提出,可以借用移动互联网时代的DAU(日活用户数)指标,用Daily Active Agents(日活智能体数,DAA)来衡量一个平台和生态的繁荣。所谓“日活智能体数”,关注的是有多少Agent在给人类干活,并交付结果,“这比无谓的Token消耗,更接近价值,也更接近本质。”他预测,未来,全球“日活智能体数”很容易会超过100亿。
5月13日,百度发布和升级通用智能体“DuMate(百度搭子)”、代码智能体“秒哒”、 数字人 智能体“百度一镜”、自我演化决策智能体“伐谋”等系列智能体产品。
在李彦宏看来,聊天 机器人 和通用智能体将成为两类入口:以ChatGPT为代表的聊天 机器人 是第一代入口,主要解决信息获取问题;第二代入口是通用智能体,解决的是任务完成问题——比如,处理合同、完成深度研究报告、做一款应用等。每一个任务都有清晰的价值交付。任务越复杂,价值越高。他判断:“通用智能体的价值天花板比聊天 机器人 更高。”
李彦宏还提出,在智能体时代,AI将倒逼企业的运行方式发生变化。企业组织的运行,需要更多授权、更少管控,因为过度企业管理往往不是降低风险,而是在压制创造力;此外,减少汇报层级,信息直达、即时决策对AI时代的组织来说至关重要,“迭代速度才是企业竞争的护城河。”
他进一步表示,AI时代不是靠“人海战术”来提高成功率,而是依靠更优秀的人、更强的AI能力和更高密度的人才配置,来做出更漂亮的结果。
(文章来源:南方都市报)
主题:新股|基金|256卡超节点6月上市|美股