每天可生产1.4万亿Token,软通动力要做AI工厂
每天可生产1.4万亿Token,软通动力要做AI工厂
2026年06月29日 15:24

随着AI推理时代加速到来,不少公司开始探索如何入局这一轮超级周期。
6月28日晚间, 软通动力 在官网微信公众号上透露,其旗下的软通智算科技有限公司与某头部大模型厂商签署智算服务协议,为其提供基于北京壹号词元工厂的Token推理服务,涵盖大模型推理加速、高性能算力集群适配及行业 AI应用 落地等场景。

这里的逻辑在于,过去两年,行业追逐的是更强的模型。但当大模型进入真实业务后,问题变成了如何持续、稳定、低成本地输出Token。
软通动力 认为,由模型厂商负责“造脑”,Token工厂则负责把模型能力转化为可规模化、具备SLA保障、可计量的智能服务。两者分工清晰,共同构成从模型能力到产业应用的完整闭环。
据了解,北京壹号词元工厂是 软通动力 “词元(Token)工厂计划”的首个标杆示范项目。 软通动力称:“其一期规划每日Token产能达1.4万亿。”同时,自北京壹号工厂发布后,为工厂提供配套服务的GPU维修公司也已在亦庄成立,计划9月开始正式对外服务。
据软通动力介绍,所谓的Token工厂,是由客户需求、操作系统和高可靠物理平台层共同构建而成。
其中,在业务结构方面,从财报上来看,2025年,软通动力 人工智能 相关业务营收184.66亿元,占比已超一半,达52.6%。
软通动力管理层在6月25日的投资者交流中明确表示, 人工智能 业务是公司发展的重要战略与转型方向,公司坚定推进“软硬一体全栈智能”战略,以AI基础设施、计算智能、场景智能、终端智能为四大核心能力板块,深度布局Agentic AI自主智能体、Physical AI具身智能体、Science AI科学智能体三大方向。
在软通动力看来,Token工厂的核心是面向Token时代的工厂级操作系统。
其中,在芯片层面,软通动力从算子适配、分布式 通信 到调度策略进行端到端调优,持续提升混合集群在真实推理负载下的效率。在模型层面,软通动力已适配主流大模型,建立了面向真实场景的服务质量评测标准。在调度层面,平台可根据任务复杂度自动匹配最合适的模型,实现成本与体验的最优平衡。
值得一提的是,Token工厂未来扩容需要更多 电力 来保障。为此,软通动力已经启动在张家口和乌兰察布的布局——用绿电支撑Token生产,用规模效应持续降低单位Token成本。
(文章来源:21世纪经济报道)
主题:基金|软通动力要做AI工厂|新股|美股