“大模型第一股”年报出炉,如何以智能“上界”掌握定价权

“大模型第一股”年报出炉,如何以智能“上界”掌握定价权
2026年03月31日 23:2

“大模型第一股” 智谱 交出上市后首份年报。
3月31日, 智谱 发布2025年年度报告。2025年,公司实现营收7.24亿元,同比增长131.9%,延续连续三年翻倍态势;研发投入依然高增,全年研发费用达31.8亿元,同比增长44.9%;全年净亏损47.18亿元,同比扩大59.5%;经调整净亏损31.82亿元,同比扩大29.1%。
智谱 在财报中给出了一个AGI商业价值的定义公式:AGI商业价值=智能上界×Token消耗规模。智能上界指的是在有限计算资源、能源或数据条件下,大模型所能达到的理论最优性能水平或能力上限。智谱CEO张鹏在业绩电话会上分享称,截至2026年3月,公司MaaS平台注册用户突破400万,即便API调用定价较去年底提升了83%,市场依然呈现出供不应求的“算力恐慌”,而这印证了高阶智能是当下的 稀缺资源 ,谁掌握了“上界”,谁就掌握了定价权。
云端业务占比提升
综合 毛利率下滑
财报显示,智谱主要提供两种服务模式:云端部署服务与本地化部署服务。公司2025年收入结构中,云端部署大幅提升。
2025年,智谱的云端部署服务收入为1.904亿元,同比大增292.6%,占总收入比重从2024年的15.5%提升至26.3%;本地化部署收入为5.34亿元,同比增长102.3%,占比从84.5%降至73.7%。
二者的毛利率趋势也存在差异。云端部署的毛利率从2024年的3.3%跃升至2025年的18.9%,毛利从160万元增加至3600万元,增幅达2150%。财报解释,随着模型推理效率提升和算力规模扩张,导致云端业务的边际成本递减,叠加智谱在2025年底至2026年初连续涨价,云端毛利率的改善趋势已经确立。
但本地化部署业务的毛利率则从2024年的66.0%大幅下降至2025年的48.8%。公司称,主要由于为满足客户需求而投入了更多的交付资源。
因此,智谱的 综合 毛利率由2024年的56.3%下降至2025年的41%,主要由于云端部署业务占比的提升和本地化部署业务毛利率的阶段性下降所致。
云端业务的爆发,得益于MaaS(Model-as-a-Service)平台的生态效应与产品的量价齐升。截至2026年3月,智谱MaaS平台注册用户突破400万,覆盖全球218个国家和地区,中国前10大互联网公司中9家已深度集成GLM模型。即便API调用定价较去年底提升83%,市场仍呈现供不应求状态。
2026年2月智谱将Coding Plan上调价格30%并取消首购优惠后,依然上线火爆,其付费开发者规模已突破24.2万。管理层称,这种“量价齐升”态势证明了市场正从盲目的价格战转向对“技术价值”的真实认可——即通过更高阶的智能,换取更确定的生产力。
智谱介绍,MaaS API平台实现年度经常性收入(ARR)约17亿元,同比提升60倍。
智谱一直在业务模式上对标Anthropic,但后者是闭源,智谱选择走开源路线,开源是否会影响商业化价值的转化?
张鹏在电话会上表示,公司在开源和商业化之间一直坚持两条腿走路。一方面,希望借用开源吸引更多开发者、研究者加入GLM生态。另一方面,随着模型越来越复杂,在大规模部署与生产应用中,企业自建往往难以及时跟上模型迭代速度,越来越多企业在尝试自建开源方案后,转而或部分转向使用云端大模型API,推动API与Token计费模式成为主流商业模式。
研发投入依然高增
“大模型操作系统”提上日程
营收高增长的同时,智谱也面临持续高研发投入的压力,这也是大模型行业技术迭代期的共性挑战。
成本端,2025年,智谱的销售成本同比增长213.3%至4.277亿元,主要源于业务扩张带来的计算服务费用增加。资本支出则同比下降83.8%至7470万元。公司称,这一显著变化主要源于算力采购策略的调整。2024年公司较多采用 租赁 方式购置算力设备,相关支出计入资本开支,2025年随着业务规模扩大,算力需求快速增长,公司灵活调整了算力采购模式,以服务采购为主、辅以部分设备 租赁 相结合的方式满足需求,因此资本支出相应减少。
研发投入仍是公司最主要的资金支出项,2025年研发费用31.8亿元,同比增长44.9%,是全年营收的4.4倍。研发费用增长主要来自研发团队扩张,以及模型迭代所需的第三方算力供应商的计算服务费用增加。截至2025年末,公司正式员工1094人,总薪酬成本(含股份支付)达13.63亿元。
持续的研发投入是支撑智谱AGI商业价值中智能“上界”持续突破的关键。智谱认为,2026年,智能范式将最终实现跨越多步迭代、具备逻辑一致性的Long-horizon Task(长程任务)闭环执行,这将进一步带来智能上界的突破与Token调用的指数级增长。智谱的目标是成为提升全社会TAC(Token Architecture Capability,Token架构能力)的基础设施,让每一个Token都能转化为可交付的经济增量。
“大模型操作系统”的开发也提上日程,张鹏认为,大模型正在吞噬软件,未来的计算平台将不再是App的堆迭,而是API商店与Agent矩阵的协同。“谁的模型进入了系统内核,谁就掌握了下一代计算的定义权。”
(文章来源:中国证券报)
主题:基金