豆包推收费版、大模型集体涨价:谁在悄悄改写AI收费模式?
豆包推收费版、大模型集体涨价:谁在悄悄改写AI收费模式?
2026年06月14日 10:12
一封道歉信,把整个行业的底牌亮了出来?6月2日,MiniMax就计费方式突然变更公开致歉。这已是今年以来第二封同类型道歉信,此前 智谱 也为类似的涨价风波致歉。这一幕背后,是行业酝酿已久的集体转向:从MiniMax、 智谱 、Kimi到阿里云,大模型厂商正在撕掉“畅享无限”的标签,结束“补贴换生态”的时代。
今年以来,MiniMax、 智谱 、Kimi、阿里云相继调整面向开发者的Coding Plan定价体系,正不约而同地选择一个方向:收紧免费用量、切换Token计费方式。
收费的变化不仅面向开发者和企业,也面向普通C端用户。6月3日,豆包公告回应即将推出专业版,称针对专业人群的生产力需求,计划推出豆包专业版。但对于广大用户日常使用的豆包功能,也将在一定额度内免费。
与此同时,在行业普遍涨价的浪潮中,DeepSeek和小米却成为两个独特的存在——“永久降价”。在涨与降的分野之间,大模型商业化正在加速进入分层时代。小米与DeepSeek降价的底气是什么?MiniMax、智谱、阿里云、火山引擎等模型厂商为何开始收紧用量,甚至以新的计费单位来重构各自的计费规则?
补贴战打完了?厂商集体提价、收紧用量
计费方式的变更,将大模型厂商的商业模式变化推到了台前。6月2日,MiniMax对计费新规致歉,并承诺对无周限额的老用户继续保持该权益、推出提升额度的补偿措施。
6月1日,MiniMax上线最新模型M3,同时将收费规则从“按次调用”改为了“按Token消耗量”计费。此前,MiniMax面向个人开发者和用户的“Coding Plan”套餐主要采用按API调用次数计费的模式,以其售价98元的plus-极速版为例,仅在每5小时的窗口期内享有一定次数的调用额度,但对月度消耗的Token总量没有上限。
↑此前MiniMax推出的套餐按照调用次数计费,对Token总量没有上限。
此前在新规生效后,计费模式从按次计费调整为按Token计费,引发用户集中投诉。消费者反映变更未提前通知、未协商,且同等任务Token消耗量远超预期,月度额度快速耗尽。
收紧无限使用的订阅制、结束补贴换取生态的策略,正成为行业的共性趋势。进入2026年,随着“龙虾”和Token经济的快速发展,大模型普遍结束“薅羊毛”时刻,取消低端Coding Plan(大模型API订阅服务)或涨价后限量开放。
但对于突然的收紧,使用者和开发者明显需要时间适应。这样的致歉信在行业内并非首次出现。今年2月,智谱就曾就类似的问题发布致歉信。原因就在于,智谱在上线GLM-5新模式的同时上调了GLM Coding Plan套餐价格,取消首购优惠,保留按季按年订阅优惠;套餐价格进行结构性调整,整体涨幅自30%起;已订阅用户价格保持不变。
这一价格调整迅速引发开发者不满,这才使得智谱下场致歉。在此之前,智谱推出的GLM Coding Plan并不限定用量,更直接在宣传海报上标记了“畅享无限编程体验”。
↑智谱去年推出的畅享套餐 。
除了智谱外,今年1月,Kimi公布其Coding plan将从基于prompt请求切换至基于Token计费方式;4月11日,阿里云百炼暂停Coding Plan Lite基础套餐的续费和升级,
Forrester副总裁兼首席分析师戴鲲认为,厂商涨价的背后,一方面是它们依托模型性能、稳定性与行业解决方案形成了能力溢价,另一方面则是它们具备云与生态上的市场领导力。他进一步提到,“从资本市场角度看,阿里、腾讯、智谱、MiniMax等厂商获得资本市场持续认可,有资金支撑通过提价从规模优先转向价值变现。当然在AI基础设施投资成本持续提升的情况下,各家厂商也都面临着变现压力”。
初创公司OneOneTalk 联合创始人、CTO彭超认为,这一轮收紧的背后,是模型厂商早期圈地战已经结束,大家都已经拥有既定的存量用户,因此开始进入“收割”阶段。“大模型本来就是非常重资产投入的行业,AI要烧钱、烧电、烧显卡,怎么可能一直免费?而且每家厂商都有成本压力,它们也要不断迭代新模型来巩固竞争力”。
C hatbot时代的订阅制被集体抛弃?
Coding是大模型行业发展几年后摸索出来的首个可持续产生商业价值的领域,这个领域比Chatbot(聊天 机器人 )和视频都更能快速商业化,以烧钱的AI视频为例,OpeAI关停现象级产品Sora便是明证。
对于Coding能产生的价值, 百度 秒哒产品总经理朱广翔去年底就提到,从价值上来说,Coding比Chatbot更能带来实实在在的生产力,“Coding与研、产、供、销、服都相关,属于生产力环节,能创造新的需求价值和空间,所以(商业化)空间更大。同时,从技术演进情况来看,Chatbot基本已经卷到一个‘瓶颈期’了,但Coding能力还在攀爬高峰,这个‘峰值’又非常高”。
但Coding Plan一开始的订阅制商业模式,为何如今被整个行业集体改头换面?
逐鹿网创始人阑夕在一档播客中这样形容大模型订阅制的商业模式:“AI大模型的订阅赚钱模式有点像健身房(办卡),我赌你不来的时间要多于来的时间,但现在很多人会拿订阅制把额度跑满,这样厂商是受不了的”。
在Chatbot时代,Coding的应用场景主要是“代码补全”,开发者单次请求下输入几个字符,模型就会返回一段补全的代码。但“龙虾”这样的智能体产品出现,让大家“来健身房”来得愈发勤奋,也让整个行业此前面向Chatbot时代推出的Coding Plan难以为继。
对此,彭超有很直观的感受,“我们转到Agent时代以后,比较Chatbot时代,Token消耗量不是十倍增长,而是百倍增长,模型厂商也要承担这个消耗,它们肯定觉得亏,都会想要少亏一些”。
进入Agent时代,智能体的运行涉及多轮理解、任务拆解、工具调用、状态衔接、时间触发和持续执行的长链路工作流,Token消耗大幅增长,过去“无限畅享”的Coding plan再也兜不住了。
涨价与降价两极分化,行业走向商业化分层
在彭超看来,真正做到仍然划算的只有DeepSeek。“DeepSeek的一大创新点在于,它采用了混合注意力架构(Hybrid Attention,包含CSA压缩稀疏注意力与HCA重度压缩注意力),在处理超长上下文时能够更高效地组织和检索信息,相比上一代模型只需约27%的计算量和10%的缓存空间,这意味着同样的任务消耗的Token和算力都更少”。
通过创新达到性价比的DeepSeek成为2026年行业涨价潮中的“异类”,并且DeepSeek还想继续普惠。从6月1日起,DeepSeek-V4-Pro当前促销价将直接转为正式价格,不再恢复原价。此前,DeepSeek已将V4-Pro API价格降至2.5折,并把输入缓存命中价格进一步压到原价1/10。
小米快速跟进,成为持续贯彻“价格战”的拥趸,5月27日就正式宣布MiMo-V2.5系列API价格永久下调,并同步升级新版Token Plan计费体系。相比原始定价,新价格最高降幅达到99%,且不再区分上下文窗口长度。
对于降价背后的原理,小米方面披露,小米团队基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储间的数据搬运量降低至优化前的约1/7,可缓存Token数量提升至约5倍。与此同时,小米还优化了专家并行方案、输入长度分桶策略等机制,进一步提升集群输入吞吐能力,从而降低单位Token成本。
戴鲲认为,小米和DeepSeek一方面依赖模型效率和算力优化压低单位成本;另一方面用低价换规模,更关键的是通过自身的商业生态与外部的战略投资实现体系内补血,形成以生态收入反哺模型的循环,因此短期降价具备可持续性。
另外,对于行业内分别有厂商选择涨价以及继续贯彻“价格战”的现象,戴鲲认为,这本质上是从流量竞争转向商业化分层。“低价模型抢开发者和生态入口,高端模型开始按能力和场景分级收费。今年行业处于从技术竞赛向规模化变现的转型期,差异化定位将会明显强化”。
彭超表示,小米此次降价依托的是推理系统层面的缓存优化(如SGLang HiCache与SWA滑动窗口注意力机制),与DeepSeek通过模型架构创新降低成本的路线有所不同,但目标一致。“DeepSeek-V4在模型架构上实现了混合注意力机制的创新,大幅降低了推理成本;随后各厂商在推理服务层面跟进优化缓存命中策略。罗福莉团队也提升了命中力”。
彭超告诉南都记者,大模型的缓存命中是指,当用户再次向模型发送一个完全相同或高度相似的请求时,模型可以直接从临时缓存中取出之前计算好的结果返回,而不需要重新进行复杂的推理计算。这个时候,大模型处理请求只需要用1/10的之前的价格,就能将答案返还给用户,这就相当于原价的10%,即打1折。
彭超关注到,每家厂商都在用各种方法把定价权握在自己手上,这些方法就包括创造自己独特的计费单位。比如小米MiMo虽然官宣降价,但其Token Plan套餐则采用Credits体系,并在此次降价中大幅优化了Credits与Token的换算比例(用量提升5-8倍);而火山引擎甚至推出了自己独特的计费单位AFP(Agent Fuel Point,智能体燃料值),作为其Agent Plan套餐的统一用量计费单位,来量化智能体资源的消耗。
AI能否打破 中国软件 付费困局?
放眼行业,涨价、免费用量的收紧正在成为新的趋势。这种变化的背后,一大原因是成本账算不平。从财报数据看,已经上市的两家大模型企业MiniMax和智譜都还没有盈利。
对此,戴鲲认为,过去单纯依靠补贴换增长的方式难以为继,今年资本趋紧、商业化考核加强,必须收敛亏损。同时模型训练与推理成本持续提升,推动各家厂商全面重估面向投资回报的价格体系。他还提到,模型厂商的涨价会导致低端通用模型竞争激烈,边际价值下降;而具备行业能力、数据资源和/或生态控制力的厂商会进一步集中。
收费不仅面向开发者。6月3日,国内目前日活最高的C端AI软件豆包公告回应即将推出专业版。豆包表示,针对专业人群的生产力需求,计划推出豆包专业版,将包含 软件开发 、数据分析、专业设计、流程自动化、金融分析、科学研究等 专业服务 。豆包收费的消息一石激起千层浪,相关话题快速冲上热搜。另外,生成作品耗费算力资源的AI视频也在加紧收费进程。
长期以来, 中国软件 市场的生态饱受从业者诟病。用户付费意愿偏低、免费模式根深蒂固。如今,随着大模型纷纷开启收费模式,一个值得关注的问题随之浮现:当前中国市场和用户对AI服务的接受意愿究竟如何?AI能否成为打破 中国软件 付费困局的关键突破口?
戴鲲认为,在当前的宏观环境下,短期内客户仍然会对价格敏感,但随着AI提高生产力的价值落地,企业付费意愿明显增强。AI有机会成为软件付费习惯的拐点,以效果为导向持续证明ROI是关键。
以AI视频生成为例,戴鲲认为,AI视频的收费无可厚非。“一方面在短视频、电商营销、游戏与内容工业的推动下,自动化视频生成的需求激增,同时多模态模型进一步成熟为应用落地提供了更好的支持;另一方面视频生成的算力消耗远高于文本,在这两方面因素的共同作用下价格回归成为必然”。
他进一步提到,整个行业正从“卖算力”过渡到“卖能力”,其中的关键取决于生成质量、成本效率、可控性与业务转化效果是否可量化。
出品:南都政商数据新闻部
(文章来源:南方都市报)