为什么AI服务订阅制,注定会走向消亡?
订阅制会被掏空,且用且珍惜。
作者| 张勇毅
编辑| 靖宇
6 月 9 日,Anthropic 发布了它迄今最强的公开模型 Claude Fable 5。按照惯例,这应该是付费用户的节日——你每个月交的钱,终于换来了第一时间摸到旗舰的资格。
但公告里有一行字,在发布后立即引发了巨大的争议:6 月 22 日之后,Fable 5 将从所有订阅计划中移除,继续使用需要单独购买用量积分。
换句话说,即使你买了会员,旗舰模型也只让你用 14 天。
一个模型在发布当天就自带「逐客令」,这在大模型行业还是头一回。
很多人把它当成 Anthropic 的一次失误,或者一次傲慢。我的看法正相反:这不是失误,是预告。
AI 订阅制正在走向一场注定的消亡——不是因为哪家公司贪婪,而是因为订阅制赖以成立的那个前提,正在被 AI 自己亲手拆掉。
01
倒计时 14 天的旗舰模型
先把事实摆清楚。按照 Anthropic 的官方安排(2026 年 6 月 9 日),Fable 5 从发布日起免费包含在 Pro、Max、Team 和按席位计费的企业版里,截止 6 月 22 日;6 月 23 日起,它会被从这些计划中拿掉,之后的每一个 token 都要从预付的用量积分里扣,费率与 API 完全一致。
这个费率不便宜:每百万输入 token 10 美元、输出 50 美元,恰好是上一代旗舰 Opus 4.8 的两倍。更微妙的是,即便在免费窗口期内,Fable 5 在订阅额度里也按大约两倍的权重计算——同样的活儿,烧额度的速度是 Opus 的两倍。
用户的反应可想而知。Hacker News 上有人直言这种「先给再收」的操作令人不安,怀疑 Anthropic 是想借机把订阅用户推向按量计费;还有开发者实测, 在每月 100 美元的 Max 计划上,一次 agent 编程会话就消耗了价值近百美元的 token 。
用户纷纷在社交媒体上吐槽自己的 token 用量完全不够|图源:twitter 而且,这不是 Anthropic 一家的动作。过去八周,整个行业都在做同一件事:OpenAI 在 4 月 2 日把 Codex 从按消息计费改成对齐 API 的按 token 计费,随后扩展到全部存量企业客户。
GitHub 在 4 月 20 日冻结 Copilot 个人版新注册,一周后宣布全线转向 AI Credits 计费,6 月 1 日切换完成——Pro 档 10 美元月费,附带的就是 10 美元积分。
Anthropic 自己的动作最密集:4 月 4 日起,禁止 OpenClaw 等第三方 agent 框架消耗订阅额度,这类用法改走按量付费;4 月 21 日,定价页上 Pro 计划的 Claude Code 一栏悄悄变成红叉,社区炸锅后 24 小时内撤回,官方解释是「针对约 2% 新注册用户的小测试」;5 月 14 日正式宣布,6 月 15 日起 Agent SDK 和无界面调用移出订阅池,改为按 API 费率计量的独立积分
三家公司,八周,同一个方向——这不是巧合,是整个行业在同一道数学题面前,交出了同一份答案。
那道数学题长什么样?
02
定价的从来不是算力
研究机构 SemiAnalysis 最近把这道数学题摆上了台面。他们把 Anthropic 和 OpenAI 的每一档订阅各买了一份,跑长程编程任务,一直跑到把每周限额耗尽,再按 API 牌价折算:这些用量,值多少钱。
此前业内的普遍认知是,一个每月 200 美元的套餐,撑死能跑出约 2000 美元的 token。实测结果远超于此:20 美元的 Claude Pro,上限约 400 美元;200 美元的 Max 20x,约 8000 美元。OpenAI 这边更夸张——20 美元的 ChatGPT Plus 能跑出约 700 美元,200 美元的 Pro 20x,约 14000 美元。
最高一档的补贴倍数,是 70 倍|图源:SemiAnalysis 有两句公道话得说在前面:这是「跑满限额」的上限值,不是普通用户的日常水位;API 牌价含毛利,折算数字也不等于真实的算力成本。但定价必须为上限兜底——保险公司不能假设没人出险。
SemiAnalysis 实测各订阅档位可消耗用量对比|图片来源:X @kimmonismus / SemiAnalysis 补贴本身不致命。流媒体补贴过,打车软件也补贴过,烧钱换增长是互联网的祖传手艺。真正致命的,是 AI 订阅制和它们之间有一个根本区别。
Netflix 敢卖包月,靠的是两件事:多放一部片子的边际成本趋近于零,以及一个人一天最多只有 24 小时可以看。Spotify 同理。 包月制成立的隐含前提,是消费量被人的生理极限锁死——它真正定价的从来不是内容,而是人的时间。
聊天机器人时代的 AI,勉强符合这个前提。一个人再能聊,一天敲键盘的量也有限;轻度用户大量闲置的额度,足够覆盖重度用户的超额消耗。
然后,Agent 来了。
一次 agent 任务是什么样的?它读 20 个文件,做规划,改代码,跑测试,读报错,再迭代—— 一轮下来,token 消耗是普通对话的 5 到 30 倍 。更要命的是,它不需要你在场。我自己就有体会:前阵子让 agent 整理两座机场的航班数据,我去洗了个澡,回来时任务跑完了,额度也见了底。你在睡觉,电表在转。
Agent 取消的不是价格上限,是消费上限。 而 AI 行业的全部演化方向——更长的任务、更多的自主性、并行的多个实例——都在朝着同一个终点狂奔:
把人从消费环节里彻底移走 。
GitHub 在公告里说得很直白,agent 用法「正在成为默认」。也就是说,订阅制还能勉强成立的那部分场景,也就是人坐在屏幕前一句一句聊,在 AI 的价值版图里占比只会越来越小。
到这里,有人会问:补贴太深,提价不就行了?
提过,然后得出了一个更糟的结果。回头看 SemiAnalysis 那张表,有一个反常的细节:档位越贵,补贴倍数越高。
Claude 这边,20 美元档的倍数是 20 倍,200 美元档是 40 倍;OpenAI 那边,从 35 倍涨到 70 倍。一半是定价设计使然——高档位按倍数放大额度,相当于给大客户打折;另一半是用户行为使然——会花 200 美元买 20x 套餐的人,就是冲着跑满来的,轻度用户根本不会出现在这个档位里。
这在保险业里有个名字:逆向选择。当一份保单的定价吸引来的全是最高风险的投保人,这份保单就没有精算意义上的活路。 任何一个固定价格,都会精准筛选出用量超过它的那批用户——这不是经营问题,是结构问题,调价只会让筛子越筛越细。
2025 年这一整年,行业其实把所有补丁都试了一遍。1 月,Sam Altman 在 X 上承认每月 200 美元的 ChatGPT Pro 在亏钱,因为用量远超预期——提价档失败。