为什么AI服务订阅制，注定会走向消亡？

速读：定价的从来不是算力。另一半是用户行为使然——会花200美元买20x套餐的人，就是冲着跑满来的，轻度用户根本不会出现在这个档位里。

2026年06月12日 15:35

订阅制会被掏空，且用且珍惜。

作者｜张勇毅

编辑｜靖宇

6 月 9 日，Anthropic 发布了它迄今最强的公开模型 Claude Fable 5。按照惯例，这应该是付费用户的节日——你每个月交的钱，终于换来了第一时间摸到旗舰的资格。

但公告里有一行字，在发布后立即引发了巨大的争议：6 月 22 日之后，Fable 5 将从所有订阅计划中移除，继续使用需要单独购买用量积分。

换句话说，即使你买了会员，旗舰模型也只让你用 14 天。

一个模型在发布当天就自带「逐客令」，这在大模型行业还是头一回。

很多人把它当成 Anthropic 的一次失误，或者一次傲慢。我的看法正相反：这不是失误，是预告。

AI 订阅制正在走向一场注定的消亡——不是因为哪家公司贪婪，而是因为订阅制赖以成立的那个前提，正在被 AI 自己亲手拆掉。

倒计时 14 天的旗舰模型

先把事实摆清楚。按照 Anthropic 的官方安排（2026 年 6 月 9 日），Fable 5 从发布日起免费包含在 Pro、Max、Team 和按席位计费的企业版里，截止 6 月 22 日；6 月 23 日起，它会被从这些计划中拿掉，之后的每一个 token 都要从预付的用量积分里扣，费率与 API 完全一致。

这个费率不便宜：每百万输入 token 10 美元、输出 50 美元，恰好是上一代旗舰 Opus 4.8 的两倍。更微妙的是，即便在免费窗口期内，Fable 5 在订阅额度里也按大约两倍的权重计算——同样的活儿，烧额度的速度是 Opus 的两倍。

用户的反应可想而知。Hacker News 上有人直言这种「先给再收」的操作令人不安，怀疑 Anthropic 是想借机把订阅用户推向按量计费；还有开发者实测，在每月 100 美元的 Max 计划上，一次 agent 编程会话就消耗了价值近百美元的 token 。

用户纷纷在社交媒体上吐槽自己的 token 用量完全不够｜图源：twitter 而且，这不是 Anthropic 一家的动作。过去八周，整个行业都在做同一件事：OpenAI 在 4 月 2 日把 Codex 从按消息计费改成对齐 API 的按 token 计费，随后扩展到全部存量企业客户。

GitHub 在 4 月 20 日冻结 Copilot 个人版新注册，一周后宣布全线转向 AI Credits 计费，6 月 1 日切换完成——Pro 档 10 美元月费，附带的就是 10 美元积分。

Anthropic 自己的动作最密集：4 月 4 日起，禁止 OpenClaw 等第三方 agent 框架消耗订阅额度，这类用法改走按量付费；4 月 21 日，定价页上 Pro 计划的 Claude Code 一栏悄悄变成红叉，社区炸锅后 24 小时内撤回，官方解释是「针对约 2% 新注册用户的小测试」；5 月 14 日正式宣布，6 月 15 日起 Agent SDK 和无界面调用移出订阅池，改为按 API 费率计量的独立积分

三家公司，八周，同一个方向——这不是巧合，是整个行业在同一道数学题面前，交出了同一份答案。

那道数学题长什么样？

定价的从来不是算力

研究机构 SemiAnalysis 最近把这道数学题摆上了台面。他们把 Anthropic 和 OpenAI 的每一档订阅各买了一份，跑长程编程任务，一直跑到把每周限额耗尽，再按 API 牌价折算：这些用量，值多少钱。

此前业内的普遍认知是，一个每月 200 美元的套餐，撑死能跑出约 2000 美元的 token。实测结果远超于此：20 美元的 Claude Pro，上限约 400 美元；200 美元的 Max 20x，约 8000 美元。OpenAI 这边更夸张——20 美元的 ChatGPT Plus 能跑出约 700 美元，200 美元的 Pro 20x，约 14000 美元。

最高一档的补贴倍数，是 70 倍｜图源：SemiAnalysis 有两句公道话得说在前面：这是「跑满限额」的上限值，不是普通用户的日常水位；API 牌价含毛利，折算数字也不等于真实的算力成本。但定价必须为上限兜底——保险公司不能假设没人出险。

SemiAnalysis 实测各订阅档位可消耗用量对比｜图片来源：X @kimmonismus / SemiAnalysis 补贴本身不致命。流媒体补贴过，打车软件也补贴过，烧钱换增长是互联网的祖传手艺。真正致命的，是 AI 订阅制和它们之间有一个根本区别。

Netflix 敢卖包月，靠的是两件事：多放一部片子的边际成本趋近于零，以及一个人一天最多只有 24 小时可以看。Spotify 同理。包月制成立的隐含前提，是消费量被人的生理极限锁死——它真正定价的从来不是内容，而是人的时间。

聊天机器人时代的 AI，勉强符合这个前提。一个人再能聊，一天敲键盘的量也有限；轻度用户大量闲置的额度，足够覆盖重度用户的超额消耗。

然后，Agent 来了。

一次 agent 任务是什么样的？它读 20 个文件，做规划，改代码，跑测试，读报错，再迭代—— 一轮下来，token 消耗是普通对话的 5 到 30 倍。更要命的是，它不需要你在场。我自己就有体会：前阵子让 agent 整理两座机场的航班数据，我去洗了个澡，回来时任务跑完了，额度也见了底。你在睡觉，电表在转。

Agent 取消的不是价格上限，是消费上限。而 AI 行业的全部演化方向——更长的任务、更多的自主性、并行的多个实例——都在朝着同一个终点狂奔：

把人从消费环节里彻底移走。

GitHub 在公告里说得很直白，agent 用法「正在成为默认」。也就是说，订阅制还能勉强成立的那部分场景，也就是人坐在屏幕前一句一句聊，在 AI 的价值版图里占比只会越来越小。

到这里，有人会问：补贴太深，提价不就行了？

提过，然后得出了一个更糟的结果。回头看 SemiAnalysis 那张表，有一个反常的细节：档位越贵，补贴倍数越高。

Claude 这边，20 美元档的倍数是 20 倍，200 美元档是 40 倍；OpenAI 那边，从 35 倍涨到 70 倍。一半是定价设计使然——高档位按倍数放大额度，相当于给大客户打折；另一半是用户行为使然——会花 200 美元买 20x 套餐的人，就是冲着跑满来的，轻度用户根本不会出现在这个档位里。

这在保险业里有个名字：逆向选择。当一份保单的定价吸引来的全是最高风险的投保人，这份保单就没有精算意义上的活路。任何一个固定价格，都会精准筛选出用量超过它的那批用户——这不是经营问题，是结构问题，调价只会让筛子越筛越细。

2025 年这一整年，行业其实把所有补丁都试了一遍。1 月，Sam Altman 在 X 上承认每月 200 美元的 ChatGPT Pro 在亏钱，因为用量远超预期——提价档失败。

主题：用户|订阅制|旗舰模型