登录

一人一周烧掉20亿Token,得到了三个“反常识”


速读:2026年,随着模型能力提升、Token价格下降,越来越多企业一线知识工作者开始像使用水电、流量一样消费Token。 订阅用户既可以使用ChatGPT聊天。 OpenAI实际上是在用较低的订阅价格,筛选和吸引最有潜力的开发者客户。
2026年06月05日 09:46

每天使用超过1亿Token这个现象并非个例。2026年,随着模型能力提升、Token价格下降,越来越多企业一线知识工作者开始像使用水电、流量一样消费Token

文|《财经》研究员 吴俊宇   

编辑|谢丽容

一个人在一周之内烧掉超过20亿Token(词元)。

在2025年,这或许是一个不可思议的数字。当时 在很多人的印象里,Token仍然是一种属于模型公司、云厂商和开发者的资源。

但过去一个月, 《财经》研究员 使用OpenAI 旗下的 代码生成工具Codex 进行了一系列尝试。其中包括, 搭建了一套覆盖亚马逊、微软、谷歌、阿里、甲骨文等主流云 计算 厂商的研究工作流。这套工作流 其实是一个本地网页应用,它 能够自动下载财报PDF文件 , 解析财报电话会内容 , 提取数十个财务指标,并自动生成图表。

在处理搭建工作流、生成报道图表等工作后,《财经》研究员的ChatGPT/ Codex 在5月24日-5月30日这一周消 耗 超过 2 3 亿Token 。

按照OpenAI官网API(应用接口)定价粗略计算(输入占比99%,输出占比1%,缓存命中比例93%),这笔Token价格约合 2550 美元(约合 1.8 万元),但订阅ChatGPT/ Codex 每月实际花费只需200美元(约合1400元)。

Codex统计的Token使用情况 每天使用超过1亿Token这个现象并非个例。 2026年 , 随着模型能力提升 、 Token价格下降,越来越多 企业一线知识工作者 开始像 使用 水电、 流量 一样消费Token。

《财经》近期密集调研了华为、阿里、腾讯、小米以及部分创业公司的多位一线产研、销售、运营人员。结论是,这些企业一线员工日均Token消耗量已经达到了1000万-3亿的规模。其中销售运营人员日均Token消耗量通常在千万级别。产研人员中等强度开发的日均Token消耗量达到了2亿-3亿,高强度开发可达到5亿以上。

在亲身体验和多方调研中,《财经》得到了一些“反常识”。

其一,对重度开发者来说,OpenAI很便宜。 如果购买200美元/月订阅套餐并 真正用满 ,OpenAI 的 Token 均价 低于 大 部分国产旗舰模型 的价格 。

其二, Coding (写代码) 正在变成像使用 Word 、PPT、Excel一样简单。代码生成能力越来越不稀缺,真正稀缺的是软件架构 的设计和审美 能力。

其三,最终真 正决定Token利用效率的并不是模型,而是人。 AI 降低了执行成本,却放大了判断的重要性。

对重度开发者来说,OpenAI很便宜

对 绝大多数普通用户来说,每月200美元订阅ChatGPT/Codex很贵 。 但对重度开发者来说,它便宜 到“ 反常 ” 。

OpenAI的官网API定价中,GPT-5.5这款最新旗舰模型百万Token输入/输出定价是5美元/30美元。这个价格远超大部分国产旗舰模型。以 DeepSeek-V4-Pro 为例,百万Token输入/输出定价3元/6元。GPT-5.5官网定价是 DeepSeek-V4-Pro 的至少10倍以上。

但根据《财经》实际测试,OpenAI旗下Codex 200美元/月的周额度耗尽后,实际使用量超过23亿Token。 若按照相同使用强度持续一个月, 套餐内的 Token 使用 规模将 超过90亿——百万Token价格仅为 0.16 元。 实际使用价格仅有官网API价格的2%左右。

《财经》调研了多位使用Codex的中国开发者发现,Codex 200美元/月的套餐内Token总额度约80亿/月-200亿/月不等。且OpenAI偶尔会刷新额度(也就是把已经使用的Token统计归零,相当于免费赠送),实际Token单价低于大部分国产旗舰模型。这几乎等于是用 200美元撬动 了 官网API 超过1 万美元的Token用量。

为什么会出现这种Token单价看起来“异常低”的情况?

因为,OpenAI的商业模式像是健身房。 绝大多数 个人 用户 订阅了会员 , 但 真正每天去锻炼的人只是少数 。OpenAI的 订阅 分成四档——8美元/月、20美元/月、100美元/月、200美元/月。订阅后,用户既可以使用ChatGPT聊天,也可以拿Codex写代码。大型企业客户无法订阅,只能使用API,要为OpenAI付出更高的价格。

The Information今年2月援引 OpenAI 投资 人披露的材 料 称 ,OpenAI整体毛利率约33%。 这看起来并不高,但这是免费用户拖累的结果。 OpenAI内部还会跟踪“Compute Margin” (计算毛利率) 指标,即收入扣除推理成本(Inference Cost)后的利润率。 如果仅看 付费用户(包括订阅用户和API客户),这一指标已接近70%。

截至今年5月, ChatGPT周活跃用户超过 10 亿,个人付费订阅数突破5000万 。截至今年6月, Codex 周活跃 用户 也 超过 500 万。 换句话说,每2 00 名ChatGPT 周活跃 用户中,只有1人使用Codex。 每10个付费用户中,只有 1人使用Codex 。

OpenAI官网信息显示,截至2026年2月 ChatGPT每天消息量 约30 亿条 。照此估算, 用户平均每天发送的消息 仅为3 . 33 条 。

大部分 用户订阅ChatGPT / Codex后,实际使用量远低于理论额度。有人每个月只进行 数百、数千次 对话,有人偶尔生成代码,还有人购买之后很快停止使用。真正能够 每月 持续消耗 数十亿、数百 亿Token , 让Agent (智能体) 工作数小时的重度用户,只是少数。

OpenAI 不是根据单个 用户 的 Token消耗 量定价 ,而是基于整体用户池定价。 OpenAI可以在大部分普通用户身上获得相对更高的利润率,补贴极少数使用Codex的重度开发者。

对Ope nAI 来说 ,Codex 虽 然 利润 不是最大的,但长远来看它是在投资 开发者。

一位中国市场的模型平台从业者对《财经》表示,每月200美元的ChatGPT/ Codex订阅是用不到官网A PI 10%的Token价格补贴市场。它像是一个面向开发者的漏斗。OpenAI实际上是在用较低的订阅价格,筛选和吸引最有潜力的开发者客户。

他此前号召企业内的开发者每天消耗10亿Token。在他看来,在没有每天亲自消耗过数10亿Token之前,很难真正理解大规模Token使用会带来什么变化。“当你不再时时刻刻担心 Token消耗,而是允许自己持续试验时,会探索出很多过去无法想象的应用和工作模式”

Codex的低价Token其实也是在鼓励这件事情。因为,重度开发者容易影响企业的采购决策,他们可以撬动企业通过团队订阅、API付费使用Token。重度开发者甚至也是潜在的创业者,他们使用Token之后,会开发出新的AI应用,甚至会组建团队。这些Token单价更贵,消耗量更大,会为OpenAI带来更多收入。

代码能力不再稀缺,软件设计能力才稀缺

AI  Coding (AI写代码) 正在变 得 像使用 Word 、PPT、Excel 办公三件套 一样简单 。

这在今天也被称为“Vibe Coding”(氛围编程)。Vibe形容的是—— 用户不再需要掌握编程语言,只需要 凭着感觉 通过聊天描述目标,AI便会自动生成代码并完成执行。

让人人都能成为Builder(建造者、开发者)。这是亚马逊AWS内部长期在思考的问题。因为软件的本质并不是编写代码 。它 是把不同 组件、 模块按照一定规则组织起来,最终解决现实世界的问题。过去,这项工作需要专业程序员完成 。 今天,随着AI Coding能力提升,越来越多普通人也开始具备这种能力。

今年4月,亚马逊AWS技术副总裁Mai-Lan Tomsen Bukovec(美兰·汤姆森·布科韦茨)在一场小规模沟通中对《财经》表示, AI 推理正在成为一种常态化的应用。用户不必成为AI专家,任何Builder都能通过API 搭建 推理应用。

今年5月,阿里 公共云事业部总裁 刘 伟光 在一次规模沟通中对《财经》表示, 随着2025年末 ,基础 模型的Coding能力跨越临界点,它带来了巨大的分水岭。越来越多没有代码基础的普通人、企业内更多不懂IT的业务人员都在成为云的直接用户。

以《财经》今年5月搭建的这套研究工作流为例,研究员在缺乏代码基础情况下利用业余时间使用Codex搭建。Codex在三周内生成了254个文件、共 6 1289行代码。这个工作流收集了五家中美云计算公司过去24个季度的财报PDF、财报电话会资料,并且解析成了图表。整个工作流的搭建、重构耗费了超过40亿Token。

一位软件工程师对《财经》表示,在2023年之前,如果完全依靠人工开发,2 54 个文件、6 1289 行代码的系统通常需要数月时间完成。如果是一个人从零开始设计、开发、调试和上线,至少需要半年时间 。

看起来,基础 模型 能力跃升,它让代码能力不再稀缺。那么真正稀缺的能力是什么?答案是软件的架构设计、审美能力。

多位软件、算法工程师对《财经》表示,AI  Coding 用来写小应用问题不大,但随着应用复杂性不断提升,软件的架构 设计 、 审美能力 、 复杂 系统的 管理 能力 变得更加重要。

这就像每个人都可以利用砖块搭建起一面墙,甚至是一个简陋的房子。但没办法像建筑师一样根据图纸进行设计,画清楚承重墙、线路图,最终指挥施工团队把建筑建成。

这是《财经》用Codex搭建研究工作流 后,用Codex绘制的一张系统工作 图 ,这还只是展现了其中的50%。 图中每一个方框都是一个模块,每一条线代表一次调用、一次数据流转或一次状态依赖。红框中的部分, 存在明显设计缺陷,它已经成了一个难以理清的线团。它 包含了多个分支 、 文件、接口、任务队列、图表生成和发布链路 。

研究工作流的系统工作图,红框为存在明显设计缺陷的部分 这说明 ,代码人人都可以用AI写,但 系统复杂性并不会自动消失。

AI 可以在数周内生成数万行代码、数百个文件时,软件开发的瓶颈会 变成架构设计和系统管理能力。因为设计 架构 的目标 不是把代码写得更多 。它需要 决定哪些模块应该存在 , 哪些链路应该合并 , 哪些路径应该删除 。

否则,代码越多,系统越像一张看不懂的网。 随着代码规模不断变大,它会直接导致中后期每一次生成新的代码,都会造成新的Bug(程序错误)。每修复一处,都会牵一发而动全身造成其他模块的Bug。 工程师将这种现象称为“耦合”。系统越复杂,耦合越多,每一次修复Bug都可能在其他地方产生新的Bug。

一位算法工程师对《财经》表示,他在日常工作中发现,现在AI生成的代码量已经远远超过人工 写代码的阶段 。 2023年之前, 工程师写代码时,每一行代码几乎都经过思考、调试和Review(审查) 。但在今天 , 一次 任务就可能生成数百甚至上千行代码,工程师很难逐行检查 。因此, “以前最大的成本是写代码,现在最大的成本是理解代码。”

人,才是决定Token效率的核心因素

从技术角度来看,最常见的理解是,芯片性能、模型能力、Agent成熟度共同决定了Token的使用效率。工程师几乎每天都在技术细节中不断提升每一枚芯片的单位Token吞吐量。单位算力成本是在这个过程中不断降低的。

不过,这些只是技术层面的问题。技术很重要,但在现实 世界里,真正决定Token效率的,仍然是人。 好的工程师可以直接省钱,但不够好的工程师只会浪费算力。

AI效率变高之后,人的判断力变得更重要了。指挥AI朝着正确方向走,可以提升效率。但指挥AI朝着错误的方向走,只会加速浪费Token。

《财经》在搭建研究工作流的过程中,出现了两次大方向的重构——这导致40亿Token至少有20亿被浪费在探索试错、 推翻旧方案 ,以及系统代码重构的过程中。

“事先把问题想清楚变得更重要了。做任何一次大功能的增减之前,都需要和AI讨论清楚需求,事先写好 PRD(Product Requirement Document , 产品需求文档) 。”一位中国头部软件公司前CEO(首席执行官)对《财经》表示,这样Token效率才能更高。

一位算法工程师对《财经》表示,技术水平高的工程师可以利用AI 把问题拆清楚、设定边界、持续复盘, 用更少的Token去解决更多问题。但技术水平有限的工程师则是只能用 AI反复试错、生成冗余代码 ,不断浪费Token。

2026年初,包括阿里、腾讯、小米、美团等大型科技公司几乎都在鼓励员工使用Token。少数公司的业务部门甚至制定Token消耗排行榜,激励Token消耗量最大的员工。

部分公司的 技术部门,工程师每月 消耗 Token 的API价格 甚至已在万元以上。 极端情况下,单个员工的Token成本甚至接近人力成本。

一家员工数超过30万人的国际科技巨头人士对《财经》表示,他所在 团队 使用的Token是无限量的。他的工程师同事长期使用Claude系列模型写代码,一周Token成本高达2000美元-3000美元。

多位科技公司产研、销售和运营人员 今年3月-5月 对《财经》表示,企业内大规模推广AI工具 后 ,微妙的心理变化正在出现。公司一方面鼓励员工更多使用Token,通过AI沉淀工作流程、业务经验 。 另一方面,不少员工担心,原本依赖个人经验形成的“隐性知识”,正在被逐步转化为Agent可调用的Skill(技能), 公司正在降低对人的依赖 程度。

不过,这些鼓励员工消耗Token的试验很快撞墙了。《财经》了解到的情况是,近半个月包括腾讯、小米在内的公司,都缩减了非技术岗位员工的Token额度。 其中腾讯对部分非技术部门的Token缩减额度超过60%。

原因是,Token浪费严重。 实际产出与消耗并不匹配。 由于执行成本低,用 AI不断尝试生成方案、修改方案、推翻方案 现象开始变得普遍。 大量Token最终 浪费 在无效试错 。

一位中国云厂商高管此前曾对《财经》表示, 从企业CIO(首席信息官)、CTO(首席技术官)的视角来看,Token消耗量并不能直接和业务价值挂钩,更多是和算力成本挂钩。

A I降低了执行成本,却没降低决策成本。Token越便宜,错误判断的放大成本越高。真正稀缺的,不是更多Token 。关键是 能把Token用在正确问题上的人。

无论是片面追求Token消耗量,还是追求Token收入增长,都只会扭曲真实业务价值。

主题:《财经》|《财经》研究员