用不起Token的我,成了AI时代的下沉市场人群

仿佛回到早期互联网,号主一不留神就会流量超额、欠费停机。
文 | 黄依婷
编辑 | 王闪
来源| 镜相工作室(ID:shangyejingxiang)
封面来源 | IC photo
2026年,人类在工作上最“奢侈”的消费是什么?答案并不是买一部性能顶配的电脑,或是置办几身体面的行头,而是能够不受限制、不计成本地使用这个世界上最先进的AI工具。
这意味着你不用为了控制成本,绞尽脑汁优化提示词,生怕弹出一句“今日免费额度已用完”;也不用再三对比,舍不得累到心爱的Claude(由美国AI公司Anthropic开发的大语言模型),只能把不那么重要的工作交给更便宜、更轻量的模型处理。
AI当然好用,但每用一次都对应着成本,Token(词元)消耗量贵到你有点用不起了。斤斤计较、小心翼翼,成了如今AI“牛马”们最真实的状态。
这让人想到了二十年前,拨号上网的时代。那时带宽紧缺且昂贵,开发者为了节约网站的带宽消耗,尽可能压缩图片、精简代码,几乎不敢上传视频。像土豆网这样的视频领域创业公司是极少数,视频所带来的带宽消耗成为网站运营的成本大头。
昨日重现。
在AI产业链条上,算力像水一样自上而下流动。从上游的GPU(图形处理器)和数据中心出发,经由云厂商、模型厂商,被封装成API(应用程序编程接口)接口,最终流向开发者和普通用户,变成一次次具体的调用、一个个可以计价的Token。它看似无形,却在每一个环节都对应着清晰的成本,GPU折旧、电力消耗、高带宽存储,最终都会汇总成账单。
现在,这条水管正在变得拥堵。一头是需求在爆发,多模态、Agent(智能体)等复杂推理场景让Token消耗量千倍增长,另一头则是供给仍未解绑,GPU、HBM(高带宽存储器)、电力和数据中心建设都存在物理极限,GPU利用率仍处于较低位置。聪明是有代价的,虽然爆发式增长导致Token单价更便宜了,但调用它需要花的钱却越来越多。
涨价逐级传导。上游GPU有价无市、算力紧缺,中游云厂商率先调整价格,亚马逊云、谷歌云、百度云、阿里云等,在过去一个季度相继上调部分AI相关服务费用,模型厂商也结束补贴周期,腾讯、阿里等接连停止免费公测,提高API调用价格,其中,腾讯混元大模型最高涨价463%。
模型和应用侧的涨价,让算力不再是独属巨头竞争中的抽象概念,它以Token的形式,给每个普通人也上了一堂付费课。就像当年的流量,以MB(手机上网流量单位)为单位计价,号主一不留神就会欠费停机。
黄仁勋日前提出的“Token经济学”概念,认为推理已成为AI最核心的工作负载,Token则是新的大宗商品——标准化、可计量、可交易。由此Token从模型训练的技术副产品,演变为驱动数字经济的核心生产要素。
在黄仁勋看来,“Token”作为商品是有质量的优劣之分的。从免费层到顶级层,每百万Token价格从0美元到150美元不等。低时延、高交互的Token(如实时对话、智能驾驶)需要昂贵算力,定价高;高吞吐、离线处理的Token(如大规模离线推理、批量数据处理)对时延不敏感,可以用便宜算力生产,定价低。
Token已经作为“商品”产生价值分层了,那使用它的人呢? 或许未来,“下沉市场”人群的定义,也不再仅限于能否消费得起实体商品了。