登录

如果没有杨元庆,黄仁勋很难完成Token生产、消费的闭环


速读:也就是4月1日,黄仁勋的好朋友,联想集团董事长、CEO 杨元庆,在联想集团新财年誓师大会上,与他的管理团队,则回答了另一个问题:这些被黄仁勋定义、即将大规模生产出来的Token。 他的意图很明确,就是要“把人工智能送进千家万户、千行百业”,如果结合黄仁勋的Token经济学原理,实际上就是为Token消费挖掘各式各样的场景,让个体和企业在消费Token时的体验达到最佳。 半个月后,也就是4月1日,黄仁勋的好朋友,联想集团董事长、CEO杨元庆,在联想集团新财年誓师大会上,与他的管理团队,则回答了另一个问题:这些被黄仁勋定义、即将大规模生产出来的Token,究竟会在什么地方被消耗掉,由谁来消耗,又该如何被消耗得更高效、更安全、更有确定性。 AI发展的中心正由训练转向推理,在这个大的基准走向上,杨元庆和黄仁勋的判断是一致的。 在英伟达2026年的GTC大会上,黄仁勋试图阐明这样一件事情:他希望整个科技产业,不再以FLOPS、TOPS作为核心计量,而是学会用一个更贴近当下AI时代的新单位——Token,来衡量AI的生产力。
2026年04月03日 13:1

  来源:热AInext

  作者:陈庆春

  2026年,一个极其微观却又宏大至极的词语,定义了这一年的全球财富逻辑:Token,也就是“词元”。

  在英伟达2026 年的 GTC 大会上,黄仁勋试图阐明这样一件事情:他希望整个科技产业,不再以 FLOPS、TOPS 作为核心计量,而是学会用一个更贴近当下AI时代的新单位——Token,来衡量AI的生产力。而英伟达就是负责生产Token 并定义生产效率的厂家。

  黄仁勋在 2026 年GTC大会上展示 Token 成本与速度的变革

  半个月后,也就是4月1日,黄仁勋的好朋友,联想集团董事长、CEO 杨元庆,在联想集团新财年誓师大会上,与他的管理团队,则回答了另一个问题:这些被黄仁勋定义、即将大规模生产出来的Token,究竟会在什么地方被消耗掉,由谁来消耗,又该如何被消耗得更高效、更安全、更有确定性。

  就在前一天3月31日,联想集团刚刚对外发布了两款专门为“硅基员工”设计的“智能体PC”,这是一款没有屏幕的特殊PC。这款PC的使用场景,就是让我们有个安心“养虾”的机器,让我们的AI助理、硅基员工有个尽情施展才能的“场所”。而这只是小小的“开胃前菜”。

  杨元庆称,2026年是联想“AI 交付之年”,将围绕“个人智能”开发出可穿戴产品,新形态的 PC、平板电脑、手机,以及个人算力中枢,等等;围绕“企业智能”则要开发出越来越多可落地交付的领域智能体,重构工作流。

  杨元庆在联想集团新财年誓师大会上展示多形态的个人智能设备

  他的意图很明确,就是要“把人工智能送进千家万户、千行百业”,如果结合黄仁勋的Token经济学原理,实际上就是为 Token 消费挖掘各式各样的场景,让个体和企业在消费Token 时的体验达到最佳。

  一个在定义“Token 如何被生产”,一个在界定“Token在哪里被消耗”。一个在推动“供给侧革命”,一个在押注“需求侧入口”。如果说英伟达正在成为全球最大的Token 生产工厂,那么联想正在努力扮演的是,全球覆盖最广、场景最丰富的Token消费终端厂商。

  在这条完整的AI产业链上,两人共同塑造的不仅是 Token生产-消费的闭环,或许正是下一代计算范式的闭环。

  黄仁勋的Token经济学:已成定局

  英伟达与联想的这种逻辑关系,在 GTC 2026 大会上得到了黄仁勋本人的确认,他面对镜头,贴身对杨元庆说:“今年将属于你,我感觉到了。”“我们做到了。”这并不是一句客套话。黄仁勋自己定义的Token经济学,正在证实这一点。

  过去十年,英伟达最成功的叙事,是把自己从一家“显卡公司”,转型成一家“加速计算公司”。在 GTC 2026 上,黄仁勋又进一步,把英伟达从“卖卡的公司”,推向了“AI 工厂公司”的角色。英伟达的产品不再只是 Blackwell、Vera Rubin 这样单一 GPU,而是一整座“AI 工厂”:从CPU、GPU、网络、存储,到整机系统,再到为 AI 工厂优化的操作系统、编译器、推理引擎和开发工具链,以及一整个CUDA生态。

  黄仁勋说:“芯片公司的时代结束了,现在是 AI 工厂的时代。我们衡量一家工厂,不再是每秒多少 FLOPS,而是每瓦能产出多少Token。”客户把这座“AI工厂”买回去的目的,就是为了更快速、更低成本的生产Token。

  Token正在成为衡量一家企业规模效率的重要单位,Token的生产与消费效率甚至将直接影响一个国家的GDP。这就是黄仁勋急切想让大众了解的“Token 经济学”。

  他并不是凭空提出这个概念,而是在顺应一个已经发生的结构性转折:AI的中心正在从训练转向推理。训练是一次性投入,而推理是持续消耗,每一次问答、每一次任务拆解、每一次智能体执行,都在持续生成并消耗 Token。

  黄仁勋说,过去两年,AI 计算需求增加了 100 万倍,“我们现在正处于正向飞轮阶段,我们已经到达了那个时刻,推理转折点已经到来”。

  黄仁勋在 2026 年GTC大会上展示过去三年的AI发展

  特别是,OpenClaw 掀起的智能体(Agent)风潮,让硅基员工走向现实 。这些硅基员工不再只是机械地等待指令,而是可以自主规划并执行复杂任务。这种“自动驾驶”式的 AI 交互,构成了Token消耗的巨大确定性。

  智谱AI CEO张鹏做过测算:“智能体完成复杂任务的Token消耗,是传统问答的10倍甚至100倍”。国家数据局数据印证了这一趋势:截至2026年3月,中国日均 Token调用量突破140万亿,两年增长超1000倍,其中OpenClaw单周贡献全平台20%的Token消耗。

  黄仁勋把 OpenClaw 捧为 “下一代 Linux”,给出了最笃定的判断:“每一家公司都必须制定OpenClaw战略,80%的传统应用将消失,SaaS公司将全面转型为智能体即服务公司”。OpenClaw 的本质,是让 AI 从 “被动应答” 走向 “自主执行”:一个智能体可拆解任务、调用工具、衍生子代理,完成一整套闭环工作。

  然而,不止是 OpenClaw 这一个智能体在干活,Anthropic 2026 年 3 月的 Economic Index 甚至给出一个非常现实的数据:约 49% 的职业,已经出现至少四分之一的任务由Claude参与完成。这个数字足以说明:Token已经在进入真实经济的毛细血管。

  黄仁勋由此画出 AI 时代的企业成长公式:企业收入 = 每瓦Token吞吐量 × 可用功率 ×Token 定价。他将Token定价分为免费层、中级层(3美元/百万Token)、高级层(6美元/百万Token)、高速层(45美元/百万Token)、超高速层(150美元/百万Token),Token 的生产效率与消费场景,直接决定企业营收与行业地位。

  黄仁勋认为推理效率决定公司业绩

  黄仁勋的 Token 经济学,已不是一种想象,而是一个正在落地的产业事实:供给端在拼命建厂,需求端正在因为智能体而被放大。只是,黄仁勋的叙事仍然停留在“生产端逻辑”:工厂如何更高效地产出Token、如何提升每瓦电产出多少 Token。至于 Token究竟在哪里被用掉、谁来承担最终的交互与执行、如何与真实数据结合、怎么消耗 Token,他并没有真正讲完。

  黄仁勋论证了 Token 经济,他能定义 AI 工厂的技术标准,却无法定义 Token在B+C端的消费场景、消费习惯、消费闭环。

  英伟达的未尽之事,恰好联想集团可以做到。

  杨元庆的算力矩阵:最丰富的Token消费场景

  AI发展的中心正由训练转向推理,在这个大的基准走向上,杨元庆和黄仁勋的判断是一致的。但杨元庆又从技术驱动以及技术实际发生的场景细分角度,对AI的整体发展做了三阶段的划分:

  首轮突破是算力引擎,次轮爆发是模型引擎,而“我们正在迈入的下一阶段则是一个天翻地覆的大时代,其特征是数据引擎驱动,尤其是私域数据驱动”。

  杨元庆认为AI 发展正迈入数据引擎阶段

  这一判断直击了Token 经济的本质:AI 要真正 “干活”,必须调用个人文档、业务数据、设备状态、用户习惯等私域数据;而私域数据不可能全部上云,只能在靠近用户的终端完成处理与推理。

  这也是 OpenClaw 能风靡全球的核心原因:它能直接调用本地文件、操控本地设备,用真实数据完成真实任务。如果没有终端对私域数据的承载,Token 只是无意义的字符序列,不产生任何经济价值。

  “养龙虾”是一个很确定的Token消费场景,而且联想挖掘到的进一步场景需求是:当人人都需要一个硅基员工时,也需要给这位“员工”安排一个固定的办公场所。如果和硅基员工共用一台 PC,就极有可能发生数据泄露的风险,而且两个人长期同时使用一台 PC 资源,也会让 PC 不堪重负,严重影响两人的工作效率。

  基于此判断,联想就以很快的速度推出了两款没有屏幕的终端产品:YOGA AI Mini 和 Think AI Tiny。它们的官方定位很直接——专门给 AI 使用的电脑,是智能体的专用终端,即智能体PC。

  YOGA AI Mini 和 Think AI Tiny

  这两个终端最大的特点就是一键部署智能体DingClaw,用的也是联想自研的 DingOS智能体操作系统,直接用语音就能让机器干活,比如让它们完成 “一键发布微博照片”、“生成市场分析报告并发送邮件” 等。联想还为其打造专属的 Skill 工厂,预计到年底将有超过8000个Skill供用户选择。如果用户想从网上下载 Skill,联想还在两个产品中内置了Skill Guard安全守门机制,对所有安装的Skill进行严格筛选,杜绝漏洞和黑客恶意代码。

  Skill 工厂

  当智能体逐渐走强、硅基员工变成常态,“AI一台电脑、人一台电脑”的大趋势将会更加明朗。《硅星人》(媒体机构)做了一个粗略的测算:全球知识工作者约5亿人,如果未来3到5年内,其中10%配备了专用的AI Agent设备,就是5000万台新增设备。按均价500美元计算,这是一个250亿美元的新增市场。如果渗透率达到20%,就是500亿美元,接近当前全球台式机市场的年出货规模。

  这 5000万台新增设备,无疑也将成为Token消费的一员猛将。每一个挂在智能体 PC 上的数字员工,都将以一种稳定、可预期的方式消耗 Token。这些Token有的源自本地推理(端侧算力),有的来自云端AI工厂(远程模型调用);它们共同构成了一个“可运维、可审计、可扩容”的Token消费节点。

  智能体PC是联想找到的第一个“确定的Token消费场景”。联想在新财年誓师大会上透露,今年将发布多种新形态的可穿戴设备与感知终端。换句话说,联想要做的并不是单一爆款,而是一套覆盖 PC、平板、手机、可穿戴以及感知终端的“算力矩阵”。

  那么,联想延伸“算力矩阵”的逻辑是什么呢?

  联想集团高级副总裁、首席技术官Tolga Kurtoglu,在新财年誓师大会上说:“联想AI必须做到高度个性化与场景化。我们必须引领AI,从由大语言模型驱动的技术,转向由私有数据与全球用户共同驱动的新阶段。”

  Tolga认为智能体要善于应用数据

  对于个体来说,就是能获得差异化个性化数据的场景;对于企业来说,就是能还原真实业务数据的场景。通过不断挖掘这个两大类场景,来延伸“算力矩阵”,提升联想AI能力。

  联想集团执行副总裁、智能设备业务集团总裁 Luca Rossi说,三年后联想与摩托罗拉将运营全球最大的个人 AI 平台之一,在数亿台形态各异、搭载不同操作系统的设备上运行。

  一旦数亿台 AI PC、智能手机、可穿戴设备开始实时运转,其消耗的Token规模将实现百万倍、千万倍的放大。如果再加上 2B侧的机房级服务器、存储、工作站,到边缘计算设备、行业专用终端,这个 Token 的消耗级别又要再度被放大数倍。

  Luca 认为跨系统是联想与摩托罗拉成为全球最大个人 AI 平台的关键原因

  目前,联想是全球仅有的既熟悉 B 端场景、又熟悉 C 端使用场景,并且能够将场景体验做到极佳的少数企业。联想集团执行副总裁、中国区总裁刘军称,仅在中国区联想过去一年就已经在B端开发了46个领域和场景智能体。

  然而,Tolga说:“场景感知不止于数据汇聚,我们需要AI无论面向个人还是企业场景,都能善用所获取的数据。”他的意思是,仅仅创造场景以及终端产品,并不是联想的目的,更重要的事情是,让这些数据能够驱动AI获得更大的进步,从而让用户在使用这些终端设备中获得更好的AI体验。

  过去一年,联想集团构建了智能体平台的核心内容,包括模型编排、智能体内核以及智能体协作等,使得跨模型、跨设备、跨数据源的 “同一个AI” 成为可能。这就是联想的自研智能体 Qira,在中国叫天禧。

  Qira(天禧)的出现,给联想终端带来了新的产品体验,直接带动了销量。Luca称:“连续两个季度,我们的全球PC市场份额超过25%,这是其他任何PC公司都未曾做到的。”在中国,联想PC销量市场份额更是创纪录地达到了36%。另外,联想旗下的摩托罗拉手机也跻身全球 Top4。

  刘军展示过去一年在天禧AI驱动下的中国区业绩

  Tolga 认为,在AI新十年,联想的优势将不在于某一项单一技术,而在于联想所构建的智能体系统。今年,他还将聚焦三个方向以提升联想智能体平台的能力:

  第一,聚焦智能体的下一项核心技术——语义数据转换层,让它能把脱离场景的原始数据,转化为具备完整上下文的知识。这项技术能让终端设备,采集并转换原始数据,以AI可理解的形式进行表示,再让这些知识实现即时可检索,从而赋能人类与AI智能体,根据具体场景输出结果。

  第二,确保AI提供准确、一致的回答,同时严密保护个性化体验所需的私密数据。让联想AI既可靠又安全,从而实现真正的差异化。

  第三,构建一套深度整合基础架构与终端设备的智能体编排层,覆盖算力、数据、模型以及企业应用。也就是进一步提升混合式AI编排技术,让用户在不同算力、模型之间能丝滑切换。

  Tolga认为,联想的智能体系统,将弥合AI所能实现的能力与客户实际应用之间的巨大鸿沟。

  如果将这句话置换到黄仁勋的 Token 经济学里,那就是说,联想关心的不是Token的生产成本和生产速度,而更在意的是,产生的Token对客户来说到底有没有实际价值。只有产生价值,才能形成消费闭环。相反,即便Token再便宜,不产生实际的价值,也不会有人消费。这才是联想创造Token消费场景与算力矩阵的真正意义。

  没有联想,英伟达的Token 只能停留在“生产阶段”;有了联想,Token才真正进入“能被消耗、被反复消耗、被高质量消耗”的阶段。

  杨元庆与黄仁勋真的是珠联璧合。而且放眼全球,又有几个能通吃 2B+2C 两端场景的企业。

  从个人智能体的日常 Token 消耗,到企业 AI 工厂的海量 Token 流转,联想的算力矩阵,把黄仁勋的 Token 工厂与真实世界的每一个用户、每一家企业牢牢绑定。这正是黄仁勋那句 “今年将属于你”的深层含义 ——只有联想,能让英伟达的Token真正流向千家万户、千行百业。

  不可忽视的Token调度层:基础大模型与智能体系统

  英伟达负责生产 Token,联想负责找到场景消耗Token,这一切顺理成章,却忽视了一个关键环节,就是基础大模型。决定智能体干活能力起点的,真正消耗Token 的,恰恰就是基础大模型。

  但杨元庆认为,模型驱动 AI 发展的阶段已经过去,现在要进入数据驱动。

  AI 不再只是回答通用问题,它开始基于个人和企业的私域数据定制答案。AI 也不再仅仅通过对话形成短期记忆,而是收集来自各种设备、传感器和应用的数据,形成全生命周期的记忆。AI 开始嵌入设备和业务流程,像龙虾OpenClaw这样的自主智能体框架,不再只是等待指令,而是可以自主规划并执行复杂任务,几乎不需要人的干预。

主题:黄仁勋|生产|英伟达|联想|杨元庆|AI工厂|Token经济学