如果没有杨元庆，黄仁勋很难完成Token生产、消费的闭环

速读：也就是4月1日，黄仁勋的好朋友，联想集团董事长、CEO 杨元庆，在联想集团新财年誓师大会上，与他的管理团队，则回答了另一个问题：这些被黄仁勋定义、即将大规模生产出来的Token。他的意图很明确，就是要“把人工智能送进千家万户、千行百业”，如果结合黄仁勋的Token经济学原理，实际上就是为Token消费挖掘各式各样的场景，让个体和企业在消费Token时的体验达到最佳。半个月后，也就是4月1日，黄仁勋的好朋友，联想集团董事长、CEO杨元庆，在联想集团新财年誓师大会上，与他的管理团队，则回答了另一个问题：这些被黄仁勋定义、即将大规模生产出来的Token，究竟会在什么地方被消耗掉，由谁来消耗，又该如何被消耗得更高效、更安全、更有确定性。 AI发展的中心正由训练转向推理，在这个大的基准走向上，杨元庆和黄仁勋的判断是一致的。在英伟达2026年的GTC大会上，黄仁勋试图阐明这样一件事情：他希望整个科技产业，不再以FLOPS、TOPS作为核心计量，而是学会用一个更贴近当下AI时代的新单位——Token，来衡量AI的生产力。

2026年04月03日 13:1

　　来源：热AInext

　　作者：陈庆春

　　2026年，一个极其微观却又宏大至极的词语，定义了这一年的全球财富逻辑：Token，也就是“词元”。

　　在英伟达2026 年的 GTC 大会上，黄仁勋试图阐明这样一件事情：他希望整个科技产业，不再以 FLOPS、TOPS 作为核心计量，而是学会用一个更贴近当下AI时代的新单位——Token，来衡量AI的生产力。而英伟达就是负责生产Token 并定义生产效率的厂家。

　　黄仁勋在 2026 年GTC大会上展示 Token 成本与速度的变革

　　半个月后，也就是4月1日，黄仁勋的好朋友，联想集团董事长、CEO 杨元庆，在联想集团新财年誓师大会上，与他的管理团队，则回答了另一个问题：这些被黄仁勋定义、即将大规模生产出来的Token，究竟会在什么地方被消耗掉，由谁来消耗，又该如何被消耗得更高效、更安全、更有确定性。

　　就在前一天3月31日，联想集团刚刚对外发布了两款专门为“硅基员工”设计的“智能体PC”，这是一款没有屏幕的特殊PC。这款PC的使用场景，就是让我们有个安心“养虾”的机器，让我们的AI助理、硅基员工有个尽情施展才能的“场所”。而这只是小小的“开胃前菜”。

　　杨元庆称，2026年是联想“AI 交付之年”，将围绕“个人智能”开发出可穿戴产品，新形态的 PC、平板电脑、手机，以及个人算力中枢，等等；围绕“企业智能”则要开发出越来越多可落地交付的领域智能体，重构工作流。

　　杨元庆在联想集团新财年誓师大会上展示多形态的个人智能设备

　　他的意图很明确，就是要“把人工智能送进千家万户、千行百业”，如果结合黄仁勋的Token经济学原理，实际上就是为 Token 消费挖掘各式各样的场景，让个体和企业在消费Token 时的体验达到最佳。

　　一个在定义“Token 如何被生产”，一个在界定“Token在哪里被消耗”。一个在推动“供给侧革命”，一个在押注“需求侧入口”。如果说英伟达正在成为全球最大的Token 生产工厂，那么联想正在努力扮演的是，全球覆盖最广、场景最丰富的Token消费终端厂商。

　　在这条完整的AI产业链上，两人共同塑造的不仅是 Token生产-消费的闭环，或许正是下一代计算范式的闭环。

　　黄仁勋的Token经济学：已成定局

　　英伟达与联想的这种逻辑关系，在 GTC 2026 大会上得到了黄仁勋本人的确认，他面对镜头，贴身对杨元庆说：“今年将属于你，我感觉到了。”“我们做到了。”这并不是一句客套话。黄仁勋自己定义的Token经济学，正在证实这一点。

　　过去十年，英伟达最成功的叙事，是把自己从一家“显卡公司”，转型成一家“加速计算公司”。在 GTC 2026 上，黄仁勋又进一步，把英伟达从“卖卡的公司”，推向了“AI 工厂公司”的角色。英伟达的产品不再只是 Blackwell、Vera Rubin 这样单一 GPU，而是一整座“AI 工厂”：从CPU、GPU、网络、存储，到整机系统，再到为 AI 工厂优化的操作系统、编译器、推理引擎和开发工具链，以及一整个CUDA生态。

　　黄仁勋说：“芯片公司的时代结束了，现在是 AI 工厂的时代。我们衡量一家工厂，不再是每秒多少 FLOPS，而是每瓦能产出多少Token。”客户把这座“AI工厂”买回去的目的，就是为了更快速、更低成本的生产Token。

　　Token正在成为衡量一家企业规模效率的重要单位，Token的生产与消费效率甚至将直接影响一个国家的GDP。这就是黄仁勋急切想让大众了解的“Token 经济学”。

　　他并不是凭空提出这个概念，而是在顺应一个已经发生的结构性转折：AI的中心正在从训练转向推理。训练是一次性投入，而推理是持续消耗，每一次问答、每一次任务拆解、每一次智能体执行，都在持续生成并消耗 Token。

　　黄仁勋说，过去两年，AI 计算需求增加了 100 万倍，“我们现在正处于正向飞轮阶段，我们已经到达了那个时刻，推理转折点已经到来”。

　　黄仁勋在 2026 年GTC大会上展示过去三年的AI发展

　　特别是，OpenClaw 掀起的智能体（Agent）风潮，让硅基员工走向现实。这些硅基员工不再只是机械地等待指令，而是可以自主规划并执行复杂任务。这种“自动驾驶”式的 AI 交互，构成了Token消耗的巨大确定性。

　　智谱AI CEO张鹏做过测算：“智能体完成复杂任务的Token消耗，是传统问答的10倍甚至100倍”。国家数据局数据印证了这一趋势：截至2026年3月，中国日均 Token调用量突破140万亿，两年增长超1000倍，其中OpenClaw单周贡献全平台20%的Token消耗。

　　黄仁勋把 OpenClaw 捧为 “下一代 Linux”，给出了最笃定的判断：“每一家公司都必须制定OpenClaw战略，80%的传统应用将消失，SaaS公司将全面转型为智能体即服务公司”。OpenClaw 的本质，是让 AI 从 “被动应答” 走向 “自主执行”：一个智能体可拆解任务、调用工具、衍生子代理，完成一整套闭环工作。

　　然而，不止是 OpenClaw 这一个智能体在干活，Anthropic 2026 年 3 月的 Economic Index 甚至给出一个非常现实的数据：约 49% 的职业，已经出现至少四分之一的任务由Claude参与完成。这个数字足以说明：Token已经在进入真实经济的毛细血管。

　　黄仁勋由此画出 AI 时代的企业成长公式：企业收入 = 每瓦Token吞吐量 × 可用功率 ×Token 定价。他将Token定价分为免费层、中级层（3美元/百万Token）、高级层（6美元/百万Token）、高速层（45美元/百万Token）、超高速层（150美元/百万Token），Token 的生产效率与消费场景，直接决定企业营收与行业地位。

　　黄仁勋认为推理效率决定公司业绩

　　黄仁勋的 Token 经济学，已不是一种想象，而是一个正在落地的产业事实：供给端在拼命建厂，需求端正在因为智能体而被放大。只是，黄仁勋的叙事仍然停留在“生产端逻辑”：工厂如何更高效地产出Token、如何提升每瓦电产出多少 Token。至于 Token究竟在哪里被用掉、谁来承担最终的交互与执行、如何与真实数据结合、怎么消耗 Token，他并没有真正讲完。

　　黄仁勋论证了 Token 经济，他能定义 AI 工厂的技术标准，却无法定义 Token在B+C端的消费场景、消费习惯、消费闭环。

　　英伟达的未尽之事，恰好联想集团可以做到。

　　杨元庆的算力矩阵：最丰富的Token消费场景

　　AI发展的中心正由训练转向推理，在这个大的基准走向上，杨元庆和黄仁勋的判断是一致的。但杨元庆又从技术驱动以及技术实际发生的场景细分角度，对AI的整体发展做了三阶段的划分：

　　首轮突破是算力引擎，次轮爆发是模型引擎，而“我们正在迈入的下一阶段则是一个天翻地覆的大时代，其特征是数据引擎驱动，尤其是私域数据驱动”。

　　杨元庆认为AI 发展正迈入数据引擎阶段

　　这一判断直击了Token 经济的本质：AI 要真正 “干活”，必须调用个人文档、业务数据、设备状态、用户习惯等私域数据；而私域数据不可能全部上云，只能在靠近用户的终端完成处理与推理。

　　这也是 OpenClaw 能风靡全球的核心原因：它能直接调用本地文件、操控本地设备，用真实数据完成真实任务。如果没有终端对私域数据的承载，Token 只是无意义的字符序列，不产生任何经济价值。

　　“养龙虾”是一个很确定的Token消费场景，而且联想挖掘到的进一步场景需求是：当人人都需要一个硅基员工时，也需要给这位“员工”安排一个固定的办公场所。如果和硅基员工共用一台 PC，就极有可能发生数据泄露的风险，而且两个人长期同时使用一台 PC 资源，也会让 PC 不堪重负，严重影响两人的工作效率。

　　基于此判断，联想就以很快的速度推出了两款没有屏幕的终端产品：YOGA AI Mini 和 Think AI Tiny。它们的官方定位很直接——专门给 AI 使用的电脑，是智能体的专用终端，即智能体PC。

　　YOGA AI Mini 和 Think AI Tiny

　　这两个终端最大的特点就是一键部署智能体DingClaw，用的也是联想自研的 DingOS智能体操作系统，直接用语音就能让机器干活，比如让它们完成 “一键发布微博照片”、“生成市场分析报告并发送邮件” 等。联想还为其打造专属的 Skill 工厂，预计到年底将有超过8000个Skill供用户选择。如果用户想从网上下载 Skill，联想还在两个产品中内置了Skill Guard安全守门机制，对所有安装的Skill进行严格筛选，杜绝漏洞和黑客恶意代码。

　　Skill 工厂

　　当智能体逐渐走强、硅基员工变成常态，“AI一台电脑、人一台电脑”的大趋势将会更加明朗。《硅星人》（媒体机构）做了一个粗略的测算：全球知识工作者约5亿人，如果未来3到5年内，其中10%配备了专用的AI Agent设备，就是5000万台新增设备。按均价500美元计算，这是一个250亿美元的新增市场。如果渗透率达到20%，就是500亿美元，接近当前全球台式机市场的年出货规模。

　　这 5000万台新增设备，无疑也将成为Token消费的一员猛将。每一个挂在智能体 PC 上的数字员工，都将以一种稳定、可预期的方式消耗 Token。这些Token有的源自本地推理（端侧算力），有的来自云端AI工厂（远程模型调用）；它们共同构成了一个“可运维、可审计、可扩容”的Token消费节点。

　　智能体PC是联想找到的第一个“确定的Token消费场景”。联想在新财年誓师大会上透露，今年将发布多种新形态的可穿戴设备与感知终端。换句话说，联想要做的并不是单一爆款，而是一套覆盖 PC、平板、手机、可穿戴以及感知终端的“算力矩阵”。

　　那么，联想延伸“算力矩阵”的逻辑是什么呢？

　　联想集团高级副总裁、首席技术官Tolga Kurtoglu，在新财年誓师大会上说：“联想AI必须做到高度个性化与场景化。我们必须引领AI，从由大语言模型驱动的技术，转向由私有数据与全球用户共同驱动的新阶段。”

　　Tolga认为智能体要善于应用数据

　　对于个体来说，就是能获得差异化个性化数据的场景；对于企业来说，就是能还原真实业务数据的场景。通过不断挖掘这个两大类场景，来延伸“算力矩阵”，提升联想AI能力。

　　联想集团执行副总裁、智能设备业务集团总裁 Luca Rossi说，三年后联想与摩托罗拉将运营全球最大的个人 AI 平台之一，在数亿台形态各异、搭载不同操作系统的设备上运行。

　　一旦数亿台 AI PC、智能手机、可穿戴设备开始实时运转，其消耗的Token规模将实现百万倍、千万倍的放大。如果再加上 2B侧的机房级服务器、存储、工作站，到边缘计算设备、行业专用终端，这个 Token 的消耗级别又要再度被放大数倍。

　　Luca 认为跨系统是联想与摩托罗拉成为全球最大个人 AI 平台的关键原因

　　目前，联想是全球仅有的既熟悉 B 端场景、又熟悉 C 端使用场景，并且能够将场景体验做到极佳的少数企业。联想集团执行副总裁、中国区总裁刘军称，仅在中国区联想过去一年就已经在B端开发了46个领域和场景智能体。

　　然而，Tolga说：“场景感知不止于数据汇聚，我们需要AI无论面向个人还是企业场景，都能善用所获取的数据。”他的意思是，仅仅创造场景以及终端产品，并不是联想的目的，更重要的事情是，让这些数据能够驱动AI获得更大的进步，从而让用户在使用这些终端设备中获得更好的AI体验。

　　过去一年，联想集团构建了智能体平台的核心内容，包括模型编排、智能体内核以及智能体协作等，使得跨模型、跨设备、跨数据源的 “同一个AI” 成为可能。这就是联想的自研智能体 Qira，在中国叫天禧。

　　Qira（天禧）的出现，给联想终端带来了新的产品体验，直接带动了销量。Luca称：“连续两个季度，我们的全球PC市场份额超过25%，这是其他任何PC公司都未曾做到的。”在中国，联想PC销量市场份额更是创纪录地达到了36%。另外，联想旗下的摩托罗拉手机也跻身全球 Top4。

　　刘军展示过去一年在天禧AI驱动下的中国区业绩

　　Tolga 认为，在AI新十年，联想的优势将不在于某一项单一技术，而在于联想所构建的智能体系统。今年，他还将聚焦三个方向以提升联想智能体平台的能力：

　　第一，聚焦智能体的下一项核心技术——语义数据转换层，让它能把脱离场景的原始数据，转化为具备完整上下文的知识。这项技术能让终端设备，采集并转换原始数据，以AI可理解的形式进行表示，再让这些知识实现即时可检索，从而赋能人类与AI智能体，根据具体场景输出结果。

　　第二，确保AI提供准确、一致的回答，同时严密保护个性化体验所需的私密数据。让联想AI既可靠又安全，从而实现真正的差异化。

　　第三，构建一套深度整合基础架构与终端设备的智能体编排层，覆盖算力、数据、模型以及企业应用。也就是进一步提升混合式AI编排技术，让用户在不同算力、模型之间能丝滑切换。

　　Tolga认为，联想的智能体系统，将弥合AI所能实现的能力与客户实际应用之间的巨大鸿沟。

　　如果将这句话置换到黄仁勋的 Token 经济学里，那就是说，联想关心的不是Token的生产成本和生产速度，而更在意的是，产生的Token对客户来说到底有没有实际价值。只有产生价值，才能形成消费闭环。相反，即便Token再便宜，不产生实际的价值，也不会有人消费。这才是联想创造Token消费场景与算力矩阵的真正意义。

　　没有联想，英伟达的Token 只能停留在“生产阶段”；有了联想，Token才真正进入“能被消耗、被反复消耗、被高质量消耗”的阶段。

　　杨元庆与黄仁勋真的是珠联璧合。而且放眼全球，又有几个能通吃 2B+2C 两端场景的企业。

　　从个人智能体的日常 Token 消耗，到企业 AI 工厂的海量 Token 流转，联想的算力矩阵，把黄仁勋的 Token 工厂与真实世界的每一个用户、每一家企业牢牢绑定。这正是黄仁勋那句 “今年将属于你”的深层含义 ——只有联想，能让英伟达的Token真正流向千家万户、千行百业。

　　不可忽视的Token调度层：基础大模型与智能体系统

　　英伟达负责生产 Token，联想负责找到场景消耗Token，这一切顺理成章，却忽视了一个关键环节，就是基础大模型。决定智能体干活能力起点的，真正消耗Token 的，恰恰就是基础大模型。

　　但杨元庆认为，模型驱动 AI 发展的阶段已经过去，现在要进入数据驱动。

　　AI 不再只是回答通用问题，它开始基于个人和企业的私域数据定制答案。AI 也不再仅仅通过对话形成短期记忆，而是收集来自各种设备、传感器和应用的数据，形成全生命周期的记忆。AI 开始嵌入设备和业务流程，像龙虾OpenClaw这样的自主智能体框架，不再只是等待指令，而是可以自主规划并执行复杂任务，几乎不需要人的干预。

主题：黄仁勋|生产|英伟达|联想|杨元庆|AI工厂|Token经济学