登录

DeepMind最新推演:AGI并非终点!1亿个人类水平AI将涌现超级智能ASI


速读:当前大模型主要依赖人类生成的数据,尤其是文本数据。 AI不一样,今天的大模型已经可以在很短时间内处理大量文本。 但这些数据并不是无限的,模型规模和训练需求增长很快,而人类自然产生高质量数据的速度有限。 例如,完全不同的架构、优化方法、神经形态硬件、模拟计算,或者基于强化学习预训练、显式世界模型的新路线。
2026年06月14日 19:28

当人工智能行业还在争论 AGI(通用人工智能)什么时候到来时,谷歌 DeepMind 的研究已经把问题往前推了一步:如果人类真的实现了 AGI,接下来会发生什么?

近日,DeepMind 发表了一项题为“From AGI to ASI” 的文章, 探讨了 如果人类真的实现 AGI,AI 将如何继续演进,最终达到 ASI(超人工智能)?

参与报告的研究人员包括 DeepMind 的多位核心研究者,他们长期研究 AGI、强化学习、多智能体系统、AI 安全和通用智能理论。比如 DeepMind 联合创始人之一、首席 AGI 科学家 Shane Legg,AIXI 模型提出者 Marcus Hutter,其被视为当今最顶尖的 AGI 理论家之一,DeepMind 资深研究员、AlphaGo 项目核心成员之一 Thore Graepel 等等。

在讨论之前,研究人员首先对 AGI 和 ASI 进行了清晰的界定。

AGI 是一套在绝大多数认知任务中,达到普通人类中位数水平的智能系统;ASI 则设定了极高的门槛,它是在人类所有活动与认知领域,全面超越大规模人类专家协作团队的智能系统。

为什么 AGI 不是终点?

论文指出, AGI 不太可能刚好停在人类水平 。原因在于,数字智能与生物智能有着根本不同的运行条件 。

人类智能很强,但它受到生物条件限制。一个人大脑的运行速度、记忆容量、寿命、学习速度、沟通方式,都有明显上限。AI 则运行在数字计算系统上,很多限制可以通过更多算力、更好硬件、更高效算法来放大或绕开。

第一, 输入输出速度更快。 人类阅读、听说、写作和操作工具的速度有限。AI 不一样,今天的大模型已经可以在很短时间内处理大量文本。未来如果连接更强的检索系统、数据库、传感器和执行工具,它获取信息、处理信息、输出结果的速度还会继续提高。

第二, 内部处理速度可以被加速。 人类思考速度受大脑结构限制。AI 的思考可以通过硬件和算法提高速度。更多 GPU、更高并行度、更优推理框架、更高效模型,都可能让系统在更短时间内完成更多推理、搜索、规划和验证。

第三, 工作记忆和长期记忆容量更大。 人类工作记忆非常有限。我们很难同时稳定处理几十个复杂变量,也很难完整记住读过的所有材料。AI 可以拥有更大的上下文窗口、更强外部记忆和更快检索能力。它可以调用大量文档、代码库、实验记录和数据库,并在任务过程中保持更多相关信息。

第四, AI 可以脱离单一身体或硬件。 人类智能绑定在一个具体的身体和大脑上。人的身体会衰老,大脑也会疲劳、受伤和死亡。AI 系统原则上可以迁移到不同硬件上,它可以从旧服务器迁移到新服务器,从较慢硬件迁移到更快硬件,也可以被备份和恢复。

第五, AI 可以无损复制 。 一个人无法把自己的知识、记忆和经验完整复制给另一个人。AI 可以,复制的不只是源代码,也可以是模型参数、上下文状态、记忆库和任务经验。一个表现良好的 AI 智能体,可以被复制成许多实例,同时处理不同任务。

第六, AI 可以高带宽共享经验。 人类社会的知识积累很强,但传播速度有限。AI 之间的信息共享可以更直接。不同实例可以共享日志、数据、模型更新、工具使用记录、失败经验和成功策略。如果系统足够同质,甚至可以共享更底层的学习信号。

这并不是说今天的 AI 已经全面超过人类,而是说:一旦 AI 达到人类水平,这些数字化特性会让它更容易继续扩展。

AGI 走向 ASI 的 4 条路径

围绕如何从 AGI 到 ASI ,研究者们提出了四种可能路径。

(来源:上述论文) 第一条路径是继续扩大算力、模型和数据。 过去几年,AI 能力的提升很大程度上来自 scaling:模型越来越大,训练数据越来越多,训练算力越来越强,推理阶段也开始投入更多计算资源。

论文认为, 如果这种趋势能持续,那么从 AGI 到 ASI 未必需要完全不同的技术路线 。 只要更多有效算力仍能转化为更强能力,继续扩大规模就可能推动 AI 越过人类水平。

不过,这条路径也面临不确定性。

最直接的是数据。当前大模型主要依赖人类生成的数据,尤其是文本数据。但高质量文本并不是无限的。随着模型继续扩大,可用数据可能不足以支撑下一阶段训练。

除了数据,资源也是重要瓶颈。继续 scaling 需要更多芯片、能源、数据中心、资金和供应链支持。算力不是抽象数字,它背后是真实世界的电力、土地、制造能力、冷却系统和资本投入。如果这些资源无法持续增长,scaling 路线就会放缓。

但论文也指出,所谓“数据墙”未必一定会成为硬障碍。AI 可能通过合成数据、自博弈、仿真环境、用户交互和搜索增强生成新的高质量训练材料。AlphaZero 就是一个例子:系统通过自我对弈产生数据,再将搜索结果蒸馏回模型,从而不断提升能力。未来类似机制可能被推广到更广泛的任务中。

第二条路径是算法层面的演化或范式转变。 论文指出,当前 AI 的主流范式大致是:用大规模 Transformer 在海量数据上进行预训练,然后再经过指令微调、强化学习、人类反馈、工具调用、检索增强和推理时计算等方式提升能力。

但研究者认为,这一范式可能还不够。 要真正达到 AGI 或 ASI,AI 系统可能需要更强的长期记忆、持续学习、互动式强化学习、世界模型、规划能力和工具使用能力。 比如,当前模型虽然可以在上下文窗口内处理复杂任务,但还不具备真正稳定的终身学习能力。它们在交互环境中的长期决策和可靠行动能力也仍有限。

未来可能出现的范式演化包括:更长甚至近乎无限的上下文、更高效的序列架构、可更新记忆系统、面向真实环境的强化学习、基于世界模型的规划、以及更强的自主智能体框架。

但论文也讨论了更激进的范式转变。例如,完全不同的架构、优化方法、神经形态硬件、模拟计算,或者基于强化学习预训练、显式世界模型的新路线。

这条路径最大的问题是难以预测。真正的范式转变往往不是简单外推可以得到的。Transformer 成为大模型时代核心架构之前,也并非所有人都预见到它会产生如此深远影响。

第三条路径是递归自我改进。 所谓递归自我改进,指的是 AI 系统帮助推进 AI 研发,从而产生更强的 AI;更强的 AI 又进一步加速下一轮 AI 研发,形成正反馈循环。

传统讨论中,自我改进常被理解为 AI 修改自己的代码。但论文把范围扩得更宽:AI 可以改进算法,也可以辅助设计芯片,可以自动调参,可以生成训练数据,可以分析实验结果,可以组织专业化分工。只要 AI 能显著提高 AI 研发效率,就已经构成某种递归改进。

这一路径之所以重要,是因为它可能改变 AI 进步的速度。如果 AI 只是被人类研究者一点点改进,进步速度就受限于人类研发能力。但如果 AI 本身成为 AI 研发的重要力量,那么进步速度可能加速。

事实上,今天已经能看到某些形式的递归改进。例如,AI 辅助写研究代码、帮助设计实验、自动调参、神经架构搜索、AI 辅助芯片设计、自动课程生成、世界模型仿真,以及一些 AI Scientist 系统。这些还不是完全自主的自我改进,但已经说明 AI 可以参与改善 AI 研发流程。

不过,研究者指出,递归改进仍可能受到很多现实限制。例如,训练更强模型需要真实算力;芯片制造需要物理工厂;许多科学实验必须等待现实世界反馈;能源和供应链无法无限加速。因此,递归自我改进可能导致快速跃迁,也可能在资源、实验和工程瓶颈前逐渐放缓。

第四条路径是多智能体协作,也就是 ASI 可能不是由单个系统产生,而是由大量 AGI 智能体组织起来之后形成。 这一路径与第一条 scaling 路径有关,但重点不同。第一条路径关心的是算力、模型和数据如何扩大;这条路径关心的是: 当许多 AGI 实例一起工作时,整体智能会如何变化。

论文认为,超级智能可能作为一种集体属性出现。许多 AGI 智能体通过协调、分工、通信和组织,可能形成类似“群体智能”或“集团智能”的系统。

这个想法并不陌生。人类社会本身就是例子。一个现代科学机构、一家大型公司、一个国家系统,都不是靠单个人完成复杂任务,而是依靠分工、协作、知识积累、组织管理和资源调配。

AGI 群体也可能如此。它们可以被组织成自动化公司、研究机构、智能体市场或服务网络。每个智能体负责不同任务,有的做规划,有的做执行,有的做验证,有的做信息搜集,有的做专业分析。通过高带宽通信,它们可以快速共享结果并调整策略。

论文提出,未来有必要研究多智能体的 scaling laws:当智能体数量增加、通信密度提高、组织结构优化时,整体能力如何变化?是线性增长、超线性增长,还是很快被协调成本抵消?

这意味着, 即使单个模型无法大幅超过人类,一个由大量人类水平 AGI 组成的系统,也可能构成实际意义上的 ASI。

实现 ASI 的六大瓶颈

虽然论文认为 AGI 不太可能是终点,但它并没有把 ASI 描绘成必然到来的神话。研究者们列出了可能阻碍 AGI 走向 ASI 的六大瓶颈。

第一是数据墙。 当前大模型的训练高度依赖大规模数据,尤其是人类生成的文本、图像、音频和视频。但这些数据并不是无限的,模型规模和训练需求增长很快,而人类自然产生高质量数据的速度有限。尤其是高质量文本数据,可能在未来成为限制因素。

第二是经济和自然资源约束。 继续扩大 AI 能力需要资金、芯片、电力、数据中心、冷却系统、土地、稀有材料、供应链和工程能力。如果训练和部署更强 AI 所需的经济投入增长太快,而 AI 带来的经济回报跟不上,那么 scaling 可能变得不可持续。

第三是神经网络范式可能不够。 当前主流路线是大规模神经网络,尤其是 Transformer,加上预训练、后训练、推理时计算、工具调用和检索增强。这一路线虽然非常成功,但不能保证一定足以达到 AGI,更不能保证足以达到 ASI。可能缺失的能力包括长期记忆、持续学习、真实环境中的稳健决策、世界模型、深层规划和自主交互能力。如果这些能力无法在现有范式内自然补齐,就可能需要新的架构、新的训练方式,甚至新的计算范式。

第四是研究越来越难。 很多技术领域都会遇到一个问题:越往后,进步越难。早期容易发现的改进被快速利用,后续突破需要更多实验、更大团队、更高成本和更复杂工程。AI 研究也可能如此。模型越大,实验越贵,验证周期越长,架构和训练细节越复杂。继续获得同样幅度的能力提升,可能需要越来越多资源。

第五是抽象壁垒,也就是 AI 能否创造超越人类的新概念。 当前 AI 主要训练在人类产生的数据上,因此它学习到的概念、语言和知识结构,很大程度上来自人类已有抽象。如果 AI 只是在人类概念体系内组合和外推,它是否能真正形成新的科学概念、新的抽象层次和超越人类的理解方式?

第六是人为放缓。 如果 AI 带来严重事故、滥用风险、军事风险、政治冲突、失业冲击、文化反弹或安全担忧,政府和公众可能要求放缓甚至限制前沿 AI 发展。可能表现为更严格的监管、强制评估、事故报告、算力限制、出口管制、责任追究,甚至暂停某些高风险训练和部署。

这些瓶颈到底是硬上限,还是可以被技术绕过的摩擦,目前并不清楚。数据墙可能被合成数据、仿真和自博弈缓解;资源瓶颈可能被更高效算法和硬件缓解;研究变难可能被 AI 研究助手抵消;抽象壁垒可能需要新的互动学习和强化学习范式来突破;人为放缓则可能受到经济利益和国际竞争压力影响。

如何评测超过人类的系统?

论文提出一个很现实的问题: 如果 AI 超过人类,我们该如何评测它?

今天很多 benchmark 本质上以人类水平为参照。比如考试题、编程题、数学题、问答任务、专业知识测试等。一旦 AI 在这些任务上达到或超过顶尖人类水平,评测就会迅速饱和。

这会带来两个后果。一方面,研究者很难继续准确衡量 AI 能力提升。另一方面,社会也很难判断系统到底处在什么能力阶段。

因此, 研究者们呼吁建立面向 AGI 后时代的新评测体系 。 包括多智能体竞争与合作任务、自动生成测试、通用压缩任务、经济生产率等间接指标,以及可以持续更新、不会轻易饱和的评估机制。

预测体系同样需要升级。 不能只依赖专家访谈或主观判断,而要建立更量化的模型,把有效算力增长、算法效率、经济回报、资源投入、AI 研发自动化等因素联系起来,并随新数据不断更新。

安全和治理方面,论文采取了一个明确但很重要的前提:为了聚焦技术路径,研究者们暂时假设 AI 安全和监管能在足够程度上解决。但他们也承认,这绝不是轻松前提。如果高级 AI 不安全、不可控,那么它本身就会成为能力发展的瓶颈,因为无法放心部署到自动化研究、基础设施和社会系统中。

鉴于当前存在太多不确定性,研究者们认为很难精准预测 ASI 何时到来,以及它具体会具备哪些能力。他们反复强调 ASI 仍受物理、计算复杂性、数据、资源、实验时间、现实世界反馈速度等限制。它不是魔法,也不自动意味着能治愈一切疾病、任意改造物质或解决所有社会问题。

参考链接:

1. https://arxiv.org/abs/2606.12683

排版:胡莉花

注:封面/首图由 AI 辅助生成

主题:速度|系统|研究|记忆|人类水平|智能系统