澳洲放羊大叔引爆AI编程革命!Claude Code急推goal模式,不干完不许停
澳洲牧羊大叔随手写的三行 bash,11 天内被 OpenAI、Anthropic 和 Hermes 集体收编了。
一觉醒来,Claude Code 又更新!
为了让 Claude 持续工作直到任务完成,Claude Code 最近推出的新功能:/goal 。
你只要设定条件,Claude 不完成任务它绝不罢休!
用过 AI 编程工具的人都懂,这到底多重要!
你给 Agent 下了一个任务,它跑了三个回合,改了两个文件,突然停下来问你「接下来需要我做什么?」
不是,bug 你这还没修完呢啊!
Agent 越来越聪明,写代码越来越快,但「从头到尾把一件事干完」这件事,到 2026 年初都没有一家能做到。
然后, 一位来自澳大利亚的牧羊大叔 Geoffrey Huntley,用三行 bash 解决了。
他把它命名为 Ralph Loop ,致敬《辛普森一家》里那个永远搞不清状况但从不放弃的小孩 Ralph Wiggum。
逻辑极其粗暴,无限循环,反复把同一个 prompt 喂给 Agent。进度写在文件系统和 Git 历史里,上下文满了就开新实例,读文件接着干。
原始,不优雅,但十分有效。
有效到 OpenAI 看见了,Nous Research 看见了,Anthropic 也看见了。
11 天,三家顶级 AI 实验室,不约而同地把这三行 bash 写进了官方产品。
这一刻,所有人都明白了一件事 ——
通用人工智能的临门一脚,可能不是更聪明的模型,而是「把事做完」的模型。
换句话说,AI 编程的核心战场正在从「生成代码」转向「闭环交付」。
4 月 30 日,OpenAI 的 Codex 率先上线 / goal。
Greg Brockman 在 X 上只丢了一句,「Codex 现已内置 Ralph loop++」。
一周后,Hermes Agent 跟上。又过 4 天,Claude Code 也上了。
11 天。三家。同一个命令。同一个功能。
但实现路径,差了十万八千里。
Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。
OpenAI 是三家里最先出手的,方案也最简洁。
在 Codex 里,/goal 是一个持久化的工作流对象,存在本地的 app-server 状态层里。
关掉终端、合上笔记本、甚至重启系统,目标都不会丢。下次打开 Codex,自动接上。
模型通过结构化的 update_goal 工具汇报进度状态,token 预算耗尽时触发「软着陆」而非硬停。
有人用这个功能连续跑了 14 个小时,中间暂停 5 小时去睡觉,回来 Codex 从断点续跑,把一个设备驱动项目做完了。
工程化,干净,但克制。
Hermes Agent 的野心最大。
在这里,/goal 只是冰山一角。真正的重头戏是多智能体看板系统,Hermes 把「让 AI 把活干完」从单 Agent 问题升级成了团队协作问题。
看板的底层是本地 SQLite,持久化存储,跨重启不丢。
你在上面创建一个任务卡片,Hermes 会直接把它拆成多个子任务,分配给不同的 Agent worker。每个 worker 是一个独立的 OS 进程,有自己的身份、模型配置和工作目录。
看板和 / goal 是两套互补的系统。/goal 管的是单个 Agent 的目标锁定(Ralph loop),看板管的是多个 Agent 之间的任务调度。一个纵向深入,一个横向铺开。
最后,是五层防烂尾机制。
第一层,心跳检测。 每个 worker 定期向看板报到,证明自己还活着。
第二层,僵尸回收。 worker 超时没响应?系统自动判定死亡,回收它手上的任务重新分配。macOS 上还有专门的达尔文僵尸检测逻辑。
第三层,退出拦截。 worker 没完成任务就退出了?系统自动把它标记为 blocked,不让它再接新活,防止「摸鱼型 Agent」反复领任务又不做。
第四层,幻觉拦截。 这是最狠的一层。AI 说「我做完了」不算数,系统会验证它实际产出的代码是否真的落盘了。Agent 说自己创建了一个文件但实际上没有?抓住,回滚,重来。
第五层,重试预算。 每个任务有独立的 max_retries,最多重试 N 次,超过就上报人类。绝对不会无限循环到死机。
主题:AI编程