登录

Fable 5刚被封杀,OpenRouter用「多模型协作」搞出了「平替天团」


速读:该平台宣布推出了世界上最聪明的“复合模型”FusionAPI,能用模型组合的方式,复刻ClaudeFable5的智力水平。 当世界上最聪明的AI被强制拔掉网线,我们能否有另一套方案,用上同样聪明的智力?
2026年06月22日 18:

最强 AI 突遭封杀下架,多模型协作能否填补空白?

    作者丨 高允毅

    编辑丨 马晓宁

当世界上最聪明的 AI 被强制拔掉网线,我们能否有另一套方案,用上同样聪明的智力?

2026年6月14日,全球最大的大模型 API 聚合平台OpenRouter,在 X 上发布一条推文,短短几天,吸引近600万人围观。

该平台宣布推出了世界上最聪明的“复合模型”Fusion API ,能用模型组合的方式,复刻 Claude Fable 5 的智力水平。 所谓“复合模型”,不是靠一个 AI 自己埋头苦干,而是让好多 AI 模型一块儿配合,做出一份最好的答案,再交给用户,对外统一用一个API 入口。

Fusion API 的横空出世,踩中了一个微妙的时机。 就在同一周,Anthropic 刚发布了 史上最强模型Claude Fable 5。该模型以强悍的长周期智能体推理出圈,能将企业原本需要数月的代码迁移工作缩短至一天。

然而,发布仅 3 天,美国政府便签发了紧急出口管制令。Anthropic 官方被迫切断全球网络,暂停该模型的 API 访问,原本跃跃欲试的开发者们,瞬间哀嚎遍野。

OpenRouter这条推文,正是精准地踩在了市场真空期的最痛点,同时给出一套新方案:与其押注单一模型,不如让一群模型"开会"。

它公布了一组惊人数据:在深度研究中,由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 组成的“模型专家团”,融合后不仅轻松击败了 Opus 4.8,其综合智力与被禁的 Fable 5 相比,得分误差不到 1%。(注:Claude Fable 5 因内容过滤仅完成 DRACO 100 道任务中的 93 道,中端模型组合完整跑完全部 100 题,二者评测样本存在差异。)

而实现这一切的调用成本,仅仅是 Fable 5 的一半。

01

Fusion API背后的“多模型拼盘”

OpenRouter 将 Fusion 冠以“市场上最智能复合模型”的称号,确实带有营销色彩。

从底层来看,它的原理是将“多模型并行、裁判海选、终审合成”三步走流程化、标准化的工程解法。

第一步: 专家团模型的“头脑风暴” 首先,用户的提示词一经触发,系统会将其同时派发给最多8 个“专家模型”,包括Fable 5、GPT-5.5、Gemini 3.1 Pro以及国产好评的GLM-5.2、Kimi K2.6等众多模型。 值得注意的是,为了防止模型“闭门造车”,系统在底层为所有专家统一配备了实时联网搜索与网页内容抓取工具。这意味着,专家模型们在交卷前,可以查阅全网最新的参考资料。这种实时交互,让 Fusion 彻底区别于简单的“少数服从多数”的盲目投票。

第二步: 裁判模型来挑刺 这是 Fusion 的灵魂所在。一个被指定当“裁判”的模型,会把所有专家的回答看一遍,然后写出一份细致的分析报告。它会特别严格地把这些回答里的意见一致的地方、 互相矛盾的地方、特别出彩的个人见解,还有大家都没注意到的盲点,一条条都揪出来。

第三步: 主笔模型最后定稿 裁判的报告出来之后, 一个主笔模型就上场了。它会吸收所有专家的优点,排除掉个别模型瞎编的东西,最后产出一份没有技术矛盾、逻辑顺畅的高质量回答。

在这里,OpenRouter 展现了一个很聪明的工程设计:为了避免多次调用导致系统延迟全面崩塌,它巧妙地让“裁判”与“主笔”两件事,放在同一个超级大模型的一次思考里一口气完成。那些复杂的开会、辩论、审计、整合,全都在后台悄悄做完了,用户最终只是一个干干净净的结果。

Fusion的这套思路,其实在学术界早有探索。2024年,Together AI 团队正式提出的一种多模型协同技术范式,又称MoA。

它的核心逻辑是“三个臭皮匠,顶个诸葛亮”,不再死磕一个超级贵、超级大的单个模型,而是分好几层,让一组便宜些的模型同时想,再让一个高级模型当评委,最后出来的答案,反而比任何单个模型都强。 在 MoA 正式提出之前,学界长期争论一个猜想:把好多比较弱的模型凑在一起,

能不能出现比最强模型还好的集体智慧? 于是就有了这种让 AI 组团辩论的方法。

从很早将工具与模型缝合的复合 AI 系统,到 2023 年把多个模型的输出直接糅合的工具,再到 2024 年谷歌让多个智能体像开会一样辩论的论文,学术界早已论证了同一件事:组合拳的输出远比单打独斗更具确定性。

Fusion 的核心价值在于它是行业首个将完整 “多模型合议” 流程标准化、托管化、开箱即用的商用 API 产品。 它把一整套复杂架构变成了一项可以托管的、即插即用的 API,无需任何基础设施。开发者不用自己再去搭服务器、调参数。只要改一行代码,就能直接指挥一整个专家团。

在真正落地的过程里,OpenRouter 表现得很务实,主要体现在两个机制上:

第一, 给用户完全透明的控制权:你可以自己决定让哪些模型当评审,让哪个模型当最后的主裁判。如果国外的服务不好用,你还能让咱们的国产大模型挑大梁。甚至可以给不同模型分配重要程度,让整个合作网完全听你指挥。

第二, 极具灵巧性的“动态智能门控”:这个功能像一个工具箱里的小插件。平时问点简单的问题,系统会自动识别,直接让一个便宜的模型秒回,根本不启动复杂的开会流程。只有碰到特别难、需要深思熟虑的问题时,才会把一群模型叫起来,一起商量。

02

在DRACO基准测试中的“聪明”表现

Fusion这套“组队干活”的聪明效果,在 Perplexity AI 发布的权威深度研究基准测试 DRACO 中得到了直接印证。

作为一个专门测试 AI 深度研究能力的硬核考场,DRACO 包含了法律、金融、医学等 10 个领域的 100 道复杂任务。

它的规则极其严苛,采用“负分淘汰制”,每道题约有39 个判定标准进行全方位“挑刺”,回答错误或硬凑字数,都会被扣分。为了防止运气成分,每个回答要找三个不同的裁判,各看一次,最后取一个稳定的平均分。

主题:Fable5|智力