Opus4.8
描述
Opus4.5是0.40,Opus4.7是0.25,Opus4.8是0.00。
文章
唯一被GPT-5.5压过的项目是终端编程(Terminal-Bench2.1),GPT-5.5拿了78.2%,Opus4.8是74.6%。
文章
分类
Opus4.8
在发布Opus4.8的同时,Anthropic再次提到了ClaudeMythos——那个目前只对少数组织开放的、能力更强的模型。
文章
效果
官方评估显示,和前代相比,Opus4.8放任自己所写代码缺陷、却不加说明的概率降低至四分之一,更愿意主动标出不确定性,减少缺乏依据的结论。
文章
其它
Opus4.8正式发布,AI第一次会说「我不确定」了2026年05月29日10:31极客公园ClaudeOpus4.8不是一次跃迁,而是一次聚焦。
文章