登录

人类药丸?Anthropic为什么要搞AI不扩散条约


速读:在文章最后,Anthropic还呼吁大家别卷了,应该搞一套监督大家的机制。
2026年06月07日 13:1

绷不住了,Anthropic 居然出来号召大伙儿把手头的 AI 开发停一停。

昨天,他们直接发了篇文章,奉劝大伙儿小心 AI,因为以后,它可能自己就能开发自己,不需要人了。。。

 看到这个消息,世超直接摊在桌子上,仿佛看到核弹爆炸 ( bushi。。。

在文章最后,Anthropic 还呼吁大家别卷了,应该搞一套监督大家的机制。

这套机制应该能让这些牛逼的公司之间互相确认,确认所有人都躺平,而不是在暗地里偷偷卷着研究 AI。

这个说法可谓是一石激起千层浪,帖子发出来不过半天,浏览量就干带到了 1000 多万。

 世超也连忙去 A 社的官网拜读了一下这份报告,但是看完就发现有点不对味了。

简单来说,它的确号召慢点开发了,但想让大家慢点开发不太可能。。。

咱们把它从头来给大家捋捋。

这篇文章的标题是 “ When AI builds itself ”,当 AI 自我迭代时。

简单来说,Anthropic 认为 AI 现在已经变的越来越牛逼,牛逼到足以自己给自己做改正,自己给自己做开发。

2025 年 2 月的时候,他们的库里 9 成以上的代码还是靠工程师手搓的,但当 Claude Code 发布以后,截止到今年 5 月,这个比例已经下降到了 2 成。

甚至有 Anthropic 的员工直接利索承认,说自己已经快五个月没写过代码了。

AI 写的代码除了数量不断变多之外,质量也变得越来越高。

 下面这张图展示了 AI 面对四种不同难度任务时的完成率,可以看到这几个月以来,随着模型能力的不断提高, AI 完成各种难度任务的成功率也在不断变高。

即使是那种最难的,没有标准答案的开放性问题,Claude 也有 70% 左右的概率能把它做完。

而这个概率在去年九月,还是 20% 不到。

从黄色到蓝色分别是:特别简单的任务、常规任务、实质性任务、开放式问题

除此之外,Anthropic 内部的很多人都表示,现在,人类和 Claude 敲的代码,质量上还是五五开,但一年,只需要一年后,大局就会被彻底逆转,Claude 写出来的代码质量将全面超越人类。

莫非,人类真药丸?

对此,Anthropic 表示我特喵的也不知道,他们干脆给人类未来规划了三种结局。

第一种结局是无事发生,假设因为种种原因,今天的 AI 已经发展到顶端了,因为什么缺卡缺电,缺水缺算法啥的原因,AI 的未来已经嗝屁了。

 当然,Anthropic 认为这种未来不太可能发生。

第二种假设则是认为 AI 的发展会继续量变,但累积不到质变的程度,人跟 AI 一起,造出安全可信的系统。

此时 AI 会承担大部分重复工作,但审查和指挥权仍然握在人的手里,只不过是角色的转变。看起来属于是个没啥大问题的好结局。

 第三种就是开头所担心的那种了,AI 掌握了足够强大的创造力,实现了完全的自动化迭代,

模型能力的提升中,算力成了唯一因素,人类或将不再重要。

在这个过程中,AI 可能会变得彻底听话来帮人类好好干活,也可能会摆脱人类的限制彻底失控。再往后,就没人能够预测了。

所以才有了后面的呼吁,呼吁大家搞一套能互相监督,全员躺平的探索机制,让全世界参与到这件事儿中,来确保大家能随时给 AI 研究来踩一脚刹车。

咋说呢,世超看完的第一时间其实会感觉它说的好像有点道理,但是转念一想就感觉不对啊。

 Anthropic 虽然给大家说了三种可能的未来,但实际上,一是被他们否定的过去,二是咱正经历的现在,而三,才是 A 社真正表示担忧的未来。与其说是三种可能,倒不如说是层层铺垫。

而且整篇文章看下来,很多数据都是他自己定义、自己采集、自己解释,甚至自己评价的。既是考生又是考官,效果上么,多少得打点折扣。

再者,这 AI 研发是你说暂停就能暂停的嘛?这玩意又不是核能,搞个 “ 不扩散 ” 条约就能大伙儿一起来监管了。

AI 这种有个数据中心就能干的活,根本没啥办法监管吧?

 总不能让每家公司都互相之间开放所有的数据区,让大家互相之间能看到自己在拿显卡干啥吧?

真要搞这么透明,建议 Anthropic 先学习一下怎么开源模型?

不然这种话说出来属实是没啥说服力。

而且 Anthropic 这次提建议的时间还很微妙,这家公司的作风可以说一直都是颇有争议。

做出牛逼模型的公司很多,但是风评能那么始终如一的就只有 A 社一家了。

打开 A 社官网,看公司介绍时,你能感觉到它几乎每个字都在向你强调安全。

你能翻到他们从产品到应用的全套安全管理措施,甚至还有给 Claude 单独撰写的安全宪法。

但是这些安全措施真有用嘛?只能说现实情况要复杂的多。

前几年的时候,A 社就承诺过,说除非公司提前确保了安全措施准备妥当,否则不会开始训练新模型。

 但很快他们就撤回了这个承诺。。。

在今年 2 月,面对《时代》周刊的采访时,他们的首席科学家表示,这种单方面的承诺并不合理,公司可能考虑放弃。

说白了,安全和发展这俩词,在硅谷就像是个箩筐,哪里需要哪里装。

当理想主义碰上商业竞争,刺刀见红,所谓的安全往往也得给季度财报和市场份额让路。

比如之前疯狂渲染焦虑的 OpenAI 奥特曼,最近就悄悄改了口风,之前还说 AI 会取代大部分工作,但最近就改了说法,承认自己之前的判断有点草率了。

英伟达的老黄就更激进了,他在采访里表示,现在的很多言论极其科幻,戏剧化且毫无帮助,不知道为什么有的 CEO 会想扮演上帝,夸大威胁来吓唬大伙儿。

咱虽然不知道他在点谁吧,但也能看出,即使都在 AI 最前沿,大家的看法也是不尽相同的。

正所谓屁股决定脑袋,看他们的观点还得看他们所处的情况。

实际上,最近这一个俩个月,Anthropic 的日子过的算不上特别好。

他们 3 号刚推出的 Claude 4.8 略显拉垮,再也没了曾经的断档领先之感。

而隔壁的 OpenAI 更是全军出击,在编程和图像生成领域直接两开花,而且奥特曼天天在网上花式找理由重置 Codex 的额度,直接成了各路开发者心中的超级大善人。

而 Anthropic 这边,为了能搞到更多的显卡,更多的算力来做出更强的模型,直接开始选择了提交 IPO 申请,开始做起了融资上市的准备。

一来一回的,因素越叠越多,就让这号召看起来也就没那么有力了。

看到这,世超想起来今年去 Google I/O 的事了,当时 DeepMind 的 CEO,哈萨比斯在现场告诉大家:

现在我们正站在 AI 奇点时代的山麓。

 结果咱还没往上爬两步呢,A 社就在前面把头扭过来,告诉你山上有风险,攀登需谨慎,为了大家的安全,我们还是一起都别爬了吧。

倒也有点道理,毕竟这些大厂的顶尖研究员肯定能看到更多东西。

但多少像是美丽而无用的废话。

因为众所周知,只要山在那儿,人是一定要登上去看看的。

责任编辑:若风

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

陌陌母公司挚文季报图解:营收24亿净利降19% 唐岩刚获派息超8000万

风口上的AI短剧人,如履薄冰

“不好看就退票”服务,能救电影院吗?

江苏一地惊现“巨型老鼠”!系外来入侵物种海狸鼠、危害甚大!

重庆市科学技术局公布科研项目终止

2026 年全国高考今日开考,多地启用 AI 智能巡查系统严防考试作弊

折扣牛广告语被指阴阳胖东来 创始人回应:放上去三年了 做不到不能逼我做到

2026年全国统一高考今天开考:新增AI监考员、智能眼镜带入即作弊

国内一特斯拉开FSD在挂壁公路跑山 马斯克转发后播放量破3千万

中国足球小将意大利七战全胜!董路:婉拒了很多友商合作 只认比亚迪

“马来西亚造”零跑汽车来了,Stellantis 当地工厂将投产 C10、B10

今日芒种:仲夏开始,收获可期

千帆星座迎来里程碑!极轨12组卫星成功发射:在轨数量增至200颗

红旗首款硬派越野正式命名为“红旗 G919”

少年改装电动车时速飙到103公里身亡 家长向修理店等索赔110万引热议:官方判了

黄仁勋与韩国三名商界大佬聚会吃辣椒 学紫苏叶包肉 LG集团会长负责烤肉

模组厂商谈长鑫 DDR5 内存:供应端有优势,但价格并不比三大原厂明显便宜

小米寻天SUV最新外观渲染图流出:环形尾灯+半隐藏门把手

日系车中国表现越来越差!丰田5月在华销量继续猛降 同比下滑31.7%

我国正测试车载核反应堆:运行数十年无需补燃料!

“马来西亚造”零跑汽车来了,Stellantis 当地工厂将投产 C10、B10

2026年第一批弄丢身份证的考生出现了:3名学生紧急求助

时隔9年!iPhone Ultra重回指纹识别:祖传Face ID惨遭抛弃

主题:直接|大家|代码