登录

AI自我复制能力获研究证实,但安全专家称其现实威胁被夸大


速读:帕利塞德研究人员在由多台计算机联网组成的受控环境中测试了多款人工智能模型。 “帕利塞德是首个在学术论文中完整、系统地记录这一过程的机构。
2026年05月07日 17:43

IT之家 5 月 7 日消息,据 TheGuardian 报道,一项新研究发现,目前的人工智能系统已能够独立将自身复制到其他计算机上。

在末日场景中,这意味着一旦超级人工智能脱离人类管控,就会通过互联网在全球范围内自我散播副本,躲避信息技术人员的紧急关停,继而继续谋划掌控世界,或是大肆铺设太阳能板、改造全球环境。

据IT之家了解,总部位于伯克利的帕利塞德(Palisade)研究机构开展了此项研究,该机构负责人杰弗里・拉迪什表示:“我们正迅速逼近一个临界点:届时一旦人工智能失控,将无人能够将其关停,因为它可以自行导出模型权重,并把自身副本复制到全球数千台计算机中。”

近几个月来,越来越多令人不安的人工智能能力被曝光,这项研究便是其中又一例证。今年 3 月,阿里巴巴的研究人员称,发现其研发的人工智能系统“罗马”突破了自身运行环境,接入外部系统进行加密货币挖矿。

而在今年 2 月,一个号称纯人工智能运营的社交平台 Moltbook 短暂掀起一波热潮。该平台似乎展现出人工智能智能体自主创立宗教、密谋反抗人类管理者的行为,不过实际情况仅有部分属实。

和诸多此类技术进展一样,帕利塞德机构的研究发现也存在局限性。此外,专家表示, 其测试的人工智能系统很难在现实环境中悄无声息地完成同类操作。

网络攻防安全领域专家杰米森・奥赖利指出:“很多时候,他们的测试环境就像软果冻一样毫无防护。”他补充道:“这并不否认该项研究的价值,但也意味着,在具备中等监控水平的真实企业环境中,实际情况远没有研究结果看上去那般骇人。”

帕利塞德研究人员在由多台计算机联网组成的受控环境中测试了多款人工智能模型。 研究人员向模型下达指令,要求其寻找并利用系统漏洞,借此将自身从一台计算机复制到另一台计算机 。结果显示,这些模型能够完成该操作,但并非每次尝试都能成功。

奥赖利表示,虽然不少计算机病毒早已具备自我复制、感染新设备的能力,但这很可能是首次有研究证明, 人工智能模型可主动利用系统漏洞,将自身复制至新服务器。

“恶意软件实现自我传播复制已有数十年历史,只是据我所知,此前从未有本地大语言模型在真实网络环境中做到这一点。”

他还补充道,从技术层面来讲,帕利塞德机构记录的这类能力,数月前就已具备实现条件。

“帕利塞德是首个在学术论文中完整、系统地记录这一过程的机构。这项研究值得肯定,但并非他们率先实现了这项技术突破,只是率先整理发表了相关研究成果。”

人工智能模型在测试环境中自我复制至其他系统,和末日场景里的失控作乱完全是两回事。若想在现实世界中肆意扩散,人工智能还需要克服重重阻碍。

首要难题是,当下人工智能模型体量庞大, 多数情况下,其自我复制的过程极易被察觉,根本无法隐蔽进行。

奥赖利说:“试想一下,每次入侵一台新主机,都要向企业网络传输 100GB 的数据,会产生多大的流量异常。对于专业网络防御人员来说,这就好比有人拖着铁链重球,大摇大摆走进精品瓷器店,极其显眼。”

网络安全独立专家米哈乌・沃兹尼亚克与奥赖利均认为,帕利塞德所用的测试环境为专门定制,其中人为设置的漏洞,远比银行、企业内网等现实网络中的漏洞更容易被利用。

沃兹尼亚克表示:“能够利用软件已知漏洞实现自我复制的计算机恶意病毒,已经存在数十年之久。”

他评价这项研究“颇具看点”,但也直言:“作为一名信息安全从业者,这篇论文会让我夜不能寐吗?完全不会。”

主题:人工智能|帕利塞德|人工智能模型|帕利塞德机构