编程智能体

为了验证FM-Agent的实战能力，研究团队对四款由ClaudeOpus、GPTCodex等顶尖编程智能体生成的大规模系统进行了正确性推理。

文章

陈海波指出，未来若想进一步提升编程智能体生成代码的可靠性，一个关键方向是对训练数据进行更严格的筛选，尽可能使用正确无误的代码来训练智能体，这或许也是未来FM-Agent的应用场景之一。

文章

在Anthropic、NVIDIA等用顶尖编程智能体生成的多个大规模系统（单个系统规模高达14.3万行）中，FM-Agent成功找到了522个隐藏bug。

文章