编程智能体
分类
生成
为了验证FM-Agent的实战能力,研究团队对四款由ClaudeOpus、GPTCodex等顶尖编程智能体生成的大规模系统进行了正确性推理。
文章
陈海波指出,未来若想进一步提升编程智能体生成代码的可靠性,一个关键方向是对训练数据进行更严格的筛选,尽可能使用正确无误的代码来训练智能体,这或许也是未来FM-Agent的应用场景之一。
文章
在Anthropic、NVIDIA等用顶尖编程智能体生成的多个大规模系统(单个系统规模高达14.3万行)中,FM-Agent成功找到了522个隐藏bug。
文章