ICML 2026｜从「鉴伪」到「修复」，AI图像取证进入闭环时代

速读：围绕这一问题，来自北京大学等机构的研究者提出了GenShield：一个统一的自回归框架，将AI生成图像检测与图像伪影修复结合到同一个闭环中，实现从“诊断”到“修复”的一体化建模。现有AI生成图像检测方法大多关注“判断一张图是真还是假”，或者进一步指出图中可疑区域。

2026年06月21日 09:58

随着生成模型的快速发展，AI 生成图像正变得越来越逼真，也让图像真实性判断变得愈发重要：一张图片究竟是由相机真实拍摄，还是由模型合成生成？

与此同时，一个与真实性判断密切相关、也更加细粒度的问题逐渐受到关注：对于 AI 生成图像中可能存在的不自然伪影，我们是否不仅能够将其定位和解释，还能进一步对其进行修复，使图像恢复为更加真实、自然的视觉外观？

围绕这一问题，来自北京大学等机构的研究者提出了 GenShield：一个统一的自回归框架，将 AI 生成图像检测与图像伪影修复结合到同一个闭环中，实现从 “诊断” 到 “修复” 的一体化建模。

论文标题：GenShield: Unified Detection and Artifact Correction for AI-Generated Images

论文链接：https://arxiv.org/abs/2605.16122

代码链接：https://github.com/zhipeixu/GenShield

从 “检测真假” 到 “诊断并修复”

现有 AI 生成图像检测方法大多关注 “判断一张图是真还是假”，或者进一步指出图中可疑区域。然而，在很多实际场景中，仅仅检测出异常还不够：如果图像中存在明显的结构错误、物理不一致或局部扭曲，我们还希望模型能够给出解释，并进一步将其修复为更自然、更接近真实拍摄的图像。

GenShield 的核心思想是：检测与修复并不是两个孤立任务，而是可以相互促进的。

一方面，检测任务能够帮助模型发现图像中的异常区域，并生成更细粒度的诊断信息；另一方面，修复任务要求模型学习真实图像的生成先验，从而反过来提升其对细微伪影的敏感性。

因此，我们将两者统一到一个框架中，让模型同时具备：

1. 可解释的 AI 生成图像检测能力

模型不仅输出 real/fake 判断，还会生成图像内容描述和伪影分析依据。

2. 可控的图像伪影修复能力

模型能够根据诊断信息对图像中的异常区域进行修复，尽量保持主体语义和整体结构不变。

3. 多步 Visual CoT 自修复能力

模型可以像 “先检查、再修改、再复查” 一样，进行多轮诊断与修复，并在图像已经自然时自动停止。

GenShield-Set：面向检测与修复的统一数据集

为了训练这一统一框架，我们进一步构建了 GenShield-Set，包含两个互补部分：

GenShield-Set-Detect 用于训练可解释检测能力，包含真实图像和 AI 生成图像，以及结构化的检测答案，包括真假判断、图像描述和判断依据。

GenShield-Set-Correct 用于训练伪影修复能力。我们基于带有异常标注的 AI 生成图像，构造了大规模 “异常图像 — 修复图像” 配对数据，并通过专家筛选保证修复质量，最终得到超过 10K 对高质量修复样本。