ICML 2026|从「鉴伪」到「修复」,AI图像取证进入闭环时代
随着生成模型的快速发展,AI 生成图像正变得越来越逼真,也让图像真实性判断变得愈发重要:一张图片究竟是由相机真实拍摄,还是由模型合成生成?
与此同时,一个与真实性判断密切相关、也更加细粒度的问题逐渐受到关注:对于 AI 生成图像中可能存在的不自然伪影,我们是否不仅能够将其定位和解释,还能进一步对其进行修复,使图像恢复为更加真实、自然的视觉外观?
围绕这一问题, 来自北京大学等机构的研究者提出了 GenShield:一个统一的自回归框架 ,将 AI 生成图像检测 与 图像伪影修复 结合到同一个闭环中,实现从 “诊断” 到 “修复” 的一体化建模。
论文标题:GenShield: Unified Detection and Artifact Correction for AI-Generated Images
论文链接:https://arxiv.org/abs/2605.16122
代码链接:https://github.com/zhipeixu/GenShield
从 “检测真假” 到 “诊断并修复”
现有 AI 生成图像检测方法大多关注 “判断一张图是真还是假”,或者进一步指出图中可疑区域。然而,在很多实际场景中,仅仅检测出异常还不够:如果图像中存在明显的结构错误、物理不一致或局部扭曲,我们还希望模型能够给出解释,并进一步将其修复为更自然、更接近真实拍摄的图像。
GenShield 的核心思想是:检测与修复并不是两个孤立任务,而是可以相互促进的。
一方面,检测任务能够帮助模型发现图像中的异常区域,并生成更细粒度的诊断信息;另一方面,修复任务要求模型学习真实图像的生成先验,从而反过来提升其对细微伪影的敏感性。
因此,我们将两者统一到一个框架中,让模型同时具备:
1. 可解释的 AI 生成图像检测能力
模型不仅输出 real/fake 判断,还会生成图像内容描述和伪影分析依据。
2. 可控的图像伪影修复能力
模型能够根据诊断信息对图像中的异常区域进行修复,尽量保持主体语义和整体结构不变。
3. 多步 Visual CoT 自修复能力
模型可以像 “先检查、再修改、再复查” 一样,进行多轮诊断与修复,并在图像已经自然时自动停止。
GenShield-Set:面向检测与修复的统一数据集
为了训练这一统一框架,我们进一步构建了 GenShield-Set,包含两个互补部分:
GenShield-Set-Detect 用于训练可解释检测能力,包含真实图像和 AI 生成图像,以及结构化的检测答案,包括真假判断、图像描述和判断依据。
GenShield-Set-Correct 用于训练伪影修复能力。我们基于带有异常标注的 AI 生成图像,构造了大规模 “异常图像 — 修复图像” 配对数据,并通过专家筛选保证修复质量,最终得到超过 10K 对高质量修复样本。
主题:图像|模型|GenShield-Set