模型

今天的diffusion模型已经不缺生成能力，缺的是更稳定、更可控、也更符合真实使用过程的生成机制。

文章

换句话说，在模型已经很强的情况下，仍然能够在“更真实”和“更丰富”之间取得更好的平衡，这一点本身就说明问题不在模型能力，而在guidance机制。

文章

进一步在像素空间任务中，原模型已经可以达到FID1.58，在强baseline的帮助下下降到1.04，而加入C²FG

文章

上交大xvivo团队：一个简单改动，让diffusion全面提升丨CVPR20262026年04月22日15:04雷锋网很多人第一次觉得图像生成模型已经足够强，往往是在它能快速画出一张看上去不错的图的时候。

文章

像从1.80降到1.51这样的提升，如果放在普通模型上已经很明显，而出现在本来就接近极限的强模型上，就更能说明剩余误差主要不是模型能力不够，而是guidance的作用方式还不够合理。

文章