登录

模型


分类

已经

今天的diffusion模型已经不缺生成能力,缺的是更稳定、更可控、也更符合真实使用过程的生成机制。
文章

换句话说,在模型已经很强的情况下,仍然能够在“更真实”和“更丰富”之间取得更好的平衡,这一点本身就说明问题不在模型能力,而在guidance机制。
文章

进一步在像素空间任务中,原模型已经可以达到FID1.58,在强baseline的帮助下下降到1.04,而加入C²FG
文章

上交大xvivo团队:一个简单改动,让diffusion全面提升丨CVPR20262026年04月22日15:04雷锋网很多人第一次觉得图像生成模型已经足够强,往往是在它能快速画出一张看上去不错的图的时候。
文章

影响

像从1.80降到1.51这样的提升,如果放在普通模型上已经很明显,而出现在本来就接近极限的强模型上,就更能说明剩余误差主要不是模型能力不够,而是guidance的作用方式还不够合理。
文章