Denoising Diffusion Probabilistic Models (DDPM)

核心结论

扩散概率模型是受非平衡热力学启发的隐变量模型,通过训练参数化马尔可夫链来逆转逐步添加噪声的扩散过程。DDPM 首次证明扩散模型可以生成高质量图像:CIFAR-10 上 Inception score 9.46、FID 3.17,256x256 LSUN 上与 ProgressiveGAN 相当的样本质量。

关键方法

  1. 前向过程(扩散过程):固定的马尔可夫链,按方差调度 逐步向数据添加高斯噪声,直到信号被完全破坏。关键性质:任意时间步 可从 以闭式形式采样:

  2. 反向过程(去噪过程):学习参数化的高斯转移 ,从纯噪声逐步恢复到数据分布。

  3. 简化训练目标,等同于对多噪声尺度的去噪分数匹配(denoising score matching)。

  4. 与 Langevin 动力学的等价性:DDPM 的采样过程可解释为在多个噪声水平上进行退火 Langevin 动力学。

与现有 Wiki 的关系

后续问题

  • 采样速度慢(需要 1000 步),后来被 DDIM、flow matching、蒸馏等方法加速。
  • DDPM 在像素空间操作,Latent Diffusion Models (LDM) 将其推广至潜在空间。