Diffusion Model前向过程与反向过程

Question

扩散模型通过前向扩散和反向去噪实现高质量生成。请详细解释前向过程（加噪）、反向过程（去噪）的数学原理，以及它们与VAE、GAN的关系。。AI 面试题。UC Berkeley 面试题

小字辈 · Accepted Answer

扩散模型（Diffusion Model）由Sohl-Dickstein等人于2015年提出，经Ho等人（DDPM, 2020）改进后成为生成模型的主流方向。 前向过程（扩散过程）： 逐步向真实数据x_0添加高斯噪声，经过T步后近似为标准正态分布。 q(x_t|x_{t-1}) = N(x_t; √(1-β_t)x_{t-1}, β_tI) 其中β_t是预定义的噪声调度（线性、余弦等），随时间递增。 通过重参数化技巧，任意时刻的x_t可直接从x_0计算： x_t = √(α̅_t)x_0 + √(1-α̅_t)ε，其中α_t=1-β_t，α̅_t=Π_{s=1}^t α_s，ε~N(0,I) 前向过程无参数，是马尔可夫链。 反向过程（去噪过程）： 目标是学习逆分布p_θ(x_{t-1}|x_t)，从噪声逐步恢复数据。 参数化为高斯分布：p_θ(x_{t-1}|x_t) = N(x_{t-1}; μ_θ(x_t,t), Σ_θ(x_t,t)) 训练网络ε_θ(x_t,t)预测添加的噪声ε： L_simple = E_{t,x_0,ε}[||ε - ε_θ(√(α̅_t)x_0 + √(...

Diffusion Model前向过程与反向过程

回答

小字辈