条件GAN与CGAN的标签引导生成

Question

条件GAN（CGAN）通过向生成器和判别器输入条件信息实现可控生成。请解释其架构设计、条件注入方式和在图像生成中的应用。。AI 面试题。Université de Montréal 面试题

小字辈 · Accepted Answer

条件GAN（Conditional GAN, CGAN）由Mirza等人于2014年提出，通过在GAN中引入条件变量y（如类别标签、文本描述或图像），实现了可控的条件化生成。 架构设计： 将条件信息y分别注入生成器和判别器： 条件生成器G(z|y)： 输入：随机噪声z + 条件y。 将z和y拼接（Concatenate）后送入生成器网络。 在DCGAN/CGAN实践中，y通常先通过嵌入层（Embedding）转换为向量，再与z拼接。 输出：基于条件y的生成样本x_fake = G(z|y)。 条件判别器D(x|y)： 输入：图像x（真实或生成）+ 条件y。 两种主流注入方式： 拼接方式：先将图像x通过若干层卷积提取特征，在靠近输出的全连接层与y拼接。 投影方式（Projection Discriminator，cGANs with Projection）：将y通过嵌入层转换为向量，与图像特征做内积后加到判别器输出中，效果更好。 输出：D(x|y) ∈ [0,1]，表示x在条件y下是真实图像的概率。 损失函数（原始CGAN对抗损失）： min_G max_D V(D,G) = E_{x...

条件GAN与CGAN的标签引导生成

回答

小字辈