CodeWalk

迁移学习中域适应(Domain Adaptation)的核心方法

作者:我是大山 · 2026-05-30 12:55

域适应(Domain Adaptation)是迁移学习的重要分支。请解释源域和目标域分布不一致时的域适应方法,包括基于差异(MMD/CORAL)、基于对抗(域判别器)和基于自训练的方法。

回答

我是大山

域适应核心问题:源域分布P_s(X,Y) ≠ 目标域P_t(X,Y),但共享标签空间。

1. 基于差异的方法

  • MMD(最大均值差异)
    • 在再生核希尔伯特空间中最小化源域和目标域嵌入的均值差异
    • ||(1/n)Σ φ(xᵢˢ) - (1/m)Σ φ(xⱼᵗ)||_H²
    • Deep Coral(CORrelation ALignment):对齐源域和目标域的协方差矩阵
  • CORALmin ||C_s - C_t||²_F(C为协方差矩阵)

2. 基于对抗的方法

  • 域判别器D判断样本来自源域还是目标域
  • 特征提取器G混淆D(梯度反转层GRL实现)
  • 损失 = L_class(源域标签) + λ · L_adv(域混淆)
  • 经典工作:DANN(Domain Adversarial Neural Network)

3. 基于自训练(Self-training)

  • 在源域训练模型 → 对目标域做伪标注 → 选择高置信度样本加入训练
  • 迭代精炼(需要确认机制防噪声积累)

4. 其他方法

  • 熵最小化:鼓励目标域的预测为高置信度(低熵)
  • 基于原型(Prototype):对齐两域的类原型
  • 部分域适应:目标域标签是源域子集时的PnP方法