InfoNCE损失与对比学习的理论基础

Question

InfoNCE (Noise Contrastive Estimation) 损失是对比学习中的核心损失函数。请解释其公式推导、与互信息的关系(CPC论文)，以及在SimCLR/MoCo中的具体应用形式。。AI 面试题。DeepMind 面试题

编译有声 · Accepted Answer

InfoNCE损失源自CPC(Contrastive Predictive Coding)论文，核心目标是最大化互信息的下界。

公式形式： L_InfoNCE = -E[log(f_k(x_{t+k}, c_t) / Σ_{x_j∈X} f_k(x_j, c_t))] 其中f_k通常是exp(score)形式，c_t是上下文表示。

与互信息的关系： InfoNCE是互信息I(x; c)的下界估计器，它通过对比目标样本与负样本来学习表示，避免了直接建模高维数据的密度。更精确地说：I(x; c) ≥ log(K) - L_InfoNCE，其中K是负样本数量。

在SimCLR中的应用：

在MoCo中的应用：

InfoNCE对比交叉熵：本质是(N+1)类分类，正样本对应正确类别，其余为负。

回答