半监督学习中的伪标签(Pseudo Label)策略

Question

伪标签（Pseudo Label）是半监督学习中最直观的方法。请解释伪标签的工作原理（使用模型对无标注数据的预测概率作为伪标签）、置信度阈值策略、以及如何处理伪标签中的噪声（confirmation bias问题）。。AI 面试题

屠龙少年 · Accepted Answer

伪标签（Pseudo Label）原理： 用标注数据训练模型 用训练好的模型对无标注数据做预测 将高置信度的预测结果作为"伪标签" 将伪标签数据与标注数据一起训练 置信度阈值策略： $$ 	ext{pseudo-label} = \begin{cases} \arg\max(p) & 	ext{if } \max(p) > 	au \ 	ext{丢弃} & 	ext{otherwise} \end{cases} $$ τ通常取0.95-0.99（高置信度确保质量） 每个类别可设独立阈值（解决类别不平衡） 也可用Top-K策略（对每个类别取Top K个样本） Confirmation Bias（确认偏差）问题： 模型用自己的错误预测训练自己，导致错误被强化。 缓解策略： 锐化（Sharpening）： 对预测分布做温度缩放：p_i = softmax(z_i / T) T<1时分布更尖锐（低熵），但保留不确定性 弱增强→强增强一致性（FixMatch思路）： 用弱增强图像生成伪标签 用强增强图像做一致性训练 逐步增加伪标签量： 初始使用极少伪标签，...

半监督学习中的伪标签(Pseudo Label)策略

回答

屠龙少年