LLM-as-Judge的评估方法与偏差控制

Question

LLM-as-Judge使用大语言模型自动评估生成文本的质量。请解释其工作原理(评分/对比/多维度)，以及位置偏差、绳长偏差和自偏爱偏差(LLM偏爱自己的输出)的缓解策略。。AI 面试题。LMSYS 面试题

苦行僧 · Accepted Answer

LLM-as-Judge(2023, LMSYS)使用GPT-4/Turbo等模型作为自动化评估器。

三种模式：

三类偏差及缓解策略：

1. 位置偏差(Position Bias)：

2. 绳长偏差(Verbosity Bias)：

3. 自偏爱偏差(Self-Enhancement Bias)：

G-Eval(2023)：基于GPT-4链式思维的评估框架，通过概率归一化输出连续评分。

实践建议：

LLM-as-Judge成本低、速度快，接近人工一致性(kappa≈0.6-0.7)。

回答