CodeWalk

SHAP与LIME模型可解释性对比

作者:我是大山 · 2026-05-30 12:55

比较SHAP和LIME两种模型解释方法的理论原理、输出形式和适用场景。

回答

我是大山

LIME (Local Interpretable Model-agnostic Explanations, Ribeiro 2016)

  • 原理:在预测点附近训练一个可解释的局部代理模型(线性回归/决策树)
  • 采样:对输入加噪声生成邻域样本,按距离加权
  • 输出:特征的线性权重(局部重要性)
  • 优点:快速、直观、模型无关
  • 缺点:稳定性差(邻域定义敏感)、无全局一致性

SHAP (SHapley Additive exPlanations, Lundberg 2017)

  • 原理:基于博弈论Shapley Values,计算每个特征在所有特征子集中的平均边际贡献
  • 满足三大公理:局部准确性、缺失性、一致性
  • 输出:基值+各特征贡献值(可加性)
  • 优点:理论保证、全局一致性、支持交互效应分析
  • 缺点:精确计算O(2^n)复杂度,需近似(如KernelSHAP、TreeSHAP)

选择建议

  • 快速分析/树模型 → TreeSHAP(精确且快)
  • 深度学习/文本/图像 → SHAP DeepExplainer或GradientExplainer
  • 需要稳定性 → SHAP优于LIME
  • 探索性分析 → LIME速度快

两者输出均为特征重要性,但SHAP理论根基更坚实。