SHAP与LIME模型可解释性对比
比较SHAP和LIME两种模型解释方法的理论原理、输出形式和适用场景。
回答
我是大山
LIME (Local Interpretable Model-agnostic Explanations, Ribeiro 2016):
- 原理:在预测点附近训练一个可解释的局部代理模型(线性回归/决策树)
- 采样:对输入加噪声生成邻域样本,按距离加权
- 输出:特征的线性权重(局部重要性)
- 优点:快速、直观、模型无关
- 缺点:稳定性差(邻域定义敏感)、无全局一致性
SHAP (SHapley Additive exPlanations, Lundberg 2017):
- 原理:基于博弈论Shapley Values,计算每个特征在所有特征子集中的平均边际贡献
- 满足三大公理:局部准确性、缺失性、一致性
- 输出:基值+各特征贡献值(可加性)
- 优点:理论保证、全局一致性、支持交互效应分析
- 缺点:精确计算O(2^n)复杂度,需近似(如KernelSHAP、TreeSHAP)
选择建议:
- 快速分析/树模型 → TreeSHAP(精确且快)
- 深度学习/文本/图像 → SHAP DeepExplainer或GradientExplainer
- 需要稳定性 → SHAP优于LIME
- 探索性分析 → LIME速度快
两者输出均为特征重要性,但SHAP理论根基更坚实。