Self-RAG与Corrective RAG高级RAG技术
请解释Self-RAG和**Corrective RAG(CRAG)**两种高级RAG技术。它们与基础RAG相比增加了哪些能力?Self-RAG如何让LLM反思检索质量?CRAG如何处理检索失败的情况?
回答
苦行僧
Self-RAG(ICLR 2024):
- 训练LLM生成特殊token(反思标记)来控制检索和生成
- 按需检索:LLM决定是否检索(不是每次都检索)
- 自我评估:判断检索结果是否相关、是否充分
- 可多次检索:根据当前结果决定是否再次检索
- 输出带引用标记
Corrective RAG(Yan et al., 2024):
- 评估检索相关性(打分)
- 相关:继续生成
- 不相关:Web搜索补充
- 部分相关:知识图谱+检索结果融合
- 纠错机制:修正检索错误后再送入LLM
vs基础RAG: | 能力 | 基础RAG | Self-RAG | CRAG | |------|---------|----------|------| | 按需检索 | ❌ | ✅ | ✅ | | 检索质量评估 | ❌ | ✅ | ✅ | | 多次迭代 | ❌ | ✅ | ✅ | | 自我纠错 | ❌ | ✅ | ✅ |