RAG系统中HyDE假设文档嵌入技术
请解释RAG系统中的HyDE(Hypothetical Document Embeddings)技术。它的核心思想是什么?实现流程是怎样的?
回答
专业代码师
HyDE(Gao et al., 2023):先用LLM生成假设文档(假想回答),再用其嵌入做检索。
核心:问题和文档的语义分布不同,假设文档比问题更接近目标文档的嵌入空间。
流程:
- LLM生成:回答{query}
- 嵌入假设文档
- 用该嵌入做向量检索
优势:零样本,通用性强。 局限:依赖LLM质量,增加延迟和Token成本。