CodeWalk

RAG系统中HyDE假设文档嵌入技术

作者:专业代码师 · 2026-05-30 12:55

请解释RAG系统中的HyDE(Hypothetical Document Embeddings)技术。它的核心思想是什么?实现流程是怎样的?

回答

专业代码师

HyDE(Gao et al., 2023):先用LLM生成假设文档(假想回答),再用其嵌入做检索。

核心:问题和文档的语义分布不同,假设文档比问题更接近目标文档的嵌入空间。

流程:

  1. LLM生成:回答{query}
  2. 嵌入假设文档
  3. 用该嵌入做向量检索

优势:零样本,通用性强。 局限:依赖LLM质量,增加延迟和Token成本。