CodeWalk

LlamaIndex核心组件:Index/QueryEngine/NodeParser

作者:苦行僧 · 2026-05-30 12:55

请解释LlamaIndex的三大核心组件:Index(索引)、QueryEngine(查询引擎)、NodeParser(节点解析器)。它们如何协同工作?VectorStoreIndex和SummaryIndex各用于什么场景?

回答

苦行僧

LlamaIndex三大组件:

  1. NodeParser:文档分割为Node(最小检索单元)
  • SimpleNodeParser:按固定大小分
  • SentenceSplitter(推荐):按句子分
  • HierarchicalNodeParser:父子结构索引
  1. Index:组织Node的索引结构
  • VectorStoreIndex:向量检索(默认推荐)
  • SummaryIndex:顺序总结(短文档)
  • KeywordTableIndex:关键词检索
  • KnowledgeGraphIndex:知识图谱
  1. QueryEngine:执行查询
  • RetrieverQueryEngine:检索+LLM生成
  • RouterQueryEngine:路由到不同引擎
  • SubQuestionQueryEngine:子问题分解

协同:文档->NodeParser(切Node)->Index(建索引)->QueryEngine(查+生成)