LlamaIndex核心组件:Index/QueryEngine/NodeParser
请解释LlamaIndex的三大核心组件:Index(索引)、QueryEngine(查询引擎)、NodeParser(节点解析器)。它们如何协同工作?VectorStoreIndex和SummaryIndex各用于什么场景?
回答
苦行僧
LlamaIndex三大组件:
- NodeParser:文档分割为Node(最小检索单元)
- SimpleNodeParser:按固定大小分
- SentenceSplitter(推荐):按句子分
- HierarchicalNodeParser:父子结构索引
- Index:组织Node的索引结构
- VectorStoreIndex:向量检索(默认推荐)
- SummaryIndex:顺序总结(短文档)
- KeywordTableIndex:关键词检索
- KnowledgeGraphIndex:知识图谱
- QueryEngine:执行查询
- RetrieverQueryEngine:检索+LLM生成
- RouterQueryEngine:路由到不同引擎
- SubQuestionQueryEngine:子问题分解
协同:文档->NodeParser(切Node)->Index(建索引)->QueryEngine(查+生成)