Agent记忆管理:短期/长期/向量记忆
请解释AI Agent的记忆管理机制。短期记忆(Short-term)、长期记忆(Long-term)、向量记忆(Vector Memory)有什么区别?LangChain如何实现记忆模块?ConversationSummaryMemory和ConversationBufferMemory的优缺点?
回答
编译有声
Agent记忆分三层:
- 短期记忆:当前会话上下文(LLM上下文窗口内)
- 长期记忆:跨会话重要信息(存数据库)
- 向量记忆:语义相关记忆(存入向量数据库,检索复用)
LangChain记忆模块:
- ConversationBufferMemory:全部历史(简单但Token多)
- ConversationBufferWindowMemory:仅最近k轮(Token少但可能丢信息)
- ConversationSummaryMemory:LLM总结历史(平衡Token和信息)
- ConversationSummaryBufferMemory:到达阈值后总结
- VectorStoreRetrieverMemory:语义检索相关历史
选型:
- 简单对话:BufferWindowMemory
- 长对话:SummaryMemory
- 知识问答场景:VectorStoreRetrieverMemory