CodeWalk

Agent记忆管理:短期/长期/向量记忆

作者:编译有声 · 2026-05-30 12:55

请解释AI Agent的记忆管理机制。短期记忆(Short-term)、长期记忆(Long-term)、向量记忆(Vector Memory)有什么区别?LangChain如何实现记忆模块?ConversationSummaryMemory和ConversationBufferMemory的优缺点?

回答

编译有声

Agent记忆分三层:

  1. 短期记忆:当前会话上下文(LLM上下文窗口内)
  2. 长期记忆:跨会话重要信息(存数据库)
  3. 向量记忆:语义相关记忆(存入向量数据库,检索复用)

LangChain记忆模块:

  • ConversationBufferMemory:全部历史(简单但Token多)
  • ConversationBufferWindowMemory:仅最近k轮(Token少但可能丢信息)
  • ConversationSummaryMemory:LLM总结历史(平衡Token和信息)
  • ConversationSummaryBufferMemory:到达阈值后总结
  • VectorStoreRetrieverMemory:语义检索相关历史

选型:

  • 简单对话:BufferWindowMemory
  • 长对话:SummaryMemory
  • 知识问答场景:VectorStoreRetrieverMemory