LangChain的核心组件Memory深度解析

阿司匹林

2025-11-03 17:45:05

文章摘要

大模型其实天生健忘！揭秘AI记忆模块的本质：每次回答都是全新函数调用。本文详解LangChain短期/长期记忆机制，并教你用K值窗口（Window）策略，实现高效、省钱且不遗忘的“智能对话”。

如果你用过 ChatGPT、DeepSeek 或其他大模型，可能会有这样的感觉：

它居然还记得我上次说过的那句话？

有时候我换个话题，它怎么又忘了之前聊过的内容。

实际上，模型（LLM）每次回答都是无记忆的，只是开发者在系统中加入了一个关键模块——Memory。

一、AI Memory的本质

首先要明确一个核心事实：模型（LLM）本身是无状态的。

你每向它提一个问题，就像在调用一个全新的函数。

这就是 Memory 模块的意义——

它会帮你保存每一轮对话的历史，再在下次对话时，把这些信息打包给模型，让它看起来像是记住了你。

二、Memory 的两种“记忆方式”

LangChain 里的 Memory，大致分成两类

短期记忆（Short-term Memory）：用于单次对话，确保对话的上下文连贯性。对话轮次越多Token 消耗越多，为节省成本一般只保留最近 K轮对话。

长期记忆（Long-term Memory）：用于跨会话情景，会储存用户的偏好、应用级的知识等。通常存储在JSON 文档中，并持久化到数据库。

三、基础实战案例

让我们动手试试最基础的 Memory：ConversationBufferMemory。

这个组件的逻辑很直白：

“把所有对话原封不动保存下来。”

适合对话轮次不多、上下文简单的应用，比如知识问答机器人、教学助手等。

示例：AI小助理记住你的自我介绍

from langchain_openai import ChatOpenAI
from langchain.chains.llm import LLMChain
from langchain.memory import ConversationBufferMemory
from langchain_core.prompts import PromptTemplate

# 1. 初始化模型
llm = ChatOpenAI(model="gpt-4o-mini")

# 2. 定义提示词
template = """
你是一位友好的智能助理。
当前对话历史：
{history}
用户提问：{question}
请作答：
"""
prompt = PromptTemplate.from_template(template)

# 3. 绑定 Memory
memory = ConversationBufferMemory()

# 4. 创建链
chain = LLMChain(llm=llm, prompt=prompt, memory=memory)

# 5. 模拟对话
print(chain.invoke({"question": "你好，我叫李雷"}))
print(chain.invoke({"question": "我叫什么名字？"}))

第一次输入你好，我叫李雷，AI会打招呼；

第二次问我叫什么名字？它就能答出李雷。

四、优化记忆

但我们前问提到过短期记忆的问题，如果你和AI聊上几十轮，Memory就会越积越大，成本高、速度慢，还可能记混。

于是有了窗口记忆（Window Memory）的概念：只保留最近的 N 轮对话。

from langchain.memory import ConversationBufferWindowMemory
memory = ConversationBufferWindowMemory(k=3)  # 只记最近3轮对话

通过控制 K值，我们成功的让 AI 只记住最近的三轮信息，有效避免了长上下文的高成本和低效率。

以上内容不代表本平台立场，仅供读者参考

LangChain的核心组件Memory深度解析

一、AI Memory的本质

二、Memory 的两种“记忆方式”

三、基础实战案例

四、 优化记忆

四、优化记忆