零基础学AI大模型之LangChain链

2025-11-14 17:51:18

大模型

文章摘要

本文讲 LangChain 的 Chain：本质是串联组件的 “流水线”，类比 Java 责任链，解耦组件、复用流程。基础链 LLMChain 组合模板与模型，适合简单单步任务，已逐步淘汰。新版 LCEL 用管道符 | 串联组件，代码极简，原生支持流式、异步，内置重试等高级功能，适合生产场景。对比旧版 Chain，LCEL 更灵活高效，是 LangChain 0.3 + 推荐范式。

前情摘要：

1、零基础学AI大模型之读懂AI大模型

2、零基础学AI大模型之从0到1调用大模型API

3、零基础学AI大模型之SpringAI

4、零基础学AI大模型之AI大模型常见概念

5、零基础学AI大模型之大模型私有化部署全指南

6、零基础学AI大模型之AI大模型可视化界面

7、零基础学AI大模型之LangChain

8、零基础学AI大模型之LangChain六大核心模块与大模型IO交互链

9、零基础学AI大模型之Prompt提示词工

10、零基础学AI大模型之LangChain-PromptTemplate

11、零基础学AI大模型之ChatModel聊天模型与ChatPromptTemplate实战

12、零基础学AI大模型之LangChain聊天模型多案例实战

零基础学AI大模型之LangChain链

1. 引言：为什么需要「Chain」？

在LangChain中，单个组件（如PromptTemplate、ChatOpenAI）只能解决单一问题：提示模板负责格式化输入，大模型负责生成内容，但实际AI应用往往需要多步骤协作——比如“接收用户问题→填充提示模板→调用大模型→解析输出结果→存储到数据库”。

「Chain（链）」正是为解决这一需求而生：它像一条“流水线”，将多个独立组件按逻辑顺序串联，形成可复用、可扩展的任务流程。类比Java中的责任链模式或工作流引擎，Chain让复杂AI任务的开发从“零散拼接”变成“标准化组装”。

2. 核心概念：什么是Chain？

2.1 Chain的定义

Chain是LangChain构建语言模型应用的核心组件，本质是「多个处理单元（模型/工具/逻辑）的有序组合」，用于实现端到端的任务流程。

2.2 用Java责任链模式类比理解

如果你熟悉Java，可以通过以下代码快速get Chain的设计思想：

// 1. 定义处理单元接口（类似LangChain的Runnable）

public interface Handler {

void handle(Request request);

}

// 2. 实现具体处理单元（类似LangChain的Prompt、LLM、Parser）

class ValidationHandler implements Handler {

// 第一步：验证用户输入合法性

@Override

public void handle(Request request) {

if (request.getContent() == null) {

throw new IllegalArgumentException("输入不能为空");

}

class LLMProcessingHandler implements Handler {

// 第二步：调用大模型处理

@Override

public void handle(Request request) {

String result = llmClient.generate(request.getContent());

request.setLlmResult(result); // 传递结果给下一个单元

}

class DatabaseSaveHandler implements Handler {

// 第三步：存储结果到数据库

@Override

public void handle(Request request) {

dbClient.save(request.getLlmResult());

}

// 3. 构建Chain并执行（类似LangChain的链组装）

public class ChainDemo {

public static void main(String[] args) {

List<Handler> chain = Arrays.asList(

new ValidationHandler(),

new LLMProcessingHandler(),

new DatabaseSaveHandler()

);

Request request = new Request("如何学习AI大模型？");

for (Handler handler : chain) {

handler.handle(request); // 按顺序执行

}

2.3 Chain的核心价值

解耦组件：每个单元只负责单一职责（验证/生成/存储），便于维护和替换；
流程复用：定义好的Chain可在多个场景中重复调用（如“问答→存储”链）；
扩展灵活：可随时新增/删除处理单元（如在“生成”后加“结果脱敏”单元）。

3. 基础链实战：LLMChain

LLMChain是LangChain中最基础的链，专门用于“提示模板+大模型”的简单组合，负责“填充模板→调用模型→返回结果”的单步流程。

注意：LLMChain是旧版（LangChain 0.2及之前）的核心链，目前LangChain 0.3+已推荐使用LCEL，但LLMChain仍被保留，适合入门理解链的本质。

3.1 LLMChain的核心构成

LLMChain由3个核心部分组成，参数说明如下表：

参数名	作用	类比Java场景	示例值
`llm`	依赖的大模型实例	注入的第三方服务客户端	`ChatOpenAI(model_name="qwen-plus")`
`prompt`	预定义的提示词模板（含动态变量）	带占位符的String模板	`PromptTemplate(input_variables=["product"], template="列举{product}的3个卖点")`
`output_parser`	（可选）模型输出的后处理器	JSON解析工具（如Jackson）	`CommaSeparatedListOutputParser()`

3.2 LLMChain完整实战案例

3.2.1 环境准备

需先安装LangChain相关依赖：

pip install langchain langchain-openai

3.2.2 代码实现（含详细注释）

# 1. 导入依赖

from langchain_openai import ChatOpenAI

from langchain.chains import LLMChain

from langchain_core.prompts import PromptTemplate

# 2. 1 定义提示词模板（动态变量为product）

# 类似Java的String.format("列举%s的3个卖点", product)

prompt_template = PromptTemplate(

input_variables=["product"], # 声明动态变量

template="你是文案高手，请列举{product}的3个核心卖点，每个卖点用简短短语描述："

)

# 2.2 初始化大模型（以阿里通义千问为例，需替换为自己的api_key）

model = ChatOpenAI(

model_name='deepseek-r1:7b', # 本地模型名称，根据实际情况填写

base_url="http://127.0.0.1:11434/v1", # 本地模型API地址

api_key="none", # 本地模型通常不需要真实API密钥

temperature=0.7 # 可根据需要调整温度参数

)

# 3. 构建LLMChain（组装模板和模型）

llm_chain = LLMChain(

llm=model, # 注入模型

prompt=prompt_template # 注入提示模板

)

# 4. 调用链（注意：需传递包含动态变量的字典）

# 旧版run()方法已淘汰，LangChain 0.3+统一用invoke()

result = llm_chain.invoke({"product": "大模型"}) # 变量product赋值为"大模型"

# 5. 输出结果

print("LLMChain输出结果：")

print(result["text"]) # result是字典，key为"text"（默认输出键）

3.2.3 运行结果示例

LangChainDeprecationWarning: The class `LLMChain` was deprecated in LangChain 0.1.17 and will be removed in 1.0. Use :meth:`~RunnableSequence, e.g., `prompt | llm`` instead.

llm_chain = LLMChain(

LLMChain输出结果：

<think>

嗯，用户让我帮忙作为文案高手，列出大模型的三个核心卖点，每个卖点用简短的话描述。首先，我需要明确用户的需求是什么。他们可能是在准备产品推广或者市场宣传，想突出大模型的主要优势。

接下来，我要考虑大模型最吸引人的地方通常是什么。数据驱动是关键，所以第一个卖点应该是“数据驱动”。这个点能突出模型有多强大，处理的信息量大，结果准确可靠。

然后，自然流畅的输出也很重要。用户可能经常需要处理文本，无论是写文案、翻译还是生成内容，自然语言的处理能力能让他们的工作更高效。所以第二个卖点是“自然流畅的输出”。

第三个卖点应该是计算速度方面。虽然数据驱动和自然输出很重要，但快速响应也是用户关注的重点，尤其是在需要即时反馈的情况下。因此，我想到“轻松应对复杂任务”作为第三个点。

最后，我要确保每个卖点都是简短而有力的，能够吸引读者的注意力并传达关键信息。这样用户的文案就能更好地突出大模型的优势了。

</think>

1. **数据驱动**

大模型基于海量数据，提供准确、可靠的内容生成与分析。

2. **自然流畅的输出**

支持多种语言，精准理解用户意图，生成自然地道的语言内容。

3. **轻松应对复杂任务**

灵活处理多种应用场景，快速响应专业或创意需求，满足多领域应用需求。

Process finished with exit code 0

3.3 LLMChain的适用场景

LLMChain仅适合简单的单步任务，例如：

生成某产品的文案/卖点；
翻译指定文本（模板为“将{text}翻译成英文”）；
给文章起标题（模板为“给{article_content}起3个标题”）。

局限性：无法实现多步骤流程（如“生成卖点→存储到Excel”），需用更复杂的链（如SequentialChain）或新版LCEL。

4. 新范式实战：LCEL（LangChain Expression Language）

LCEL是LangChain 0.3+推出的声明式编程语言，核心思想是用「管道符|」串联组件，替代旧版的类继承式链，解决了LLMChain的灵活性不足问题。

4.1 为什么需要LCEL？

旧版Chain（如LLMChain）存在以下痛点：

多组件组合繁琐（如“模板+模型+解析器”需手动封装）；
不支持流式响应（无法实现ChatGPT的“逐字输出”效果）；
同步/异步调用不统一（需分别处理同步run()和异步arun()）。

LCEL的核心优势正是解决这些痛点：

代码极简：用|串联组件，如prompt | model | parser；
原生支持流式：可直接返回迭代器，实现“逐字输出”；
标准化接口：所有组件均实现Runnable协议，输入输出均为字典，无缝衔接；
高级功能内置：支持调试、重试、并行调用（如同时调用两个模型对比结果）。

4.2 LCEL的核心语法

LCEL的核心是「管道符|」，规则如下：

左侧组件的输出 → 作为右侧组件的输入；
所有组件的输入/输出均为字典格式（键为变量名，值为数据）；
链的最终调用用invoke()（同步）、ainvoke()（异步）或stream()（流式）。

语法结构示例：

# 组件1：提示模板（输入：question；输出：格式化后的prompt）

prompt = ChatPromptTemplate.from_template("回答问题：{question}")

# 组件2：大模型（输入：格式化后的prompt；输出：模型原始响应）

model = ChatOpenAI(...)

# 组件3：输出解析器（输入：模型原始响应；输出：纯文本）

parser = StrOutputParser()

# 用|串联成链

chain = prompt | model | parser

# 调用链（输入字典需包含question变量）

result = chain.invoke({"question": "如何学习AI大模型？"})

4.3 LCEL完整实战案例（对比旧版LLMChain）

4.3.1 案例需求

实现“接收用户问题→生成格式化提示→调用模型→解析纯文本输出”的流程，对比LCEL与LLMChain的代码差异。

4.3.2 代码实现（LCEL版 vs LLMChain版）

# 导入依赖（LCEL需额外导入输出解析器）

from langchain_core.output_parsers import StrOutputParser

from langchain_core.prompts import ChatPromptTemplate

from langchain_openai import ChatOpenAI

from langchain.chains import LLMChain

# 初始化大模型（两版共用）

model = ChatOpenAI(

model_name='deepseek-r1:7b', # 本地模型名称，根据实际情况填写

base_url="http://127.0.0.1:11434/v1", # 本地模型API地址

api_key="none", # 本地模型通常不需要真实API密钥

temperature=0.7 # 可根据需要调整温度参数

)

# --------------------------

# 方式1：新版LCEL实现（推荐）

# --------------------------

print("=== LCEL版输出 ===")

# 1. 定义提示模板（用ChatPromptTemplate，支持多轮对话格式）

lcel_prompt = ChatPromptTemplate.from_template(

"你是AI学习顾问，请用3个步骤回答：{question}"

)

# 2. 定义输出解析器（将模型响应转为纯文本）

parser = StrOutputParser()

# 3. 用管道符串联组件（prompt → model → parser）

lcel_chain = lcel_prompt | model | parser

# 4. 调用链（输入为字典，key与模板变量一致）

lcel_result = lcel_chain.invoke({"question": "零基础如何学习AI大模型？"})

print(lcel_result)

# --------------------------

# 方式2：旧版LLMChain实现

# --------------------------

print("\n=== LLMChain版输出 ===")

# 1. 定义提示模板

llmchain_prompt = ChatPromptTemplate.from_template(

"你是AI学习顾问，请用3个步骤回答：{question}"

)

# 2. 构建LLMChain（需显式传入llm和prompt）

llm_chain = LLMChain(

llm=model,

prompt=llmchain_prompt

)

# 3. 调用链（需传递字典参数）

llmchain_result = llm_chain.invoke({"question": "零基础如何学习AI大模型？"})

print(llmchain_result["text"])

4.3.3 运行结果对比

两者输出逻辑一致，但LCEL代码更简洁（少了显式的LLMChain封装）：

=== LCEL版输出 ===

<think>

嗯，我现在想开始学习人工智能大模型，但我对这个领域几乎一无所知。首先，我得弄清楚人工智能和大模型到底是什么。听说大模型像ChatGPT那样可以回答各种问题，这看起来很酷，但我不确定具体是怎么运作的。

接下来，我觉得基础知识是必须有的。数学方面，听说线性代数、微积分和概率统计很重要，但我对这些领域了解不多。我应该从哪里开始呢？可能需要找一些入门教程或者书籍来学习这些基础概念。然后编程基础也很重要，特别是Python，因为我知道它被广泛用于机器学习。如果我对编程不太熟悉，可能需要花时间学习数据结构、算法以及Python的基础语法。

接着是机器学习和深度学习的概念。我听说过监督学习、无监督学习和强化学习，但具体怎么操作还是模糊的。我还记得看到过一些模型，比如神经网络，但不清楚它们是如何训练起来的。可能需要找一个具体的项目来实践，逐步了解这些概念。另外，工具方面，像TensorFlow或PyTorch听起来很有用，但我不太清楚哪个更适合我，或者如何安装和使用它们。

然后是搭建自己的模型，这听起来有点复杂。听说可以通过开源库来实现，比如训练一个分类器，但实际操作起来可能需要处理大量数据和调参，这些我都不是很清楚该怎么开始。可能需要寻找一些教程或案例研究，一步步跟着走。

最后，关于AI的应用和伦理问题，我也感到好奇。我知道大模型被用来回答问题和生成内容，但它们在安全性和隐私方面可能会有问题。我得学习相关的伦理规范，确保我的使用符合道德标准，避免滥用这些技术。

总的来说，我需要系统地学习基础知识，逐步掌握编程技能，了解机器学习和深度学习的概念，并尝试实际操作来应用这些知识。同时，关注当前的研究和实践，保持对新知识的更新也是很重要的。

</think>

学习人工智能大模型可以从以下三个步骤开始：

1. **建立基础知识**：

- 学习数学：从基础的代数、微积分和统计学入手，理解线性代数、微积分和概率论在AI中的应用。

- 掌握编程：选择Python作为学习语言，掌握数据结构、算法和基础编程概念。可以通过在线课程或书籍逐步学习。

2. **了解机器学习与深度学习**：

- 学习概念：研究监督学习、无监督学习和强化学习的基本原理，理解神经网络和深度学习的运作机制。

- 实践操作：尝试构建一个简单的分类模型，使用TensorFlow或PyTorch进行数据处理和模型训练。

3. **实践与应用**：

- 开发项目：利用开源库构建和训练模型，如训练一个分类器或生成式AI工具。

- 关注前沿：追踪AI研究进展，了解大模型的最新发展和应用案例，确保理解和应用符合伦理规范。

=== LLMChain版输出 ===

D:\a-pythonProject\ai-langchain\main.py:355: LangChainDeprecationWarning: The class `LLMChain` was deprecated in LangChain 0.1.17 and will be removed in 1.0. Use :meth:`~RunnableSequence, e.g., `prompt | llm`` instead.

llm_chain = LLMChain(

<think>

好，我现在需要回答用户的问题：“零基础如何学习AI大模型？”按照要求，我需要用三个步骤来详细解释。让我仔细思考一下应该如何组织这些建议。

首先，我想第一步应该是关于基础知识的学习。因为AI大模型建立在很多技术的基础之上，所以必须先打好这些基础。数学和编程是关键，特别是线性代数、概率统计等数学知识对理解机器学习算法很重要。编程语言方面，Python是最常用的，因为它有丰富的库和支持社区，所以需要掌握基础语法和常用库的使用。

接下来是实践操作，也就是搭建AI大模型的项目。只有实际动手做，才能真正理解和应用所学知识。可以选择一些开源框架，比如TensorFlow或PyTorch，从简单的分类任务开始，逐步尝试改进模型性能。通过自己的项目积累经验，同时参考优秀案例和教程，可以更快地提升技能。

最后是持续学习和优化阶段。AI领域发展迅速，需要不断更新知识和工具。了解最新的技术趋势，如大语言模型的发展、模型压缩等，并将这些新知识应用到实际项目中。定期回顾并优化自己的模型，保持模型性能的竞争力。

现在，我应该把这些思路整理成三个步骤，每一步下面加上详细说明，确保内容清晰易懂。

</think>

零基础学习AI大模型可以分为以下三个步骤：

1. **打好数学和编程基础**

- 学习线性代数、概率统计、微积分等数学知识。

- 掌握Python编程，了解数据结构、算法和库如NumPy、Pandas的使用。

2. **实践操作，搭建AI模型项目**

- 利用开源框架（如TensorFlow、PyTorch）开始小规模项目，如文本分类或图像识别。

- 参考教程和案例，逐步学习构建和优化模型。

3. **持续学习与优化模型**

- 关注新技术如大语言模型进展、模型压缩等。

- 不断优化模型性能，并将新知识应用到实际项目中，提升模型效果。

Process finished with exit code 0

5. 旧版Chain vs 新版LCEL核心差异

为了帮助大家快速选择，整理两者的关键差异如下表：

对比维度	旧版Chain（如LLMChain）	新版LCEL（LangChain 0.3+）
构建方式	类继承（需实例化Chain子类）	声明式管道（`\|`串联组件）
代码简洁度	繁琐（需显式封装Chain）	极简（一行串联多个组件）
流式响应	不支持	原生支持（`stream()`方法）
异步调用	需用`arun()`，接口不统一	原生支持（`ainvoke()`/`astream()`）
组件兼容性	仅支持Chain子类	支持所有实现`Runnable`协议的组件
高级功能	无（需手动实现重试、并行）	内置调试、重试、并行调用
适用场景	入门学习、简单单步任务	生产级应用、复杂多步骤流程

6. 总结

6.1 核心总结

Chain的本质：组件的有序串联，解决多步骤AI任务的流程化问题；
LLMChain定位：基础入门链，适合理解“模板+模型”的简单组合，已逐步被LCEL替代；
LCEL优势：LangChain 0.3+的推荐范式，用|简化组装，支持流式、异步，适合生产场景。

如果本文对你有帮助，欢迎点赞+关注，后续会持续更新LangChain进阶实战内容！如有问题，也欢迎在评论区留言讨论~

以上内容不代表本平台立场，仅供读者参考