前面讲的都是怎么开发 LangChain 应用。这一篇讲怎么部署——把做好的应用跑起来、对外提供服务。
LangChain 的部署方案有个演进:从 LangServe 到 LangGraph Platform。这一篇讲清两者的定位和选择。
为什么要专门的部署方案
LangChain 应用部署,和普通 Web 应用有区别:
- 有状态的 Agent:Agent 跨多步、有 checkpoint、要 HITL,不是简单的请求-响应
- 长流程:一个 Agent run 可能跑很久,传统 HTTP 请求挂不住
- 流式:要边生成边返回,不是等完再给
- 与 LangSmith 集成:部署后还要能追踪、评估
这些需求,普通 Web 框架(Flask/FastAPI)直接搭会比较麻烦。LangChain 的部署方案就是把这些封装好。
LangServe:无状态链的部署
LangServe 是较早的方案,定位是把 LangChain 的 Runnable 暴露成 API。
它适合无状态的链:你有一个 RAG 链、一个简单的 prompt→model 链,想包成 API 给别人调。LangServe 把这个 Runnable 变成一个 HTTP 接口,支持 invoke/stream/batch。
LangServe 简单、够用,但它假设的是「无状态、一次请求一次响应」。它不天然处理 Agent 的长流程、checkpoint、HITL 这些。
LangGraph Platform:有状态 Agent 的运行时
LangGraph Platform 是 v1.0 主推的部署方案,定位是部署有状态、长流程 Agent 的运行时。
它和 LangServe 的区别:LangGraph Platform 原生支持 Agent 的那些特殊需求:
- 状态管理:内置 checkpointer,Agent 的状态持久化、恢复开箱即用
- 长流程:支持 Agent 跑很久,不卡死请求(异步、后台)
- 流式:原生支持 Agent 思考过程的流式输出
- HITL:支持 Agent 暂停等人、恢复(第 15 篇的机制)
- LangSmith 集成:部署即追踪
简单说,LangGraph Platform 是为 Agent 这个形态专门设计的运行时,而 LangServe 更像是「把链变成 API」的通用工具。
怎么选
| 维度 | LangServe | LangGraph Platform |
|---|---|---|
| 适合 | 无状态链(RAG、简单问答) | 有状态 Agent |
| 状态 | 无 | 原生持久化、恢复 |
| 长流程 | 不擅长 | 原生支持 |
| HITL | 不支持 | 原生支持 |
| 复杂度 | 简单 | 功能全但重 |
一个务实判断:
- 部署简单的无状态链(RAG 问答、一次性处理)→ LangServe 够用,简单
- 部署 Agent(多步、有记忆、要 HITL、长流程)→ LangGraph Platform
趋势上,LangGraph Platform 是未来——因为 LangChain 的重心在 Agent,而 Agent 需要的就是 Platform 提供的能力。LangServe 在退化成「简单无状态部署」的定位。
部署不只是「跑起来」
最后强调一点:生产部署不只是「把应用跑起来」。一个完整的部署要考虑:
- 可观测:接 LangSmith,trace/eval(前两篇)
- 可靠性:重试、fallback(第 07 篇)、限流
- 扩缩容:Agent 长流程,并发管理和普通应用不同
- 成本:token 是真金白银,要监控
LangGraph Platform 把这些打包了。如果自己用 LangServe + FastAPI 搭,这些得自己实现。
收束:按 Agent 形态选部署
这一篇讲了部署:
- LangChain 应用部署有特殊性(有状态、长流程、流式、HITL)
- LangServe:无状态链变 API,简单
- LangGraph Platform:有状态 Agent 的运行时,v1.0 主推
- 简单链用 LangServe,Agent 用 Platform
- 趋势:Platform 是未来,LangServe 退到简单场景
- 生产部署还要考虑可观测、可靠、扩缩容、成本
下一篇是全系列最后一篇——系列收束,做整个 42 篇的总结。
关于十三Tech
我是十三,All in AI Agent 方向的架构师,专注 AI 工程实践。我相信 AI 是程序员的最佳搭档。
如果你想跟完这套「图解 LangChain」,欢迎关注公众号 「十三Tech」。全系列 42 篇,会按认识基础、LangGraph 状态机、Agent 与 middleware、RAG 检索、Tools/MCP/记忆、生产化收束这条线更新。

