MCP (Model Context Protocol) 技术理解 - 第六篇
引言
上一篇文章里,我们拆解了一个天气实时预报的MCP Server,相信大家对MCP的基本形态已经有了一些体感。那么这一篇,咱们重点聊聊MCP客户端在实际使用中会遇到的问题和配置方式。如果篇幅允许,还会顺带介绍几个MCP的高级特性。
在正式开始之前,先快速回顾一下此前的系列内容,方便大家保持知识连贯:MCP技术理解系列的前五篇文章,分别从协议基础、工作原理、Server实现等角度做了梳理。这一篇则要深入Client端,解决“怎么调”、“怎么配”这些更落地的问题。
如何调用MCP server
很多人会有一个误区:是不是让LLM直接发出指令,就能调用对应的MCP Server?这个理解其实是不对的。根本原因在于,LLM本身不具备外调能力——它不能直接发起一个HTTP请求或执行一个系统命令。
实际上,调用MCP Server的场景可分为两类。但无论哪种情况,真正的调用方都是AI应用通过MCP Client来完成的,LLM只负责推理输入和输出。弄清楚这两类场景,我们再去拆解MCP Client的配置细节,就会清晰很多。
这里先铺垫两个关键认识:
- :这意味着你可以在Client层做前置拦截。如果LLM“发疯”了,想执行
安全隔离
rm -rf /这样的危险操作,你的Ja va或Go代码完全可以在发送给Server之前检测并拦截这个请求。 - :LLM输出的是文本/Token,而MCP Server需要的是JSON-RPC消息。Client就是那个适配器(Adapter),负责完成这两种格式的互转。
协议转换
场景一:作为用户在现有host中调用
如果你只是想让Claude Code或Cursor这类现成的AI应用,去调用一个现成的MCP Server(包括你自己编写的),那你根本不需要写任何MCP Client代码,只需要修改配置文件即可。在这种情况下,host就是AI应用本身,它已经内置了写好的MCP Client代码。你配置好MCP Server,它就会自动维护连接、完成后续的一切。
场景二:作为开发者通过代码调用
如果你想在自己开发的Ja va、Go或Python程序中调用一个MCP Server——比如构建一个能调用本地工具的AI Agent——那你就需要自己实现一个MCP Client。
以Stdio传输方式为例,核心交互流程可以简化为三步:
- :你的程序(Client)启动MCP Server作为子进程,比如执行
启动进程
npx -y @modelcontextprotocol/server-filesystem这样的命令。 - :发送
握手(Initialization)
initialize请求,协商协议版本和能力。 - :发送
发送指令
tools/list、tools/call、resources/read等JSON-RPC消息。
在这个场景下,你需要自己编写MCP Client代码来处理初始化链接、维护协议和连接、发送消息以及处理响应。
一次MCP调用示例
看过上面的流程,可能有人还会疑惑:那LLM在整个过程中到底扮演什么角色?别急,我们上面其实已经说了——AI应用通过MCP Client调用MCP Server,LLM只负责推理输入和输出。下面用一个完整的调用链来演示,看完就清楚了。
先明确各个角色的职责:
- :负责管控全局,协调各个请求和负载均衡。
AI应用
- :负责连接Server、管理进程、维护对话上下文。
MCP Client
- :无状态的Worker。它不知道上下文,不关心是谁在问,只负责接收指令 → 干活 → 返回结果。
MCP Server
- :它没有“手脚”(不能联网、不能读文件)。它的工作是对用户的自然语言进行分析,对比AI应用提供的Tools List,然后生成一个结构化的JSON文本,告诉AI应用:“请帮我调用这个函数,参数是X和Y。”
LLM
下面是完整的交互流程:
- :
初始化(Handshake)
- Client启动Server。
- Client询问Server:“你有什么本事?”(Tools List)
- Server回答:“我会读文件(
fs.read),我会查数据库(db.query)。”
- :
用户提问
- 用户对Client说:“帮我查一下
user_id=101的订单。”
- 用户对Client说:“帮我查一下
- :
Prompt组装(AI应用内部逻辑)
- AI应用将用户的System Prompt + Server提供的工具定义(Schema)+ 用户问题,打包发给LLM。
- :
LLM决策
- LLM经过推理,发现
db.query工具能解决这个问题。 - LLM返回给AI应用(而不是直接给Server)一个结构化的指令:
{ "tool_use": "db.query", "params": { "sql": "SELECT * FROM orders WHERE user_id=101" } }
- LLM经过推理,发现
- :
执行(真正的MCP调用发生在这里)
- AI应用解析LLM的响应,发现它想调用工具,于是控制MCP Client发送相关请求和数据。
- Client通过JSON-RPC(Stdio/SSE)向MCP Server发送
tools/call请求。
- :
Server响应
- Server执行SQL,返回JSON数据给Client。
- :
回环(Loop Back)
- AI应用接收到Client返回的数据,将Server的执行结果再次喂给LLM。
- AI应用说:“刚才你让我调用的工具,结果是
[Order A, Order B],请生成给用户的最终回复。”
- :
最终输出
- LLM生成自然语言回复:“用户你好,ID为101的用户有两笔订单……”
在AI应用里面配置MCP server
相信通过上面的解析,大家对整个调用过程应该比较清晰了。接下来,我们再按场景逐步拆解MCP Client的配置问题。
前面提到,在Claude Code这类现成的AI应用里,我们只需要配置MCP Server即可,不需要编写MCP Client代码。下面以Claude Code为例,具体看看怎么配。
配置信息写在claude_desktop_config.json文件中:
// ~/Library/Application Support/Claude/claude_desktop_config.json
{
"mcpServers": {
"weather": {
"command": "uv",
"args": ["--directory", "/absolute/path/to/weather", "run", "weather-server"]
},
"filesystem": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-filesystem", "/Users/username/Documents"]
},
"github": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-github"],
"env": {
"GITHUB_PERSONAL_ACCESS_TOKEN": "ghp_your_token_here"
}
}
}
}
可以将每一项配置理解为在终端执行一个长连接的子进程。以下是关键参数的拆解:
1. mcpServers
weather、github)是该Server的唯一标识符,用于在AI界面显示和内部隔离。
2. command(可执行文件)
这是Client尝试启动的二进制文件或脚本解释器,用于指定入口程序。常见值包括
npx(Node.js)、python、uv(Python包管理器),或者你编译好的Go/Ja va二进制文件。
3. args(启动参数)
这是一个字符串数组,会被追加在
command后面,形成完整的shell启动命令。
- :
weather示例
uv --directory /path/to/weather run weather-server,这告诉uv切换到特定目录并运行该项目。 - :
filesystem示例
npx -y @modelcontextprotocol/server-filesystem /Users/username/Documents。-y表示自动确认安装,最后一个参数是传给Server程序内部的参数,告知它允许访问哪个文件夹——这是一个白名单机制。
4. env(环境变量)
这是子进程启动时注入的环境变量,用于传递敏感信息(API Keys)或配置参数,从而避免将这些信息硬编码在代码或命令行参数中。就像在Docker中配置
ENV或在本地.env文件中定义变量一样。以GitHub示例为例,GITHUB_PERSONAL_ACCESS_TOKEN会被注入到该进程的上下文中,Server代码可以通过os.Getenv("GITHUB_PERSONAL_ACCESS_TOKEN")(Go)或System.getenv(...)(Ja va)获取。
通过代码来调用MCP server
这就是前面说的场景二——在自己构建的AI应用中,需要使用官方提供的SDK来编写MCP Client代码。
这里补充一个信息:官方提供了多种SDK。其中,后端开发常用的Go SDK由Google和Go官方维护,Ja va SDK由Spring AI官方维护,而Python SDK则由MCP官方维护。
下面是用Python SDK编写MCP Client的示例代码:
from mcp import ClientSession, StdioServerParameters
from mcp.client.stdio import stdio_client
# 配置服务器参数
server_params = StdioServerParameters(
command="uv",
args=["--directory", "/path/to/weather", "run", "weather-server"],
)
async def main():
async with stdio_client(server_params) as (read, write):
async with ClientSession(read, write) as session:
# 初始化连接
await session.initialize()
# 列出可用工具
tools = await session.list_tools()
print("A vailable tools:", tools)
# 调用工具
result = await session.call_tool(
"get_forecast",
arguments={"latitude": 37.7749, "longitude": -122.4194}
)
print("Forecast:", result)
# 列出资源
resources = await session.list_resources()
print("A vailable resources:", resources)
# 读取资源
config = await session.read_resource("weather://config")
print("Config:", config)
if __name__ == "__main__":
import asyncio
asyncio.run(main())
总结
这一篇主要解答了MCP Client的几个核心问题:Client到底怎么调用Server?在不同场景下,我们该如何配置或编写客户端代码?相信结合前面的系列文章,大家对MCP的整体理解已经比较完整了。下一篇我们会继续深入,聊聊MCP的高级特性以及一些需要特别注意的细节——这些点在实际落地中尤为重要。