首页 > 教程攻略 > ai教程 >MCP (Model Context Protocol) 技术理解 - 第六篇

MCP (Model Context Protocol) 技术理解 - 第六篇

来源:互联网 时间:2026-05-29 07:34:08

引言

上一篇文章里,我们拆解了一个天气实时预报的MCP Server,相信大家对MCP的基本形态已经有了一些体感。那么这一篇,咱们重点聊聊MCP客户端在实际使用中会遇到的问题和配置方式。如果篇幅允许,还会顺带介绍几个MCP的高级特性。

在正式开始之前,先快速回顾一下此前的系列内容,方便大家保持知识连贯:MCP技术理解系列的前五篇文章,分别从协议基础、工作原理、Server实现等角度做了梳理。这一篇则要深入Client端,解决“怎么调”、“怎么配”这些更落地的问题。

如何调用MCP server

很多人会有一个误区:是不是让LLM直接发出指令,就能调用对应的MCP Server?这个理解其实是不对的。根本原因在于,LLM本身不具备外调能力——它不能直接发起一个HTTP请求或执行一个系统命令。

实际上,调用MCP Server的场景可分为两类。但无论哪种情况,真正的调用方都是AI应用通过MCP Client来完成的,LLM只负责推理输入和输出。弄清楚这两类场景,我们再去拆解MCP Client的配置细节,就会清晰很多。

这里先铺垫两个关键认识:

  • 安全隔离

    :这意味着你可以在Client层做前置拦截。如果LLM“发疯”了,想执行rm -rf /这样的危险操作,你的Ja va或Go代码完全可以在发送给Server之前检测并拦截这个请求。
  • 协议转换

    :LLM输出的是文本/Token,而MCP Server需要的是JSON-RPC消息。Client就是那个适配器(Adapter),负责完成这两种格式的互转。

场景一:作为用户在现有host中调用

如果你只是想让Claude Code或Cursor这类现成的AI应用,去调用一个现成的MCP Server(包括你自己编写的),那你根本不需要写任何MCP Client代码,只需要修改配置文件即可。在这种情况下,host就是AI应用本身,它已经内置了写好的MCP Client代码。你配置好MCP Server,它就会自动维护连接、完成后续的一切。

场景二:作为开发者通过代码调用

如果你想在自己开发的Ja va、Go或Python程序中调用一个MCP Server——比如构建一个能调用本地工具的AI Agent——那你就需要自己实现一个MCP Client。

以Stdio传输方式为例,核心交互流程可以简化为三步:

  1. 启动进程

    :你的程序(Client)启动MCP Server作为子进程,比如执行npx -y @modelcontextprotocol/server-filesystem这样的命令。
  2. 握手(Initialization)

    :发送initialize请求,协商协议版本和能力。
  3. 发送指令

    :发送tools/listtools/callresources/read等JSON-RPC消息。

在这个场景下,你需要自己编写MCP Client代码来处理初始化链接、维护协议和连接、发送消息以及处理响应。

一次MCP调用示例

看过上面的流程,可能有人还会疑惑:那LLM在整个过程中到底扮演什么角色?别急,我们上面其实已经说了——AI应用通过MCP Client调用MCP Server,LLM只负责推理输入和输出。下面用一个完整的调用链来演示,看完就清楚了。

先明确各个角色的职责:

  • AI应用

    :负责管控全局,协调各个请求和负载均衡。
  • MCP Client

    :负责连接Server、管理进程、维护对话上下文。
  • MCP Server

    :无状态的Worker。它不知道上下文,不关心是谁在问,只负责接收指令 → 干活 → 返回结果。
  • LLM

    :它没有“手脚”(不能联网、不能读文件)。它的工作是对用户的自然语言进行分析,对比AI应用提供的Tools List,然后生成一个结构化的JSON文本,告诉AI应用:“请帮我调用这个函数,参数是X和Y。”

下面是完整的交互流程:

  • 初始化(Handshake)

    • Client启动Server。
    • Client询问Server:“你有什么本事?”(Tools List)
    • Server回答:“我会读文件(fs.read),我会查数据库(db.query)。”
  • 用户提问

    • 用户对Client说:“帮我查一下user_id=101的订单。”
  • Prompt组装(AI应用内部逻辑)

    • AI应用将用户的System Prompt + Server提供的工具定义(Schema)+ 用户问题,打包发给LLM。
  • LLM决策

    • LLM经过推理,发现db.query工具能解决这个问题。
    • LLM返回给AI应用(而不是直接给Server)一个结构化的指令:{ "tool_use": "db.query", "params": { "sql": "SELECT * FROM orders WHERE user_id=101" } }
  • 执行(真正的MCP调用发生在这里)

    • AI应用解析LLM的响应,发现它想调用工具,于是控制MCP Client发送相关请求和数据。
    • Client通过JSON-RPC(Stdio/SSE)向MCP Server发送tools/call请求。
  • Server响应

    • Server执行SQL,返回JSON数据给Client。
  • 回环(Loop Back)

    • AI应用接收到Client返回的数据,将Server的执行结果再次喂给LLM。
    • AI应用说:“刚才你让我调用的工具,结果是[Order A, Order B],请生成给用户的最终回复。”
  • 最终输出

    • LLM生成自然语言回复:“用户你好,ID为101的用户有两笔订单……”

在AI应用里面配置MCP server

相信通过上面的解析,大家对整个调用过程应该比较清晰了。接下来,我们再按场景逐步拆解MCP Client的配置问题。

前面提到,在Claude Code这类现成的AI应用里,我们只需要配置MCP Server即可,不需要编写MCP Client代码。下面以Claude Code为例,具体看看怎么配。

配置信息写在claude_desktop_config.json文件中:

// ~/Library/Application Support/Claude/claude_desktop_config.json { "mcpServers": { "weather": { "command": "uv", "args": ["--directory", "/absolute/path/to/weather", "run", "weather-server"] }, "filesystem": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-filesystem", "/Users/username/Documents"] }, "github": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-github"], "env": { "GITHUB_PERSONAL_ACCESS_TOKEN": "ghp_your_token_here" } } } }

可以将每一项配置理解为在终端执行一个长连接的子进程。以下是关键参数的拆解:

1. mcpServers

:根节点,是一个Map。Key(如weathergithub)是该Server的唯一标识符,用于在AI界面显示和内部隔离。

2. command(可执行文件)


这是Client尝试启动的二进制文件或脚本解释器,用于指定入口程序。常见值包括npx(Node.js)、pythonuv(Python包管理器),或者你编译好的Go/Ja va二进制文件。

3. args(启动参数)


这是一个字符串数组,会被追加在command后面,形成完整的shell启动命令。

  • weather示例

    uv --directory /path/to/weather run weather-server,这告诉uv切换到特定目录并运行该项目。
  • filesystem示例

    npx -y @modelcontextprotocol/server-filesystem /Users/username/Documents-y表示自动确认安装,最后一个参数是传给Server程序内部的参数,告知它允许访问哪个文件夹——这是一个白名单机制。

4. env(环境变量)


这是子进程启动时注入的环境变量,用于传递敏感信息(API Keys)或配置参数,从而避免将这些信息硬编码在代码或命令行参数中。就像在Docker中配置ENV或在本地.env文件中定义变量一样。以GitHub示例为例,GITHUB_PERSONAL_ACCESS_TOKEN会被注入到该进程的上下文中,Server代码可以通过os.Getenv("GITHUB_PERSONAL_ACCESS_TOKEN")(Go)或System.getenv(...)(Ja va)获取。

通过代码来调用MCP server

这就是前面说的场景二——在自己构建的AI应用中,需要使用官方提供的SDK来编写MCP Client代码。

这里补充一个信息:官方提供了多种SDK。其中,后端开发常用的Go SDK由Google和Go官方维护,Ja va SDK由Spring AI官方维护,而Python SDK则由MCP官方维护。

下面是用Python SDK编写MCP Client的示例代码:

from mcp import ClientSession, StdioServerParameters from mcp.client.stdio import stdio_client # 配置服务器参数 server_params = StdioServerParameters( command="uv", args=["--directory", "/path/to/weather", "run", "weather-server"], ) async def main(): async with stdio_client(server_params) as (read, write): async with ClientSession(read, write) as session: # 初始化连接 await session.initialize() # 列出可用工具 tools = await session.list_tools() print("A vailable tools:", tools) # 调用工具 result = await session.call_tool( "get_forecast", arguments={"latitude": 37.7749, "longitude": -122.4194} ) print("Forecast:", result) # 列出资源 resources = await session.list_resources() print("A vailable resources:", resources) # 读取资源 config = await session.read_resource("weather://config") print("Config:", config) if __name__ == "__main__": import asyncio asyncio.run(main())

总结

这一篇主要解答了MCP Client的几个核心问题:Client到底怎么调用Server?在不同场景下,我们该如何配置或编写客户端代码?相信结合前面的系列文章,大家对MCP的整体理解已经比较完整了。下一篇我们会继续深入,聊聊MCP的高级特性以及一些需要特别注意的细节——这些点在实际落地中尤为重要。