MCP 协议详解：AI 工具调用的新标准

via

发表：2026-07-02 09:01:21

修改：2026-07-02 09:01:19

引言：AI 应用的工具调用困境

在过去两年里，大语言模型（LLM）从单纯的文本生成工具进化为能够调用外部工具、访问实时数据、执行复杂任务的智能体。然而，每当你想让一个 AI 模型调用一个新工具时，通常需要写大量的胶水代码：定义函数签名、处理参数解析、管理认证、处理错误……每个 AI 平台还有自己的接口规范。OpenAI 的 Function Calling、Anthropic 的 Tool Use、Google 的 Function Call —— 三套格式，三套适配代码。

2024 年底，Anthropic 提出了 MCP（Model Context Protocol） 协议，试图终结这种碎片化局面。经过一年多的发展，MCP 已经成为 AI 工具调用领域事实上的标准，被 OpenAI、Google、Microsoft 等主要厂商采纳。本文将深入剖析 MCP 的设计理念、核心机制、生态现状以及实战实践。

一、MCP 是什么？

MCP（Model Context Protocol）是一个开放协议，旨在标准化 AI 应用与外部数据源、工具之间的连接方式。你可以把它理解为"AI 领域的 USB-C 接口" —— 不管你的模型是 GPT、Claude 还是 Gemini，不管你的工具是数据库查询、文件系统访问还是 API 调用，只要双方实现 MCP 协议，就能即插即用。

在 MCP 出现之前，如果你想让 AI 助手访问你的公司内部知识库，你需要为每个 AI 平台单独写一套集成代码。切换模型意味着重写所有集成。MCP 通过提供统一的协议规范，让"写一次，到处用"成为现实。

核心设计目标

统一接口：一套协议适配所有模型和所有工具
双向通信：支持模型主动调用工具，也支持工具向模型推送上下文
安全可控：工具声明能力，模型和用户共同决定是否调用
可扩展：支持自定义工具、资源、提示模板

二、架构解析

MCP 采用了客户端-服务端架构，其中一个 AI 应用（如 Claude Desktop）作为 MCP 客户端，可以连接多个 MCP 服务端。每个 MCP 服务端 wraps 一种工具或数据源。

2.1 通信层

MCP 基于 JSON-RPC 2.0 协议进行消息传输，支持两种传输方式：

stdio 传输：通过标准输入/输出进行通信，适用于本地运行的 MCP 服务端
HTTP + SSE 传输：基于 HTTP 长连接和 Server-Sent Events，适用于远程 MCP 服务端

这种设计让 MCP 既能在本地安全运行（如访问文件系统），也能在远程部署（如访问云数据库）。

2.2 核心原语

MCP 定义了三种核心原语，分别对应不同的使用场景：

Tools（工具）

Tools 是最常用的原语，允许模型执行操作。每个 Tool 包含名称、描述、参数 schema（JSON Schema 格式）和处理器。模型通过调用 Tool 来完成具体任务，如查询数据库、发送邮件、执行代码等。

{
  "name": "query_database",
  "description": "执行 SQL 查询并返回结果",
  "inputSchema": {
    "type": "object",
    "properties": {
      "sql": { "type": "string", "description": "SQL 查询语句" }
    },
    "required": ["sql"]
  }
}

Resources（资源）

Resources 允许服务端向模型暴露可读的数据，如文件内容、数据库记录、API 响应等。与 Tools 不同，Resources 是被动的 —— 模型可以读取但不执行操作。Resources 通过 URI 标识。

Prompts（提示模板）

Prompts 允许服务端提供预定义的提示模板，帮助用户更好地与模型交互。例如，一个代码分析 MCP 服务端可以提供"分析代码安全风险"的模板，用户选择后自动生成结构化的提示。

三、实战：构建一个 MCP 服务端

让我们用 Python 构建一个简单的 MCP 服务端，提供天气查询功能。

3.1 环境准备

pip install mcp

3.2 代码实现

from mcp.server import Server
from mcp.types import Tool, TextContent
import json
import aiohttp

server = Server("weather-mcp")

@server.list_tools()
async def list_tools() -> list[Tool]:
    return [
        Tool(
            name="get_weather",
            description="获取指定城市的当前天气信息",
            inputSchema={
                "type": "object",
                "properties": {
                    "city": {
                        "type": "string",
                        "description": "城市名称，如 Beijing, Shanghai"
                    },
                    "units": {
                        "type": "string",
                        "enum": ["metric", "imperial"],
                        "description": "温度单位：metric(摄氏) 或 imperial(华氏)"
                    }
                },
                "required": ["city"]
            }
        )
    ]

@server.call_tool()
async def call_tool(name: str, arguments: dict) -> list[TextContent]:
    if name == "get_weather":
        city = arguments["city"]
        units = arguments.get("units", "metric")
        # 实际项目中调用天气 API
        async with aiohttp.ClientSession() as session:
            async with session.get(
                f"https://api.openweathermap.org/data/2.5/weather",
                params={"q": city, "units": units, "appid": "YOUR_API_KEY"}
            ) as resp:
                data = await resp.json()
                temp = data["main"]["temp"]
                desc = data["weather"][0]["description"]
                return [
                    TextContent(
                        type="text",
                        text=json.dumps({
                            "city": city,
                            "temperature": temp,
                            "description": desc,
                            "units": units
                        }, ensure_ascii=False)
                    )
                ]
    raise ValueError(f"Unknown tool: {name}")

if __name__ == "__main__":
    import asyncio
    from mcp.server.stdio import stdio_server
    
    async def main():
        async with stdio_server() as (read, write):
            await server.run(read, write, server.create_initialization_info())
    
    asyncio.run(main())

3.3 接入客户端

写好服务端后，你可以在任何支持 MCP 的客户端中配置使用。以 Claude Desktop 为例，编辑配置文件添加：

{
  "mcpServers": {
    "weather": {
      "command": "python",
      "args": ["/path/to/weather_mcp.py"]
    }
  }
}

重启客户端后，模型就能自动发现并调用你的工具了。不需要写任何集成代码 —— 这就是 MCP 的威力。

四、生态现状与趋势

4.1 官方与社区服务端

截至 2026 年中，MCP 生态已有数百个公开的服务端实现，覆盖了主流开发场景：

开发工具：GitHub、GitLab、Bitbucket、Linear
数据库：PostgreSQL、MySQL、MongoDB、SQLite、Redis
云平台：AWS、Google Cloud、Azure、Vercel
生产力工具：Slack、Notion、Jira、Figma
搜索引擎：Brave Search、Google Search、Tavily
文件系统：本地文件、Google Drive、Dropbox

这些服务端大多是开源项目，你可以直接使用或基于它们进行定制。

4.2 多模型支持

MCP 最初由 Anthropic 提出，但现在已被广泛采纳：

Claude：原生支持，MCP 是其工具调用的主要机制
OpenAI：在 2025 年宣布支持 MCP，ChatGPT 和 API 均可使用
Google Gemini：通过 SDK 层适配 MCP
开源生态：LangChain、LlamaIndex 等框架已内置 MCP 支持

这意味着你写的 MCP 服务端可以被几乎所有主流 AI 应用复用，真正实现了"一次开发，处处可用"。

五、安全与最佳实践

5.1 权限控制

MCP 服务端应该遵循最小权限原则。不要让一个服务端拥有超出其功能范围的权限。例如，一个只读分析服务端不应该有写入权限。

5.2 输入校验

即使模型应该发送正确格式的参数，服务端也必须做严格的输入校验。模型可能产生幻觉参数，或被 prompt injection 攻击诱导发送恶意输入。

5.3 敏感数据处理

工具返回的数据可能包含敏感信息。服务端应该实现数据脱敏机制，避免将 API 密钥、密码、个人信息等直接暴露给模型。

5.4 审计日志

记录所有工具调用的时间、参数、返回结果，便于事后审计和调试。生产环境中这不是可选项。

六、面临的挑战

MCP 并非完美无缺。在实际使用中，有几个值得关注的挑战：

性能开销：每次工具调用都需要完整的 JSON-RPC 往返，对于高频调用场景可能成为瓶颈。HTTP+SSE 传输模式尤其需要注意连接管理。

错误处理标准化：虽然 MCP 定义了错误码，但不同服务端对错误的处理方式差异较大。有些返回结构化错误，有些直接抛异常，缺乏一致性。

版本管理：当一个服务端升级了 Tool 的参数 schema，使用旧版本 schema 的模型可能调用失败。目前 MCP 还没有成熟的版本协商机制。

调试体验：MCP 的 stdio 传输意味着服务端的 stdout 被协议占用，调试日志需要走 stderr 或文件。对新手来说调试门槛偏高。

总结

MCP 协议在 AI 工具调用领域做了正确的事：统一接口、分离关注点、即插即用。它不是万能药，但它解决了 AI 应用集成中最痛的那部分问题 —— 重复编写适配代码。

对于正在构建 AI 应用的开发者来说，尽早拥抱 MCP 是明智的选择。即使你当前只用一个模型，MCP 的解耦设计也让你的架构更健壮、更未来-proof。当你需要切换模型或新增工具时，只需要插拔 MCP 服务端，核心代码无需改动。

AI 的未来不是更大的模型，而是模型与工具、数据、服务之间更紧密的连接。MCP 正在定义这种连接的标准。你准备好了吗？