MCP 2026年6月12日 约 16 分钟 Model Context Protocol AI Agent

2026 MCP 为什么会成为
AI 时代的 HTTP 协议?

N×M 困境 · 三层架构 · 与 REST 差异 · 四大厂商入局 · 边界与落地

Model Context Protocol MCP 与 AI Agent 基础设施

正在搭建 AI Agent 的开发者与技术决策者在 2024 年前面对的是一片「各说各话」的工具集成混沌:ChatGPT Plugins、OpenAI Function Calling、Claude Tool Use、各 IDE 插件格式互不兼容,N 个模型 × M 个工具 = N×M 个定制适配。2024 年 11 月 Anthropic 开源的 Model Context Protocol(MCP),被越来越多人比作 AI 时代的 HTTP。本文严格沿这一脉络展开:历史类比 → N×M 困境 → MCP 技术架构 → 与 HTTP/REST 的深层差异 → 2026 年四大厂商入局与生态数据 → 尚未完善的边界 → 开发者与企业落地意义,并说明在租用 VNC 远程 Mac上跑 Cursor / OpenClaw MCP 时,为何图形会话仍是验收刚需。

01

引子:互联网诞生前的混沌,与 AI 2024 年前的镜像

1970 年代的网络世界并不「互联」:ARPAnet、Ethernet、分组无线网络各自为政,每次跨网连接都要定制翻译层,成本高且易出错。TCP/IP 的出现定义了统一通信规则,让不同网络的设备开口「说同一种语言」;HTTP 在此之上再次抽象,构建了万维网的基础。

AI 世界在 2024 年前,正处于同一种混沌之中:大模型能力边界清晰——训练数据截止、无法访问实时信息、无法执行操作——业界共识是给 AI 接上「手脚」,即工具调用(Tool Use / Function Calling)。但每家模型、每个 IDE、每个 Agent 框架都有自己的接入格式,一旦更换模型供应商,集成逻辑往往要推倒重来。

  1. 01

    碎片化接口:ChatGPT Plugins、OpenAI Function Calling、Claude Tool Use……格式各异,文档驱动、硬编码为主。

  2. 02

    更换供应商成本:从 Claude 换到 GPT 再到 Gemini,工具层几乎要重写。

  3. 03

    类比 USB-C 之前:不同设备有不同充电口;MCP 要做的,就是 AI 工具集成领域的 USB-C。

02

N×M 困境:为什么 REST 接 AI 仍不够

现代 LLM 要靠外部工具补足能力,但现实是 N 个 AI 模型 × M 个外部工具 = N×M 个定制化集成。典型痛点如下表所示。

场景痛点
企业 CRM 接入 AI需为 Claude、GPT、Gemini 分别开发适配层
IDE 中的 AI 助手访问文件系统、数据库、API 的方式各不相同
AI Agent 编排LangChain、CrewAI 等框架工具定义无法跨框架复用

传统 REST API 的局限进一步放大了这一问题:静态发现(开发者读文档、硬编码)、无状态(多步工作流需手动传上下文)、不可自描述(API 不会「告诉」AI 自己能做什么)。REST 解决的是「能不能调用」;MCP 解决的是「AI 如何发现、选择并正确调用工具」——这才是 Agent 时代的核心命题。

03

MCP 是什么:三层角色、传输层与 JSON-RPC

Model Context Protocol(模型上下文协议)由 Anthropic 于 2024 年 11 月正式开源,是一套开放标准,定义 AI 模型(客户端)与外部工具/数据(服务端)之间通信的统一规范,核心思想是将「AI 能发现哪些工具、如何调用它们」标准化。

三层角色模型

  • H

    Host(宿主层):如 Claude Desktop、Cursor、VS Code,承载用户交互。

  • C

    MCP Client(客户端):维护与每个 Server 的 1:1 会话连接。

  • S

    MCP Server(服务端):暴露工具(Tools)、资源(Resources)、提示模板(Prompts),对接数据库、API、文件系统等外部系统。

Client 与 Server 之间通过 JSON-RPC 2.0 通信,支持运行时发现(tools/list)、资源读取(resources/read)及 Server 向 Client 的反向推送。

JSON-RPC · 工具调用示例
{
  "jsonrpc": "2.0",
  "method": "tools/call",
  "params": {
    "name": "query_database",
    "arguments": { "sql": "SELECT * FROM users LIMIT 10" }
  },
  "id": 1
}
传输方式适用场景特点
STDIO本地子进程零依赖、启动快、隔离性好
HTTP + SSE远程/云端服务跨网络、可水平扩展(需注意 session affinity)
04

MCP 与 HTTP:历史相似性与本质区别

维度互联网时代AI Agent 时代
问题不同网络协议互不兼容不同 AI 工具集成方式各异
解决方案TCP/IP + HTTPMCP
核心价值统一通信语言,让设备互联统一工具接口,让 AI 互联
开放性开放标准,任何人实现开源协议,任何人实现 Server/Client
应用层HTTP 之上诞生 Web、Email、FTPMCP 之上将诞生 AI 应用生态

MCP 的核心优势可概括为四条:运行时发现(Agent 启动时 tools/list 获取清单)、有状态会话(持久连接支持多步工作流)、自描述能力(JSON Schema 描述参数与副作用)、双向通信(Server 可反向请求推理或向用户索要信息)。

05

2026 年为何 MCP 能脱颖而出:时机、背书与网络效应

  1. 01

    时机:2024 年 LLM 能力突破阈值,Agent 成为主流范式,工具调用碎片化问题极度尖锐。

  2. 02

    来源背书:Anthropic 技术可信度 + Claude 旗舰产品率先集成 + 开源降低门槛。

  3. 03

    四大厂商一个季度全面入局:2024 年 11 月 Anthropic 开源规范;2025 年 Cursor、Zed、Continue 等 IDE 原生支持;2026 年 Q1 OpenAI 宣布采用 MCP2026 年 Q2 Google DeepMind CEO 宣布 Gemini 支持 MCP2026 年 Q2 Microsoft 完成支持;治理权移交 Linux Foundation 旗下 Agentic AI Foundation(AAIF)

  4. 04

    网络效应:截至 2026 年,MCP 生态已有超过 10,000 个 MCP 服务器;每新增一个 Server,所有兼容 Client 立即可用——这正是 HTTP 当年奠定 Web 生态的同一种正反馈。

  5. 05

    无厂商锁定:开发者可自由切换底层 LLM,工具集成无需改写——闭源方案难以提供同等价值。

从「一家公司的私有标准」到「行业公共基础设施」——AAIF 治理的意义,堪比互联网协议由 IETF 治理。

06

边界:它还不完全是 HTTP,以及与 A2A 的互补

理性看待 MCP,需承认尚未完善的部分:

  • !

    安全机制仍在补齐:OAuth 2.0/2.1 标准化身份验证列入 2026 路线图;约 1000 个 MCP 服务器处于暴露且未授权状态,间接提示注入攻击已被记录。

  • !

    可发现性:尚无统一「MCP 服务器注册表」(类比没有 DNS 的互联网),工具发现仍依赖人工配置。

  • !

    水平扩展:SSE 传输需 session affinity,不如无状态 HTTP 天然易扩展。

Google 推出的 Agent-to-Agent(A2A)协议定义 Agent 之间的通信,与 MCP 不是竞争而是分层:MCP = AI 模型 ↔ 工具/数据(垂直集成)A2A = AI Agent ↔ AI Agent(横向编排)。两者共同构成 Agent 互联网的协议栈。

07

开发者与企业:写一次、到处跑与治理面统一

视角关键收益(可引用数据)
开发者MCP Server 写完即可被所有兼容 Client 使用;企业 AI 集成开发成本降幅达 38–55%;垂直领域专属 Server 仍是蓝海
企业集成资产从绑定供应商变为可移植资产;在 Server 层集中管理权限;Google Cloud、Azure、AWS 均提供托管 MCP 服务
行业格局标准化接口降低新创公司进入门槛约 62%;传统系统集成商定制化需求减少约 43%

落地五步(含远程 Mac 验收)

  1. 1

    选定 Host(Cursor / Claude Desktop / VS Code)并确认 2026 年版本已原生支持 MCP。

  2. 2

    从社区或自建部署 MCP Server;本地开发优先 STDIO,生产可考虑 HTTP+SSE。

  3. 3

    在配置中注册 Server,用 tools/list 验证运行时发现是否正常。

  4. 4

    对涉及浏览器、钥匙串、屏幕录制的 Server,在 macOS 图形会话中完成 TCC 权限与首次弹窗(纯 SSH 无法替代)。

  5. 5

    记录 Server 版本、权限边界与审计日志;与站内 OpenClaw 浏览器 MCPAgent Skill 文互链,形成完整 Agent 工具链。

08

FAQ

不会完全取代。REST 仍适合传统服务间调用;MCP 面向 AI 运行时发现与有状态工具会话,二者在不同层级互补。

Claude Desktop、Cursor、Zed、Continue 等 IDE;2026 年 OpenAI、Google Gemini、Microsoft 均已宣布或完成 MCP 支持;OpenClaw 等 Agent 框架亦提供 MCP 接入路径。

浏览器 DevTools MCP、文件系统高权限操作、钥匙串与屏幕录制等常触发 macOS TCC 弹窗。纯 SSH 无法点选「始终允许」,需 VNC 图形会话完成与 Host 同机的权限验收。详见站内远程 Mac 权限清单

MCP 连接模型与工具/数据;A2A(Agent-to-Agent) 连接 Agent 与 Agent。二者构成 Agent 互联网的不同协议层,而非零和竞争。

结语:协议即基础设施

HTTP 没有发明浏览器,但没有 HTTP 就没有浏览器生态;TCP/IP 没有发明邮件,但没有 TCP/IP 就没有 Email。MCP 没有发明 AI Agent,但它正在成为 AI Agent 生态能够存在的基础设施。多年后回望,2024 年 11 月 Anthropic 开源 MCP 规范这一刻,可能正是 AI 时代的「HTTP 诞生时刻」。

对个体开发者而言,真正隐性成本不在「会不会配 MCP JSON」,而在Host 与 Server 是否跑在稳定、可图形验收的 macOS 环境:Windows 主力机 + 云端 Mac 混跑 Cursor MCP 时,权限弹窗、Chrome 自动化与 Gateway 日志往往要在同一台远程机器的桌面会话里交叉核对;自购 Mac mini 则要承担睡眠、系统更新与折旧,低配机型在大规模 tools/list 与浏览器类 Server 并发时也容易吃满内存。

若你希望按小时验证 MCP 工具链、又要在与 Cursor / OpenClaw 同机的图形界面里完成权限与控制台验收,可通过 VNCMac 租用远程 Mac:下方主按钮进入购买页选节点;需要对比套餐与连接说明时,先浏览首页或帮助页 SSH-VNC 指南。