N×M 困境 · 三层架构 · 与 REST 差异 · 四大厂商入局 · 边界与落地
正在搭建 AI Agent 的开发者与技术决策者在 2024 年前面对的是一片「各说各话」的工具集成混沌:ChatGPT Plugins、OpenAI Function Calling、Claude Tool Use、各 IDE 插件格式互不兼容,N 个模型 × M 个工具 = N×M 个定制适配。2024 年 11 月 Anthropic 开源的 Model Context Protocol(MCP),被越来越多人比作 AI 时代的 HTTP。本文严格沿这一脉络展开:历史类比 → N×M 困境 → MCP 技术架构 → 与 HTTP/REST 的深层差异 → 2026 年四大厂商入局与生态数据 → 尚未完善的边界 → 开发者与企业落地意义,并说明在租用 VNC 远程 Mac上跑 Cursor / OpenClaw MCP 时,为何图形会话仍是验收刚需。
1970 年代的网络世界并不「互联」:ARPAnet、Ethernet、分组无线网络各自为政,每次跨网连接都要定制翻译层,成本高且易出错。TCP/IP 的出现定义了统一通信规则,让不同网络的设备开口「说同一种语言」;HTTP 在此之上再次抽象,构建了万维网的基础。
AI 世界在 2024 年前,正处于同一种混沌之中:大模型能力边界清晰——训练数据截止、无法访问实时信息、无法执行操作——业界共识是给 AI 接上「手脚」,即工具调用(Tool Use / Function Calling)。但每家模型、每个 IDE、每个 Agent 框架都有自己的接入格式,一旦更换模型供应商,集成逻辑往往要推倒重来。
碎片化接口:ChatGPT Plugins、OpenAI Function Calling、Claude Tool Use……格式各异,文档驱动、硬编码为主。
更换供应商成本:从 Claude 换到 GPT 再到 Gemini,工具层几乎要重写。
类比 USB-C 之前:不同设备有不同充电口;MCP 要做的,就是 AI 工具集成领域的 USB-C。
现代 LLM 要靠外部工具补足能力,但现实是 N 个 AI 模型 × M 个外部工具 = N×M 个定制化集成。典型痛点如下表所示。
| 场景 | 痛点 |
|---|---|
| 企业 CRM 接入 AI | 需为 Claude、GPT、Gemini 分别开发适配层 |
| IDE 中的 AI 助手 | 访问文件系统、数据库、API 的方式各不相同 |
| AI Agent 编排 | LangChain、CrewAI 等框架工具定义无法跨框架复用 |
传统 REST API 的局限进一步放大了这一问题:静态发现(开发者读文档、硬编码)、无状态(多步工作流需手动传上下文)、不可自描述(API 不会「告诉」AI 自己能做什么)。REST 解决的是「能不能调用」;MCP 解决的是「AI 如何发现、选择并正确调用工具」——这才是 Agent 时代的核心命题。
Model Context Protocol(模型上下文协议)由 Anthropic 于 2024 年 11 月正式开源,是一套开放标准,定义 AI 模型(客户端)与外部工具/数据(服务端)之间通信的统一规范,核心思想是将「AI 能发现哪些工具、如何调用它们」标准化。
Host(宿主层):如 Claude Desktop、Cursor、VS Code,承载用户交互。
MCP Client(客户端):维护与每个 Server 的 1:1 会话连接。
MCP Server(服务端):暴露工具(Tools)、资源(Resources)、提示模板(Prompts),对接数据库、API、文件系统等外部系统。
Client 与 Server 之间通过 JSON-RPC 2.0 通信,支持运行时发现(tools/list)、资源读取(resources/read)及 Server 向 Client 的反向推送。
{
"jsonrpc": "2.0",
"method": "tools/call",
"params": {
"name": "query_database",
"arguments": { "sql": "SELECT * FROM users LIMIT 10" }
},
"id": 1
}| 传输方式 | 适用场景 | 特点 |
|---|---|---|
| STDIO | 本地子进程 | 零依赖、启动快、隔离性好 |
| HTTP + SSE | 远程/云端服务 | 跨网络、可水平扩展(需注意 session affinity) |
| 维度 | 互联网时代 | AI Agent 时代 |
|---|---|---|
| 问题 | 不同网络协议互不兼容 | 不同 AI 工具集成方式各异 |
| 解决方案 | TCP/IP + HTTP | MCP |
| 核心价值 | 统一通信语言,让设备互联 | 统一工具接口,让 AI 互联 |
| 开放性 | 开放标准,任何人实现 | 开源协议,任何人实现 Server/Client |
| 应用层 | HTTP 之上诞生 Web、Email、FTP | MCP 之上将诞生 AI 应用生态 |
MCP 的核心优势可概括为四条:运行时发现(Agent 启动时 tools/list 获取清单)、有状态会话(持久连接支持多步工作流)、自描述能力(JSON Schema 描述参数与副作用)、双向通信(Server 可反向请求推理或向用户索要信息)。
时机:2024 年 LLM 能力突破阈值,Agent 成为主流范式,工具调用碎片化问题极度尖锐。
来源背书:Anthropic 技术可信度 + Claude 旗舰产品率先集成 + 开源降低门槛。
四大厂商一个季度全面入局:2024 年 11 月 Anthropic 开源规范;2025 年 Cursor、Zed、Continue 等 IDE 原生支持;2026 年 Q1 OpenAI 宣布采用 MCP;2026 年 Q2 Google DeepMind CEO 宣布 Gemini 支持 MCP;2026 年 Q2 Microsoft 完成支持;治理权移交 Linux Foundation 旗下 Agentic AI Foundation(AAIF)。
网络效应:截至 2026 年,MCP 生态已有超过 10,000 个 MCP 服务器;每新增一个 Server,所有兼容 Client 立即可用——这正是 HTTP 当年奠定 Web 生态的同一种正反馈。
无厂商锁定:开发者可自由切换底层 LLM,工具集成无需改写——闭源方案难以提供同等价值。
从「一家公司的私有标准」到「行业公共基础设施」——AAIF 治理的意义,堪比互联网协议由 IETF 治理。
理性看待 MCP,需承认尚未完善的部分:
安全机制仍在补齐:OAuth 2.0/2.1 标准化身份验证列入 2026 路线图;约 1000 个 MCP 服务器处于暴露且未授权状态,间接提示注入攻击已被记录。
可发现性:尚无统一「MCP 服务器注册表」(类比没有 DNS 的互联网),工具发现仍依赖人工配置。
水平扩展:SSE 传输需 session affinity,不如无状态 HTTP 天然易扩展。
Google 推出的 Agent-to-Agent(A2A)协议定义 Agent 之间的通信,与 MCP 不是竞争而是分层:MCP = AI 模型 ↔ 工具/数据(垂直集成);A2A = AI Agent ↔ AI Agent(横向编排)。两者共同构成 Agent 互联网的协议栈。
| 视角 | 关键收益(可引用数据) |
|---|---|
| 开发者 | MCP Server 写完即可被所有兼容 Client 使用;企业 AI 集成开发成本降幅达 38–55%;垂直领域专属 Server 仍是蓝海 |
| 企业 | 集成资产从绑定供应商变为可移植资产;在 Server 层集中管理权限;Google Cloud、Azure、AWS 均提供托管 MCP 服务 |
| 行业格局 | 标准化接口降低新创公司进入门槛约 62%;传统系统集成商定制化需求减少约 43% |
选定 Host(Cursor / Claude Desktop / VS Code)并确认 2026 年版本已原生支持 MCP。
从社区或自建部署 MCP Server;本地开发优先 STDIO,生产可考虑 HTTP+SSE。
在配置中注册 Server,用 tools/list 验证运行时发现是否正常。
对涉及浏览器、钥匙串、屏幕录制的 Server,在 macOS 图形会话中完成 TCC 权限与首次弹窗(纯 SSH 无法替代)。
记录 Server 版本、权限边界与审计日志;与站内 OpenClaw 浏览器 MCP、Agent Skill 文互链,形成完整 Agent 工具链。
不会完全取代。REST 仍适合传统服务间调用;MCP 面向 AI 运行时发现与有状态工具会话,二者在不同层级互补。
Claude Desktop、Cursor、Zed、Continue 等 IDE;2026 年 OpenAI、Google Gemini、Microsoft 均已宣布或完成 MCP 支持;OpenClaw 等 Agent 框架亦提供 MCP 接入路径。
浏览器 DevTools MCP、文件系统高权限操作、钥匙串与屏幕录制等常触发 macOS TCC 弹窗。纯 SSH 无法点选「始终允许」,需 VNC 图形会话完成与 Host 同机的权限验收。详见站内远程 Mac 权限清单。
MCP 连接模型与工具/数据;A2A(Agent-to-Agent) 连接 Agent 与 Agent。二者构成 Agent 互联网的不同协议层,而非零和竞争。
HTTP 没有发明浏览器,但没有 HTTP 就没有浏览器生态;TCP/IP 没有发明邮件,但没有 TCP/IP 就没有 Email。MCP 没有发明 AI Agent,但它正在成为 AI Agent 生态能够存在的基础设施。多年后回望,2024 年 11 月 Anthropic 开源 MCP 规范这一刻,可能正是 AI 时代的「HTTP 诞生时刻」。
对个体开发者而言,真正隐性成本不在「会不会配 MCP JSON」,而在Host 与 Server 是否跑在稳定、可图形验收的 macOS 环境:Windows 主力机 + 云端 Mac 混跑 Cursor MCP 时,权限弹窗、Chrome 自动化与 Gateway 日志往往要在同一台远程机器的桌面会话里交叉核对;自购 Mac mini 则要承担睡眠、系统更新与折旧,低配机型在大规模 tools/list 与浏览器类 Server 并发时也容易吃满内存。
若你希望按小时验证 MCP 工具链、又要在与 Cursor / OpenClaw 同机的图形界面里完成权限与控制台验收,可通过 VNCMac 租用远程 Mac:下方主按钮进入购买页选节点;需要对比套餐与连接说明时,先浏览首页或帮助页 SSH-VNC 指南。