N×M 困境 · 三層架構 · 與 REST 差異 · 四大廠商入局 · 邊界與落地
正在搭建 AI Agent 的開發者與技術決策者,在 2024 年前面對的是一片「各說各話」的工具整合混沌:ChatGPT Plugins、OpenAI Function Calling、Claude Tool Use、各 IDE 外掛格式互不兼容,N 個模型 × M 個工具 = N×M 個客製適配。2024 年 11 月 Anthropic 開源的 Model Context Protocol(MCP),愈來愈多人將它比作 AI 時代的 HTTP。本文沿這條脈絡展開:歷史類比 → N×M 困境 → MCP 技術架構 → 與 HTTP/REST 的深層差異 → 2026 年四大廠商入局與生態數據 → 尚未完善的邊界 → 開發者與企業落地意義,並說明在租用 VNC 遠端 Mac上跑 Cursor / OpenClaw MCP 時,為何圖形工作階段仍是驗收剛需。
1970 年代的網路世界並不「互聯」:ARPAnet、Ethernet、分組無線網路各自為政,每次跨網連線都要客製翻譯層,成本高且易出錯。TCP/IP 的出現定義了統一通訊規則,讓不同網路的裝置開口「說同一種語言」;HTTP 在此之上再次抽象,建構了全球資訊網的基礎。
AI 世界在 2024 年前,正處於同一種混沌之中:大模型能力邊界清晰——訓練資料截止、無法存取即時資訊、無法執行操作——業界共識是給 AI 接上「手腳」,即工具呼叫(Tool Use / Function Calling)。但每家模型、每個 IDE、每個 Agent 框架都有自己的接入格式,一旦更換模型供應商,整合邏輯往往要推倒重來。
碎片化介面:ChatGPT Plugins、OpenAI Function Calling、Claude Tool Use……格式各異,以文件驅動、硬編碼為主。
更換供應商成本:從 Claude 換到 GPT 再到 Gemini,工具層幾乎要重寫。
類比 USB-C 之前:不同裝置有不同充電孔;MCP 要做的,就是 AI 工具整合領域的 USB-C。
現代 LLM 要靠外部工具補足能力,但現實是 N 個 AI 模型 × M 個外部工具 = N×M 個客製化整合。典型痛點如下表所示。
| 場景 | 痛點 |
|---|---|
| 企業 CRM 接入 AI | 需為 Claude、GPT、Gemini 分別開發適配層 |
| IDE 中的 AI 助手 | 存取檔案系統、資料庫、API 的方式各不相同 |
| AI Agent 編排 | LangChain、CrewAI 等框架工具定義無法跨框架複用 |
傳統 REST API 的侷限進一步放大了這個問題:靜態發現(開發者讀文件、硬編碼)、無狀態(多步工作流需手動傳上下文)、不可自描述(API 不會「告訴」AI 自己能做什麼)。REST 解決的是「能不能呼叫」;MCP 解決的是「AI 如何發現、選擇並正確呼叫工具」——這才是 Agent 時代的核心命題。
Model Context Protocol(模型上下文協議)由 Anthropic 於 2024 年 11 月正式開源,是一套開放標準,定義 AI 模型(用戶端)與外部工具/資料(伺服器端)之間通訊的統一規範,核心思想是將「AI 能發現哪些工具、如何呼叫它們」標準化。
Host(宿主層):如 Claude Desktop、Cursor、VS Code,承載使用者互動。
MCP Client(用戶端):維護與每個 Server 的 1:1 工作階段連線。
MCP Server(伺服器端):暴露工具(Tools)、資源(Resources)、提示模板(Prompts),對接資料庫、API、檔案系統等外部系統。
Client 與 Server 之間透過 JSON-RPC 2.0 通訊,支援執行時發現(tools/list)、資源讀取(resources/read)及 Server 向 Client 的反向推送。
{
"jsonrpc": "2.0",
"method": "tools/call",
"params": {
"name": "query_database",
"arguments": { "sql": "SELECT * FROM users LIMIT 10" }
},
"id": 1
}| 傳輸方式 | 適用場景 | 特點 |
|---|---|---|
| STDIO | 本機子程序 | 零依賴、啟動快、隔離性好 |
| HTTP + SSE | 遠端/雲端服務 | 跨網路、可水平擴展(需注意 session affinity) |
| 維度 | 網際網路時代 | AI Agent 時代 |
|---|---|---|
| 問題 | 不同網路協議互不兼容 | 不同 AI 工具整合方式各異 |
| 解決方案 | TCP/IP + HTTP | MCP |
| 核心價值 | 統一通訊語言,讓裝置互聯 | 統一工具介面,讓 AI 互聯 |
| 開放性 | 開放標準,任何人可實作 | 開源協議,任何人可實作 Server/Client |
| 應用層 | HTTP 之上誕生 Web、Email、FTP | MCP 之上將誕生 AI 應用生態 |
MCP 的核心優勢可概括為四條:執行時發現(Agent 啟動時 tools/list 取得清單)、有狀態工作階段(持久連線支援多步工作流)、自描述能力(JSON Schema 描述參數與副作用)、雙向通訊(Server 可反向請求推理或向使用者索取資訊)。
時機:2024 年 LLM 能力突破閾值,Agent 成為主流範式,工具呼叫碎片化問題極度尖銳。
來源背書:Anthropic 技術可信度 + Claude 旗艦產品率先整合 + 開源降低門檻。
四大廠商一個季度全面入局:2024 年 11 月 Anthropic 開源規範;2025 年 Cursor、Zed、Continue 等 IDE 原生支援;2026 年 Q1 OpenAI 宣布採用 MCP;2026 年 Q2 Google DeepMind CEO 宣布 Gemini 支援 MCP;2026 年 Q2 Microsoft 完成支援;治理權移交 Linux Foundation 旗下 Agentic AI Foundation(AAIF)。
網路效應:截至 2026 年,MCP 生態已有超過 10,000 個 MCP 伺服器;每新增一個 Server,所有兼容 Client 立即可用——這正是 HTTP 當年奠定 Web 生態的同一種正反饋。
無廠商鎖定:開發者可自由切換底層 LLM,工具整合無需改寫——閉源方案難以提供同等價值。
從「一家公司的私有標準」到「產業公共基礎設施」——AAIF 治理的意義,堪比網際網路協議由 IETF 治理。
理性看待 MCP,需承認尚未完善的部分:
安全機制仍在補齊:OAuth 2.0/2.1 標準化身分驗證列入 2026 路線圖;約 1000 個 MCP 伺服器處於暴露且未授權狀態,間接提示注入攻擊已被記錄。
可發現性:尚無統一「MCP 伺服器註冊表」(類比沒有 DNS 的網際網路),工具發現仍依賴人工配置。
水平擴展:SSE 傳輸需 session affinity,不如無狀態 HTTP 天然易擴展。
Google 推出的 Agent-to-Agent(A2A)協議定義 Agent 之間的通訊,與 MCP 不是競爭而是分層:MCP = AI 模型 ↔ 工具/資料(垂直整合);A2A = AI Agent ↔ AI Agent(橫向編排)。兩者共同構成 Agent 網際網路的協議棧。
| 視角 | 關鍵收益(可引用數據) |
|---|---|
| 開發者 | MCP Server 寫完即可被所有兼容 Client 使用;企業 AI 整合開發成本降幅達 38–55%;垂直領域專屬 Server 仍是藍海 |
| 企業 | 整合資產從綁定供應商變為可移植資產;在 Server 層集中管理權限;Google Cloud、Azure、AWS 均提供託管 MCP 服務 |
| 產業格局 | 標準化介面降低新創公司進入門檻約 62%;傳統系統整合商客製化需求減少約 43% |
選定 Host(Cursor / Claude Desktop / VS Code)並確認 2026 年版本已原生支援 MCP。
從社群或自建部署 MCP Server;本機開發優先 STDIO,生產可考慮 HTTP+SSE。
在配置中註冊 Server,用 tools/list 驗證執行時發現是否正常。
對涉及瀏覽器、鑰匙圈、螢幕錄製的 Server,在 macOS 圖形工作階段中完成 TCC 權限與首次彈窗(純 SSH 無法替代)。
記錄 Server 版本、權限邊界與稽核日誌;與站內 OpenClaw 瀏覽器 MCP、Agent Skill 文互鏈,形成完整 Agent 工具鏈。
不會完全取代。REST 仍適合傳統服務間呼叫;MCP 面向 AI 執行時發現與有狀態工具工作階段,二者在不同層級互補。
Claude Desktop、Cursor、Zed、Continue 等 IDE;2026 年 OpenAI、Google Gemini、Microsoft 均已宣布或完成 MCP 支援;OpenClaw 等 Agent 框架亦提供 MCP 接入路徑。
瀏覽器 DevTools MCP、檔案系統高權限操作、鑰匙圈與螢幕錄製等常觸發 macOS TCC 彈窗。純 SSH 無法點選「始終允許」,需 VNC 圖形工作階段完成與 Host 同機的權限驗收。詳見站內遠端 Mac 權限清單。
MCP 連接模型與工具/資料;A2A(Agent-to-Agent) 連接 Agent 與 Agent。二者構成 Agent 網際網路的不同協議層,而非零和競爭。
HTTP 沒有發明瀏覽器,但沒有 HTTP 就沒有瀏覽器生態;TCP/IP 沒有發明郵件,但沒有 TCP/IP 就沒有 Email。MCP 沒有發明 AI Agent,但它正在成為 AI Agent 生態能夠存在的基礎設施。多年後回望,2024 年 11 月 Anthropic 開源 MCP 規範這一刻,可能正是 AI 時代的「HTTP 誕生時刻」。
對個體開發者而言,真正隱性成本不在「會不會配 MCP JSON」,而在Host 與 Server 是否跑在穩定、可圖形驗收的 macOS 環境:Windows 主力機 + 雲端 Mac 混跑 Cursor MCP 時,權限彈窗、Chrome 自動化與 Gateway 日誌往往要在同一台遠端機器的桌面工作階段裡交叉核對;自購 Mac mini 則要承擔睡眠、系統更新與折舊,低配機型在大規模 tools/list 與瀏覽器類 Server 並發時也容易吃滿記憶體。
若你希望按小時驗證 MCP 工具鏈、又要在與 Cursor / OpenClaw 同機的圖形介面裡完成權限與控制台驗收,可透過 VNCMac 租用遠端 Mac:下方主按鈕進入購買頁選節點;需要對比套餐與連線說明時,先瀏覽首頁或說明頁 SSH-VNC 指南。