MCP 2026年6月12日 約 16 分鐘 Model Context Protocol AI Agent

2026 MCP 為什麼會成為
AI 時代的 HTTP 協議?

N×M 困境 · 三層架構 · 與 REST 差異 · 四大廠商入局 · 邊界與落地

Model Context Protocol MCP 與 AI Agent 基礎設施

正在搭建 AI Agent 的開發者與技術決策者,在 2024 年前面對的是一片「各說各話」的工具整合混沌:ChatGPT Plugins、OpenAI Function Calling、Claude Tool Use、各 IDE 外掛格式互不兼容,N 個模型 × M 個工具 = N×M 個客製適配。2024 年 11 月 Anthropic 開源的 Model Context Protocol(MCP),愈來愈多人將它比作 AI 時代的 HTTP。本文沿這條脈絡展開:歷史類比 → N×M 困境 → MCP 技術架構 → 與 HTTP/REST 的深層差異 → 2026 年四大廠商入局與生態數據 → 尚未完善的邊界 → 開發者與企業落地意義,並說明在租用 VNC 遠端 Mac上跑 Cursor / OpenClaw MCP 時,為何圖形工作階段仍是驗收剛需。

01

引子:網際網路誕生前的混沌,與 AI 2024 年前的鏡像

1970 年代的網路世界並不「互聯」:ARPAnet、Ethernet、分組無線網路各自為政,每次跨網連線都要客製翻譯層,成本高且易出錯。TCP/IP 的出現定義了統一通訊規則,讓不同網路的裝置開口「說同一種語言」;HTTP 在此之上再次抽象,建構了全球資訊網的基礎。

AI 世界在 2024 年前,正處於同一種混沌之中:大模型能力邊界清晰——訓練資料截止、無法存取即時資訊、無法執行操作——業界共識是給 AI 接上「手腳」,即工具呼叫(Tool Use / Function Calling)。但每家模型、每個 IDE、每個 Agent 框架都有自己的接入格式,一旦更換模型供應商,整合邏輯往往要推倒重來。

  1. 01

    碎片化介面:ChatGPT Plugins、OpenAI Function Calling、Claude Tool Use……格式各異,以文件驅動、硬編碼為主。

  2. 02

    更換供應商成本:從 Claude 換到 GPT 再到 Gemini,工具層幾乎要重寫。

  3. 03

    類比 USB-C 之前:不同裝置有不同充電孔;MCP 要做的,就是 AI 工具整合領域的 USB-C。

02

N×M 困境:為什麼 REST 接 AI 仍不夠

現代 LLM 要靠外部工具補足能力,但現實是 N 個 AI 模型 × M 個外部工具 = N×M 個客製化整合。典型痛點如下表所示。

場景痛點
企業 CRM 接入 AI需為 Claude、GPT、Gemini 分別開發適配層
IDE 中的 AI 助手存取檔案系統、資料庫、API 的方式各不相同
AI Agent 編排LangChain、CrewAI 等框架工具定義無法跨框架複用

傳統 REST API 的侷限進一步放大了這個問題:靜態發現(開發者讀文件、硬編碼)、無狀態(多步工作流需手動傳上下文)、不可自描述(API 不會「告訴」AI 自己能做什麼)。REST 解決的是「能不能呼叫」;MCP 解決的是「AI 如何發現、選擇並正確呼叫工具」——這才是 Agent 時代的核心命題。

03

MCP 是什麼:三層角色、傳輸層與 JSON-RPC

Model Context Protocol(模型上下文協議)由 Anthropic 於 2024 年 11 月正式開源,是一套開放標準,定義 AI 模型(用戶端)與外部工具/資料(伺服器端)之間通訊的統一規範,核心思想是將「AI 能發現哪些工具、如何呼叫它們」標準化。

三層角色模型

  • H

    Host(宿主層):如 Claude Desktop、Cursor、VS Code,承載使用者互動。

  • C

    MCP Client(用戶端):維護與每個 Server 的 1:1 工作階段連線。

  • S

    MCP Server(伺服器端):暴露工具(Tools)、資源(Resources)、提示模板(Prompts),對接資料庫、API、檔案系統等外部系統。

Client 與 Server 之間透過 JSON-RPC 2.0 通訊,支援執行時發現(tools/list)、資源讀取(resources/read)及 Server 向 Client 的反向推送。

JSON-RPC · 工具呼叫範例
{
  "jsonrpc": "2.0",
  "method": "tools/call",
  "params": {
    "name": "query_database",
    "arguments": { "sql": "SELECT * FROM users LIMIT 10" }
  },
  "id": 1
}
傳輸方式適用場景特點
STDIO本機子程序零依賴、啟動快、隔離性好
HTTP + SSE遠端/雲端服務跨網路、可水平擴展(需注意 session affinity)
04

MCP 與 HTTP:歷史相似性與本質區別

維度網際網路時代AI Agent 時代
問題不同網路協議互不兼容不同 AI 工具整合方式各異
解決方案TCP/IP + HTTPMCP
核心價值統一通訊語言,讓裝置互聯統一工具介面,讓 AI 互聯
開放性開放標準,任何人可實作開源協議,任何人可實作 Server/Client
應用層HTTP 之上誕生 Web、Email、FTPMCP 之上將誕生 AI 應用生態

MCP 的核心優勢可概括為四條:執行時發現(Agent 啟動時 tools/list 取得清單)、有狀態工作階段(持久連線支援多步工作流)、自描述能力(JSON Schema 描述參數與副作用)、雙向通訊(Server 可反向請求推理或向使用者索取資訊)。

05

2026 年為何 MCP 能脫穎而出:時機、背書與網路效應

  1. 01

    時機:2024 年 LLM 能力突破閾值,Agent 成為主流範式,工具呼叫碎片化問題極度尖銳。

  2. 02

    來源背書:Anthropic 技術可信度 + Claude 旗艦產品率先整合 + 開源降低門檻。

  3. 03

    四大廠商一個季度全面入局:2024 年 11 月 Anthropic 開源規範;2025 年 Cursor、Zed、Continue 等 IDE 原生支援;2026 年 Q1 OpenAI 宣布採用 MCP2026 年 Q2 Google DeepMind CEO 宣布 Gemini 支援 MCP2026 年 Q2 Microsoft 完成支援;治理權移交 Linux Foundation 旗下 Agentic AI Foundation(AAIF)

  4. 04

    網路效應:截至 2026 年,MCP 生態已有超過 10,000 個 MCP 伺服器;每新增一個 Server,所有兼容 Client 立即可用——這正是 HTTP 當年奠定 Web 生態的同一種正反饋。

  5. 05

    無廠商鎖定:開發者可自由切換底層 LLM,工具整合無需改寫——閉源方案難以提供同等價值。

從「一家公司的私有標準」到「產業公共基礎設施」——AAIF 治理的意義,堪比網際網路協議由 IETF 治理。

06

邊界:它還不完全是 HTTP,以及與 A2A 的互補

理性看待 MCP,需承認尚未完善的部分:

  • !

    安全機制仍在補齊:OAuth 2.0/2.1 標準化身分驗證列入 2026 路線圖;約 1000 個 MCP 伺服器處於暴露且未授權狀態,間接提示注入攻擊已被記錄。

  • !

    可發現性:尚無統一「MCP 伺服器註冊表」(類比沒有 DNS 的網際網路),工具發現仍依賴人工配置。

  • !

    水平擴展:SSE 傳輸需 session affinity,不如無狀態 HTTP 天然易擴展。

Google 推出的 Agent-to-Agent(A2A)協議定義 Agent 之間的通訊,與 MCP 不是競爭而是分層:MCP = AI 模型 ↔ 工具/資料(垂直整合)A2A = AI Agent ↔ AI Agent(橫向編排)。兩者共同構成 Agent 網際網路的協議棧。

07

開發者與企業:寫一次、到處跑與治理面統一

視角關鍵收益(可引用數據)
開發者MCP Server 寫完即可被所有兼容 Client 使用;企業 AI 整合開發成本降幅達 38–55%;垂直領域專屬 Server 仍是藍海
企業整合資產從綁定供應商變為可移植資產;在 Server 層集中管理權限;Google Cloud、Azure、AWS 均提供託管 MCP 服務
產業格局標準化介面降低新創公司進入門檻約 62%;傳統系統整合商客製化需求減少約 43%

落地五步(含遠端 Mac 驗收)

  1. 1

    選定 Host(Cursor / Claude Desktop / VS Code)並確認 2026 年版本已原生支援 MCP。

  2. 2

    從社群或自建部署 MCP Server;本機開發優先 STDIO,生產可考慮 HTTP+SSE。

  3. 3

    在配置中註冊 Server,用 tools/list 驗證執行時發現是否正常。

  4. 4

    對涉及瀏覽器、鑰匙圈、螢幕錄製的 Server,在 macOS 圖形工作階段中完成 TCC 權限與首次彈窗(純 SSH 無法替代)。

  5. 5

    記錄 Server 版本、權限邊界與稽核日誌;與站內 OpenClaw 瀏覽器 MCPAgent Skill 文互鏈,形成完整 Agent 工具鏈。

08

FAQ

不會完全取代。REST 仍適合傳統服務間呼叫;MCP 面向 AI 執行時發現與有狀態工具工作階段,二者在不同層級互補。

Claude Desktop、Cursor、Zed、Continue 等 IDE;2026 年 OpenAI、Google Gemini、Microsoft 均已宣布或完成 MCP 支援;OpenClaw 等 Agent 框架亦提供 MCP 接入路徑。

瀏覽器 DevTools MCP、檔案系統高權限操作、鑰匙圈與螢幕錄製等常觸發 macOS TCC 彈窗。純 SSH 無法點選「始終允許」,需 VNC 圖形工作階段完成與 Host 同機的權限驗收。詳見站內遠端 Mac 權限清單

MCP 連接模型與工具/資料;A2A(Agent-to-Agent) 連接 Agent 與 Agent。二者構成 Agent 網際網路的不同協議層,而非零和競爭。

結語:協議即基礎設施

HTTP 沒有發明瀏覽器,但沒有 HTTP 就沒有瀏覽器生態;TCP/IP 沒有發明郵件,但沒有 TCP/IP 就沒有 Email。MCP 沒有發明 AI Agent,但它正在成為 AI Agent 生態能夠存在的基礎設施。多年後回望,2024 年 11 月 Anthropic 開源 MCP 規範這一刻,可能正是 AI 時代的「HTTP 誕生時刻」。

對個體開發者而言,真正隱性成本不在「會不會配 MCP JSON」,而在Host 與 Server 是否跑在穩定、可圖形驗收的 macOS 環境:Windows 主力機 + 雲端 Mac 混跑 Cursor MCP 時,權限彈窗、Chrome 自動化與 Gateway 日誌往往要在同一台遠端機器的桌面工作階段裡交叉核對;自購 Mac mini 則要承擔睡眠、系統更新與折舊,低配機型在大規模 tools/list 與瀏覽器類 Server 並發時也容易吃滿記憶體。

若你希望按小時驗證 MCP 工具鏈、又要在與 Cursor / OpenClaw 同機的圖形介面裡完成權限與控制台驗收,可透過 VNCMac 租用遠端 Mac:下方主按鈕進入購買頁選節點;需要對比套餐與連線說明時,先瀏覽首頁或說明頁 SSH-VNC 指南。