會議路徑 · 決策矩陣 · 八步 Runbook · VNC 驗收
把 OpenClaw 接進即時會議的維運團隊,面對的失敗模式與聊天通道不同:音訊必須雙工、PSTN 來電者需要穩定撥入號,助理還得聽見會議室聲音,卻不能把 API 金鑰塞進瀏覽器分頁。OpenClaw v2026.5.4 一次交付三件套——Google Meet 入會(日曆感知加入與會議室音訊擷取)、Twilio 撥入(以 SecretRef 管理憑證的 PSTN 腿)、以及託管在 Gateway 的 Gemini 即時語音橋,把上述來源 mux 進與 v2026.4.26 瀏覽器 Talk 相同的 Live 傳輸家族。本文提供六類編號痛點、傳輸決策矩陣、可貼進變更單的八步 Runbook、四條可引用工單結論,以及租用 Apple Silicon 遠端 Mac 時的二十分鐘 VNC 驗收格。請交叉閱讀 Gateway 公網與 HTTPS 反向代理、多通道上線順序;橋接基線通過後再讀 v2026.5.7 增量升級,避免語音入會與通道 fan-out 或發佈鏈漂移互相打架。
會議整合常靜默失敗:Gateway 日誌顯示程序健康,與會者卻聽不到聲音;或 PSTN 來電者聽見助理,Meet 與會者聽不見。下列六項是租用 macOS 節點上最常見的類別——操作者只走 SSH、從未打開 Chromium 站點設定或 macOS 麥克風隱私清單。
Meet OAuth 與網域政策:Workspace 管理員限制哪些 OAuth 用戶端可讀日曆或以自動與會者加入。症狀像「卡在同意畫面」,Gateway 卻無錯,直到你把 Google Admin 稽核時間戳與 redirect URI 清單對齊。
瀏覽器擷取 vs 無頭幻想:Meet 音訊擷取仍依賴受支援的 Chromium 設定檔與真實 HTTPS 來源。無頭 Linux 中繼無法代你點 macOS TCC;用迴路 hack 會產生梳狀濾波與不可用逐字稿。
Twilio 憑證散落:Account SID、API 金鑰、每號碼 webhook 分散在多份 env,會出現「電話響了但橋收不到 media」——回呼 URL 仍指向上週的臨時隧道主機名。
橋接會話碰撞:同一 Meet 房間有兩個橋擁有者時,回音、重複工具呼叫、與通道存檔不一致的逐字稿會同時出現;多通道 fan-out 在語音基線凍結前啟用時尤其常見。
反向代理 WebSocket 漂移:長連線雙工音訊需要正確的 Upgrade 與閒置逾時。為 REST 調過的 TLS 終止器會在聊天煙測從未觸發的路徑上丟橋。
共用租約的證據缺口:合規會問「誰在麥克風上按了允許」,且要對齊 Gateway session id。純 SSH 文字答不了;需要 VNC 目擊加上與 launchd 同一使用者的 listener 表匯出。
請把這些痛點當架構關卡,而非打磨項。跳過它們的隱性成本,是工單在「Google 配額」與「模型太小」之間來回一週,而橋從未把 PSTN 與 Meet mux 到同一 session id。
事故橋接前先查表,別急著換 Gemini 規格。列刻意區分入會方式(音訊如何進 OpenClaw)與推理層(代理拿文字做什麼)。
| 需求 | 5.4 優先 | 勿無 mux 混用 | 首個 VNC 檢查 |
|---|---|---|---|
| 排程 Meet+螢幕分享 | Meet 入會+單一橋會話 | 同房間再開瀏覽器 Talk 分頁 | Chromium 對 Meet 來源的麥克風/站點權限 |
| 僅 PSTN 與會者 | Twilio 撥入腿進橋 | 每位來電者一個 Gateway 程序 | Twilio 偵錯器顯示 in-progress 且 CallSid 對齊 |
| 桌面開發者測語音 | 瀏覽器 Talk(4.26 路徑) | 同機再掛 Meet 機器人與會者 | 單一麥克風擁有者;活動監視器音訊裝置 |
| 會後非同步摘要 | 通道逐字稿+TTS 播報 | 橋無限期常駐 | 橋拆除日誌;cron 狀態 |
| 公網 webhook 回呼 | Gateway 前 HTTPS 反代 | 18789 裸奔上網 | TLS 憑證主機名=Twilio webhook 主機名 |
| 通話中 IM fan-out | 橋基線後再開多通道 | Meet 煙測前啟用全部通道 | channels list vs 活躍橋擁有者 |
此表與多通道指引天然配對:文字通道適合指揮控制,但不應在橋活著時成為第二個音訊擁有者。為 Twilio 暴露 Gateway 時,請重用與營運主控台相同的 Host 與憑證紀律——勿在未更新 Twilio 語音 URL 的情況下另開子網域裸 HTTP 端點。
每個 live room 一個橋 session id——Meet 腿、PSTN 腿與 Gemini 上游必須共用,否則你在除回音,不是在除智慧不足。
用三個平面思考。入會平面:Meet 連接器訂閱日曆事件(或明確 meet URL),啟動受控瀏覽器上下文,把會議室音訊幀轉給 Gateway。Twilio 連接器接受入向 PSTN/SIP,正規化編解碼器,作為同一橋的另一條腿掛上。橋平面:Gateway 擁有會話生命週期、trace id、Google/Twilio 的 SecretRef 解析,以及上游 Live 節流時的背壓。代理平面:工具、技能與通道逐字稿仍正交——你仍希望在 Slack 或 Telegram 下結構化指令,同時語音保持雙工。
相較 v2026.4.26 瀏覽器 Talk,Meet 入會多了排程與與會者政策:機器人是具組織同意的與會者,不是本機分頁實驗。相較多通道訊息,語音橋會話有時間邊界且對抖動敏感;勿把 IM 重試策略套在音訊幀上。此處的 Gemini 即時語音橋指與 Talk 相同的 Live 家族,但由 mux 後的 PCM/Opus 腿餵入,而非單一分頁擷取——Gateway 代為協商上游權杖,秘密不進 Local Storage。
在租用遠端 Mac 上,實務錨點仍是一個互動式 macOS 使用者擁有 launchd、Chromium 設定檔與麥克風 TCC。「Gateway 在用戶 A、瀏覽器在用戶 B」會復現 Meet 顯示已連線、橋卻讀到靜音的經典分裂快取。
請依序執行。前半固定版本與 URL;中段驗證入會;末尾掛可觀測性,再開多通道 fan-out。
凍結與備份:記錄 openclaw --version、node 絕對路徑、OPENCLAW_HOME、Gateway listener 矩陣、租約 id、launchd 標籤。把現有 Meet/Twilio 設定區塊(脫敏)匯出進變更單。
升級至 v2026.5.4 並 doctor:執行 openclaw doctor;在動 Meet 前先處理 4.26 時代片段的過時 relay 鍵。保留上一版設定樹 tarball 以便回滾。
Workspace OAuth(必須 VNC):以 Gateway 使用者在 Chromium 完成 Google Workspace 同意;若網域限制應用,請在 Admin 主控台允許 client id。
Twilio SecretRef 與 webhook:以 SecretRef 存放 Account SID 與權杖;語音狀態回呼指向 HTTPS 反代主機名,勿指臨時隧道。從 VPC 外驗證 TLS 鏈。
宣告單一橋設定檔:讓 Meet 入會與 Twilio 撥入共用每個日曆系列或會議名稱的 bridgeSessionId 範本。文件化閒置拆除逾時(例如最後 PSTN 掛斷後 120 秒)。
實驗室 Meet 煙測:測試 Meet 內兩副人類耳機加一個撥入號。確認 Gateway 日誌只有一個橋擁有者,且 Meet/Twilio 腿 trace id 一致。
Gemini 上游探針:經橋跑短雙工提示;在 Gateway 指標擷取首包延遲與端到端往返。與同主機 4.26 瀏覽器 Talk 基線對照。
啟用多通道 fan-out:僅在語音基線通過後,依 多通道上線順序 開啟,避免 Telegram/Slack 指令在同一房間再開一座橋。
voiceBridge:
owner: gateway
geminiLive:
region: us-central1
traceHeader: X-OpenClaw-Bridge-Trace
meet:
calendarId: primary
joinWindowMinutes: 15
twilio:
dialInNumber: "+1XXXXXXXXXX"
statusCallback: "https://gateway.example.com/twilio/voice/status"
mux:
bridgeSessionTemplate: "meet-${eventId}"
maxPstnLegs: 4
idleTeardownSeconds: 120
說明:鍵名為示意;你的建置可能透過 openclaw configure 暴露等價區塊。YAML 供審閱者理解,請對照發行說明再貼上,勿盲抄。
openclaw --version openclaw doctor openclaw gateway status openclaw secrets audit lsof -nP -iTCP -sTCP:LISTEN | rg -i "openclaw|18789" || true openclaw channels list
警告:在排除橋 mux 與代理 WebSocket 升級前,勿把根因寫成「Gemini 配額」——配額儀表板在雙工路徑上常是客氣的謊言。
同一輪變更裡並行跑 SSH 自動化與 VNC 目擊。下表給單一操作者;請把截圖附在變更紀錄。
| 檢查項 | VNC(與 Gateway 同使用者) | SSH | 通過 |
|---|---|---|---|
| 版本頁腳 | Gateway UI 建置與 CLI 一致 | openclaw --version | 5.4.x 一致 |
| Meet 麥克風同意 | Chromium+系統設定麥克風 | 不可替代 | 路徑與二進位一致 |
| Twilio webhook 可達 | 可選瀏覽器開狀態 URL | 公網主機名 curl -I | TLS 有效;2xx |
| 橋 trace 對齊 | 依 trace 標頭過濾網路 | Gateway 日誌 grep | 單一 session id |
| 雙工煙測 | SLA 內聽見往返 | 指標快照 | 無單向音訊 |
| 拆除 | Meet 分頁乾淨關閉 | 閒置計時觸發 | 無孤兒 PSTN |
若計畫接著升 v2026.5.7,請把本格 JSON 與日誌摘錄存成語音基線包。5.7 的發佈鏈修復不能取代橋驗收——它疊在上面。
若組織在 Linux 上還跑僅出站代理,請把 Meet 與 Twilio 入會留在 macOS 錨點主機。Linux 擅長 webhook 與批次,但無法閉合本流程所需的麥克風與 OAuth 證據鏈。
演練 A—代理故障切換:橋活著時 reload Nginx 或 Caddy,確認 Twilio 重試狀態回呼而不會生出第二個橋 session。演練 B—部分 PSTN 遺失:Meet 仍開著時掉一條來電腿,確認 mux 策略要麼優雅移除該腿,要麼在日誌標記 degraded 且值班真的會讀。
請文件化 Meet 開始螢幕分享時代理預期行為:有些團隊靜音橋擷取以免念投影片文字;有些要把共享內容送進視覺工具。5.4 橋不替你決定產品政策——仍要宣告螢幕內容是否成為模型輸入。
最後對齊留存:語音逐字稿可能比 IM 存檔更敏感。在邀請外部撥入號之前,請把橋設定與既有 SecretRef 稽核節奏、法律保全規則配對。
HTTPS、埠與 Twilio 回呼一致性。
閱讀 →語音基線通過後再開 IM fan-out。
閱讀 →橋驗收通過後的增量清單。
閱讀 →能——這是 5.4 的設計重點。每個 live room 宣告一個橋擁有者,並在 Gemini 上游前 mux PSTN 腿。同一 Meet 上兩個擁有者會產生回音與分歧逐字稿。
不能。Workspace OAuth、Chromium 權限與 macOS 麥克風 TCC 需要與 VNC 相同的互動使用者。SSH 仍不可或缺:listener 表與日誌歸檔。
4.26 優化本機瀏覽器分頁上的 Google Live transport。5.4 增加日曆 Meet 入會與 Twilio PSTN,並在 Gateway 內顯式定義橋會話語意。
若範圍含 Meet 或 Twilio,請先完成 5.4 橋驗收。再增量套用 5.7 的發佈鏈與 channels CLI 改進,勿跳過語音基線。
OpenClaw v2026.5.4 把會議音訊變成 Gateway 的一等公民:Meet 與 Twilio 是入會平面,Gemini Live 是雙工推理傳輸,變更流程仍由你掌握秘密、代理逾時與會話拆除。只走 SSH 的團隊常因權限漂移與 Meet UI 假綠而多耗數週,日誌卻解釋不了。
自有實體 Mac 還要背睡眠策略、更新視窗與硬體折舊;小筆電則在 Meet 擷取、PSTN mux 與逐字稿存檔同時進行時容易窒息。租用可覆核圖形工作階段的遠端 Mac把映像與在線率交給服務商,你仍握橋政策與 SecretRef 清冊——橋在中途掉落時平均恢復時間通常更短。
若希望少押一台硬體、又要在與 Gateway 同一 macOS 使用者下跑完第六節驗收格,可透過 VNCMac 租用雲端 Mac:下方主按鈕進入購買頁;對照方案請先瀏覽首頁再排下一次橋接變更視窗。