会议入口分工 · 传输决策表 · 十条 Runbook · VNC 二十分钟验收
把 OpenClaw 接进实时会议时,失败模式与 IM 通道截然不同:音频必须保持双工,外线参会者需要稳定拨入号,助手还要听见会议室而不把 API 密钥塞进浏览器标签页。OpenClaw v2026.5.4 将三件事打包交付——Google Meet 入会(日历感知加入与房间音频采集)、Twilio 拨入(PSTN 腿经 SecretRef 管理凭证)、以及运行在 Gateway 内的 Gemini 实时语音桥,把上述音源复用到与 v2026.4.26 浏览器 Talk 同族的 Live 传输上。本文给出六类典型痛点、传输决策对照表、十条可写进变更单的 Runbook、四条工单级结论,以及面向租用 Apple Silicon 远程 Mac 的二十分钟 VNC 验收表。交叉阅读 Gateway 公网 HTTPS 反代、多渠道消息上线顺序;语音基线通过后,再按 v2026.5.7 增量升级 推进插件发布链。本文不重复 Gemini TTS 异步朗读 与浏览器 Talk 专文边界,专注「Meet + 电话 + 实时桥」的可复现顺序。
会议集成常常静默失败:Gateway 进程健康,但参会者听不见助手;或外线只听到模型、Meet 里却静音。在只开 SSH 的租用 macOS 上,操作者从未打开 Chromium 站点设置或系统「麦克风」列表,就会把问题误判成「模型太小」或「Google 配额」。下列六类是 2026 年我们在远程节点上最常见的事故形态。
Meet OAuth 与域策略:Workspace 管理员限制哪些 OAuth 客户端可读日历或以自动化身份入会;症状像「卡在同意页」,Gateway 无报错,直到你把 Google Admin 审计时间戳与 redirect URI 白名单对齐。
浏览器采集 vs headless 幻想:Meet 音频采集仍依赖受支持的 Chromium 配置与真实 HTTPS 源;无桌面 Linux 中继无法点 macOS TCC;用环回「假采集」会产生梳状滤波与不可用转写。
Twilio 凭证散落:Account SID、API Key、号码 Webhook 分布在多份 env 里,出现「电话能响、桥收不到 media」——回调 URL 仍指向上周隧道主机名。
桥会话碰撞:同一 Meet 房间两个 bridge owner 导致回声、重复工具调用、与通道归档不一致的 transcript;常在未冻结语音基线就开启多渠道扇出时出现。
反代 WebSocket 漂移:双工音频需要路径上正确的 Upgrade 与空闲超时;只为 REST 调优的 TLS 终结器会在聊天烟测全绿时仍掉桥。
共享租约证据缺口:合规会问「谁点了麦克风允许」是否与 Gateway session id 对齐;纯 SSH 文本无法回答,需要 VNC 目击 + 同用户监听表导出。
把这些痛点当作架构闸门而非打磨项;跳过它们,隐性成本是在「配额」与「模型档位」之间来回拉扯一整周的工单,而 PSTN 与 Meet 从未 mux 到同一 bridgeSessionId。
事故桥接前先查此表。行刻意区分入口(音频如何进入 OpenClaw)与推理(Agent 如何处理文本),避免一上来就改 Gemini SKU。
| 需求场景 | 5.4 优先方案 | 勿在未 mux 时混用 | 首次 VNC 核对 |
|---|---|---|---|
| 定时 Meet + 共享屏幕 | Meet 入会 + 单 bridge 会话 | 同房间再开浏览器 Talk 标签 | Meet 源站的 Chromium 麦克风/站点权限 |
| 仅 PSTN 参会者 | Twilio 拨入腿进桥 | 每路来电单独 Gateway 进程 | Twilio Debugger 显示 in-progress 且 CallSid 一致 |
| 桌面开发者测语音 | 浏览器 Talk(4.26 路径) | 同机再挂 Meet 机器人 | 单一麦克风 owner;活动监视器音频设备 |
| 会后异步纪要 | 通道 transcript + TTS 回读 | 桥会话无限挂起 | 桥拆除日志;cron 任务状态 |
| 公网 Webhook 回调 | Gateway 前 HTTPS 反代 | 18789 裸端口暴露公网 | 证书主机名 = Twilio Webhook 主机名 |
| 会中 IM 扇出 | 语音基线后的多渠道 | Meet 烟测前全开通道 | channels list vs 活跃 bridge owner |
文本通道适合指挥控制,但不应在 live bridge 期间成为第二音频 owner。为 Twilio 暴露 Gateway 时,复用与运营控制台相同的 Host 头与证书纪律——勿为语音状态回调另造未写入 Twilio 控制台的子域。
每个活跃房间一个 bridge 会话 id——Meet 腿、PSTN 腿与 Gemini 上游必须共享,否则你在调回声,不是调智能。
入口平面:Meet 连接器订阅日历事件(或显式 meet URL),在受控浏览器上下文中启动,把房间音频帧送入 Gateway。Twilio 连接器接收 PSTN/SIP,归一化编解码后作为另一条腿挂到同一 bridge。桥平面:Gateway 管 session 生命周期、trace id、Google/Twilio 的 SecretRef 解析,以及上游 Live 节流时的背压。Agent 平面:工具、技能与通道 transcript 仍正交——你仍希望在 Telegram 或飞书里发结构化命令,而语音保持双工。
相对 v2026.4.26 浏览器 Talk,Meet 入会多了排期与组织同意:机器人是带策略的参会者,不是本机标签实验。相对多渠道消息,语音桥会话有时限、怕抖动,不宜照搬 IM 重试策略到音频帧。此处「Gemini 实时语音桥」指 Gateway 用与 Talk 同族的 Live 传输,但由 mux 后的 PCM/Opus 腿喂入——上游 token 在 Gateway 协商,密钥不落 Local Storage。
在租用远程 Mac 上,实践锚点仍是一个交互式 macOS 用户同时拥有 launchd、Chromium 配置与麦克风 TCC。「Gateway 用用户 A、浏览器用用户 B」会复现 Meet 显示已连接、桥却读静音的经典分裂。
按序执行:前半冻结版本与 URL,中段验证入口,末尾挂可观测性后再开多渠道扇出。
冻结与备份:记录 openclaw --version、node 绝对路径、OPENCLAW_HOME、Gateway 监听矩阵、租约 ID、launchd label;将 Meet/Twilio 配置段(脱敏)导出进变更单。
升至 v2026.5.4 并 doctor:运行 openclaw doctor;先清理 4.26 时代 relay 弃用键再碰 Meet;保留回滚配置树 tarball。
Workspace OAuth(VNC 强制):以 Gateway 同用户在 Chromium 完成 Google 同意;若域限制客户端,在 Admin 控制台 allowlist 并截图。
Twilio SecretRef 与 Webhook:Account SID/Token 走 SecretRef;语音状态回调指向稳定 HTTPS 反代主机名,勿用临时隧道;从 VPC 外验证 TLS 链。
声明单一 bridge 配置:Meet 与 Twilio 共享每日历序列的 bridgeSessionId 模板;文档空闲拆除超时(例如末路 PSTN 挂断后 120 秒)。
实验室 Meet 烟测:测试 Meet 上两副耳机 + 一路拨入;Gateway 日志应显示单一 bridge owner,Meet 与 Twilio 腿 trace id 一致。
Gemini 上游探针:经桥发送短双工提示;采集首包延迟与往返指标,与同机 4.26 Talk 基线对比。
再开多渠道扇出:仅当语音基线通过后,按多渠道上线顺序启用,避免 Slack/Telegram 命令在同一房间拉起第二座桥。
反代与 WebSocket 对齐:对照公网反代清单核对 Upgrade、空闲超时与 Twilio HTTP 回调表一致(建议 ≥120s 且三处同表)。
归档基线包:导出本节验收表截图、监听表、桥 session.open/teardown 日志片段;若计划升 5.7,将此包标为「语音基线 bundle」附在工单。
voiceBridge:
owner: gateway
geminiLive:
region: us-central1
traceHeader: X-OpenClaw-Bridge-Trace
meet:
calendarId: primary
joinWindowMinutes: 15
twilio:
dialInNumber: "+86XXXXXXXXXXX"
statusCallback: "https://gateway.example.com/twilio/voice/status"
mux:
bridgeSessionTemplate: "meet-${eventId}"
maxPstnLegs: 4
idleTeardownSeconds: 120
说明:键名为示意;你的构建可能通过 openclaw configure 暴露等价段。YAML 供评审,勿不经发行说明核对就整段粘贴。
openclaw --version openclaw doctor openclaw gateway status openclaw secrets audit lsof -nP -iTCP -sTCP:LISTEN | rg -i "openclaw|18789" || true openclaw channels list
演练 A(反代 reload):活跃 bridge 期间 reload Nginx/Caddy,确认 Twilio 重试状态回调且未生成第二 session。演练 B(部分 PSTN 掉线):Meet 仍在线时挂断一路来电,验证 mux 优雅摘腿或日志标 degraded。
另需书面约定:Meet 开始共享屏幕时,桥采集是否静音旁路、共享内容是否进入 vision 工具——5.4 不替产品政策做决定。语音 transcript 往往比 IM 更敏感,请在引入外线拨入前对齐 SecretRef 审计与法务保留策略。
同一轮巡检内完成 SSH 与 VNC;截图附变更记录。表面向单操作员在租用 Mac 上执行。
| 核对项 | VNC(与 Gateway 同用户) | SSH | 通过标准 |
|---|---|---|---|
| 版本脚注 | 控制台构建号与 CLI 一致 | openclaw --version | 5.4.x 一致 |
| Meet 麦克风同意 | Chromium + 系统设置麦克风 | 不可替代 | 路径与二进制一致 |
| Twilio Webhook 可达 | 可选浏览器打开状态 URL | 公网主机名 curl -I | TLS 有效;2xx |
| 桥 trace 对齐 | Network 过滤 trace 头 | Gateway 日志 grep | 单一 session id |
| 双工烟测 | 耳内听到往返 | 指标快照 | 无单向音频 |
| 拆除 | Meet 标签干净关闭 | 空闲计时器触发 | 无孤儿 PSTN |
若随后计划升 v2026.5.7,将本表 JSON 与日志摘录存档为语音基线包——5.7 的发布链修复叠在桥验收之上,不能替代。组织若在 Linux 上跑纯出站 Agent,仍建议把 Meet/Twilio 入口放在 macOS 锚点:Linux 擅长 Webhook 与批处理,但无法闭合本文所需的麦克风与 OAuth 证据链。
Twilio 回调与运营控制台证书纪律一致。
阅读 →语音基线通过后再扇出 IM。
阅读 →桥验收后的插件链与 channels CLI。
阅读 →可以,且是 5.4 的设计要点:每个活跃房间声明单一 bridge 所有者,在 Gemini 上游之前 mux PSTN 腿;同一 Meet 上两套 owner 会产生回声与分叉 transcript。
不能。Workspace OAuth、Chromium 权限与 macOS 麦克风 TCC 需要 VNC 下同用户交互会话;SSH 仍负责监听表与日志归档。
4.26 优化本机浏览器标签上的 Google Live 双工;5.4 增加日历 Meet 入会、Twilio PSTN 与 Gateway 内显式 bridgeSession 语义。详见浏览器 Talk 验收文。
不能替代双工会话。TTS 适合异步朗读与 WAV 回读,见Gemini TTS 边界文;实时会议必须走本文桥路径。
范围含 Meet 或 Twilio 时,应先完成 5.4 语音桥验收,再增量应用 5.7 的发布链与 channels 可观测性,勿跳过桥基线。
OpenClaw v2026.5.4 把会议音频提升为 Gateway 的一等公民:Meet 与 Twilio 是入口平面,Gemini Live 是双工推理传输,变更流程仍由你掌控密钥、反代超时与会话拆除。只走 SSH 的团队常因权限漂移与 Meet「假绿」界面浪费数周——日志里永远没有解释。
自有 Mac 要承担睡眠策略、更新窗口与折旧;小容量笔记本在 Meet 采集、PSTN mux 与归档并发时容易磁盘打满。租用带 Apple Silicon 的远程 Mac把在线率与基线镜像交给服务商,你保留 bridge 策略与 SecretRef 清单,并在同一桌面会话里对齐 Gateway 控制台与系统设置——这与 OpenClaw 在 2026 年强调的「可视化排障 + 可审计自动化」同一套语言。
若你需要一台便于完成第六节同款同用户 VNC 验收的远程 Mac,可通过 VNCMac 下单:主按钮进入中文站购买页;连接说明见帮助中心。