Границы · матрица · runbook · метрики · разбор сбоев · динамик в графической сессии
Команды, у которых OpenClaw уже работает и которым нужны голосовые ответы или телефония, сталкиваются с другим классом сбоев, чем чисто текстовые боты. В ветке 2026.4.x в примечаниях к релизам расширяют встроенную поверхность Google, включая синтез речи Gemini, который должен уживаться с логами Gateway, лимитами вложений каналов и аудиомаршрутом macOS. Этот материал прикладной: пять типичных ошибок, компактная матрица вывода, восьмишаговый runbook от openclaw doctor до повторяемых объявлений, четыре метрики для тикета и таблица разбора, где SSH-доказательства дополняются одной честной графической проверкой. Читайте вместе с чеклистом браузер MCP, обратным прокси Gateway, статьёй «нет ответа», многомодельной маршрутизацией и встроенным веб-поиском, чтобы квоты и аудио не спорили в разных чатах.
Список отсортирован по частоте жалоб от команд, которые впервые подключают TTS. Если вы год в телефонии, сверните его во внутренний лист onboarding. Главное отличие голоса от текста — объём байтов и путь воспроизведения: одинаковый «успешный» HTTP в мессенджере может потерять вложение из-за политики канала, а на macOS звук может уйти в отключённый Bluetooth — одной строки INFO в журнале для этого недостаточно.
Успех HTTP без успеха для уха. Gateway фиксирует синтез, но канал режет вложение, пережимает сверх лимита или устройство вывода macOS указывает на отключённый приёмник. Бесконечные повторы по SSH редко лечат такой класс багов без одного захода в графическую сессию.
Раздувание WAV. Длинные фразы и высокая частота дискретизации дают многомегабайтные объекты. На облачных Mac уже борются DerivedData и кэши; смотрите чеклист по диску, прежде чем включать постоянные голосовые сводки.
Смешение лимитов TTS и чата. Стратегии fallback из руководства по маршрутизации для completion не защищают голос автоматически. Всплеск 429 на TTS выглядит как случайная тишина, пока текст ещё идёт.
Дрейф согласий macOS под launchd. Та же схема, что в браузер MCP: фоновые демоны могут не разделять граф согласий, выданный при интерактивном onboard.
TLS и Host на публичном Gateway. Пока обратный прокси не доведён, клиенты ловят «иногда таймаут» вместо ясного 401, а голос страдает первым из‑за больших тел.
Зафиксируйте эти пункты в ревью изменений: продукт, эксплуатация и безопасность увидят одни и те же поля доказательств — что значит «синтез ок», что значит «канал принял вложение», что значит «устройство реально играет». Без последнего звена в отчётах снова всплывёт «провайдер моделей нестабилен».
| Вывод | Фокус эксплуатации | Первый проход в VNC | Заметка |
|---|---|---|---|
| Вложение WAV в чат | Лимиты размера, MIME | Рекомендуется | Скачайте локально и проверьте байты. |
| PCM или телефонный мост | Буферы джиттера | Часто | Ближе к стеку драйверов. |
| Только лог «успех» | Счётчики квот | Можно пропустить | Всё равно планируйте периодические прослушивания. |
| Дымовой тест динамика | Устройство по умолчанию, mute | Обязательно | Тот же GUI-пользователь, что и у Gateway. |
Сначала добейтесь слышимости в VNC, потом объявляйте демон готовым к бою.
Матрица не выбирает продукт за вас: она фиксирует, кто обязан один раз кликнуть в GUI, а что можно автоматизировать скриптом. Для арендованного Mac это обычно значит: внести «первое прослушивание и скрин панели звука» в чеклист релиза, а не ждать первого недовольного клиента.
Порядок предполагает работающий Gateway; с нуля начните с openclaw onboard --install-daemon и вернитесь к шагу 3. Если в пике одновременно включены веб-поиск и голос, заранее прочитайте разделы про одобрения и квоты в статье о встроенном поиске и сверьте суммарную параллельность на стороне шлюза.
Версии и плагины. openclaw --version и openclaw doctor; сохраните строки про плагины, медиа и Google.
Раздельные секреты. Явные имена для ключей TTS в выводе openclaw secrets plan, чтобы тикеты ротации не схватили чужой handle.
Минимальная поверхность плагина. Включите только нужные пути Google TTS, затем десятисловное зондирование до длинных текстов.
Зафиксировать формат. Частота дискретизации, контейнер и MIME, которые разрешает канал, — в конфиге, а не «как договорились в чате».
Доказательства Gateway. Для одного успеха и одной ошибки сохраните код, задержку, число повторов и тело ошибки upstream.
Проход динамика в VNC. Панель «Звук», активное устройство, скрытый mute, скриншот громкости.
Сухой прогон канала. Песочница с лимитами по вендору из внутренней вики.
Политика хранения. Каталоги кэша, максимальный возраст, кто может чистить вручную, со ссылкой на охрану диска.
Короткая фраза-зонд (удобно по меткам времени в логах): OpenClaw TTS: раз два три четыре пять.
Заметка: при одновременном веб-поиске и TTS следите за суммарной параллельностью Gateway и троттлингом каналов; порядок загрузки плагинов сверьте с выводом doctor и с материалом про встроенный поиск.
Между шагами 5 и 6 при ожидании всплесков добавьте стресс: двадцать зондов с реалистичным интервалом, затем проверьте рост временных каталогов и число открытых дескрипторов. На почасовых облачных узлах плотные циклы бьют и по CPU, и по диску сильнее, чем на ноутбуке.
Внимание: если слышите только «тишину», сначала пройдите таблицу раздела 5, и только потом звоните в поддержку модели.
Цифры без владельца устаревают: назначьте каждую метрику именованной смене дежурных и по возможности прикладывайте ссылки на дашборды, а не единичные скриншоты. Пока автоматизации нет, храните CSV рядом с тикетом.
Дисциплина как в статье о типовых ошибках: сначала транспорт и учётные данные, потом диск и формат, и лишь затем «качество» голоса. Если похоже на «сообщение ушло, текста нет», откройте материал «нет ответа», чтобы не спутать канал с TTS.
| Симптом | Сначала проверить | Действие в VNC |
|---|---|---|
| В логах ок, в чате тишина | Размер вложения, MIME, коды API | Ручная загрузка WAV и локальное воспроизведение. |
| Редкие 429 | Общие ключи, всплеск трафика | Скриншот квоты в консоли облака. |
| Заикание | Конкуренция за CPU с браузер MCP | Мониторинг активности, поиск пиков. |
| Ошибки записи | Заполненный диск | Свободное место в Finder на томе. |
Если разбор застрял, сравните метки времени между Gateway, webhook канала и access-логами обратного прокси. Рассинхрон часов даёт ложные корреляции — сначала NTP, затем повторите короткую фразу-зонд. После ротации ключей убедитесь, что новый секрет попал в plist launchd или unit, который реально стартует Gateway, а не только в интерактивный профиль shell — иначе ночной деплой снова принесёт «тишину».
Права macOS и порядок подключения DevTools.
Читать →TLS, Host, WebSocket, минимальная поверхность.
Читать →Тихие сбои и порядок логов, не путать с аудио.
Читать →Синтезу нужен исходящий доступ к конечным точкам Google. Ваш слушатель может оставаться закрытым, если входящий трафик настроен по статье про обратный прокси.
Дашборды можно общие, слепые fallback — нет: у голоса другие кривые стоимости и задержки, чем у текстовых completion.
После минорного обновления macOS, смены аудиодрайвера или обновления бинарника Gateway — как дымовой тест, а не разовая любопытность onboarding.
Голос — произведение учётных данных, синтеза, диска, Gateway, политик канала и состояния аудио ОС. Любой множитель, равный нулю, даёт тишину в продукте при «здоровых» журналах.
Круглосуточный голосовой узел на настольном Mac тянет сон, обновления ОС и амортизацию железа. Аренда облачного Mac с SSH и плановой проверкой в VNC оставляет аптайм и образ провайдеру, а вам — секреты и runbook.
Команды, которые экономят на графической проверке, обычно тратят больше инженерных часов на «фантомные» аудиосбои. Чеклист — дешёвая страховка. Нужен рабочий стол macOS без покупки железа — используйте VNCMac: основная кнопка ведёт на страницу покупки, дополнительная — на главную с тарифами.