Limites · matrice · huit pas VNC · conclusions ticket · FAQ · renvois
Les équipes qui exécutent déjà OpenClaw sur un Mac distant et veulent industrialiser Talk Mode voient arriver, avec v2026.4.10, un fournisseur vocal MLX local expérimental, puis avec v2026.4.11 un confort micro plus net : après la première autorisation macOS, on ne devrait plus être contraint de rebasculer Talk pour des raisons purement internes. Cela ne supprime pas l’invariant Apple : l’accord microphone reste une affaire de session graphique interactive. Rester sur SSH invite à confondre silence audio et absence de réponse du modèle. Nous séparons clairement Talk + MLX du plugin Gemini TTS et de Voice Wake avec le tableau /tasks, fournissons une matrice de prérequis, un runbook VNC en huit étapes (versions figées jusqu’au ZIP de preuve), quatre phrases prêtes pour les tickets, et un tableau d’ordre de symptômes. Les renvois vers sans réponse / échec silencieux et registre froid v2026.4.25 + Gateway mixte empêchent d’isoler la voix du programme de montée de version global.
Talk Mode enchaîne disponibilité Gateway, audio bureau, TCC micro et fournisseur vocal (MLX inclus). Sur Mac loués ou partagés, les erreurs sont stéréotypées : démarrage depuis SSH sans fenêtre VNC pour cliquer l’autorisation ; premier chargement MLX long pris pour un gel ; ou critères empruntés au guide WAV du TTS et appliqués à la conversation temps réel. Les cinq puces suivantes forment une taxonomie prête à coller dans la section causes.
Mélange de canaux : capture et lecture traversent la pile audio macOS. Client VNC muet, casque Bluetooth re-négocié ou périphérique agrégé mal fadé ⇒ silence même si les journaux disent « synthétisé ».
MLX expérimental : génération Apple Silicon, mémoire unifiée et premier téléchargement de poids dictent le démarrage à froid. Comparez toujours avec un fournisseur non-MLX avant de réécrire le routage modèle.
Décalage de versions : CLI et Gateway divergents ⇒ l’UI Talk peut mentir quelques minutes. Avant de toucher au micro, exécutez la preuve Gateway mixte.
Proximité Voice Wake : Voice Wake ouvre Talk mains libres ; allowlists cron et surface /tasks ne remplacent pas le choix de fournisseur dans la session parlée.
Mauvais ordre de triage : modifier les modèles avant la liste Microphone allonge le MTTR et noie les signaux.
Documentez ces motifs dans vos kits de formation : ils évitent l’idée simpliste « le LLM est muet ». Les incidents vocaux sont des intersections réseau + prompts graphiques + ressources locales.
Pour les environnements réglementés, ajoutez une colonne « preuve visuelle » obligatoire : sans capture d’écran datée du panneau Microphone, certaines équipes sécurité refusent de classer l’incident comme résolu. Prévoyez aussi un gabarit de communication utilisateur lorsque vous coupez MLX : annoncez explicitement si la voix repasse sur un moteur stable afin d’éviter les attentes UX contradictoires entre bureaux.
Partagez le tableau avant qu’on vous demande « une voix » sans préciser le pipeline — cela évite d’exiger des exports WAV longs via Talk ou d’planifier des lectures cron dans la session temps réel.
| Capacité | Usage principal | Dépendances | Lien avec cet article |
|---|---|---|---|
| Talk + MLX (4.10+) | Dialogue oral dans la session, parole locale expérimentale | Micro, sortie, Gateway, actifs MLX optionnels | Fil rouge |
| Plugin Gemini TTS | Synthèse outillée, réponses façon WAV | Secrets plugin, allowlists, politique | Contraste — autre runbook |
| Voice Wake (4.1) | Entrée mains libres dans Talk | Micro, config wake, services résidents | Entrée voisine, réglages séparés |
| Heartbeat / cron | Automations légères | cron, allowlists outils, logs | Ne pas fusionner sauf preuve sans réponse |
Règle courte : s’il faut une feuille de consentement macOS, il faut barre de menus et Réglages Système dans le même utilisateur.
Après mise à jour macOS, nettoyez les entrées fantômes dans Microphone puis relancez l’application pour ressusciter les invites bloquées. Gardez ces photos dans le même dossier que vos graphes Gateway.
Travaillez en VNC sous le même utilisateur macOS qui possède OpenClaw. Sur flotte partagée, indiquez dans le ticket qui est habilité à valider le micro afin d’éviter des allers-retours qui invalident l’audit.
Figez versions : notez openclaw --version, build Gateway. Symptôme « accord puis re-bascule » ⇒ visez 4.11+ avant tout tuning profond.
Sauvegardez config : espace de travail + ~/.openclaw ; toute bascule Talk doit être réversible.
Gateway : console VNC, port 18789 (ou votre port) sain, WebSocket aligné CLI.
Talk ON : testez si possible sans MLX d’abord, puis MLX pour isoler téléchargement vs droits.
Réglages → Confidentialité et sécurité → Microphone : cases cochées pour binaires attendus ; supprimez doublons obsolètes ; relancez l’app.
Comportement 4.11 : après premier grant, enchaîner Talk sans interrupteur cosmétique supplémentaire.
Contrôle lecture : phrases courtes, écoutez saturations et latence vs sous-titres ; relevez pics CPU/RAM.
ZIP preuve : réseau Gateway, extraits Talk, page Micro, chaînes de version.
Sondes (exemple) : 1) VNC → Micro : entrées attendues ACTIVES 2) Talk ON → phrase courte → audio bas entendu, sous-titres cohérents 3) Passage MLX → répéter 2), noter latence du premier tour
Info : si la politique interdit l’expérimentation, désactivez MLX explicitement et nommez l’accepteur du risque.
En industrialisant ces huit cases dans vos procédures d’astreinte, tout le monde voit quelle case reste vide à 03 h du matin. Nommez le ZIP avec date, hôte et compte pour simplifier audit et passation. Pour les équipes distribuées, ajoutez la mention du fuseau horaire du Mac dans le ticket afin d’aligner les journaux Gateway et Console sans conversion mentale error-prone.
Conformité : micro toujours allumé sur machine partagée = intersection RGPD / travail / clients — minimiser et tracer.
Silence avec sous-titres : sortie → mute VNC → liste Micro → logs Gateway → swap fournisseur. Pas de texte non plus ? Allez vers sans réponse plutôt que boucler sur Talk.
| Symptôme | D’abord | Ensuite |
|---|---|---|
| Son absent, texte OK | Périphérique, audio client VNC | Échec chargement provider |
| Pas de Talk après 1er grant (<4.11) | Montée 4.11+ | Versions mixtes CLI/Gateway |
| Premier tour MLX très lent | Froid / ressources | Baseline sans MLX |
| Entrée OpenClaw absente | Lancement graphique capture | Chemins binaires dupliqués |
Complétez la table par des horodatages, titres de fenêtre et modèle de casque : les profils Bluetooth qui basculent entre HFP et A2DP restent une source majeure de « sous-titres sans voix » sur Mac distants. Ajoutez systématiquement un test WebRTC ou un fichier local court : si le système joue ce fichier mais pas Talk, vous savez que le problème est localisé côté OpenClaw plutôt que côté pilote audio global.
Chaîne WAV et outils, pas Talk sessionnel.
Lire →Entrée mains libres vs audio intra-session.
Lire →Alignez versions avant de soupçonner le micro.
Lire →Non. TTS = synthèse outillée / fichiers ; Talk = temps réel en session. Journaux et rollback diffèrent.
Oui : TCC reste graphique ; le fix concerne l’état applicatif post-accord.
Sortie + mute client, puis Micro, puis Gateway, puis fournisseur. Sans texte → article sans réponse.
La voix rend OpenClaw plus riche mais déplace les incidents vers l’audio bureau et les invites Confidentialité, conçus pour une session graphique, pas pour un shell seul. Éviter VNC « par économie » coûte en temps de pont, réinstallations et anecdotes non reproductibles.
Le matériel dédié n’échappe pas Bluetooth ni resets de permissions après mise à jour ; le multi-locataire ajoute dérive d’image et builds Gateway divergents. Un Mac distant loué avec VNC gouverné + SSH d’automatisation permet d’attacher captures micro et panneau réseau au même dossier de ticket.
Pour un Mac à la consommation aligné sur ce runbook et le reste de la série OpenClaw ici, utilisez VNCMac : bouton principal vers la page d’achat ; gardez l’accueil ouvert pendant que vous validez réseau et droits en parallèle.