Mode Talk
Le mode Talk est une boucle continue de conversation vocale :- Écouter la parole
- Envoyer la transcription au modèle (session principale,
chat.send) - Attendre la réponse
- La prononcer via le fournisseur Talk configuré (
talk.speak)
Comportement (macOS)
- Overlay toujours actif tant que le mode Talk est activé.
- Transitions de phase Écoute → Réflexion → Parole.
- Lors d’une courte pause (fenêtre de silence), la transcription en cours est envoyée.
- Les réponses sont écrites dans WebChat (comme si elles étaient tapées).
- Interruption sur parole (activée par défaut) : si l’utilisateur commence à parler pendant que l’assistant parle, nous arrêtons la lecture et notons l’horodatage de l’interruption pour le prompt suivant.
Directives vocales dans les réponses
L’assistant peut préfixer sa réponse avec une unique ligne JSON pour contrôler la voix :- Première ligne non vide uniquement.
- Les clés inconnues sont ignorées.
once: trues’applique uniquement à la réponse en cours.- Sans
once, la voix devient la nouvelle valeur par défaut du mode Talk. - La ligne JSON est supprimée avant la lecture TTS.
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Configuration (~/.openclaw/openclaw.json)
interruptOnSpeech: truesilenceTimeoutMs: lorsqu’il n’est pas défini, Talk conserve la fenêtre de pause par défaut de la plateforme avant d’envoyer la transcription (700 ms sur macOS et Android, 900 ms sur iOS)voiceId: se rabat surELEVENLABS_VOICE_ID/SAG_VOICE_ID(ou la première voix ElevenLabs lorsqu’une clé API est disponible)modelId: par défauteleven_v3lorsqu’il n’est pas définiapiKey: se rabat surELEVENLABS_API_KEY(ou le profil shell de la passerelle s’il est disponible)outputFormat: par défautpcm_44100sur macOS/iOS etpcm_24000sur Android (définissezmp3_*pour forcer le streaming MP3)
Interface macOS
- Bascule dans la barre de menus : Talk
- Onglet de configuration : groupe Mode Talk (identifiant de voix + bascule d’interruption)
- Overlay :
- Écoute : nuage qui pulse avec le niveau du micro
- Réflexion : animation d’enfoncement
- Parole : anneaux rayonnants
- Clic sur le nuage : arrêter la parole
- Clic sur X : quitter le mode Talk
Remarques
- Nécessite les permissions Parole + Microphone.
- Utilise
chat.sendcontre la clé de sessionmain. - La passerelle résout la lecture Talk via
talk.speaken utilisant le fournisseur Talk actif. Android se rabat sur le TTS système local uniquement lorsque cette RPC n’est pas disponible. stabilitypoureleven_v3est validé à0.0,0.5, ou1.0; les autres modèles acceptent0..1.latency_tierest validé à0..4lorsqu’il est défini.- Android prend en charge les formats de sortie
pcm_16000,pcm_22050,pcm_24000, etpcm_44100pour le streaming AudioTrack à faible latence.