De Talk-modus is een continue spraakgesprekslus:Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- Luister naar spraak
- Stuur transcript naar het model (hoofdsessie, chat.send)
- Wacht op het antwoord
- Spreek het uit via de geconfigureerde Talk-provider (
talk.speak)
Gedrag (macOS)
- Altijd-zichtbare overlay terwijl de Talk-modus is ingeschakeld.
- Luisteren → Denken → Spreken-faseovergangen.
- Bij een korte pauze (stiltevenster) wordt het huidige transcript verzonden.
- Antwoorden worden naar WebChat geschreven (hetzelfde als typen).
- Onderbreken bij spraak (standaard aan): als de gebruiker begint te praten terwijl de assistent spreekt, stoppen we het afspelen en noteren we het tijdstip van de onderbreking voor de volgende prompt.
Spraakinstructies in antwoorden
De assistent kan het antwoord vooraf laten gaan door een enkele JSON-regel om spraak te regelen:- Alleen de eerste niet-lege regel.
- Onbekende sleutels worden genegeerd.
once: truegeldt alleen voor het huidige antwoord.- Zonder
oncewordt de stem de nieuwe standaard voor de Talk-modus. - De JSON-regel wordt verwijderd vóór TTS-weergave.
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Configuratie (~/.openclaw/openclaw.json)
interruptOnSpeech: truesilenceTimeoutMs: wanneer niet ingesteld, behoudt Talk het standaard pauzevenster van het platform voordat het transcript wordt verzonden (700 ms op macOS en Android, 900 ms op iOS)provider: selecteert de actieve Talk-provider. Gebruikelevenlabs,mlxofsystemvoor de macOS-lokale afspeelpaden.providers.<provider>.voiceId: valt terug opELEVENLABS_VOICE_ID/SAG_VOICE_IDvoor ElevenLabs (of de eerste ElevenLabs-stem wanneer een API-sleutel beschikbaar is).providers.elevenlabs.modelId: standaardeleven_v3wanneer niet ingesteld.providers.mlx.modelId: standaardmlx-community/Soprano-80M-bf16wanneer niet ingesteld.providers.elevenlabs.apiKey: valt terug opELEVENLABS_API_KEY(of het Gateway-shellprofiel indien beschikbaar).speechLocale: optionele BCP 47-locale-id voor spraakherkenning op het apparaat voor Talk op iOS/macOS. Laat niet ingesteld om de apparaatstandaard te gebruiken.outputFormat: standaardpcm_44100op macOS/iOS enpcm_24000op Android (stelmp3_*in om MP3-streaming af te dwingen)
macOS-UI
- Menubalkschakelaar: Talk
- Configuratietabblad: groep Talk-modus (stem-id + onderbrekingsschakelaar)
- Overlay:
- Luisteren: wolk pulseert met microfoonniveau
- Denken: zakkende animatie
- Spreken: uitstralende ringen
- Klik op wolk: stoppen met spreken
- Klik op X: Talk-modus afsluiten
Android-UI
- Schakelaar op spraaktabblad: Talk
- Handmatige Mic en Talk zijn wederzijds exclusieve runtime-opnamemodi.
- Handmatige Mic stopt wanneer de app de voorgrond verlaat of de gebruiker het spraaktabblad verlaat.
- Talk-modus blijft actief totdat deze wordt uitgeschakeld of de Android-node de verbinding verbreekt, en gebruikt Androids microfoon-foreground-service-type terwijl deze actief is.
Opmerkingen
- Vereist machtigingen voor Spraak + Microfoon.
- Gebruikt
chat.sendmet sessiesleutelmain. - De Gateway lost Talk-afspelen op via
talk.speakmet de actieve Talk-provider. Android valt alleen terug op lokale systeem-TTS wanneer die RPC niet beschikbaar is. - macOS-lokale MLX-weergave gebruikt de gebundelde
openclaw-mlx-tts-helper wanneer aanwezig, of een uitvoerbaar bestand opPATH. StelOPENCLAW_MLX_TTS_BINin om tijdens ontwikkeling naar een aangepast helperbinair bestand te wijzen. stabilityvooreleven_v3wordt gevalideerd als0.0,0.5of1.0; andere modellen accepteren0..1.latency_tierwordt gevalideerd als0..4wanneer ingesteld.- Android ondersteunt
pcm_16000,pcm_22050,pcm_24000enpcm_44100-uitvoerformaten voor AudioTrack-streaming met lage latentie.