Tryb rozmowy
Tryb rozmowy to ciągła pętla rozmowy głosowej:- Nasłuchuj mowy
- Wyślij transkrypt do modelu (sesja główna,
chat.send) - Poczekaj na odpowiedź
- Odtwórz ją przez skonfigurowanego dostawcę trybu rozmowy (
talk.speak)
Zachowanie (macOS)
- Zawsze aktywna nakładka podczas włączonego trybu rozmowy.
- Przejścia faz Listening → Thinking → Speaking.
- Przy krótkiej pauzie (okno ciszy) bieżący transkrypt jest wysyłany.
- Odpowiedzi są zapisywane do WebChat (tak samo jak przy wpisywaniu).
- Przerwanie przez mowę (domyślnie włączone): jeśli użytkownik zacznie mówić, gdy asystent mówi, zatrzymujemy odtwarzanie i zapisujemy znacznik czasu przerwania do następnego promptu.
Dyrektywy głosowe w odpowiedziach
Asystent może poprzedzić odpowiedź pojedynczą linią JSON, aby sterować głosem:- Tylko pierwsza niepusta linia.
- Nieznane klucze są ignorowane.
once: truedotyczy tylko bieżącej odpowiedzi.- Bez
oncegłos staje się nowym domyślnym głosem trybu rozmowy. - Linia JSON jest usuwana przed odtworzeniem TTS.
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Konfiguracja (~/.openclaw/openclaw.json)
interruptOnSpeech: truesilenceTimeoutMs: gdy nie jest ustawione, tryb rozmowy zachowuje domyślne dla platformy okno pauzy przed wysłaniem transkryptu (700 msna macOS i Android,900 msna iOS)voiceId: wraca doELEVENLABS_VOICE_ID/SAG_VOICE_ID(albo do pierwszego głosu ElevenLabs, gdy dostępny jest klucz API)modelId: domyślnieeleven_v3, gdy nie jest ustawioneapiKey: wraca doELEVENLABS_API_KEY(albo do profilu powłoki gateway, jeśli jest dostępny)outputFormat: domyślniepcm_44100na macOS/iOS orazpcm_24000na Androidzie (ustawmp3_*, aby wymusić strumieniowanie MP3)
UI macOS
- Przełącznik w pasku menu: Talk
- Karta konfiguracji: grupa Talk Mode (voice id + przełącznik przerwania)
- Nakładka:
- Listening: pulsująca chmura z poziomem mikrofonu
- Thinking: opadająca animacja
- Speaking: promieniujące kręgi
- Kliknięcie chmury: zatrzymuje mówienie
- Kliknięcie X: wychodzi z trybu rozmowy
Uwagi
- Wymaga uprawnień do mowy i mikrofonu.
- Używa
chat.sendwzględem klucza sesjimain. - Gateway rozwiązuje odtwarzanie trybu rozmowy przez
talk.speakz użyciem aktywnego dostawcy trybu rozmowy. Android przechodzi awaryjnie na lokalny systemowy TTS tylko wtedy, gdy ten RPC jest niedostępny. stabilitydlaeleven_v3jest walidowane do0.0,0.5lub1.0; inne modele akceptują0..1.latency_tierjest walidowane do0..4, gdy jest ustawione.- Android obsługuje formaty wyjściowe
pcm_16000,pcm_22050,pcm_24000ipcm_44100dla niskolatencyjnego strumieniowania AudioTrack.