Режим Talk
Режим Talk — це безперервний цикл голосової розмови:- Слухати мовлення
- Надіслати транскрипт моделі (основна сесія,
chat.send) - Дочекатися відповіді
- Озвучити її через налаштованого провайдера Talk (
talk.speak)
Поведінка (macOS)
- Постійно видиме накладання, поки режим Talk увімкнено.
- Переходи між фазами Listening → Thinking → Speaking.
- Після короткої паузи (вікно тиші) поточний транскрипт надсилається.
- Відповіді записуються у WebChat (так само, як під час введення тексту).
- Переривання мовленням (типово увімкнено): якщо користувач починає говорити, поки помічник говорить, ми зупиняємо відтворення й фіксуємо часову позначку переривання для наступного prompt.
Голосові директиви у відповідях
Помічник може додати на початку відповіді один JSON-рядок, щоб керувати голосом:- Лише перший непорожній рядок.
- Невідомі ключі ігноруються.
once: trueзастосовується лише до поточної відповіді.- Без
onceголос стає новим типовим голосом для режиму Talk. - JSON-рядок видаляється перед відтворенням через TTS.
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Конфігурація (~/.openclaw/openclaw.json)
interruptOnSpeech: truesilenceTimeoutMs: якщо не задано, Talk використовує типове для платформи вікно паузи перед надсиланням транскрипту (700 msна macOS і Android,900 msна iOS)voiceId: резервно використовуєELEVENLABS_VOICE_ID/SAG_VOICE_ID(або перший голос ElevenLabs, коли доступний API-ключ)modelId: якщо не задано, типово використовуєтьсяeleven_v3apiKey: резервно використовуєELEVENLABS_API_KEY(або shell profile gateway, якщо доступно)outputFormat: типовоpcm_44100на macOS/iOS іpcm_24000на Android (установітьmp3_*, щоб примусово використовувати потокове передавання MP3)
UI macOS
- Перемикач у рядку меню: Talk
- Вкладка конфігурації: група Talk Mode (voice id + перемикач переривання)
- Накладання:
- Listening: хмара пульсує відповідно до рівня мікрофона
- Thinking: анімація занурення
- Speaking: кільця, що розходяться
- Натискання на хмару: зупинити озвучення
- Натискання X: вийти з режиму Talk
Примітки
- Потрібні дозволи Speech + Microphone.
- Використовує
chat.sendдля ключа сесіїmain. - Gateway визначає відтворення Talk через
talk.speak, використовуючи активного провайдера Talk. Android резервно використовує лише локальний системний TTS, коли цей RPC недоступний. stabilityдляeleven_v3перевіряється на значення0.0,0.5або1.0; інші моделі приймають0..1.latency_tierперевіряється на0..4, коли задано.- Android підтримує формати виводу
pcm_16000,pcm_22050,pcm_24000іpcm_44100для низьколатентного потокового відтворення через AudioTrack.