Mode Talk
Mode talk adalah loop percakapan suara berkelanjutan:- Mendengarkan ucapan
- Mengirim transkrip ke model (sesi utama, chat.send)
- Menunggu respons
- Mengucapkannya melalui provider Talk yang dikonfigurasi (
talk.speak)
Perilaku (macOS)
- Overlay selalu aktif saat mode Talk diaktifkan.
- Transisi fase Mendengarkan → Berpikir → Berbicara.
- Saat terjadi jeda singkat (jendela hening), transkrip saat ini dikirim.
- Balasan ditulis ke WebChat (sama seperti mengetik).
- Interupsi saat ada ucapan (default aktif): jika pengguna mulai berbicara saat asisten sedang berbicara, kami menghentikan pemutaran dan mencatat stempel waktu interupsi untuk prompt berikutnya.
Direktif suara dalam balasan
Asisten dapat memberi awalan pada balasannya dengan satu baris JSON untuk mengontrol suara:- Hanya baris pertama yang tidak kosong.
- Key yang tidak dikenal diabaikan.
once: truehanya berlaku untuk balasan saat ini.- Tanpa
once, suara tersebut menjadi default baru untuk mode Talk. - Baris JSON dihapus sebelum pemutaran TTS.
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Konfigurasi (~/.openclaw/openclaw.json)
interruptOnSpeech: truesilenceTimeoutMs: jika tidak disetel, Talk mempertahankan jendela jeda default platform sebelum mengirim transkrip (700 msdi macOS dan Android,900 msdi iOS)voiceId: menggunakan fallback keELEVENLABS_VOICE_ID/SAG_VOICE_ID(atau suara ElevenLabs pertama saat kunci API tersedia)modelId: default keeleven_v3jika tidak disetelapiKey: menggunakan fallback keELEVENLABS_API_KEY(atau profil shell gateway jika tersedia)outputFormat: default kepcm_44100di macOS/iOS danpcm_24000di Android (setelmp3_*untuk memaksa streaming MP3)
UI macOS
- Toggle bilah menu: Talk
- Tab konfigurasi: grup Mode Talk (voice id + toggle interupsi)
- Overlay:
- Mendengarkan: awan berdenyut dengan level mic
- Berpikir: animasi tenggelam
- Berbicara: cincin yang memancar
- Klik awan: hentikan berbicara
- Klik X: keluar dari mode Talk
Catatan
- Memerlukan izin Speech + Microphone.
- Menggunakan
chat.sendterhadap key sesimain. - Gateway menyelesaikan pemutaran Talk melalui
talk.speakmenggunakan provider Talk aktif. Android menggunakan fallback ke TTS sistem lokal hanya saat RPC tersebut tidak tersedia. stabilityuntukeleven_v3divalidasi ke0.0,0.5, atau1.0; model lain menerima0..1.latency_tierdivalidasi ke0..4saat disetel.- Android mendukung format output
pcm_16000,pcm_22050,pcm_24000, danpcm_44100untuk streaming AudioTrack berlatensi rendah.