Konuşma Modu
Konuşma modu, sürekli bir sesli konuşma döngüsüdür:- Konuşmayı dinle
- Transkripti modele gönder (ana oturum,
chat.send) - Yanıtı bekle
- Bunu yapılandırılmış Konuşma sağlayıcısı üzerinden seslendir (
talk.speak)
Davranış (macOS)
- Konuşma modu etkinken her zaman açık katman.
- Dinleme → Düşünme → Konuşma aşama geçişleri.
- Kısa bir duraklamada (sessizlik penceresi), mevcut transkript gönderilir.
- Yanıtlar WebChat’e yazılır (yazıyormuşsunuz gibi aynı şekilde).
- Konuşmada kesme (varsayılan açık): kullanıcı, asistan konuşurken konuşmaya başlarsa oynatmayı durdururuz ve bir sonraki istem için kesme zaman damgasını not ederiz.
Yanıtlardaki ses yönergeleri
Asistan, sesi denetlemek için yanıtını tek bir JSON satırıyla önekleyebilir:- Yalnızca ilk boş olmayan satır.
- Bilinmeyen anahtarlar yok sayılır.
once: trueyalnızca mevcut yanıt için geçerlidir.onceolmadan ses, Konuşma modu için yeni varsayılan olur.- JSON satırı TTS oynatımından önce kaldırılır.
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Config (~/.openclaw/openclaw.json)
interruptOnSpeech: truesilenceTimeoutMs: ayarlanmadığında Konuşma, transkripti göndermeden önce platform varsayılan duraklama penceresini korur (macOS ve Android'de 700 ms, iOS'ta 900 ms)voiceId:ELEVENLABS_VOICE_ID/SAG_VOICE_IDdeğerine geri düşer (veya API anahtarı varsa ilk ElevenLabs sesi)modelId: ayarlanmadığında varsayılan olarakeleven_v3apiKey:ELEVENLABS_API_KEYdeğerine geri düşer (veya varsa gateway kabuk profiline)outputFormat: varsayılan olarak macOS/iOS’tapcm_44100, Android’depcm_24000olur (MP3 akışını zorlamak içinmp3_*ayarlayın)
macOS UI
- Menü çubuğu anahtarı: Konuş
- Config sekmesi: Konuşma Modu grubu (ses kimliği + kesme anahtarı)
- Katman:
- Dinleme: mikrofon düzeyiyle birlikte atımlı bulut
- Düşünme: alçalan animasyon
- Konuşma: yayılan halkalar
- Buluta tıklayın: konuşmayı durdur
- X’e tıklayın: Konuşma modundan çık
Notlar
- Speech + Microphone izinleri gerektirir.
mainoturum anahtarına karşıchat.sendkullanır.- Gateway, etkin Konuşma sağlayıcısını kullanarak Konuşma oynatımını
talk.speaküzerinden çözer. Android yalnızca bu RPC kullanılamadığında yerel sistem TTS’ine geri döner. eleven_v3içinstability,0.0,0.5veya1.0olarak doğrulanır; diğer modeller0..1kabul eder.latency_tier, ayarlandığında0..4aralığında doğrulanır.- Android, düşük gecikmeli AudioTrack akışı için
pcm_16000,pcm_22050,pcm_24000vepcm_44100çıktı biçimlerini destekler.