Talk modunun iki çalışma zamanı biçimi vardır:Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- Yerel macOS/iOS/Android Talk, yerel konuşma tanıma, Gateway sohbeti ve
talk.speakTTS kullanır. Düğümlertalkyeteneğini ilan eder ve destekledikleritalk.*komutlarını bildirir. - Tarayıcı Talk, istemciye ait
webrtcveprovider-websocketoturumları içintalk.client.create, ya da Gateway’e aitgateway-relayoturumları içintalk.session.createkullanır.managed-room, Gateway devri ve telsiz konuşma odaları için ayrılmıştır. - Yalnızca transkripsiyon yapan istemciler, yardımcı sesli yanıtı olmadan altyazı veya dikte gerektiğinde
talk.session.create({ mode: "transcription", transport: "gateway-relay", brain: "none" }), ardındantalk.session.appendAudio,talk.session.cancelTurnvetalk.session.closekullanır.
- Konuşmayı dinle
- Transkripti etkin oturum üzerinden modele gönder
- Yanıtı bekle
- Yapılandırılmış Talk sağlayıcısı (
talk.speak) üzerinden seslendir
talk.client.toolCall üzerinden iletir; tarayıcı istemcileri gerçek zamanlı danışmalar için doğrudan chat.send çağırmaz.
Yalnızca transkripsiyon yapan Talk, gerçek zamanlı ve STT/TTS oturumlarıyla aynı ortak Talk olay zarfını yayar, ancak mode: "transcription" ve brain: "none" kullanır. Altyazılar, dikte ve yalnızca gözlem amaçlı konuşma yakalama içindir; tek seferlik yüklenen sesli notlar hâlâ medya/ses yolunu kullanır.
Davranış (macOS)
- Talk modu etkinken her zaman açık katman.
- Dinleme → Düşünme → Konuşma aşama geçişleri.
- Kısa duraklama durumunda (sessizlik penceresi), mevcut transkript gönderilir.
- Yanıtlar WebChat’e yazılır (yazmakla aynı).
- Konuşmada kesme (varsayılan açık): kullanıcı yardımcı konuşurken konuşmaya başlarsa oynatmayı durdurur ve sonraki istem için kesinti zaman damgasını not ederiz.
Yanıtlarda ses yönergeleri
Yardımcı, sesi kontrol etmek için yanıtının başına tek bir JSON satırı ekleyebilir:- Yalnızca ilk boş olmayan satır.
- Bilinmeyen anahtarlar yok sayılır.
once: trueyalnızca geçerli yanıta uygulanır.onceyoksa ses, Talk modu için yeni varsayılan olur.- JSON satırı TTS oynatmadan önce çıkarılır.
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Yapılandırma (~/.openclaw/openclaw.json)
interruptOnSpeech: truesilenceTimeoutMs: ayarlanmadığında Talk, transkripti göndermeden önce platformun varsayılan duraklama penceresini korur (macOS ve Android'de 700 ms, iOS'te 900 ms)provider: etkin Talk sağlayıcısını seçer. macOS-yerel oynatma yolları içinelevenlabs,mlxveyasystemkullanın.providers.<provider>.voiceId: ElevenLabs içinELEVENLABS_VOICE_ID/SAG_VOICE_IDdeğerine geri döner (veya API anahtarı kullanılabiliyorsa ilk ElevenLabs sesine).providers.elevenlabs.modelId: ayarlanmadığında varsayılan olarakeleven_v3olur.providers.mlx.modelId: ayarlanmadığında varsayılan olarakmlx-community/Soprano-80M-bf16olur.providers.elevenlabs.apiKey:ELEVENLABS_API_KEYdeğerine geri döner (veya varsa gateway kabuk profiline).consultThinkingLevel: gerçek zamanlıopenclaw_agent_consultçağrılarının arkasındaki tam OpenClaw ajan çalıştırması için isteğe bağlı düşünme düzeyi geçersiz kılması.consultFastMode: gerçek zamanlıopenclaw_agent_consultçağrıları için isteğe bağlı hızlı mod geçersiz kılması.realtime.provider: etkin tarayıcı/sunucu gerçek zamanlı ses sağlayıcısını seçer. WebRTC içinopenai, sağlayıcı WebSocket içingoogleveya Gateway relay üzerinden yalnızca köprü sağlayıcısı kullanın.realtime.providers.<provider>sağlayıcıya ait gerçek zamanlı yapılandırmayı saklar. Tarayıcı yalnızca geçici veya kısıtlı oturum kimlik bilgilerini alır, asla standart API anahtarı almaz.realtime.providers.openai.voice: yerleşik OpenAI Realtime ses kimliği. Geçerligpt-realtime-2seslerialloy,ash,ballad,coral,echo,sage,shimmer,verse,marinvecedardeğerleridir; en iyi kalite içinmarinvecedarönerilir.realtime.brain:agent-consult, gerçek zamanlı araç çağrılarını Gateway politikası üzerinden yönlendirir;direct-toolsyalnızca sahip uyumluluk davranışıdır;nonetranskripsiyon veya harici orkestrasyon içindir.realtime.instructions: OpenClaw’ın yerleşik gerçek zamanlı istemine sağlayıcıya dönük sistem yönergeleri ekler. Ses tarzı ve tonu için kullanın; OpenClaw varsayılanopenclaw_agent_consultkılavuzunu korur.talk.catalog, birinci taraf Talk istemcilerinin desteklenmeyen kombinasyonlardan kaçınabilmesi için her sağlayıcının geçerli modlarını, aktarımlarını, brain stratejilerini, gerçek zamanlı ses biçimlerini ve yetenek bayraklarını açığa çıkarır.- Akış transkripsiyon sağlayıcıları
talk.catalog.transcriptionüzerinden keşfedilir. Geçerli Gateway relay, özel Talk transkripsiyon yapılandırma yüzeyi eklenene kadar Voice Call akış sağlayıcısı yapılandırmasını kullanır. speechLocale: iOS/macOS üzerinde cihaz içi Talk konuşma tanıma için isteğe bağlı BCP 47 yerel ayar kimliği. Cihaz varsayılanını kullanmak için ayarlamayın.outputFormat: macOS/iOS üzerinde varsayılan olarakpcm_44100, Android üzerindepcm_24000olur (MP3 akışını zorlamak içinmp3_*ayarlayın)
macOS kullanıcı arayüzü
- Menü çubuğu anahtarı: Talk
- Yapılandırma sekmesi: Talk Mode grubu (ses kimliği + kesme anahtarı)
- Katman:
- Dinleme: bulut mikrofon düzeyiyle titreşir
- Düşünme: batma animasyonu
- Konuşma: yayılan halkalar
- Buluta tıkla: konuşmayı durdur
- X’e tıkla: Talk modundan çık
Android kullanıcı arayüzü
- Ses sekmesi anahtarı: Talk
- Manuel Mic ve Talk, birbirini dışlayan çalışma zamanı yakalama modlarıdır.
- Uygulama ön plandan ayrıldığında veya kullanıcı Ses sekmesinden çıktığında Manuel Mic durur.
- Talk Mode kapatılana veya Android düğümünün bağlantısı kesilene kadar çalışmaya devam eder ve etkinken Android’in mikrofon foreground-service türünü kullanır.
Notlar
- Konuşma + Mikrofon izinleri gerektirir.
- Yerel Talk etkin Gateway oturumunu kullanır ve yalnızca yanıt olayları kullanılamadığında geçmiş yoklamasına geri döner.
- Tarayıcı gerçek zamanlı Talk, sağlayıcıya ait tarayıcı oturumlarına
chat.sendaçmak yerineopenclaw_agent_consultiçintalk.client.toolCallkullanır. - Yalnızca transkripsiyon yapan Talk,
talk.session.create,talk.session.appendAudio,talk.session.cancelTurnvetalk.session.closekullanır; istemciler kısmi/son transkript güncellemeleri içintalk.eventaboneliği yapar. - gateway, Talk oynatmayı etkin Talk sağlayıcısını kullanarak
talk.speaküzerinden çözer. Android yalnızca bu RPC kullanılamadığında yerel sistem TTS’ye geri döner. - macOS yerel MLX oynatma, varsa paketle gelen
openclaw-mlx-ttsyardımcısını veyaPATHüzerindeki bir yürütülebilir dosyayı kullanır. Geliştirme sırasında özel yardımcı ikiliye işaret etmek içinOPENCLAW_MLX_TTS_BINayarlayın. eleven_v3içinstability,0.0,0.5veya1.0değerlerine doğrulanır; diğer modeller0..1kabul eder.latency_tierayarlandığında0..4aralığına doğrulanır.- Android, düşük gecikmeli AudioTrack akışı için
pcm_16000,pcm_22050,pcm_24000vepcm_44100çıktı biçimlerini destekler.