OpenClaw, metinden konuşmaya, Scribe v2 ile toplu konuşmadan metne ve Scribe v2 Realtime ile akışlı STT için ElevenLabs kullanır.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
| Yetenek | OpenClaw yüzeyi | Varsayılan |
|---|---|---|
| Metinden konuşmaya | messages.tts / talk | eleven_multilingual_v2 |
| Toplu konuşmadan metne | tools.media.audio | scribe_v2 |
| Akışlı konuşmadan metne | Sesli Arama akışı veya Google Meet realtime.transcriptionProvider | scribe_v2_realtime |
Kimlik doğrulama
OrtamdaELEVENLABS_API_KEY ayarlayın. Mevcut ElevenLabs araçlarıyla uyumluluk
için XI_API_KEY de kabul edilir.
Metinden konuşmaya
modelId değerini eleven_v3 olarak ayarlayın.
OpenClaw, mevcut kurulumlar için varsayılan olarak eleven_multilingual_v2
kullanmaya devam eder.
ElevenLabs seçili voice.tts/messages.tts sağlayıcısı olduğunda Discord ses
kanalları ElevenLabs’in akışlı TTS uç noktasını kullanır. Oynatma, OpenClaw’ın
önce tüm ses dosyasını indirip yazmasını beklemek yerine döndürülen ses akışından
başlar. latencyTier, bunu kabul eden modeller için ElevenLabs’in
optimize_streaming_latency sorgu parametresine eşlenir; OpenClaw, bunu reddeden
eleven_v3 için bu parametreyi atlar.
Konuşmadan metne
Gelen ses ekleri ve kısa kaydedilmiş ses bölümleri için Scribe v2 kullanın:model_id: "scribe_v2" ile multipart sesi ElevenLabs
/v1/speech-to-text adresine gönderir. Dil ipuçları mevcut olduğunda
language_code değerine eşlenir.
Akışlı STT
Birlikte gelenelevenlabs Plugin’i, Sesli Arama ve Google Meet aracı modu
akışlı transkripsiyonu için Scribe v2 Realtime kaydeder.
| Ayar | Yapılandırma yolu | Varsayılan |
|---|---|---|
| API anahtarı | plugins.entries.voice-call.config.streaming.providers.elevenlabs.apiKey | ELEVENLABS_API_KEY / XI_API_KEY değerlerine geri döner |
| Model | ...elevenlabs.modelId | scribe_v2_realtime |
| Ses biçimi | ...elevenlabs.audioFormat | ulaw_8000 |
| Örnekleme hızı | ...elevenlabs.sampleRate | 8000 |
| İşleme stratejisi | ...elevenlabs.commitStrategy | vad |
| Dil | ...elevenlabs.languageCode | (ayarlanmamış) |
Sesli Arama, Twilio medyasını 8 kHz G.711 u-law olarak alır. ElevenLabs realtime
sağlayıcısı varsayılan olarak
ulaw_8000 kullanır, bu nedenle telefon çerçeveleri
kod dönüştürme olmadan iletilebilir.plugins.entries.google-meet.config.realtime.transcriptionProvider değerini
"elevenlabs" olarak ayarlayın ve aynı sağlayıcı bloğunu
plugins.entries.google-meet.config.realtime.providers.elevenlabs altında
yapılandırın.