Ana içeriğe atla

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

OpenClaw, metinden konuşmaya, Scribe v2 ile toplu konuşmadan metne ve Scribe v2 Realtime ile akışlı STT için ElevenLabs kullanır.
YetenekOpenClaw yüzeyiVarsayılan
Metinden konuşmayamessages.tts / talkeleven_multilingual_v2
Toplu konuşmadan metnetools.media.audioscribe_v2
Akışlı konuşmadan metneSesli Arama akışı veya Google Meet realtime.transcriptionProviderscribe_v2_realtime

Kimlik doğrulama

Ortamda ELEVENLABS_API_KEY ayarlayın. Mevcut ElevenLabs araçlarıyla uyumluluk için XI_API_KEY de kabul edilir.
export ELEVENLABS_API_KEY="..."

Metinden konuşmaya

{
  messages: {
    tts: {
      providers: {
        elevenlabs: {
          apiKey: "${ELEVENLABS_API_KEY}",
          voiceId: "pMsXgVXv3BLzUgSXRplE",
          modelId: "eleven_multilingual_v2",
        },
      },
    },
  },
}
ElevenLabs v3 TTS kullanmak için modelId değerini eleven_v3 olarak ayarlayın. OpenClaw, mevcut kurulumlar için varsayılan olarak eleven_multilingual_v2 kullanmaya devam eder. ElevenLabs seçili voice.tts/messages.tts sağlayıcısı olduğunda Discord ses kanalları ElevenLabs’in akışlı TTS uç noktasını kullanır. Oynatma, OpenClaw’ın önce tüm ses dosyasını indirip yazmasını beklemek yerine döndürülen ses akışından başlar. latencyTier, bunu kabul eden modeller için ElevenLabs’in optimize_streaming_latency sorgu parametresine eşlenir; OpenClaw, bunu reddeden eleven_v3 için bu parametreyi atlar.

Konuşmadan metne

Gelen ses ekleri ve kısa kaydedilmiş ses bölümleri için Scribe v2 kullanın:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "elevenlabs", model: "scribe_v2" }],
      },
    },
  },
}
OpenClaw, model_id: "scribe_v2" ile multipart sesi ElevenLabs /v1/speech-to-text adresine gönderir. Dil ipuçları mevcut olduğunda language_code değerine eşlenir.

Akışlı STT

Birlikte gelen elevenlabs Plugin’i, Sesli Arama ve Google Meet aracı modu akışlı transkripsiyonu için Scribe v2 Realtime kaydeder.
AyarYapılandırma yoluVarsayılan
API anahtarıplugins.entries.voice-call.config.streaming.providers.elevenlabs.apiKeyELEVENLABS_API_KEY / XI_API_KEY değerlerine geri döner
Model...elevenlabs.modelIdscribe_v2_realtime
Ses biçimi...elevenlabs.audioFormatulaw_8000
Örnekleme hızı...elevenlabs.sampleRate8000
İşleme stratejisi...elevenlabs.commitStrategyvad
Dil...elevenlabs.languageCode(ayarlanmamış)
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "elevenlabs",
            providers: {
              elevenlabs: {
                apiKey: "${ELEVENLABS_API_KEY}",
                audioFormat: "ulaw_8000",
                commitStrategy: "vad",
                languageCode: "en",
              },
            },
          },
        },
      },
    },
  },
}
Sesli Arama, Twilio medyasını 8 kHz G.711 u-law olarak alır. ElevenLabs realtime sağlayıcısı varsayılan olarak ulaw_8000 kullanır, bu nedenle telefon çerçeveleri kod dönüştürme olmadan iletilebilir.
Google Meet aracı modu için plugins.entries.google-meet.config.realtime.transcriptionProvider değerini "elevenlabs" olarak ayarlayın ve aynı sağlayıcı bloğunu plugins.entries.google-meet.config.realtime.providers.elevenlabs altında yapılandırın.

İlgili