Ana içeriğe atla

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Deepgram bir konuşmadan metne API’sidir. OpenClaw içinde, tools.media.audio aracılığıyla gelen ses/sesli not transkripsiyonu için ve Voice Call akış STT’si için plugins.entries.voice-call.config.streaming üzerinden kullanılır. Toplu transkripsiyon için OpenClaw, tam ses dosyasını Deepgram’a yükler ve transkripti yanıt işlem hattına enjekte eder ({{Transcript}} + [Audio] bloğu). Voice Call akışı için OpenClaw, canlı G.711 u-law karelerini Deepgram’ın WebSocket listen uç noktasına iletir ve Deepgram bunları döndürdükçe kısmi veya nihai transkriptler üretir.
AyrıntıDeğer
Web sitesideepgram.com
Belgelerdevelopers.deepgram.com
Kimlik doğrulamaDEEPGRAM_API_KEY
Varsayılan modelnova-3

Başlangıç

1

API anahtarınızı ayarlayın

Deepgram API anahtarınızı ortama ekleyin:
DEEPGRAM_API_KEY=dg_...
2

Ses sağlayıcısını etkinleştirin

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

Bir sesli not gönderin

Bağlı herhangi bir kanal üzerinden bir ses mesajı gönderin. OpenClaw bunu Deepgram aracılığıyla transkribe eder ve transkripti yanıt işlem hattına enjekte eder.

Yapılandırma seçenekleri

SeçenekYolAçıklama
modeltools.media.audio.models[].modelDeepgram model kimliği (varsayılan: nova-3)
languagetools.media.audio.models[].languageDil ipucu (isteğe bağlı)
detect_languagetools.media.audio.providerOptions.deepgram.detect_languageDil algılamayı etkinleştirir (isteğe bağlı)
punctuatetools.media.audio.providerOptions.deepgram.punctuateNoktalama işaretlerini etkinleştirir (isteğe bağlı)
smart_formattools.media.audio.providerOptions.deepgram.smart_formatAkıllı biçimlendirmeyi etkinleştirir (isteğe bağlı)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

Voice Call akış STT’si

Paketlenmiş deepgram Plugin’i, Voice Call Plugin’i için bir gerçek zamanlı transkripsiyon sağlayıcısı da kaydeder.
AyarYapılandırma yoluVarsayılan
API anahtarıplugins.entries.voice-call.config.streaming.providers.deepgram.apiKeyDEEPGRAM_API_KEY değerine geri döner
Model...deepgram.modelnova-3
Dil...deepgram.language(ayarlanmamış)
Kodlama...deepgram.encodingmulaw
Örnekleme oranı...deepgram.sampleRate8000
Uç noktalama...deepgram.endpointingMs800
Ara sonuçlar...deepgram.interimResultstrue
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "deepgram",
            providers: {
              deepgram: {
                apiKey: "${DEEPGRAM_API_KEY}",
                model: "nova-3",
                endpointingMs: 800,
                language: "en-US",
              },
            },
          },
        },
      },
    },
  },
}
Voice Call, telefon sesini 8 kHz G.711 u-law olarak alır. Deepgram akış sağlayıcısı varsayılan olarak encoding: "mulaw" ve sampleRate: 8000 kullanır; bu nedenle Twilio medya kareleri doğrudan iletilebilir.

Notlar

Kimlik doğrulama standart sağlayıcı kimlik doğrulama sırasını izler. DEEPGRAM_API_KEY en basit yoldur.
Bir proxy kullanırken uç noktaları veya üst bilgileri tools.media.audio.baseUrl ve tools.media.audio.headers ile geçersiz kılın.
Çıktı, diğer sağlayıcılarla aynı ses kurallarını izler (boyut sınırları, zaman aşımları, transkript enjeksiyonu).

İlgili

Medya araçları

Ses, görüntü ve video işleme işlem hattına genel bakış.

Yapılandırma

Medya aracı ayarları dahil tam yapılandırma başvurusu.

Sorun giderme

Yaygın sorunlar ve hata ayıklama adımları.

SSS

OpenClaw kurulumu hakkında sık sorulan sorular.