Deepgram bir konuşmadan metne API’sidir. OpenClaw içinde,Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
tools.media.audio
aracılığıyla gelen ses/sesli not transkripsiyonu için ve Voice Call akış STT’si
için plugins.entries.voice-call.config.streaming üzerinden kullanılır.
Toplu transkripsiyon için OpenClaw, tam ses dosyasını Deepgram’a yükler
ve transkripti yanıt işlem hattına enjekte eder ({{Transcript}} +
[Audio] bloğu). Voice Call akışı için OpenClaw, canlı G.711
u-law karelerini Deepgram’ın WebSocket listen uç noktasına iletir ve
Deepgram bunları döndürdükçe kısmi veya nihai transkriptler üretir.
| Ayrıntı | Değer |
|---|---|
| Web sitesi | deepgram.com |
| Belgeler | developers.deepgram.com |
| Kimlik doğrulama | DEEPGRAM_API_KEY |
| Varsayılan model | nova-3 |
Başlangıç
Yapılandırma seçenekleri
| Seçenek | Yol | Açıklama |
|---|---|---|
model | tools.media.audio.models[].model | Deepgram model kimliği (varsayılan: nova-3) |
language | tools.media.audio.models[].language | Dil ipucu (isteğe bağlı) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | Dil algılamayı etkinleştirir (isteğe bağlı) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | Noktalama işaretlerini etkinleştirir (isteğe bağlı) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | Akıllı biçimlendirmeyi etkinleştirir (isteğe bağlı) |
- Dil ipucuyla
- Deepgram seçenekleriyle
Voice Call akış STT’si
Paketlenmişdeepgram Plugin’i, Voice Call Plugin’i için bir gerçek zamanlı
transkripsiyon sağlayıcısı da kaydeder.
| Ayar | Yapılandırma yolu | Varsayılan |
|---|---|---|
| API anahtarı | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | DEEPGRAM_API_KEY değerine geri döner |
| Model | ...deepgram.model | nova-3 |
| Dil | ...deepgram.language | (ayarlanmamış) |
| Kodlama | ...deepgram.encoding | mulaw |
| Örnekleme oranı | ...deepgram.sampleRate | 8000 |
| Uç noktalama | ...deepgram.endpointingMs | 800 |
| Ara sonuçlar | ...deepgram.interimResults | true |
Voice Call, telefon sesini 8 kHz G.711 u-law olarak alır. Deepgram
akış sağlayıcısı varsayılan olarak
encoding: "mulaw" ve sampleRate: 8000
kullanır; bu nedenle Twilio medya kareleri doğrudan iletilebilir.Notlar
Kimlik doğrulama
Kimlik doğrulama
Kimlik doğrulama standart sağlayıcı kimlik doğrulama sırasını izler.
DEEPGRAM_API_KEY
en basit yoldur.Proxy ve özel uç noktalar
Proxy ve özel uç noktalar
Bir proxy kullanırken uç noktaları veya üst bilgileri
tools.media.audio.baseUrl ve
tools.media.audio.headers ile geçersiz kılın.Çıktı davranışı
Çıktı davranışı
Çıktı, diğer sağlayıcılarla aynı ses kurallarını izler (boyut sınırları, zaman aşımları,
transkript enjeksiyonu).
İlgili
Medya araçları
Ses, görüntü ve video işleme işlem hattına genel bakış.
Yapılandırma
Medya aracı ayarları dahil tam yapılandırma başvurusu.
Sorun giderme
Yaygın sorunlar ve hata ayıklama adımları.
SSS
OpenClaw kurulumu hakkında sık sorulan sorular.