Deepgram adalah API speech-to-text. Di OpenClaw, Deepgram digunakan untuk transkripsi audio/voice note masuk melaluiDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
tools.media.audio dan untuk STT streaming Voice Call
melalui plugins.entries.voice-call.config.streaming.
Untuk transkripsi batch, OpenClaw mengunggah file audio lengkap ke Deepgram
dan menyisipkan transkrip ke pipeline balasan ({{Transcript}} +
blok [Audio]). Untuk Voice Call streaming, OpenClaw meneruskan frame G.711
u-law langsung melalui endpoint WebSocket listen milik Deepgram dan memancarkan transkrip parsial atau
final saat Deepgram mengembalikannya.
| Detail | Nilai |
|---|---|
| Website | deepgram.com |
| Docs | developers.deepgram.com |
| Auth | DEEPGRAM_API_KEY |
| Model default | nova-3 |
Memulai
Opsi konfigurasi
| Option | Path | Deskripsi |
|---|---|---|
model | tools.media.audio.models[].model | ID model Deepgram (default: nova-3) |
language | tools.media.audio.models[].language | Petunjuk bahasa (opsional) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | Aktifkan deteksi bahasa (opsional) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | Aktifkan tanda baca (opsional) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | Aktifkan pemformatan cerdas (opsional) |
- With language hint
- With Deepgram options
Voice Call streaming STT
Plugindeepgram bawaan juga mendaftarkan provider transkripsi realtime
untuk plugin Voice Call.
| Setting | Path konfigurasi | Default |
|---|---|---|
| API key | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | Fallback ke DEEPGRAM_API_KEY |
| Model | ...deepgram.model | nova-3 |
| Language | ...deepgram.language | (tidak disetel) |
| Encoding | ...deepgram.encoding | mulaw |
| Sample rate | ...deepgram.sampleRate | 8000 |
| Endpointing | ...deepgram.endpointingMs | 800 |
| Interim results | ...deepgram.interimResults | true |
Voice Call menerima audio telephony sebagai G.711 u-law 8 kHz. Provider
streaming Deepgram default ke
encoding: "mulaw" dan sampleRate: 8000, sehingga
frame media Twilio dapat diteruskan secara langsung.Catatan
Authentication
Authentication
Auth mengikuti urutan auth provider standar.
DEEPGRAM_API_KEY adalah
jalur yang paling sederhana.Proxy and custom endpoints
Proxy and custom endpoints
Timpa endpoint atau header dengan
tools.media.audio.baseUrl dan
tools.media.audio.headers saat menggunakan proxy.Output behavior
Output behavior
Output mengikuti aturan audio yang sama seperti provider lain (batas ukuran, timeout,
penyisipan transkrip).
Terkait
Media tools
Ikhtisar pipeline pemrosesan audio, gambar, dan video.
Configuration
Referensi konfigurasi lengkap termasuk pengaturan tool media.
Troubleshooting
Masalah umum dan langkah debug.
FAQ
Pertanyaan umum tentang penyiapan OpenClaw.