Langsung ke konten utama

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Deepgram adalah API speech-to-text. Di OpenClaw, Deepgram digunakan untuk transkripsi audio/voice note masuk melalui tools.media.audio dan untuk STT streaming Voice Call melalui plugins.entries.voice-call.config.streaming. Untuk transkripsi batch, OpenClaw mengunggah file audio lengkap ke Deepgram dan menyisipkan transkrip ke pipeline balasan ({{Transcript}} + blok [Audio]). Untuk Voice Call streaming, OpenClaw meneruskan frame G.711 u-law langsung melalui endpoint WebSocket listen milik Deepgram dan memancarkan transkrip parsial atau final saat Deepgram mengembalikannya.
DetailNilai
Websitedeepgram.com
Docsdevelopers.deepgram.com
AuthDEEPGRAM_API_KEY
Model defaultnova-3

Memulai

1

Set your API key

Tambahkan API key Deepgram Anda ke environment:
DEEPGRAM_API_KEY=dg_...
2

Enable the audio provider

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

Send a voice note

Kirim pesan audio melalui channel terhubung apa pun. OpenClaw mentranskripsikannya melalui Deepgram dan menyisipkan transkrip ke pipeline balasan.

Opsi konfigurasi

OptionPathDeskripsi
modeltools.media.audio.models[].modelID model Deepgram (default: nova-3)
languagetools.media.audio.models[].languagePetunjuk bahasa (opsional)
detect_languagetools.media.audio.providerOptions.deepgram.detect_languageAktifkan deteksi bahasa (opsional)
punctuatetools.media.audio.providerOptions.deepgram.punctuateAktifkan tanda baca (opsional)
smart_formattools.media.audio.providerOptions.deepgram.smart_formatAktifkan pemformatan cerdas (opsional)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

Voice Call streaming STT

Plugin deepgram bawaan juga mendaftarkan provider transkripsi realtime untuk plugin Voice Call.
SettingPath konfigurasiDefault
API keyplugins.entries.voice-call.config.streaming.providers.deepgram.apiKeyFallback ke DEEPGRAM_API_KEY
Model...deepgram.modelnova-3
Language...deepgram.language(tidak disetel)
Encoding...deepgram.encodingmulaw
Sample rate...deepgram.sampleRate8000
Endpointing...deepgram.endpointingMs800
Interim results...deepgram.interimResultstrue
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "deepgram",
            providers: {
              deepgram: {
                apiKey: "${DEEPGRAM_API_KEY}",
                model: "nova-3",
                endpointingMs: 800,
                language: "en-US",
              },
            },
          },
        },
      },
    },
  },
}
Voice Call menerima audio telephony sebagai G.711 u-law 8 kHz. Provider streaming Deepgram default ke encoding: "mulaw" dan sampleRate: 8000, sehingga frame media Twilio dapat diteruskan secara langsung.

Catatan

Auth mengikuti urutan auth provider standar. DEEPGRAM_API_KEY adalah jalur yang paling sederhana.
Timpa endpoint atau header dengan tools.media.audio.baseUrl dan tools.media.audio.headers saat menggunakan proxy.
Output mengikuti aturan audio yang sama seperti provider lain (batas ukuran, timeout, penyisipan transkrip).

Terkait

Media tools

Ikhtisar pipeline pemrosesan audio, gambar, dan video.

Configuration

Referensi konfigurasi lengkap termasuk pengaturan tool media.

Troubleshooting

Masalah umum dan langkah debug.

FAQ

Pertanyaan umum tentang penyiapan OpenClaw.