Langsung ke konten utama

Deepgram (Transkripsi Audio)

Deepgram adalah API speech-to-text. Di OpenClaw, ini digunakan untuk transkripsi audio/catatan suara masuk melalui tools.media.audio. Saat diaktifkan, OpenClaw mengunggah file audio ke Deepgram dan menyisipkan transkrip ke pipeline balasan ({{Transcript}} + blok [Audio]). Ini bukan streaming; ini menggunakan endpoint transkripsi rekaman siap pakai.
DetailNilai
Situs webdeepgram.com
Dokumendevelopers.deepgram.com
AuthDEEPGRAM_API_KEY
Model defaultnova-3

Memulai

1

Setel API key Anda

Tambahkan API key Deepgram Anda ke environment:
DEEPGRAM_API_KEY=dg_...
2

Aktifkan provider audio

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

Kirim catatan suara

Kirim pesan audio melalui channel terhubung apa pun. OpenClaw akan mentranskripsikannya melalui Deepgram dan menyisipkan transkrip ke pipeline balasan.

Opsi konfigurasi

OpsiPathDeskripsi
modeltools.media.audio.models[].modelID model Deepgram (default: nova-3)
languagetools.media.audio.models[].languagePetunjuk bahasa (opsional)
detect_languagetools.media.audio.providerOptions.deepgram.detect_languageAktifkan deteksi bahasa (opsional)
punctuatetools.media.audio.providerOptions.deepgram.punctuateAktifkan tanda baca (opsional)
smart_formattools.media.audio.providerOptions.deepgram.smart_formatAktifkan pemformatan cerdas (opsional)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

Catatan

Autentikasi mengikuti urutan auth provider standar. DEEPGRAM_API_KEY adalah jalur yang paling sederhana.
Override endpoint atau header dengan tools.media.audio.baseUrl dan tools.media.audio.headers saat menggunakan proxy.
Output mengikuti aturan audio yang sama seperti provider lain (batas ukuran, timeout, penyisipan transkrip).
Transkripsi Deepgram bersifat khusus rekaman siap pakai (bukan streaming real-time). OpenClaw mengunggah file audio lengkap dan menunggu transkrip penuh sebelum menyisipkannya ke dalam percakapan.

Terkait

Tool media

Ikhtisar pipeline pemrosesan audio, gambar, dan video.

Konfigurasi

Referensi config lengkap termasuk pengaturan tool media.

Pemecahan masalah

Masalah umum dan langkah debugging.

FAQ

Pertanyaan yang sering diajukan tentang penyiapan OpenClaw.