Vai al contenuto principale

Deepgram (Trascrizione audio)

Deepgram è un’API speech-to-text. In OpenClaw viene usata per la trascrizione di audio/messaggi vocali in ingresso tramite tools.media.audio. Quando è abilitata, OpenClaw carica il file audio su Deepgram e inserisce la trascrizione nella pipeline di risposta (blocco {{Transcript}} + [Audio]). Questa modalità non è in streaming; usa l’endpoint di trascrizione preregistrata.
DettaglioValore
Sito webdeepgram.com
Documentazionedevelopers.deepgram.com
AutenticazioneDEEPGRAM_API_KEY
Modello predefinitonova-3

Per iniziare

1

Imposta la tua chiave API

Aggiungi la tua chiave API Deepgram all’ambiente:
DEEPGRAM_API_KEY=dg_...
2

Abilita il provider audio

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

Invia un messaggio vocale

Invia un messaggio audio tramite qualsiasi canale connesso. OpenClaw lo trascrive tramite Deepgram e inserisce la trascrizione nella pipeline di risposta.

Opzioni di configurazione

OpzionePercorsoDescrizione
modeltools.media.audio.models[].modelID modello Deepgram (predefinito: nova-3)
languagetools.media.audio.models[].languageSuggerimento lingua (facoltativo)
detect_languagetools.media.audio.providerOptions.deepgram.detect_languageAbilita il rilevamento della lingua (facoltativo)
punctuatetools.media.audio.providerOptions.deepgram.punctuateAbilita la punteggiatura (facoltativo)
smart_formattools.media.audio.providerOptions.deepgram.smart_formatAbilita la formattazione intelligente (facoltativo)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

Note

L’autenticazione segue l’ordine standard dei provider. DEEPGRAM_API_KEY è il percorso più semplice.
Sovrascrivi endpoint o header con tools.media.audio.baseUrl e tools.media.audio.headers quando usi un proxy.
L’output segue le stesse regole audio degli altri provider (limiti di dimensione, timeout, inserimento della trascrizione).
La trascrizione Deepgram è solo preregistrata (non in streaming in tempo reale). OpenClaw carica il file audio completo e attende la trascrizione completa prima di inserirla nella conversazione.

Correlati

Strumenti media

Panoramica della pipeline di elaborazione audio, immagini e video.

Configurazione

Riferimento completo della configurazione, incluse le impostazioni degli strumenti media.

Risoluzione dei problemi

Problemi comuni e passaggi di debug.

FAQ

Domande frequenti sulla configurazione di OpenClaw.