Deepgram (Trascrizione audio)
Deepgram è un’API speech-to-text. In OpenClaw viene usata per la trascrizione di audio/messaggi vocali in ingresso tramitetools.media.audio.
Quando è abilitato, OpenClaw carica il file audio su Deepgram e inietta la trascrizione
nella pipeline di risposta ({{Transcript}} + blocco [Audio]). Questo non è streaming;
usa l’endpoint di trascrizione preregistrata.
Sito web: https://deepgram.comDocumentazione: https://developers.deepgram.com
Avvio rapido
- Imposta la tua chiave API:
- Abilita il provider:
Opzioni
model: ID del modello Deepgram (predefinito:nova-3)language: suggerimento di lingua (facoltativo)tools.media.audio.providerOptions.deepgram.detect_language: abilita il rilevamento della lingua (facoltativo)tools.media.audio.providerOptions.deepgram.punctuate: abilita la punteggiatura (facoltativo)tools.media.audio.providerOptions.deepgram.smart_format: abilita la formattazione intelligente (facoltativo)
Note
- L’autenticazione segue il normale ordine auth del provider;
DEEPGRAM_API_KEYè il percorso più semplice. - Sovrascrivi endpoint o header con
tools.media.audio.baseUrletools.media.audio.headersquando usi un proxy. - L’output segue le stesse regole audio degli altri provider (limiti di dimensione, timeout, iniezione della trascrizione).