Passer au contenu principal

Deepgram (transcription audio)

Deepgram est une API de transcription vocale. Dans OpenClaw, elle est utilisée pour la transcription audio/des notes vocales entrantes via tools.media.audio. Lorsqu’elle est activée, OpenClaw téléverse le fichier audio vers Deepgram et injecte la transcription dans le pipeline de réponse ({{Transcript}} + bloc [Audio]). Il ne s’agit pas d’un flux en continu ; cela utilise le point de terminaison de transcription préenregistrée. Site web : https://deepgram.com
Documentation : https://developers.deepgram.com

Démarrage rapide

  1. Définissez votre clé API :
DEEPGRAM_API_KEY=dg_...
  1. Activez le fournisseur :
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

Options

  • model: ID du modèle Deepgram (par défaut : nova-3)
  • language: indication de langue (facultatif)
  • tools.media.audio.providerOptions.deepgram.detect_language: activer la détection de langue (facultatif)
  • tools.media.audio.providerOptions.deepgram.punctuate: activer la ponctuation (facultatif)
  • tools.media.audio.providerOptions.deepgram.smart_format: activer le formatage intelligent (facultatif)
Exemple avec langue :
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}
Exemple avec options Deepgram :
{
  tools: {
    media: {
      audio: {
        enabled: true,
        providerOptions: {
          deepgram: {
            detect_language: true,
            punctuate: true,
            smart_format: true,
          },
        },
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

Remarques

  • L’authentification suit l’ordre standard d’authentification des fournisseurs ; DEEPGRAM_API_KEY est le chemin le plus simple.
  • Remplacez les points de terminaison ou les en-têtes avec tools.media.audio.baseUrl et tools.media.audio.headers lorsque vous utilisez un proxy.
  • La sortie suit les mêmes règles audio que les autres fournisseurs (limites de taille, délais d’expiration, injection de transcription).