Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Deepgram est une API de reconnaissance vocale. Dans OpenClaw, elle est utilisée pour la transcription des fichiers audio/notes vocales entrants via tools.media.audio et pour la reconnaissance vocale en streaming de Voice Call via plugins.entries.voice-call.config.streaming. Pour la transcription par lot, OpenClaw téléverse le fichier audio complet vers Deepgram et injecte la transcription dans le pipeline de réponse ({{Transcript}} + bloc [Audio]). Pour la transcription en streaming Voice Call, OpenClaw transfère des trames G.711 u-law live via le point de terminaison WebSocket listen de Deepgram et émet des transcriptions partielles ou finales à mesure que Deepgram les renvoie.
DétailValeur
Site webdeepgram.com
Documentationdevelopers.deepgram.com
AuthentificationDEEPGRAM_API_KEY
Modèle par défautnova-3

Démarrage

1

Définir votre clé API

Ajoutez votre clé API Deepgram à l’environnement :
DEEPGRAM_API_KEY=dg_...
2

Activer le fournisseur audio

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

Envoyer une note vocale

Envoyez un message audio via n’importe quel canal connecté. OpenClaw le transcrit via Deepgram et injecte la transcription dans le pipeline de réponse.

Options de configuration

OptionCheminDescription
modeltools.media.audio.models[].modelIdentifiant du modèle Deepgram (par défaut : nova-3)
languagetools.media.audio.models[].languageIndice de langue (facultatif)
detect_languagetools.media.audio.providerOptions.deepgram.detect_languageActiver la détection de langue (facultatif)
punctuatetools.media.audio.providerOptions.deepgram.punctuateActiver la ponctuation (facultatif)
smart_formattools.media.audio.providerOptions.deepgram.smart_formatActiver le formatage intelligent (facultatif)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

Reconnaissance vocale en streaming Voice Call

Le Plugin intégré deepgram enregistre aussi un fournisseur de transcription temps réel pour le Plugin Voice Call.
ParamètreChemin de configurationPar défaut
Clé APIplugins.entries.voice-call.config.streaming.providers.deepgram.apiKeySe replie sur DEEPGRAM_API_KEY
Modèle...deepgram.modelnova-3
Langue...deepgram.language(non défini)
Encodage...deepgram.encodingmulaw
Taux d’échantillonnage...deepgram.sampleRate8000
Endpointing...deepgram.endpointingMs800
Résultats intermédiaires...deepgram.interimResultstrue
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "deepgram",
            providers: {
              deepgram: {
                apiKey: "${DEEPGRAM_API_KEY}",
                model: "nova-3",
                endpointingMs: 800,
                language: "en-US",
              },
            },
          },
        },
      },
    },
  },
}
Voice Call reçoit l’audio téléphonique en G.711 u-law 8 kHz. Le fournisseur de streaming Deepgram utilise par défaut encoding: "mulaw" et sampleRate: 8000, de sorte que les trames média Twilio peuvent être transférées directement.

Remarques

L’authentification suit l’ordre standard d’authentification des fournisseurs. DEEPGRAM_API_KEY est le chemin le plus simple.
Remplacez les points de terminaison ou les en-têtes avec tools.media.audio.baseUrl et tools.media.audio.headers lors de l’utilisation d’un proxy.
La sortie suit les mêmes règles audio que les autres fournisseurs (plafonds de taille, délais, injection de transcription).

Liens associés

Outils média

Vue d’ensemble du pipeline de traitement audio, image et vidéo.

Configuration

Référence complète de configuration, y compris les paramètres des outils média.

Dépannage

Problèmes courants et étapes de débogage.

FAQ

Questions fréquemment posées sur la configuration d’OpenClaw.