Zum Hauptinhalt springen

Deepgram (Audio-Transkription)

Deepgram ist eine Speech-to-Text-API. In OpenClaw wird sie für die Transkription eingehender Audio-/Sprachnotizen über tools.media.audio verwendet. Wenn aktiviert, lädt OpenClaw die Audiodatei zu Deepgram hoch und fügt das Transkript in die Antwort-Pipeline ein ({{Transcript}} + [Audio]-Block). Dies ist nicht Streaming; es verwendet den Endpunkt für vorab aufgezeichnete Transkription.
DetailWert
Websitedeepgram.com
Docsdevelopers.deepgram.com
AuthDEEPGRAM_API_KEY
Standardmodellnova-3

Erste Schritte

1

API-Schlüssel festlegen

Fügen Sie Ihren Deepgram-API-Schlüssel zur Umgebung hinzu:
DEEPGRAM_API_KEY=dg_...
2

Audio-Provider aktivieren

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

Eine Sprachnotiz senden

Senden Sie eine Audionachricht über einen beliebigen verbundenen Kanal. OpenClaw transkribiert sie über Deepgram und fügt das Transkript in die Antwort-Pipeline ein.

Konfigurationsoptionen

OptionPfadBeschreibung
modeltools.media.audio.models[].modelDeepgram-Modell-ID (Standard: nova-3)
languagetools.media.audio.models[].languageSprachhinweis (optional)
detect_languagetools.media.audio.providerOptions.deepgram.detect_languageSpracherkennung aktivieren (optional)
punctuatetools.media.audio.providerOptions.deepgram.punctuateZeichensetzung aktivieren (optional)
smart_formattools.media.audio.providerOptions.deepgram.smart_formatSmart Formatting aktivieren (optional)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

Hinweise

Die Authentifizierung folgt der Standardreihenfolge für Provider-Authentifizierung. DEEPGRAM_API_KEY ist der einfachste Weg.
Überschreiben Sie Endpunkte oder Header mit tools.media.audio.baseUrl und tools.media.audio.headers, wenn Sie einen Proxy verwenden.
Die Ausgabe folgt denselben Audioregeln wie bei anderen Providern (Größenbeschränkungen, Timeouts, Einfügen des Transkripts).
Deepgram-Transkription ist nur für vorab aufgezeichnete Audioinhalte verfügbar (kein Echtzeit-Streaming). OpenClaw lädt die vollständige Audiodatei hoch und wartet auf das vollständige Transkript, bevor es in die Konversation eingefügt wird.

Verwandte Themen

Media tools

Überblick über die Verarbeitungs-Pipeline für Audio, Bilder und Video.

Konfiguration

Vollständige Konfigurationsreferenz einschließlich Einstellungen für Media-Tools.

Fehlerbehebung

Häufige Probleme und Debugging-Schritte.

FAQ

Häufig gestellte Fragen zum OpenClaw-Setup.