Deepgram (Audio-Transkription)
Deepgram ist eine Speech-to-Text-API. In OpenClaw wird sie für die Transkription eingehender Audio-/Sprachnachrichten übertools.media.audio verwendet.
Wenn aktiviert, lädt OpenClaw die Audiodatei zu Deepgram hoch und injiziert das Transkript in die Antwort-Pipeline ({{Transcript}} + [Audio]-Block). Dies ist kein Streaming;
es verwendet den Endpunkt für voraufgezeichnete Transkription.
Website: https://deepgram.comDokumentation: https://developers.deepgram.com
Schnellstart
- Legen Sie Ihren API-Schlüssel fest:
- Aktivieren Sie den Provider:
Optionen
model: Deepgram-Modell-ID (Standard:nova-3)language: Sprachhinweis (optional)tools.media.audio.providerOptions.deepgram.detect_language: Spracherkennung aktivieren (optional)tools.media.audio.providerOptions.deepgram.punctuate: Zeichensetzung aktivieren (optional)tools.media.audio.providerOptions.deepgram.smart_format: intelligente Formatierung aktivieren (optional)
Hinweise
- Die Authentifizierung folgt der Standardreihenfolge für Provider-Authentifizierung;
DEEPGRAM_API_KEYist der einfachste Weg. - Überschreiben Sie Endpunkte oder Header mit
tools.media.audio.baseUrlundtools.media.audio.headers, wenn Sie einen Proxy verwenden. - Die Ausgabe folgt denselben Audioregeln wie bei anderen Providern (Größenbeschränkungen, Timeouts, Transkript-Injektion).