Deepgram (transkrypcja audio)
Deepgram to API speech-to-text. W OpenClaw jest używane do transkrypcji przychodzącego audio/notatek głosowych przeztools.media.audio.
Po włączeniu OpenClaw przesyła plik audio do Deepgram i wstrzykuje transkrypcję
do pipeline’u odpowiedzi ({{Transcript}} + blok [Audio]). To nie jest streaming;
używany jest endpoint transkrypcji nagrań wstępnie zarejestrowanych.
Strona: https://deepgram.comDokumentacja: https://developers.deepgram.com
Szybki start
- Ustaw klucz API:
- Włącz providera:
Opcje
model: identyfikator modelu Deepgram (domyślnie:nova-3)language: wskazówka językowa (opcjonalnie)tools.media.audio.providerOptions.deepgram.detect_language: włącz wykrywanie języka (opcjonalnie)tools.media.audio.providerOptions.deepgram.punctuate: włącz interpunkcję (opcjonalnie)tools.media.audio.providerOptions.deepgram.smart_format: włącz inteligentne formatowanie (opcjonalnie)
Uwagi
- Uwierzytelnianie podąża za standardową kolejnością auth providerów;
DEEPGRAM_API_KEYto najprostsza ścieżka. - Nadpisuj endpointy lub nagłówki przez
tools.media.audio.baseUrlitools.media.audio.headers, gdy używasz proxy. - Wynik podlega tym samym regułom audio co u innych providerów (limity rozmiaru, timeouty, wstrzykiwanie transkryptu).