Deepgram(音声文字起こし)
Deepgramはspeech-to-text APIです。OpenClawでは、tools.media.audio 経由の受信音声/ボイスメモの文字起こしに使用されます。
有効にすると、OpenClawは音声ファイルをDeepgramへアップロードし、その文字起こし結果を
返信パイプラインに注入します({{Transcript}} + [Audio] ブロック)。これはストリーミングではなく、
録音済み音声向けの文字起こしエンドポイントを使用します。
Website: https://deepgram.comDocs: https://developers.deepgram.com
クイックスタート
- API keyを設定します:
- providerを有効にします:
オプション
model: Deepgram model id(デフォルト:nova-3)language: 言語ヒント(任意)tools.media.audio.providerOptions.deepgram.detect_language: 言語検出を有効にする(任意)tools.media.audio.providerOptions.deepgram.punctuate: 句読点を有効にする(任意)tools.media.audio.providerOptions.deepgram.smart_format: スマート整形を有効にする(任意)
注意
- 認証は標準のprovider auth順序に従います。最も簡単なのは
DEEPGRAM_API_KEYです。 - proxyを使用する場合は、
tools.media.audio.baseUrlとtools.media.audio.headersでendpointまたはheadersを上書きできます。 - 出力は他のproviderと同じ音声ルールに従います(サイズ上限、タイムアウト、文字起こしの注入)。