メインコンテンツへスキップ

Deepgram(音声文字起こし)

Deepgram は speech-to-text API です。OpenClaw では、tools.media.audio を通じた受信 audio/voice note の文字起こしに使用されます。 有効にすると、OpenClaw は音声ファイルを Deepgram にアップロードし、文字起こし結果を reply pipeline({{Transcript}} + [Audio] ブロック)に注入します。これはストリーミングではなく、事前録音文字起こしエンドポイントを使用します。
DetailValue
Websitedeepgram.com
Docsdevelopers.deepgram.com
AuthDEEPGRAM_API_KEY
Default modelnova-3

はじめに

1

Set your API key

Deepgram API キーを環境変数に追加します:
DEEPGRAM_API_KEY=dg_...
2

Enable the audio provider

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

Send a voice note

接続済みチャネルのいずれかを通じて音声メッセージを送信します。OpenClaw はそれを Deepgram で文字起こしし、その transcript を reply pipeline に注入します。

設定オプション

OptionPathDescription
modeltools.media.audio.models[].modelDeepgram model ID(デフォルト: nova-3
languagetools.media.audio.models[].language言語ヒント(任意)
detect_languagetools.media.audio.providerOptions.deepgram.detect_language言語検出を有効にする(任意)
punctuatetools.media.audio.providerOptions.deepgram.punctuate句読点を有効にする(任意)
smart_formattools.media.audio.providerOptions.deepgram.smart_formatスマートフォーマットを有効にする(任意)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

注意事項

認証は標準の provider 認証順序に従います。最も簡単な方法は DEEPGRAM_API_KEY です。
プロキシを使用する場合は、tools.media.audio.baseUrltools.media.audio.headers でエンドポイントまたはヘッダーを上書きできます。
出力は、他の provider と同じ audio ルール(サイズ上限、タイムアウト、 transcript 注入)に従います。
Deepgram の文字起こしは事前録音のみです(リアルタイムストリーミングではありません)。OpenClaw は完全な音声ファイルをアップロードし、全文の transcript を待ってから会話に注入します。

関連

Media tools

audio、image、video 処理パイプラインの概要。

Configuration

media tool 設定を含む完全な設定リファレンス。

Troubleshooting

よくある問題とデバッグ手順。

FAQ

OpenClaw セットアップに関するよくある質問。