Deepgram は speech-to-text API です。OpenClaw では、Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
tools.media.audio を通じた受信音声/ボイスノートの文字起こし、および
plugins.entries.voice-call.config.streaming を通じた Voice Call のストリーミング STT に使用されます。
バッチ文字起こしでは、OpenClaw は完全な音声ファイルを Deepgram にアップロードし、
文字起こし結果を返信パイプラインに注入します({{Transcript}} +
[Audio] block)。Voice Call のストリーミングでは、OpenClaw は live な G.711
u-law frame を Deepgram の WebSocket listen endpoint へ転送し、Deepgram が返す partial または
final transcript を発行します。
| Detail | Value |
|---|---|
| Website | deepgram.com |
| Docs | developers.deepgram.com |
| Auth | DEEPGRAM_API_KEY |
| Default model | nova-3 |
はじめに
設定オプション
| Option | Path | Description |
|---|---|---|
model | tools.media.audio.models[].model | Deepgram model id(デフォルト: nova-3) |
language | tools.media.audio.models[].language | 言語ヒント(任意) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | 言語検出を有効化(任意) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | 句読点付与を有効化(任意) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | スマート整形を有効化(任意) |
- 言語ヒントあり
- Deepgram オプションあり
Voice Call ストリーミング STT
バンドル済みのdeepgram Plugin は、Voice Call Plugin 向けの realtime transcription provider も登録します。
| Setting | Config path | Default |
|---|---|---|
| API key | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | DEEPGRAM_API_KEY にフォールバック |
| Model | ...deepgram.model | nova-3 |
| Language | ...deepgram.language | (未設定) |
| Encoding | ...deepgram.encoding | mulaw |
| Sample rate | ...deepgram.sampleRate | 8000 |
| Endpointing | ...deepgram.endpointingMs | 800 |
| Interim results | ...deepgram.interimResults | true |
Voice Call は、8 kHz G.711 u-law の電話音声を受信します。Deepgram
streaming provider のデフォルトは
encoding: "mulaw" と sampleRate: 8000 なので、
Twilio の media frame をそのまま直接転送できます。注意
認証
認証
認証は標準の provider auth 順序に従います。最も簡単なのは
DEEPGRAM_API_KEY を使う方法です。Proxy とカスタム endpoint
Proxy とカスタム endpoint
proxy を使用する場合は、
tools.media.audio.baseUrl と
tools.media.audio.headers で endpoint または header を上書きします。出力動作
出力動作
出力は他の provider と同じ音声ルールに従います(size cap、timeout、
transcript injection)。
関連
Media tools
音声、画像、および動画処理パイプラインの概要。
Configuration
media tool 設定を含む完全な設定リファレンス。
Troubleshooting
一般的な問題とデバッグ手順。
FAQ
OpenClaw セットアップに関するよくある質問。