Deepgram (транскрибування аудіо)
Deepgram — це API для speech-to-text. В OpenClaw він використовується для транскрибування вхідного аудіо/голосових повідомлень черезtools.media.audio.
Коли його ввімкнено, OpenClaw вивантажує аудіофайл до Deepgram і вставляє транскрипт
у конвеєр відповіді ({{Transcript}} + блок [Audio]). Це не потоковий режим;
використовується кінцева точка транскрибування попередньо записаного аудіо.
Вебсайт: https://deepgram.comДокументація: https://developers.deepgram.com
Швидкий старт
- Встановіть свій API key:
- Увімкніть провайдера:
Параметри
model: ідентифікатор моделі Deepgram (типово:nova-3)language: підказка мови (необов’язково)tools.media.audio.providerOptions.deepgram.detect_language: увімкнути визначення мови (необов’язково)tools.media.audio.providerOptions.deepgram.punctuate: увімкнути пунктуацію (необов’язково)tools.media.audio.providerOptions.deepgram.smart_format: увімкнути smart formatting (необов’язково)
Примітки
- Автентифікація виконується за стандартним порядком автентифікації провайдерів;
DEEPGRAM_API_KEY— найпростіший варіант. - Перевизначайте кінцеві точки або заголовки через
tools.media.audio.baseUrlіtools.media.audio.headers, якщо використовуєте проксі. - Вивід дотримується тих самих правил для аудіо, що й інші провайдери (обмеження розміру, тайм-аути, вставлення транскрипту).