Providers

Deepgram

Deepgram — это API преобразования речи в текст. В OpenClaw он используется для транскрибации входящих аудио/голосовых заметок через tools.media.audio и для потокового STT голосовых вызовов через plugins.entries.voice-call.config.streaming.

Для пакетной транскрибации OpenClaw загружает полный аудиофайл в Deepgram и внедряет транскрипт в конвейер ответа (блок {{Transcript}} + [Audio]). Для потоковой передачи голосового вызова OpenClaw пересылает live-кадры G.711 u-law через WebSocket-эндпоинт Deepgram listen и выдает частичные или финальные транскрипты по мере их возврата Deepgram.

Сведения	Значение
Сайт	deepgram.com
Документация	developers.deepgram.com
Аутентификация	`DEEPGRAM_API_KEY`
Модель по умолчанию	`nova-3`

Начало работы

Задайте ключ API

Добавьте ключ API Deepgram в окружение:

Code

DEEPGRAM_API_KEY=dg_...

Включите аудиопровайдера

json5

{  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

Отправьте голосовую заметку

Отправьте аудиосообщение через любой подключенный канал. OpenClaw транскрибирует его через Deepgram и внедрит транскрипт в конвейер ответа.

Параметры конфигурации

Параметр	Путь	Описание
`model`	`tools.media.audio.models[].model`	Идентификатор модели Deepgram (по умолчанию: `nova-3`)
`language`	`tools.media.audio.models[].language`	Подсказка языка (необязательно)
`detect_language`	`tools.media.audio.providerOptions.deepgram.detect_language`	Включить определение языка (необязательно)
`punctuate`	`tools.media.audio.providerOptions.deepgram.punctuate`	Включить пунктуацию (необязательно)
`smart_format`	`tools.media.audio.providerOptions.deepgram.smart_format`	Включить интеллектуальное форматирование (необязательно)

С подсказкой языка

json5

{  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],      },    },  },}

С параметрами Deepgram

json5

{  tools: {    media: {      audio: {        enabled: true,        providerOptions: {          deepgram: {            detect_language: true,            punctuate: true,            smart_format: true,          },        },        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

Потоковое STT для Voice Call

Встроенный Plugin deepgram также регистрирует поставщика транскрибации в реальном времени для Plugin Voice Call.

Настройка	Путь конфигурации	По умолчанию
Ключ API	`plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey`	Использует `DEEPGRAM_API_KEY`
Модель	`...deepgram.model`	`nova-3`
Язык	`...deepgram.language`	(не задано)
Кодирование	`...deepgram.encoding`	`mulaw`
Частота дискретизации	`...deepgram.sampleRate`	`8000`
Endpointing	`...deepgram.endpointingMs`	`800`
Промежуточные результаты	`...deepgram.interimResults`	`true`

json5

{  plugins: {    entries: {      "voice-call": {        config: {          streaming: {            enabled: true,            provider: "deepgram",            providers: {              deepgram: {                apiKey: "${DEEPGRAM_API_KEY}",                model: "nova-3",                endpointingMs: 800,                language: "en-US",              },            },          },        },      },    },  },}

Примечания

Аутентификация

Аутентификация следует стандартному порядку авторизации поставщиков. DEEPGRAM_API_KEY — самый простой путь.

Прокси и пользовательские конечные точки

Переопределяйте конечные точки или заголовки с помощью tools.media.audio.baseUrl и tools.media.audio.headers при использовании прокси.

Поведение вывода

Вывод следует тем же правилам для аудио, что и у других поставщиков (ограничения размера, тайм-ауты, внедрение транскрипта).

Связанные материалы

Медиаинструменты

Обзор конвейера обработки аудио, изображений и видео.

Конфигурация

Полный справочник конфигурации, включая настройки медиаинструментов.

Устранение неполадок

Распространенные проблемы и шаги отладки.

Часто задаваемые вопросы

Часто задаваемые вопросы о настройке OpenClaw.

Was this useful?

Deepgram

Начало работы

Задайте ключ API

Включите аудиопровайдера

Отправьте голосовую заметку

Параметры конфигурации

С подсказкой языка

С параметрами Deepgram

Потоковое STT для Voice Call

Примечания

Связанные материалы

On this page

Molty