Providers

Deepgram

Deepgram — это API преобразования речи в текст. В OpenClaw он используется для транскрибации входящих аудио/голосовых заметок через tools.media.audio и для потокового STT голосовых вызовов через plugins.entries.voice-call.config.streaming.

Для пакетной транскрибации OpenClaw загружает полный аудиофайл в Deepgram и внедряет транскрипт в конвейер ответа (блок {{Transcript}} + [Audio]). Для потоковой передачи голосового вызова OpenClaw пересылает live-кадры G.711 u-law через WebSocket-эндпоинт Deepgram listen и выдает частичные или финальные транскрипты по мере их возврата Deepgram.

Сведения Значение
Сайт deepgram.com
Документация developers.deepgram.com
Аутентификация DEEPGRAM_API_KEY
Модель по умолчанию nova-3

Начало работы

  • Задайте ключ API

    Добавьте ключ API Deepgram в окружение:

    Code
    DEEPGRAM_API_KEY=dg_...
  • Включите аудиопровайдера

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}
  • Отправьте голосовую заметку

    Отправьте аудиосообщение через любой подключенный канал. OpenClaw транскрибирует его через Deepgram и внедрит транскрипт в конвейер ответа.

  • Параметры конфигурации

    Параметр Путь Описание
    model tools.media.audio.models[].model Идентификатор модели Deepgram (по умолчанию: nova-3)
    language tools.media.audio.models[].language Подсказка языка (необязательно)
    detect_language tools.media.audio.providerOptions.deepgram.detect_language Включить определение языка (необязательно)
    punctuate tools.media.audio.providerOptions.deepgram.punctuate Включить пунктуацию (необязательно)
    smart_format tools.media.audio.providerOptions.deepgram.smart_format Включить интеллектуальное форматирование (необязательно)

    С подсказкой языка

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],      },    },  },}

    С параметрами Deepgram

    json5
    {  tools: {    media: {      audio: {        enabled: true,        providerOptions: {          deepgram: {            detect_language: true,            punctuate: true,            smart_format: true,          },        },        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

    Потоковое STT для Voice Call

    Встроенный Plugin deepgram также регистрирует поставщика транскрибации в реальном времени для Plugin Voice Call.

    Настройка Путь конфигурации По умолчанию
    Ключ API plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey Использует DEEPGRAM_API_KEY
    Модель ...deepgram.model nova-3
    Язык ...deepgram.language (не задано)
    Кодирование ...deepgram.encoding mulaw
    Частота дискретизации ...deepgram.sampleRate 8000
    Endpointing ...deepgram.endpointingMs 800
    Промежуточные результаты ...deepgram.interimResults true
    json5
    {  plugins: {    entries: {      "voice-call": {        config: {          streaming: {            enabled: true,            provider: "deepgram",            providers: {              deepgram: {                apiKey: "${DEEPGRAM_API_KEY}",                model: "nova-3",                endpointingMs: 800,                language: "en-US",              },            },          },        },      },    },  },}

    Примечания

    Аутентификация

    Аутентификация следует стандартному порядку авторизации поставщиков. DEEPGRAM_API_KEY — самый простой путь.

    Прокси и пользовательские конечные точки

    Переопределяйте конечные точки или заголовки с помощью tools.media.audio.baseUrl и tools.media.audio.headers при использовании прокси.

    Поведение вывода

    Вывод следует тем же правилам для аудио, что и у других поставщиков (ограничения размера, тайм-ауты, внедрение транскрипта).

    Связанные материалы

    Was this useful?
    On this page

    On this page