Saltar al contenido principal

Deepgram (transcripción de audio)

Deepgram es una API de speech-to-text. En OpenClaw se usa para la transcripción de audio/notas de voz entrantes mediante tools.media.audio. Cuando está habilitado, OpenClaw carga el archivo de audio en Deepgram e inyecta la transcripción en la canalización de respuesta ({{Transcript}} + bloque [Audio]). Esto no es streaming; usa el endpoint de transcripción de audio pregrabado. Sitio web: https://deepgram.com
Documentación: https://developers.deepgram.com

Inicio rápido

  1. Configura tu clave de API:
DEEPGRAM_API_KEY=dg_...
  1. Habilita el proveedor:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

Opciones

  • model: id del modelo de Deepgram (predeterminado: nova-3)
  • language: pista de idioma (opcional)
  • tools.media.audio.providerOptions.deepgram.detect_language: habilita la detección de idioma (opcional)
  • tools.media.audio.providerOptions.deepgram.punctuate: habilita la puntuación (opcional)
  • tools.media.audio.providerOptions.deepgram.smart_format: habilita el formato inteligente (opcional)
Ejemplo con idioma:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}
Ejemplo con opciones de Deepgram:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        providerOptions: {
          deepgram: {
            detect_language: true,
            punctuate: true,
            smart_format: true,
          },
        },
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

Notas

  • La autenticación sigue el orden estándar de autenticación del proveedor; DEEPGRAM_API_KEY es la ruta más simple.
  • Anula endpoints o cabeceras con tools.media.audio.baseUrl y tools.media.audio.headers cuando uses un proxy.
  • La salida sigue las mismas reglas de audio que otros proveedores (límites de tamaño, tiempos de espera, inyección de transcripción).