Deepgram (transcripción de audio)
Deepgram es una API de speech-to-text. En OpenClaw se usa para la transcripción de audio/notas de voz entrantes mediantetools.media.audio.
Cuando está habilitado, OpenClaw carga el archivo de audio en Deepgram e inyecta la transcripción
en la canalización de respuesta ({{Transcript}} + bloque [Audio]). Esto no es streaming;
usa el endpoint de transcripción de audio pregrabado.
Sitio web: https://deepgram.comDocumentación: https://developers.deepgram.com
Inicio rápido
- Configura tu clave de API:
- Habilita el proveedor:
Opciones
model: id del modelo de Deepgram (predeterminado:nova-3)language: pista de idioma (opcional)tools.media.audio.providerOptions.deepgram.detect_language: habilita la detección de idioma (opcional)tools.media.audio.providerOptions.deepgram.punctuate: habilita la puntuación (opcional)tools.media.audio.providerOptions.deepgram.smart_format: habilita el formato inteligente (opcional)
Notas
- La autenticación sigue el orden estándar de autenticación del proveedor;
DEEPGRAM_API_KEYes la ruta más simple. - Anula endpoints o cabeceras con
tools.media.audio.baseUrlytools.media.audio.headerscuando uses un proxy. - La salida sigue las mismas reglas de audio que otros proveedores (límites de tamaño, tiempos de espera, inyección de transcripción).