Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Deepgram es una API de conversión de voz a texto. En OpenClaw se usa para la transcripción de audio/notas de voz entrantes mediante tools.media.audio y para la STT en tiempo real de Voice Call mediante plugins.entries.voice-call.config.streaming. Para la transcripción por lotes, OpenClaw sube el archivo de audio completo a Deepgram e inyecta la transcripción en el flujo de respuesta ({{Transcript}} + bloque [Audio]). Para la STT en tiempo real de Voice Call, OpenClaw reenvía tramas G.711 u-law en vivo a través del endpoint WebSocket listen de Deepgram y emite transcripciones parciales o finales a medida que Deepgram las devuelve.
DetalleValor
Sitio webdeepgram.com
Documentacióndevelopers.deepgram.com
AutenticaciónDEEPGRAM_API_KEY
Modelo predeterminadonova-3

Primeros pasos

1

Configura tu clave de API

Añade tu clave de API de Deepgram al entorno:
DEEPGRAM_API_KEY=dg_...
2

Habilita el proveedor de audio

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

Envía una nota de voz

Envía un mensaje de audio a través de cualquier canal conectado. OpenClaw lo transcribe mediante Deepgram e inyecta la transcripción en el flujo de respuesta.

Opciones de configuración

OpciónRutaDescripción
modeltools.media.audio.models[].modelID del modelo de Deepgram (predeterminado: nova-3)
languagetools.media.audio.models[].languageIndicación de idioma (opcional)
detect_languagetools.media.audio.providerOptions.deepgram.detect_languageHabilita la detección de idioma (opcional)
punctuatetools.media.audio.providerOptions.deepgram.punctuateHabilita la puntuación (opcional)
smart_formattools.media.audio.providerOptions.deepgram.smart_formatHabilita el formateo inteligente (opcional)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

STT en tiempo real de Voice Call

El Plugin deepgram incluido también registra un proveedor de transcripción en tiempo real para el Plugin Voice Call.
ConfiguraciónRuta de configuraciónPredeterminado
Clave de APIplugins.entries.voice-call.config.streaming.providers.deepgram.apiKeyUsa DEEPGRAM_API_KEY como respaldo
Modelo...deepgram.modelnova-3
Idioma...deepgram.language(sin configurar)
Codificación...deepgram.encodingmulaw
Frecuencia de muestreo...deepgram.sampleRate8000
Detección de fin de enunciado...deepgram.endpointingMs800
Resultados provisionales...deepgram.interimResultstrue
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "deepgram",
            providers: {
              deepgram: {
                apiKey: "${DEEPGRAM_API_KEY}",
                model: "nova-3",
                endpointingMs: 800,
                language: "en-US",
              },
            },
          },
        },
      },
    },
  },
}
Voice Call recibe audio de telefonía como G.711 u-law a 8 kHz. El proveedor de Deepgram para tiempo real usa por defecto encoding: "mulaw" y sampleRate: 8000, por lo que las tramas multimedia de Twilio pueden reenviarse directamente.

Notas

La autenticación sigue el orden estándar de autenticación de proveedores. DEEPGRAM_API_KEY es la ruta más sencilla.
Sustituye los endpoints o encabezados con tools.media.audio.baseUrl y tools.media.audio.headers cuando uses un proxy.
La salida sigue las mismas reglas de audio que otros proveedores (límites de tamaño, tiempos de espera, inyección de transcripción).

Relacionado

Herramientas multimedia

Descripción general del flujo de procesamiento de audio, imágenes y video.

Configuración

Referencia completa de configuración, incluida la de las herramientas multimedia.

Resolución de problemas

Problemas comunes y pasos de depuración.

Preguntas frecuentes

Preguntas frecuentes sobre la configuración de OpenClaw.