Naar hoofdinhoud gaan

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Deepgram is een speech-to-text-API. In OpenClaw wordt deze gebruikt voor inkomende audio-/spraaknotitie-transcriptie via tools.media.audio en voor streaming-STT voor Voice Call via plugins.entries.voice-call.config.streaming. Voor batchtranscriptie uploadt OpenClaw het volledige audiobestand naar Deepgram en injecteert het transcript in de antwoordpipeline ({{Transcript}} + [Audio]-blok). Voor Voice Call-streaming stuurt OpenClaw live G.711 u-law-frames door via Deepgrams WebSocket-listen-endpoint en geeft gedeeltelijke of definitieve transcripties uit zodra Deepgram ze terugstuurt.
DetailWaarde
Websitedeepgram.com
Docsdevelopers.deepgram.com
AuthDEEPGRAM_API_KEY
Standaardmodelnova-3

Aan de slag

1

Stel je API-sleutel in

Voeg je Deepgram-API-sleutel toe aan de omgeving:
DEEPGRAM_API_KEY=dg_...
2

Schakel de audioprovider in

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

Stuur een spraaknotitie

Stuur een audiobericht via een verbonden kanaal. OpenClaw transcribeert het via Deepgram en injecteert het transcript in de antwoordpipeline.

Configuratieopties

OptiePadBeschrijving
modeltools.media.audio.models[].modelDeepgram-model-id (standaard: nova-3)
languagetools.media.audio.models[].languageTaalhint (optioneel)
detect_languagetools.media.audio.providerOptions.deepgram.detect_languageTaaldetectie inschakelen (optioneel)
punctuatetools.media.audio.providerOptions.deepgram.punctuateInterpunctie inschakelen (optioneel)
smart_formattools.media.audio.providerOptions.deepgram.smart_formatSlimme opmaak inschakelen (optioneel)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

Voice Call-streaming-STT

De gebundelde deepgram-plugin registreert ook een realtime transcriptieprovider voor de Voice Call-plugin.
InstellingConfiguratiepadStandaard
API-sleutelplugins.entries.voice-call.config.streaming.providers.deepgram.apiKeyValt terug op DEEPGRAM_API_KEY
Model...deepgram.modelnova-3
Taal...deepgram.language(niet ingesteld)
Codering...deepgram.encodingmulaw
Samplefrequentie...deepgram.sampleRate8000
Endpointing...deepgram.endpointingMs800
Tussenresultaten...deepgram.interimResultstrue
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "deepgram",
            providers: {
              deepgram: {
                apiKey: "${DEEPGRAM_API_KEY}",
                model: "nova-3",
                endpointingMs: 800,
                language: "en-US",
              },
            },
          },
        },
      },
    },
  },
}
Voice Call ontvangt telefonie-audio als 8 kHz G.711 u-law. De Deepgram- streamingprovider gebruikt standaard encoding: "mulaw" en sampleRate: 8000, zodat Twilio-mediaframes rechtstreeks kunnen worden doorgestuurd.

Opmerkingen

Authenticatie volgt de standaardvolgorde voor provider-authenticatie. DEEPGRAM_API_KEY is de eenvoudigste route.
Overschrijf endpoints of headers met tools.media.audio.baseUrl en tools.media.audio.headers wanneer je een proxy gebruikt.
Uitvoer volgt dezelfde audioregels als andere providers (groottelimieten, time-outs, transcriptinjectie).

Gerelateerd

Mediatools

Overzicht van de verwerkingspipeline voor audio, afbeeldingen en video.

Configuratie

Volledige configuratiereferentie inclusief instellingen voor mediatools.

Probleemoplossing

Veelvoorkomende problemen en stappen voor foutopsporing.

FAQ

Veelgestelde vragen over het instellen van OpenClaw.