Deepgram is een speech-to-text-API. In OpenClaw wordt deze gebruikt voor inkomende audio-/spraaknotitie-transcriptie viaDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
tools.media.audio en voor streaming-STT
voor Voice Call via plugins.entries.voice-call.config.streaming.
Voor batchtranscriptie uploadt OpenClaw het volledige audiobestand naar Deepgram
en injecteert het transcript in de antwoordpipeline ({{Transcript}} +
[Audio]-blok). Voor Voice Call-streaming stuurt OpenClaw live G.711
u-law-frames door via Deepgrams WebSocket-listen-endpoint en geeft gedeeltelijke
of definitieve transcripties uit zodra Deepgram ze terugstuurt.
| Detail | Waarde |
|---|---|
| Website | deepgram.com |
| Docs | developers.deepgram.com |
| Auth | DEEPGRAM_API_KEY |
| Standaardmodel | nova-3 |
Aan de slag
Configuratieopties
| Optie | Pad | Beschrijving |
|---|---|---|
model | tools.media.audio.models[].model | Deepgram-model-id (standaard: nova-3) |
language | tools.media.audio.models[].language | Taalhint (optioneel) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | Taaldetectie inschakelen (optioneel) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | Interpunctie inschakelen (optioneel) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | Slimme opmaak inschakelen (optioneel) |
- Met taalhint
- Met Deepgram-opties
Voice Call-streaming-STT
De gebundeldedeepgram-plugin registreert ook een realtime transcriptieprovider
voor de Voice Call-plugin.
| Instelling | Configuratiepad | Standaard |
|---|---|---|
| API-sleutel | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | Valt terug op DEEPGRAM_API_KEY |
| Model | ...deepgram.model | nova-3 |
| Taal | ...deepgram.language | (niet ingesteld) |
| Codering | ...deepgram.encoding | mulaw |
| Samplefrequentie | ...deepgram.sampleRate | 8000 |
| Endpointing | ...deepgram.endpointingMs | 800 |
| Tussenresultaten | ...deepgram.interimResults | true |
Voice Call ontvangt telefonie-audio als 8 kHz G.711 u-law. De Deepgram-
streamingprovider gebruikt standaard
encoding: "mulaw" en sampleRate: 8000, zodat
Twilio-mediaframes rechtstreeks kunnen worden doorgestuurd.Opmerkingen
Authenticatie
Authenticatie
Authenticatie volgt de standaardvolgorde voor provider-authenticatie.
DEEPGRAM_API_KEY is
de eenvoudigste route.Proxy en aangepaste endpoints
Proxy en aangepaste endpoints
Overschrijf endpoints of headers met
tools.media.audio.baseUrl en
tools.media.audio.headers wanneer je een proxy gebruikt.Uitvoergedrag
Uitvoergedrag
Uitvoer volgt dezelfde audioregels als andere providers (groottelimieten, time-outs,
transcriptinjectie).
Gerelateerd
Mediatools
Overzicht van de verwerkingspipeline voor audio, afbeeldingen en video.
Configuratie
Volledige configuratiereferentie inclusief instellingen voor mediatools.
Probleemoplossing
Veelvoorkomende problemen en stappen voor foutopsporing.
FAQ
Veelgestelde vragen over het instellen van OpenClaw.