Providers

Azure-spraak

Azure Speech is een meegeleverde Azure AI Speech-provider voor tekst-naar-spraak. OpenClaw roept de Azure Speech REST API rechtstreeks aan met SSML en synthetiseert MP3 voor standaardantwoorden, native Ogg/Opus voor spraakberichten en 8 kHz mulaw voor telefoniekanalen zoals Voice Call. De aanvraag stuurt de uitvoerindeling van de provider via de header X-Microsoft-OutputFormat.

Detail	Waarde
Provider-ID	`azure-speech` (alias: `azure`)
Website	Azure AI Speech
Documentatie	Speech REST tekst-naar-spraak
Authenticatie	`AZURE_SPEECH_KEY` plus `AZURE_SPEECH_REGION`
Standaardstem	`en-US-JennyNeural`
Standaardbestandsuitvoer	`audio-24khz-48kbitrate-mono-mp3`
Standaardbestand voor spraakberichten	`ogg-24khz-16bit-mono-opus`

Aan de slag

Een Azure Speech-resource maken

Maak in de Azure-portal een Speech-resource. Kopieer KEY 1 uit Resource Management > Keys and Endpoint en kopieer de resourcelocatie, zoals eastus.

Code

AZURE_SPEECH_KEY=<speech-resource-key>AZURE_SPEECH_REGION=eastus

Azure Speech selecteren in tts

json5

{  tts: {    auto: "always",    provider: "azure-speech",    providers: {      "azure-speech": {        voice: "en-US-JennyNeural",        lang: "en-US",      },    },  },}

Een bericht verzenden

Stuur een antwoord via een verbonden kanaal. OpenClaw synthetiseert de audio met Azure Speech en levert MP3 voor standaardaudio, of Ogg/Opus wanneer het kanaal een spraakbericht verwacht.

Configuratieopties

Alle opties bevinden zich onder tts.providers["azure-speech"].

Optie	Beschrijving
`apiKey`	Resourcesleutel voor Azure Speech. Valt terug op `AZURE_SPEECH_KEY`, `AZURE_SPEECH_API_KEY` of `SPEECH_KEY`.
`region`	Resourceregio voor Azure Speech. Valt terug op `AZURE_SPEECH_REGION` of `SPEECH_REGION`.
`endpoint`	Optionele overschrijving van het Azure Speech-eindpunt. Valt terug op vertrouwde `AZURE_SPEECH_ENDPOINT`.
`baseUrl`	Optionele overschrijving van de basis-URL voor Azure Speech.
`voice`	ShortName van de Azure-stem (standaard `en-US-JennyNeural`). Verouderde alias: `voiceId`.
`lang`	SSML-taalcode (standaard `en-US`).
`outputFormat`	Uitvoerindeling van audiobestanden (standaard `audio-24khz-48kbitrate-mono-mp3`).
`voiceNoteOutputFormat`	Uitvoerindeling voor spraakberichten (standaard `ogg-24khz-16bit-mono-opus`).
`timeoutMs`	Overschrijving van de time-out voor aanvragen in milliseconden. Valt terug op de globale `tts.timeoutMs`.

De provider wordt als geconfigureerd beschouwd zodra apiKey is ingesteld, samen met een van region, endpoint of baseUrl. Omgevingsvariabelen worden alleen als terugvaloptie gecontroleerd voor niet-ingestelde configuratiesleutels. .env-bestanden van de werkruimte kunnen AZURE_SPEECH_ENDPOINT niet instellen; gebruik de procesomgeving, het globale runtime-dotenv-bestand of expliciete configuratie voor eindpuntroutering.

Opmerkingen

Authenticatie

Azure Speech gebruikt een Speech-resourcesleutel, geen Azure OpenAI-sleutel. De sleutel wordt verzonden als Ocp-Apim-Subscription-Key; OpenClaw leidt https://<region>.tts.speech.microsoft.com af van region, tenzij je endpoint of baseUrl opgeeft.

Stemnamen

Gebruik de waarde ShortName van de Azure Speech-stem, bijvoorbeeld en-US-JennyNeural. De meegeleverde provider kan via dezelfde Speech-resource stemmen weergeven en filtert stemmen uit die zijn gemarkeerd als verouderd, ingetrokken of uitgeschakeld.

Audio-uitvoer

Azure accepteert uitvoerindelingen zoals audio-24khz-48kbitrate-mono-mp3, ogg-24khz-16bit-mono-opus en riff-24khz-16bit-mono-pcm. OpenClaw vraagt Ogg/Opus aan voor voice-note-doelen, zodat kanalen native spraakballonnen kunnen verzenden zonder extra MP3-conversie, en dwingt raw-8khz-8bit-mono-mulaw af voor telefoniedoelen.

Alias

azure wordt geaccepteerd als provideralias voor bestaande configuratie, maar nieuwe configuratie moet azure-speech gebruiken om verwarring met Azure OpenAI- modelproviders te voorkomen.