Naar hoofdinhoud gaan

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Azure Speech is een Azure AI Speech-provider voor tekst-naar-spraak. In OpenClaw synthetiseert het standaard uitgaande antwoordaudio als MP3, native Ogg/Opus voor spraaknotities, en 8 kHz mulaw-audio voor telefoniekanalen zoals Voice Call. OpenClaw gebruikt de Azure Speech REST API rechtstreeks met SSML en verzendt de uitvoerindeling die eigendom is van de provider via X-Microsoft-OutputFormat.
DetailWaarde
WebsiteAzure AI Speech
DocsSpeech REST tekst-naar-spraak
AuthAZURE_SPEECH_KEY plus AZURE_SPEECH_REGION
Default voiceen-US-JennyNeural
Default file outputaudio-24khz-48kbitrate-mono-mp3
Default voice-note fileogg-24khz-16bit-mono-opus

Aan de slag

1

Create an Azure Speech resource

Maak in de Azure-portal een Speech-resource. Kopieer KEY 1 uit Resource Management > Keys and Endpoint, en kopieer de resourcelocatie, zoals eastus.
AZURE_SPEECH_KEY=<speech-resource-key>
AZURE_SPEECH_REGION=eastus
2

Select Azure Speech in messages.tts

{
  messages: {
    tts: {
      auto: "always",
      provider: "azure-speech",
      providers: {
        "azure-speech": {
          voice: "en-US-JennyNeural",
          lang: "en-US",
        },
      },
    },
  },
}
3

Send a message

Verzend een antwoord via een willekeurig verbonden kanaal. OpenClaw synthetiseert de audio met Azure Speech en levert MP3 voor standaardaudio, of Ogg/Opus wanneer het kanaal een spraaknotitie verwacht.

Configuratieopties

OptiePadBeschrijving
apiKeymessages.tts.providers.azure-speech.apiKeyAzure Speech-resourcesleutel. Valt terug op AZURE_SPEECH_KEY, AZURE_SPEECH_API_KEY of SPEECH_KEY.
regionmessages.tts.providers.azure-speech.regionAzure Speech-resourceregio. Valt terug op AZURE_SPEECH_REGION of SPEECH_REGION.
endpointmessages.tts.providers.azure-speech.endpointOptionele override voor Azure Speech-eindpunt/basis-URL.
baseUrlmessages.tts.providers.azure-speech.baseUrlOptionele override voor Azure Speech-basis-URL.
voicemessages.tts.providers.azure-speech.voiceAzure-spraakstem ShortName (standaard en-US-JennyNeural).
langmessages.tts.providers.azure-speech.langSSML-taalcode (standaard en-US).
outputFormatmessages.tts.providers.azure-speech.outputFormatUitvoerindeling voor audiobestanden (standaard audio-24khz-48kbitrate-mono-mp3).
voiceNoteOutputFormatmessages.tts.providers.azure-speech.voiceNoteOutputFormatUitvoerindeling voor spraaknotities (standaard ogg-24khz-16bit-mono-opus).

Notities

Azure Speech gebruikt een Speech-resourcesleutel, geen Azure OpenAI-sleutel. De sleutel wordt verzonden als Ocp-Apim-Subscription-Key; OpenClaw leidt https://<region>.tts.speech.microsoft.com af uit region, tenzij je endpoint of baseUrl opgeeft.
Gebruik de Azure Speech-spraakwaarde ShortName, bijvoorbeeld en-US-JennyNeural. De gebundelde provider kan stemmen weergeven via dezelfde Speech-resource en filtert stemmen die als verouderd of uitgefaseerd zijn gemarkeerd.
Azure accepteert uitvoerindelingen zoals audio-24khz-48kbitrate-mono-mp3, ogg-24khz-16bit-mono-opus en riff-24khz-16bit-mono-pcm. OpenClaw vraagt Ogg/Opus aan voor voice-note-doelen, zodat kanalen native spraakballonnen kunnen verzenden zonder extra MP3-conversie.
azure wordt geaccepteerd als provideralias voor bestaande PR’s en gebruikersconfiguratie, maar nieuwe configuratie moet azure-speech gebruiken om verwarring met Azure OpenAI-modelproviders te voorkomen.

Gerelateerd

Text-to-speech

Overzicht van TTS, providers en messages.tts-configuratie.

Configuration

Volledige configuratiereferentie inclusief messages.tts-instellingen.

Providers

Alle gebundelde OpenClaw-providers.

Troubleshooting

Veelvoorkomende problemen en foutopsporingsstappen.