X-Microsoft-OutputFormat.
| Détail | Valeur |
|---|---|
| Site web | Azure AI Speech |
| Documentation | Synthèse vocale REST Speech |
| Authentification | AZURE_SPEECH_KEY plus AZURE_SPEECH_REGION |
| Voix par défaut | en-US-JennyNeural |
| Sortie de fichier par défaut | audio-24khz-48kbitrate-mono-mp3 |
| Fichier de note vocale par défaut | ogg-24khz-16bit-mono-opus |
Prise en main
Créer une ressource Azure Speech
Dans le portail Azure, créez une ressource Speech. Copiez KEY 1 depuis
Resource Management > Keys and Endpoint, puis copiez l’emplacement de la ressource
tel que
eastus.Options de configuration
| Option | Chemin | Description |
|---|---|---|
apiKey | messages.tts.providers.azure-speech.apiKey | Clé de ressource Azure Speech. Utilise en repli AZURE_SPEECH_KEY, AZURE_SPEECH_API_KEY ou SPEECH_KEY. |
region | messages.tts.providers.azure-speech.region | Région de la ressource Azure Speech. Utilise en repli AZURE_SPEECH_REGION ou SPEECH_REGION. |
endpoint | messages.tts.providers.azure-speech.endpoint | Remplacement facultatif de l’endpoint/de l’URL de base Azure Speech. |
baseUrl | messages.tts.providers.azure-speech.baseUrl | Remplacement facultatif de l’URL de base Azure Speech. |
voice | messages.tts.providers.azure-speech.voice | ShortName de la voix Azure (par défaut en-US-JennyNeural). |
lang | messages.tts.providers.azure-speech.lang | Code de langue SSML (par défaut en-US). |
outputFormat | messages.tts.providers.azure-speech.outputFormat | Format de sortie du fichier audio (par défaut audio-24khz-48kbitrate-mono-mp3). |
voiceNoteOutputFormat | messages.tts.providers.azure-speech.voiceNoteOutputFormat | Format de sortie des notes vocales (par défaut ogg-24khz-16bit-mono-opus). |
Remarques
Authentification
Authentification
Azure Speech utilise une clé de ressource Speech, et non une clé Azure OpenAI. La clé
est envoyée comme
Ocp-Apim-Subscription-Key ; OpenClaw dérive
https://<region>.tts.speech.microsoft.com à partir de region, sauf si vous
fournissez endpoint ou baseUrl.Noms des voix
Noms des voix
Utilisez la valeur
ShortName de la voix Azure Speech, par exemple
en-US-JennyNeural. Le fournisseur intégré peut lister les voix via la
même ressource Speech et filtre les voix marquées comme obsolètes ou retirées.Sorties audio
Sorties audio
Azure accepte des formats de sortie tels que
audio-24khz-48kbitrate-mono-mp3,
ogg-24khz-16bit-mono-opus et riff-24khz-16bit-mono-pcm. OpenClaw
demande Ogg/Opus pour les cibles voice-note afin que les canaux puissent envoyer des
bulles vocales natives sans conversion supplémentaire en MP3.Alias
Alias
azure est accepté comme alias de fournisseur pour les PR existantes et la configuration utilisateur,
mais les nouvelles configurations doivent utiliser azure-speech pour éviter toute confusion avec les
fournisseurs de modèles Azure OpenAI.Liens associés
Synthèse vocale
Vue d’ensemble de la TTS, fournisseurs et configuration
messages.tts.Configuration
Référence complète de configuration, y compris les paramètres
messages.tts.Fournisseurs
Tous les fournisseurs OpenClaw intégrés.
Dépannage
Problèmes courants et étapes de débogage.