Providers

Voz de Azure

Azure Speech es un proveedor integrado de texto a voz de Azure AI Speech. OpenClaw llama directamente a la API REST de Azure Speech con SSML y sintetiza MP3 para respuestas estándar, Ogg/Opus nativo para notas de voz y mulaw de 8 kHz para canales de telefonía como Voice Call. La solicitud envía el formato de salida propiedad del proveedor mediante el encabezado X-Microsoft-OutputFormat.

Detalle	Valor
ID del proveedor	`azure-speech` (alias: `azure`)
Sitio web	Azure AI Speech
Documentación	Texto a voz mediante la API REST de Speech
Autenticación	`AZURE_SPEECH_KEY` más `AZURE_SPEECH_REGION`
Voz predeterminada	`en-US-JennyNeural`
Archivo de salida predeterminado	`audio-24khz-48kbitrate-mono-mp3`
Archivo de nota de voz predeterminado	`ogg-24khz-16bit-mono-opus`

Primeros pasos

Crear un recurso de Azure Speech

En el portal de Azure, cree un recurso de Speech. Copie KEY 1 de Resource Management > Keys and Endpoint y copie la ubicación del recurso, como eastus.

Code

AZURE_SPEECH_KEY=<speech-resource-key>AZURE_SPEECH_REGION=eastus

Seleccionar Azure Speech en tts

json5

{  tts: {    auto: "always",    provider: "azure-speech",    providers: {      "azure-speech": {        voice: "en-US-JennyNeural",        lang: "en-US",      },    },  },}

Enviar un mensaje

Envíe una respuesta mediante cualquier canal conectado. OpenClaw sintetiza el audio con Azure Speech y entrega MP3 para audio estándar u Ogg/Opus cuando el canal espera una nota de voz.

Opciones de configuración

Todas las opciones se encuentran en tts.providers["azure-speech"].

Opción	Descripción
`apiKey`	Clave del recurso de Azure Speech. Utiliza como alternativa `AZURE_SPEECH_KEY`, `AZURE_SPEECH_API_KEY` o `SPEECH_KEY`.
`region`	Región del recurso de Azure Speech. Utiliza como alternativa `AZURE_SPEECH_REGION` o `SPEECH_REGION`.
`endpoint`	Sustitución opcional del punto de conexión de Azure Speech. Utiliza como alternativa el valor de confianza `AZURE_SPEECH_ENDPOINT`.
`baseUrl`	Sustitución opcional de la URL base de Azure Speech.
`voice`	ShortName de la voz de Azure (valor predeterminado: `en-US-JennyNeural`). Alias heredado: `voiceId`.
`lang`	Código de idioma SSML (valor predeterminado: `en-US`).
`outputFormat`	Formato de salida del archivo de audio (valor predeterminado: `audio-24khz-48kbitrate-mono-mp3`).
`voiceNoteOutputFormat`	Formato de salida de la nota de voz (valor predeterminado: `ogg-24khz-16bit-mono-opus`).
`timeoutMs`	Sustitución del tiempo de espera de la solicitud en milisegundos. Utiliza como alternativa el valor global `tts.timeoutMs`.

El proveedor se considera configurado cuando se establece apiKey junto con uno de region, endpoint o baseUrl. Las variables de entorno solo se comprueban como alternativa para las claves de configuración que no se hayan establecido. Los archivos .env del espacio de trabajo no pueden establecer AZURE_SPEECH_ENDPOINT; use el entorno del proceso, el archivo dotenv global del entorno de ejecución o una configuración explícita para el enrutamiento de puntos de conexión.

Notas

Autenticación

Azure Speech utiliza una clave de recurso de Speech, no una clave de Azure OpenAI. La clave se envía como Ocp-Apim-Subscription-Key; OpenClaw deriva https://<region>.tts.speech.microsoft.com de region, a menos que se proporcione endpoint o baseUrl.

Nombres de voz

Use el valor ShortName de la voz de Azure Speech, por ejemplo, en-US-JennyNeural. El proveedor integrado puede enumerar las voces mediante el mismo recurso de Speech y excluye las voces marcadas como obsoletas, retiradas o deshabilitadas.

Salidas de audio

Azure acepta formatos de salida como audio-24khz-48kbitrate-mono-mp3, ogg-24khz-16bit-mono-opus y riff-24khz-16bit-mono-pcm. OpenClaw solicita Ogg/Opus para los destinos voice-note, de modo que los canales puedan enviar burbujas de voz nativas sin una conversión adicional a MP3, y fuerza raw-8khz-8bit-mono-mulaw para los destinos de telefonía.

Alias

azure se acepta como alias de proveedor para la configuración existente, pero la configuración nueva debe usar azure-speech para evitar confusiones con los proveedores de modelos de Azure OpenAI.