Langsung ke konten utama
Azure Speech adalah provider text-to-speech Azure AI Speech. Di OpenClaw, provider ini mensintesis audio balasan keluar sebagai MP3 secara default, Ogg/Opus native untuk voice note, dan audio mulaw 8 kHz untuk saluran telepon seperti Voice Call. OpenClaw menggunakan REST API Azure Speech secara langsung dengan SSML dan mengirim format output milik provider melalui X-Microsoft-OutputFormat.
DetailNilai
Situs webAzure AI Speech
DokumenSpeech REST text-to-speech
AuthAZURE_SPEECH_KEY plus AZURE_SPEECH_REGION
Voice defaulten-US-JennyNeural
Output file defaultaudio-24khz-48kbitrate-mono-mp3
File voice-note defaultogg-24khz-16bit-mono-opus

Memulai

1

Buat resource Azure Speech

Di portal Azure, buat resource Speech. Salin KEY 1 dari Resource Management > Keys and Endpoint, dan salin lokasi resource seperti eastus.
AZURE_SPEECH_KEY=<speech-resource-key>
AZURE_SPEECH_REGION=eastus
2

Pilih Azure Speech di messages.tts

{
  messages: {
    tts: {
      auto: "always",
      provider: "azure-speech",
      providers: {
        "azure-speech": {
          voice: "en-US-JennyNeural",
          lang: "en-US",
        },
      },
    },
  },
}
3

Kirim pesan

Kirim balasan melalui saluran terhubung apa pun. OpenClaw mensintesis audio dengan Azure Speech dan mengirim MP3 untuk audio standar, atau Ogg/Opus ketika saluran mengharapkan voice note.

Opsi konfigurasi

OpsiPathDeskripsi
apiKeymessages.tts.providers.azure-speech.apiKeyKey resource Azure Speech. Fallback ke AZURE_SPEECH_KEY, AZURE_SPEECH_API_KEY, atau SPEECH_KEY.
regionmessages.tts.providers.azure-speech.regionRegion resource Azure Speech. Fallback ke AZURE_SPEECH_REGION atau SPEECH_REGION.
endpointmessages.tts.providers.azure-speech.endpointOverride endpoint/base URL Azure Speech opsional.
baseUrlmessages.tts.providers.azure-speech.baseUrlOverride base URL Azure Speech opsional.
voicemessages.tts.providers.azure-speech.voiceShortName voice Azure (default en-US-JennyNeural).
langmessages.tts.providers.azure-speech.langKode bahasa SSML (default en-US).
outputFormatmessages.tts.providers.azure-speech.outputFormatFormat output file audio (default audio-24khz-48kbitrate-mono-mp3).
voiceNoteOutputFormatmessages.tts.providers.azure-speech.voiceNoteOutputFormatFormat output voice note (default ogg-24khz-16bit-mono-opus).

Catatan

Azure Speech menggunakan key resource Speech, bukan key Azure OpenAI. Key dikirim sebagai Ocp-Apim-Subscription-Key; OpenClaw menurunkan https://<region>.tts.speech.microsoft.com dari region kecuali Anda memberikan endpoint atau baseUrl.
Gunakan nilai ShortName voice Azure Speech, misalnya en-US-JennyNeural. Provider bawaan dapat mencantumkan voice melalui resource Speech yang sama dan memfilter voice yang ditandai deprecated atau retired.
Azure menerima format output seperti audio-24khz-48kbitrate-mono-mp3, ogg-24khz-16bit-mono-opus, dan riff-24khz-16bit-mono-pcm. OpenClaw meminta Ogg/Opus untuk target voice-note agar saluran dapat mengirim gelembung suara native tanpa konversi MP3 tambahan.
azure diterima sebagai alias provider untuk PR yang sudah ada dan konfigurasi pengguna, tetapi konfigurasi baru sebaiknya menggunakan azure-speech agar tidak membingungkan dengan provider model Azure OpenAI.

Terkait

Text-to-speech

Ringkasan TTS, provider, dan konfigurasi messages.tts.

Konfigurasi

Referensi konfigurasi lengkap termasuk pengaturan messages.tts.

Provider

Semua provider OpenClaw bawaan.

Pemecahan masalah

Masalah umum dan langkah debugging.