Ana içeriğe atla
Azure Speech, bir Azure AI Speech text-to-speech sağlayıcısıdır. OpenClaw içinde giden yanıt sesini varsayılan olarak MP3, sesli notlar için yerel Ogg/Opus ve Voice Call gibi telefon kanalları için 8 kHz mulaw ses olarak sentezler. OpenClaw, Azure Speech REST API’sini doğrudan SSML ile kullanır ve sağlayıcı sahipli çıktı biçimini X-Microsoft-OutputFormat üzerinden gönderir.
AyrıntıDeğer
WebsiteAzure AI Speech
DokümanlarSpeech REST text-to-speech
Kimlik doğrulamaAZURE_SPEECH_KEY artı AZURE_SPEECH_REGION
Varsayılan sesen-US-JennyNeural
Varsayılan dosya çıktısıaudio-24khz-48kbitrate-mono-mp3
Varsayılan sesli not dosyasıogg-24khz-16bit-mono-opus

Başlarken

1

Bir Azure Speech kaynağı oluşturun

Azure portalında bir Speech kaynağı oluşturun. Resource Management > Keys and Endpoint bölümünden KEY 1 değerini kopyalayın ve eastus gibi kaynak konumunu da kopyalayın.
AZURE_SPEECH_KEY=<speech-resource-key>
AZURE_SPEECH_REGION=eastus
2

messages.tts içinde Azure Speech'i seçin

{
  messages: {
    tts: {
      auto: "always",
      provider: "azure-speech",
      providers: {
        "azure-speech": {
          voice: "en-US-JennyNeural",
          lang: "en-US",
        },
      },
    },
  },
}
3

Bir mesaj gönderin

Bağlı herhangi bir kanal üzerinden bir yanıt gönderin. OpenClaw sesi Azure Speech ile sentezler ve standart ses için MP3, kanal sesli not beklediğinde ise Ogg/Opus teslim eder.

Yapılandırma seçenekleri

SeçenekYolAçıklama
apiKeymessages.tts.providers.azure-speech.apiKeyAzure Speech kaynak anahtarı. AZURE_SPEECH_KEY, AZURE_SPEECH_API_KEY veya SPEECH_KEY değerlerine fallback yapar.
regionmessages.tts.providers.azure-speech.regionAzure Speech kaynak bölgesi. AZURE_SPEECH_REGION veya SPEECH_REGION değerlerine fallback yapar.
endpointmessages.tts.providers.azure-speech.endpointİsteğe bağlı Azure Speech uç noktası/base URL geçersiz kılması.
baseUrlmessages.tts.providers.azure-speech.baseUrlİsteğe bağlı Azure Speech base URL geçersiz kılması.
voicemessages.tts.providers.azure-speech.voiceAzure ses ShortName değeri (varsayılan en-US-JennyNeural).
langmessages.tts.providers.azure-speech.langSSML dil kodu (varsayılan en-US).
outputFormatmessages.tts.providers.azure-speech.outputFormatSes dosyası çıktı biçimi (varsayılan audio-24khz-48kbitrate-mono-mp3).
voiceNoteOutputFormatmessages.tts.providers.azure-speech.voiceNoteOutputFormatSesli not çıktı biçimi (varsayılan ogg-24khz-16bit-mono-opus).

Notlar

Azure Speech, Azure OpenAI anahtarı değil, bir Speech kaynak anahtarı kullanır. Anahtar Ocp-Apim-Subscription-Key olarak gönderilir; OpenClaw, siz endpoint veya baseUrl sağlamadığınız sürece region değerinden https://<region>.tts.speech.microsoft.com türetir.
Azure Speech ses ShortName değerini kullanın; örneğin en-US-JennyNeural. Paketlenmiş sağlayıcı sesleri aynı Speech kaynağı üzerinden listeleyebilir ve kullanımdan kaldırılmış veya emekliye ayrılmış olarak işaretlenen sesleri filtreler.
Azure; audio-24khz-48kbitrate-mono-mp3, ogg-24khz-16bit-mono-opus ve riff-24khz-16bit-mono-pcm gibi çıktı biçimlerini kabul eder. OpenClaw, voice-note hedefleri için Ogg/Opus ister; böylece kanallar ekstra MP3 dönüştürmesi olmadan yerel ses baloncukları gönderebilir.
azure, mevcut PR’ler ve kullanıcı config’i için sağlayıcı takma adı olarak kabul edilir, ancak yeni config, Azure OpenAI model sağlayıcılarıyla karışıklığı önlemek için azure-speech kullanmalıdır.

İlgili

Text-to-speech

TTS genel bakışı, sağlayıcılar ve messages.tts config’i.

Yapılandırma

messages.tts ayarları dahil tam config referansı.

Sağlayıcılar

Tüm paketlenmiş OpenClaw sağlayıcıları.

Sorun giderme

Yaygın sorunlar ve hata ayıklama adımları.