X-Microsoft-OutputFormat.
| التفصيل | القيمة |
|---|---|
| الموقع الإلكتروني | Azure AI Speech |
| الوثائق | Speech REST text-to-speech |
| المصادقة | AZURE_SPEECH_KEY بالإضافة إلى AZURE_SPEECH_REGION |
| الصوت الافتراضي | en-US-JennyNeural |
| إخراج الملف الافتراضي | audio-24khz-48kbitrate-mono-mp3 |
| ملف الملاحظة الصوتية الافتراضي | ogg-24khz-16bit-mono-opus |
البدء
أنشئ مورد Azure Speech
في بوابة Azure، أنشئ مورد Speech. انسخ KEY 1 من
Resource Management > Keys and Endpoint، وانسخ موقع المورد
مثل
eastus.خيارات التكوين
| الخيار | المسار | الوصف |
|---|---|---|
apiKey | messages.tts.providers.azure-speech.apiKey | مفتاح مورد Azure Speech. ويعود إلى AZURE_SPEECH_KEY أو AZURE_SPEECH_API_KEY أو SPEECH_KEY. |
region | messages.tts.providers.azure-speech.region | منطقة مورد Azure Speech. ويعود إلى AZURE_SPEECH_REGION أو SPEECH_REGION. |
endpoint | messages.tts.providers.azure-speech.endpoint | تجاوز اختياري لنقطة نهاية/عنوان URL الأساسي لـ Azure Speech. |
baseUrl | messages.tts.providers.azure-speech.baseUrl | تجاوز اختياري لعنوان URL الأساسي لـ Azure Speech. |
voice | messages.tts.providers.azure-speech.voice | قيمة ShortName للصوت في Azure (الافتراضي en-US-JennyNeural). |
lang | messages.tts.providers.azure-speech.lang | رمز لغة SSML (الافتراضي en-US). |
outputFormat | messages.tts.providers.azure-speech.outputFormat | تنسيق إخراج ملف الصوت (الافتراضي audio-24khz-48kbitrate-mono-mp3). |
voiceNoteOutputFormat | messages.tts.providers.azure-speech.voiceNoteOutputFormat | تنسيق إخراج الملاحظة الصوتية (الافتراضي ogg-24khz-16bit-mono-opus). |
ملاحظات
المصادقة
المصادقة
يستخدم Azure Speech مفتاح مورد Speech، وليس مفتاح Azure OpenAI. يتم إرسال
المفتاح على هيئة
Ocp-Apim-Subscription-Key؛ ويشتق OpenClaw
العنوان https://<region>.tts.speech.microsoft.com من region ما لم
توفر endpoint أو baseUrl.أسماء الأصوات
أسماء الأصوات
استخدم قيمة
ShortName الخاصة بالصوت في Azure Speech، مثل
en-US-JennyNeural. ويمكن للمزوّد المضمن عرض الأصوات عبر
مورد Speech نفسه ويصفّي الأصوات المعلّمة على أنها deprecated أو retired.مخرجات الصوت
مخرجات الصوت
يقبل Azure تنسيقات إخراج مثل
audio-24khz-48kbitrate-mono-mp3،
وogg-24khz-16bit-mono-opus، وriff-24khz-16bit-mono-pcm. ويطلب OpenClaw
Ogg/Opus لأهداف voice-note حتى تتمكن القنوات من إرسال
فقاعات صوتية أصلية من دون تحويل إضافي من MP3.الاسم البديل
الاسم البديل
تُقبل
azure كاسم بديل للمزوّد من أجل PRs الحالية وتكوينات المستخدمين،
لكن يجب أن تستخدم التكوينات الجديدة azure-speech لتجنب الالتباس مع
مزوّدي نماذج Azure OpenAI.ذو صلة
تحويل النص إلى كلام
نظرة عامة على TTS، والمزوّدين، وتكوين
messages.tts.التكوين
المرجع الكامل للتكوين بما في ذلك إعدادات
messages.tts.المزوّدون
جميع مزوّدي OpenClaw المضمنين.
استكشاف الأخطاء وإصلاحها
المشكلات الشائعة وخطوات تصحيح الأخطاء.