Deepgram هي واجهة API لتحويل الكلام إلى نص. وفي OpenClaw تُستخدم لنسخ الصوت/الملاحظات الصوتية الواردة عبرDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
tools.media.audio، وللنسخ المتدفق في Voice Call
عبر plugins.entries.voice-call.config.streaming.
في النسخ الدفعي، يرفع OpenClaw ملف الصوت كاملًا إلى Deepgram
ويحقن النص المنسوخ في مسار الرد ({{Transcript}} +
كتلة [Audio]). أما في النسخ المتدفق لـ Voice Call، فيمرّر OpenClaw
إطارات G.711 u-law الحية عبر نقطة نهاية WebSocket listen الخاصة بـ Deepgram
ويصدر نصوصًا جزئية أو نهائية عندما تعيدها Deepgram.
| التفصيل | القيمة |
|---|---|
| الموقع | deepgram.com |
| المستندات | developers.deepgram.com |
| المصادقة | DEEPGRAM_API_KEY |
| النموذج الافتراضي | nova-3 |
البدء
خيارات التهيئة
| الخيار | المسار | الوصف |
|---|---|---|
model | tools.media.audio.models[].model | معرّف نموذج Deepgram (الافتراضي: nova-3) |
language | tools.media.audio.models[].language | تلميح اللغة (اختياري) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | تمكين اكتشاف اللغة (اختياري) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | تمكين علامات الترقيم (اختياري) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | تمكين التنسيق الذكي (اختياري) |
- مع تلميح اللغة
- مع خيارات Deepgram
النسخ المتدفق في Voice Call
تسجّل Plugin المجمّعةdeepgram أيضًا موفّر نسخ فوري
لـ Plugin الخاصة بـ Voice Call.
| الإعداد | مسار التهيئة | الافتراضي |
|---|---|---|
| مفتاح API | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | يعود إلى DEEPGRAM_API_KEY |
| النموذج | ...deepgram.model | nova-3 |
| اللغة | ...deepgram.language | (غير معيّنة) |
| الترميز | ...deepgram.encoding | mulaw |
| معدل العينة | ...deepgram.sampleRate | 8000 |
| Endpointing | ...deepgram.endpointingMs | 800 |
| النتائج المرحلية | ...deepgram.interimResults | true |
تستقبل Voice Call الصوت الهاتفي بصيغة G.711 u-law عند 8 kHz. ويكون
موفّر البث في Deepgram مضبوطًا افتراضيًا على
encoding: "mulaw" وsampleRate: 8000، بحيث
يمكن تمرير إطارات وسائط Twilio مباشرة.ملاحظات
المصادقة
المصادقة
تتبع المصادقة ترتيب auth القياسي الخاص بالموفّر. ويُعد
DEEPGRAM_API_KEY
أبسط مسار.Proxy ونقاط النهاية المخصصة
Proxy ونقاط النهاية المخصصة
تجاوز نقاط النهاية أو الرؤوس باستخدام
tools.media.audio.baseUrl و
tools.media.audio.headers عند استخدام proxy.سلوك الإخراج
سلوك الإخراج
يتبع الإخراج قواعد الصوت نفسها كما في الموفّرين الآخرين (حدود الحجم، والمهلات،
وحقن النص المنسوخ).
ذو صلة
أدوات الوسائط
نظرة عامة على خط معالجة الصوت والصور والفيديو.
التهيئة
مرجع التهيئة الكامل بما في ذلك إعدادات أداة الوسائط.
استكشاف الأخطاء وإصلاحها
المشكلات الشائعة وخطوات تصحيح الأخطاء.
الأسئلة الشائعة
الأسئلة المتكررة حول إعداد OpenClaw.