الانتقال إلى المحتوى الرئيسي

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Deepgram هي واجهة API لتحويل الكلام إلى نص. وفي OpenClaw تُستخدم لنسخ الصوت/الملاحظات الصوتية الواردة عبر tools.media.audio، وللنسخ المتدفق في Voice Call عبر plugins.entries.voice-call.config.streaming. في النسخ الدفعي، يرفع OpenClaw ملف الصوت كاملًا إلى Deepgram ويحقن النص المنسوخ في مسار الرد ({{Transcript}} + كتلة [Audio]). أما في النسخ المتدفق لـ Voice Call، فيمرّر OpenClaw إطارات G.711 u-law الحية عبر نقطة نهاية WebSocket ‏listen الخاصة بـ Deepgram ويصدر نصوصًا جزئية أو نهائية عندما تعيدها Deepgram.
التفصيلالقيمة
الموقعdeepgram.com
المستنداتdevelopers.deepgram.com
المصادقةDEEPGRAM_API_KEY
النموذج الافتراضيnova-3

البدء

1

عيّن مفتاح API الخاص بك

أضف مفتاح Deepgram API إلى البيئة:
DEEPGRAM_API_KEY=dg_...
2

فعّل موفّر الصوت

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

أرسل ملاحظة صوتية

أرسل رسالة صوتية عبر أي قناة متصلة. سيقوم OpenClaw بنسخها عبر Deepgram وحقن النص في مسار الرد.

خيارات التهيئة

الخيارالمسارالوصف
modeltools.media.audio.models[].modelمعرّف نموذج Deepgram (الافتراضي: nova-3)
languagetools.media.audio.models[].languageتلميح اللغة (اختياري)
detect_languagetools.media.audio.providerOptions.deepgram.detect_languageتمكين اكتشاف اللغة (اختياري)
punctuatetools.media.audio.providerOptions.deepgram.punctuateتمكين علامات الترقيم (اختياري)
smart_formattools.media.audio.providerOptions.deepgram.smart_formatتمكين التنسيق الذكي (اختياري)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

النسخ المتدفق في Voice Call

تسجّل Plugin المجمّعة deepgram أيضًا موفّر نسخ فوري لـ Plugin الخاصة بـ Voice Call.
الإعدادمسار التهيئةالافتراضي
مفتاح APIplugins.entries.voice-call.config.streaming.providers.deepgram.apiKeyيعود إلى DEEPGRAM_API_KEY
النموذج...deepgram.modelnova-3
اللغة...deepgram.language(غير معيّنة)
الترميز...deepgram.encodingmulaw
معدل العينة...deepgram.sampleRate8000
Endpointing...deepgram.endpointingMs800
النتائج المرحلية...deepgram.interimResultstrue
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "deepgram",
            providers: {
              deepgram: {
                apiKey: "${DEEPGRAM_API_KEY}",
                model: "nova-3",
                endpointingMs: 800,
                language: "en-US",
              },
            },
          },
        },
      },
    },
  },
}
تستقبل Voice Call الصوت الهاتفي بصيغة G.711 u-law عند 8 kHz. ويكون موفّر البث في Deepgram مضبوطًا افتراضيًا على encoding: "mulaw" وsampleRate: 8000، بحيث يمكن تمرير إطارات وسائط Twilio مباشرة.

ملاحظات

تتبع المصادقة ترتيب auth القياسي الخاص بالموفّر. ويُعد DEEPGRAM_API_KEY أبسط مسار.
تجاوز نقاط النهاية أو الرؤوس باستخدام tools.media.audio.baseUrl و tools.media.audio.headers عند استخدام proxy.
يتبع الإخراج قواعد الصوت نفسها كما في الموفّرين الآخرين (حدود الحجم، والمهلات، وحقن النص المنسوخ).

ذو صلة

أدوات الوسائط

نظرة عامة على خط معالجة الصوت والصور والفيديو.

التهيئة

مرجع التهيئة الكامل بما في ذلك إعدادات أداة الوسائط.

استكشاف الأخطاء وإصلاحها

المشكلات الشائعة وخطوات تصحيح الأخطاء.

الأسئلة الشائعة

الأسئلة المتكررة حول إعداد OpenClaw.