الانتقال إلى المحتوى الرئيسي

Deepgram ‏(نسخ الصوت)

Deepgram هي واجهة API لتحويل الكلام إلى نص. وفي OpenClaw تُستخدم من أجل نسخ الملاحظات الصوتية/الصوت الوارد عبر tools.media.audio. عند التمكين، يرفع OpenClaw ملف الصوت إلى Deepgram ويحقن النص المنسوخ في مسار الرد ({{Transcript}} + كتلة [Audio]). وهذا ليس بثًا مباشرًا؛ إذ يستخدم نقطة نهاية النسخ الخاصة بالتسجيلات المسبقة. الموقع: https://deepgram.com
الوثائق: https://developers.deepgram.com

البدء السريع

  1. عيّن مفتاح API الخاص بك:
DEEPGRAM_API_KEY=dg_...
  1. فعّل المزوّد:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

الخيارات

  • model: معرّف نموذج Deepgram ‏(الافتراضي: nova-3)
  • language: تلميح اللغة (اختياري)
  • tools.media.audio.providerOptions.deepgram.detect_language: تمكين اكتشاف اللغة (اختياري)
  • tools.media.audio.providerOptions.deepgram.punctuate: تمكين علامات الترقيم (اختياري)
  • tools.media.audio.providerOptions.deepgram.smart_format: تمكين التنسيق الذكي (اختياري)
مثال مع اللغة:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}
مثال مع خيارات Deepgram:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        providerOptions: {
          deepgram: {
            detect_language: true,
            punctuate: true,
            smart_format: true,
          },
        },
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

ملاحظات

  • تتبع المصادقة ترتيب مصادقة المزوّد القياسي؛ ويُعد DEEPGRAM_API_KEY أبسط مسار.
  • تجاوز نقاط النهاية أو الرؤوس باستخدام tools.media.audio.baseUrl وtools.media.audio.headers عند استخدام proxy.
  • يتبع الخرج قواعد الصوت نفسها الخاصة بالمزوّدين الآخرين (حدود الحجم، والمهلات، وحقن النص المنسوخ).