الانتقال إلى المحتوى الرئيسي

توليد الصور

تتيح أداة image_generate للوكيل إنشاء الصور وتحريرها باستخدام الموفّرين المهيأين لديك. تُسلَّم الصور المُنشأة تلقائيًا كمرفقات وسائط في رد الوكيل.
لا تظهر الأداة إلا عند توفر موفّر واحد على الأقل لتوليد الصور. إذا لم ترَ image_generate ضمن أدوات الوكيل لديك، فقم بتهيئة agents.defaults.imageGenerationModel أو بإعداد مفتاح API للموفّر.

البدء السريع

  1. عيّن مفتاح API لموفّر واحد على الأقل (مثل OPENAI_API_KEY أو GEMINI_API_KEY).
  2. عيّن نموذجك المفضّل اختياريًا:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
      },
    },
  },
}
  1. اطلب من الوكيل: “أنشئ صورة لتميمة كركند ودودة.”
يستدعي الوكيل image_generate تلقائيًا. لا حاجة إلى allow-list للأداة — فهي مفعلة افتراضيًا عند توفر موفّر.

الموفّرون المدعومون

الموفّرالنموذج الافتراضيدعم التحريرمفتاح API
OpenAIgpt-image-1نعم (حتى 5 صور)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewنعمGEMINI_API_KEY أو GOOGLE_API_KEY
falfal-ai/flux/devنعمFAL_KEY
MiniMaximage-01نعم (مرجع موضوع)MINIMAX_API_KEY أو MiniMax OAuth (minimax-portal)
ComfyUIworkflowنعم (صورة واحدة، وفق تهيئة workflow)COMFY_API_KEY أو COMFY_CLOUD_API_KEY للسحابة
Vydragrok-imagineلاVYDRA_API_KEY
استخدم action: "list" لفحص الموفّرين والنماذج المتاحة أثناء التشغيل:
/tool image_generate action=list

معاملات الأداة

المعاملالنوعالوصف
promptstringprompt لتوليد الصور (مطلوب لـ action: "generate")
actionstring"generate" (الافتراضي) أو "list" لفحص الموفّرين
modelstringتجاوز للموفّر/النموذج، مثل openai/gpt-image-1
imagestringمسار صورة مرجعية واحدة أو URL لوضع التحرير
imagesstring[]عدة صور مرجعية لوضع التحرير (حتى 5)
sizestringتلميح للحجم: 1024x1024 أو 1536x1024 أو 1024x1536 أو 1024x1792 أو 1792x1024
aspectRatiostringنسبة الأبعاد: 1:1 أو 2:3 أو 3:2 أو 3:4 أو 4:3 أو 4:5 أو 5:4 أو 9:16 أو 16:9 أو 21:9
resolutionstringتلميح للدقة: 1K أو 2K أو 4K
countnumberعدد الصور المطلوب إنشاؤها (1–4)
filenamestringتلميح لاسم ملف الخرج
لا يدعم جميع الموفّرين كل المعاملات. وعندما يدعم موفّر fallback خيارًا هندسيًا قريبًا بدلًا من الخيار المطلوب تمامًا، يعيد OpenClaw تعيينه إلى أقرب حجم أو نسبة أبعاد أو دقة مدعومة قبل الإرسال. أما التجاوزات غير المدعومة فعلًا فيُبلّغ عنها مع ذلك في نتيجة الأداة. تعرض نتائج الأداة الإعدادات المطبقة. وعندما يعيد OpenClaw تعيين الخيارات الهندسية أثناء fallback بين الموفّرين، فإن القيم المعادة size وaspectRatio وresolution تعكس ما أُرسل فعليًا، بينما يلتقط details.normalization التحويل من المطلوب إلى المطبق.

التهيئة

اختيار النموذج

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

ترتيب اختيار الموفّر

عند إنشاء صورة، يحاول OpenClaw الموفّرين بهذا الترتيب:
  1. معامل model من استدعاء الأداة (إذا حدده الوكيل)
  2. imageGenerationModel.primary من التهيئة
  3. imageGenerationModel.fallbacks بالترتيب
  4. الاكتشاف التلقائي — يستخدم فقط القيم الافتراضية للموفّرين المدعومة بالمصادقة:
    • الموفّر الافتراضي الحالي أولًا
    • ثم بقية موفّري توليد الصور المسجلين بترتيب معرّف الموفّر
إذا فشل موفّر ما (خطأ مصادقة، أو حد معدل، وما إلى ذلك)، تُجرَّب المرشحات التالية تلقائيًا. وإذا فشل الجميع، يتضمن الخطأ تفاصيل كل محاولة. ملاحظات:
  • الاكتشاف التلقائي واعٍ بالمصادقة. لا يدخل موفّر ما إلى قائمة المرشحين الافتراضية إلا عندما يتمكن OpenClaw فعليًا من مصادقة ذلك الموفّر.
  • الاكتشاف التلقائي مفعّل افتراضيًا. عيّن agents.defaults.mediaGenerationAutoProviderFallback: false إذا كنت تريد أن يستخدم توليد الصور فقط الإدخالات الصريحة model وprimary وfallbacks.
  • استخدم action: "list" لفحص الموفّرين المسجلين حاليًا، ونماذجهم الافتراضية، وتلميحات متغيرات البيئة للمصادقة.

تحرير الصور

تدعم OpenAI وGoogle وfal وMiniMax وComfyUI تحرير الصور المرجعية. مرّر مسار صورة مرجعية أو URL:
"أنشئ نسخة مائية من هذه الصورة" + image: "/path/to/photo.jpg"
تدعم OpenAI وGoogle حتى 5 صور مرجعية عبر المعامل images. أما fal وMiniMax وComfyUI فتدعم صورة واحدة. يتوفر توليد الصور في MiniMax عبر مساري مصادقة MiniMax المضمّنين كليهما:
  • minimax/image-01 لإعدادات مفتاح API
  • minimax-portal/image-01 لإعدادات OAuth

إمكانات الموفّرين

الإمكانيةOpenAIGooglefalMiniMaxComfyUIVydra
الإنشاءنعم (حتى 4)نعم (حتى 4)نعم (حتى 4)نعم (حتى 9)نعم (مخرجات يحددها workflow)نعم (1)
التحرير/المرجعنعم (حتى 5 صور)نعم (حتى 5 صور)نعم (صورة واحدة)نعم (صورة واحدة، مرجع موضوع)نعم (صورة واحدة، وفق تهيئة workflow)لا
التحكم بالحجمنعمنعمنعملالالا
نسبة الأبعادلانعمنعم (للإنشاء فقط)نعملالا
الدقة (1K/2K/4K)لانعمنعملالالا

ذو صلة