الانتقال إلى المحتوى الرئيسي

إنشاء الصور

تتيح أداة image_generate للوكيل إنشاء الصور وتحريرها باستخدام الموفّرين المهيئين لديك. وتُسلَّم الصور المُنشأة تلقائيًا كمرفقات وسائط في رد الوكيل.
لا تظهر الأداة إلا عند توفر موفّر واحد على الأقل لإنشاء الصور. إذا لم ترَ image_generate ضمن أدوات الوكيل لديك، فقم بتهيئة agents.defaults.imageGenerationModel أو إعداد مفتاح API لأحد الموفّرين.

البدء السريع

  1. اضبط مفتاح API لموفّر واحد على الأقل (مثل OPENAI_API_KEY أو GEMINI_API_KEY).
  2. اختياريًا، اضبط النموذج المفضل لديك:
{
  agents: {
    defaults: {
      imageGenerationModel: "openai/gpt-image-1",
    },
  },
}
  1. اطلب من الوكيل: “أنشئ صورة لتميمة كركند ودودة.”
يستدعي الوكيل image_generate تلقائيًا. لا حاجة إلى قائمة سماح للأدوات — فهي مفعلة افتراضيًا عندما يكون هناك موفّر متاح.

الموفّرون المدعومون

الموفّرالنموذج الافتراضيدعم التحريرمفتاح API
OpenAIgpt-image-1نعم (حتى 5 صور)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewنعمGEMINI_API_KEY أو GOOGLE_API_KEY
falfal-ai/flux/devنعمFAL_KEY
MiniMaximage-01نعم (مرجع للعنصر)MINIMAX_API_KEY أو OAuth لـ MiniMax (minimax-portal)
استخدم action: "list" لفحص الموفّرين والنماذج المتاحة في وقت التشغيل:
/tool image_generate action=list

معلمات الأداة

المعلمةالنوعالوصف
promptstringمطالبة إنشاء الصورة (مطلوبة لـ action: "generate")
actionstring"generate" (الافتراضي) أو "list" لفحص الموفّرين
modelstringتجاوز provider/model، مثل openai/gpt-image-1
imagestringمسار صورة مرجعية واحدة أو عنوان URL لوضع التحرير
imagesstring[]صور مرجعية متعددة لوضع التحرير (حتى 5)
sizestringتلميح الحجم: 1024x1024 أو 1536x1024 أو 1024x1536 أو 1024x1792 أو 1792x1024
aspectRatiostringنسبة الأبعاد: 1:1 أو 2:3 أو 3:2 أو 3:4 أو 4:3 أو 4:5 أو 5:4 أو 9:16 أو 16:9 أو 21:9
resolutionstringتلميح الدقة: 1K أو 2K أو 4K
countnumberعدد الصور المطلوب إنشاؤها (1–4)
filenamestringتلميح اسم ملف الإخراج
لا يدعم جميع الموفّرين جميع المعلمات. تمرر الأداة ما يدعمه كل موفّر وتتجاهل الباقي.

التكوين

اختيار النموذج

{
  agents: {
    defaults: {
      // String form: primary model only
      imageGenerationModel: "google/gemini-3.1-flash-image-preview",

      // Object form: primary + ordered fallbacks
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

ترتيب اختيار الموفّر

عند إنشاء صورة، يحاول OpenClaw استخدام الموفّرين بهذا الترتيب:
  1. المعلمة model من استدعاء الأداة (إذا حددها الوكيل)
  2. imageGenerationModel.primary من التكوين
  3. imageGenerationModel.fallbacks بالترتيب
  4. الكشف التلقائي — يستخدم فقط افتراضيات الموفّرين المدعومة بالمصادقة:
    • الموفّر الافتراضي الحالي أولًا
    • بقية موفّري إنشاء الصور المسجلين حسب ترتيب معرّف الموفّر
إذا فشل أحد الموفّرين (خطأ مصادقة، أو حد معدل، وما إلى ذلك)، تُجرَّب المحاولة التالية تلقائيًا. وإذا فشل الجميع، يتضمن الخطأ تفاصيل من كل محاولة. ملاحظات:
  • يعتمد الكشف التلقائي على حالة المصادقة. لا يدخل الافتراضي الخاص بأي موفّر إلى قائمة المرشحين إلا عندما يتمكن OpenClaw فعلًا من المصادقة على ذلك الموفّر.
  • استخدم action: "list" لفحص الموفّرين المسجلين حاليًا، ونماذجهم الافتراضية، وتلميحات متغيرات بيئة المصادقة.

تحرير الصور

يدعم OpenAI وGoogle وfal وMiniMax تحرير الصور المرجعية. مرّر مسار صورة مرجعية أو عنوان URL:
"أنشئ نسخة بالألوان المائية من هذه الصورة" + image: "/path/to/photo.jpg"
يدعم OpenAI وGoogle حتى 5 صور مرجعية عبر المعلمة images. ويدعم fal وMiniMax صورة واحدة. يتوفر إنشاء الصور في MiniMax عبر مساري المصادقة المضمّنين في MiniMax:
  • minimax/image-01 لإعدادات مفتاح API
  • minimax-portal/image-01 لإعدادات OAuth

قدرات الموفّرين

القدرةOpenAIGooglefalMiniMax
الإنشاءنعم (حتى 4)نعم (حتى 4)نعم (حتى 4)نعم (حتى 9)
التحرير/المرجعنعم (حتى 5 صور)نعم (حتى 5 صور)نعم (صورة واحدة)نعم (صورة واحدة، مرجع عنصر)
التحكم في الحجمنعمنعمنعملا
نسبة الأبعادلانعمنعم (للإنشاء فقط)نعم
الدقة (1K/2K/4K)لانعمنعملا

ذو صلة