توليد الصور
تتيح أداة image_generate للوكيل إنشاء الصور وتحريرها باستخدام الموفّرين المهيأين لديك. تُسلَّم الصور المُنشأة تلقائيًا كمرفقات وسائط في رد الوكيل.
لا تظهر الأداة إلا عند توفر موفّر واحد على الأقل لتوليد الصور. إذا لم ترَ image_generate ضمن أدوات الوكيل لديك، فقم بتهيئة agents.defaults.imageGenerationModel أو بإعداد مفتاح API للموفّر.
البدء السريع
- عيّن مفتاح API لموفّر واحد على الأقل (مثل
OPENAI_API_KEY أو GEMINI_API_KEY).
- عيّن نموذجك المفضّل اختياريًا:
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-1",
},
},
},
}
- اطلب من الوكيل: “أنشئ صورة لتميمة كركند ودودة.”
يستدعي الوكيل image_generate تلقائيًا. لا حاجة إلى allow-list للأداة — فهي مفعلة افتراضيًا عند توفر موفّر.
الموفّرون المدعومون
| الموفّر | النموذج الافتراضي | دعم التحرير | مفتاح API |
|---|
| OpenAI | gpt-image-1 | نعم (حتى 5 صور) | OPENAI_API_KEY |
| Google | gemini-3.1-flash-image-preview | نعم | GEMINI_API_KEY أو GOOGLE_API_KEY |
| fal | fal-ai/flux/dev | نعم | FAL_KEY |
| MiniMax | image-01 | نعم (مرجع موضوع) | MINIMAX_API_KEY أو MiniMax OAuth (minimax-portal) |
| ComfyUI | workflow | نعم (صورة واحدة، وفق تهيئة workflow) | COMFY_API_KEY أو COMFY_CLOUD_API_KEY للسحابة |
| Vydra | grok-imagine | لا | VYDRA_API_KEY |
استخدم action: "list" لفحص الموفّرين والنماذج المتاحة أثناء التشغيل:
/tool image_generate action=list
معاملات الأداة
| المعامل | النوع | الوصف |
|---|
prompt | string | prompt لتوليد الصور (مطلوب لـ action: "generate") |
action | string | "generate" (الافتراضي) أو "list" لفحص الموفّرين |
model | string | تجاوز للموفّر/النموذج، مثل openai/gpt-image-1 |
image | string | مسار صورة مرجعية واحدة أو URL لوضع التحرير |
images | string[] | عدة صور مرجعية لوضع التحرير (حتى 5) |
size | string | تلميح للحجم: 1024x1024 أو 1536x1024 أو 1024x1536 أو 1024x1792 أو 1792x1024 |
aspectRatio | string | نسبة الأبعاد: 1:1 أو 2:3 أو 3:2 أو 3:4 أو 4:3 أو 4:5 أو 5:4 أو 9:16 أو 16:9 أو 21:9 |
resolution | string | تلميح للدقة: 1K أو 2K أو 4K |
count | number | عدد الصور المطلوب إنشاؤها (1–4) |
filename | string | تلميح لاسم ملف الخرج |
لا يدعم جميع الموفّرين كل المعاملات. وعندما يدعم موفّر fallback خيارًا هندسيًا قريبًا بدلًا من الخيار المطلوب تمامًا، يعيد OpenClaw تعيينه إلى أقرب حجم أو نسبة أبعاد أو دقة مدعومة قبل الإرسال. أما التجاوزات غير المدعومة فعلًا فيُبلّغ عنها مع ذلك في نتيجة الأداة.
تعرض نتائج الأداة الإعدادات المطبقة. وعندما يعيد OpenClaw تعيين الخيارات الهندسية أثناء fallback بين الموفّرين، فإن القيم المعادة size وaspectRatio وresolution تعكس ما أُرسل فعليًا، بينما يلتقط details.normalization التحويل من المطلوب إلى المطبق.
التهيئة
اختيار النموذج
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-1",
fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
},
},
},
}
ترتيب اختيار الموفّر
عند إنشاء صورة، يحاول OpenClaw الموفّرين بهذا الترتيب:
- معامل
model من استدعاء الأداة (إذا حدده الوكيل)
imageGenerationModel.primary من التهيئة
imageGenerationModel.fallbacks بالترتيب
- الاكتشاف التلقائي — يستخدم فقط القيم الافتراضية للموفّرين المدعومة بالمصادقة:
- الموفّر الافتراضي الحالي أولًا
- ثم بقية موفّري توليد الصور المسجلين بترتيب معرّف الموفّر
إذا فشل موفّر ما (خطأ مصادقة، أو حد معدل، وما إلى ذلك)، تُجرَّب المرشحات التالية تلقائيًا. وإذا فشل الجميع، يتضمن الخطأ تفاصيل كل محاولة.
ملاحظات:
- الاكتشاف التلقائي واعٍ بالمصادقة. لا يدخل موفّر ما إلى قائمة المرشحين الافتراضية
إلا عندما يتمكن OpenClaw فعليًا من مصادقة ذلك الموفّر.
- الاكتشاف التلقائي مفعّل افتراضيًا. عيّن
agents.defaults.mediaGenerationAutoProviderFallback: false إذا كنت تريد أن يستخدم
توليد الصور فقط الإدخالات الصريحة model وprimary وfallbacks.
- استخدم
action: "list" لفحص الموفّرين المسجلين حاليًا،
ونماذجهم الافتراضية، وتلميحات متغيرات البيئة للمصادقة.
تحرير الصور
تدعم OpenAI وGoogle وfal وMiniMax وComfyUI تحرير الصور المرجعية. مرّر مسار صورة مرجعية أو URL:
"أنشئ نسخة مائية من هذه الصورة" + image: "/path/to/photo.jpg"
تدعم OpenAI وGoogle حتى 5 صور مرجعية عبر المعامل images. أما fal وMiniMax وComfyUI فتدعم صورة واحدة.
يتوفر توليد الصور في MiniMax عبر مساري مصادقة MiniMax المضمّنين كليهما:
minimax/image-01 لإعدادات مفتاح API
minimax-portal/image-01 لإعدادات OAuth
إمكانات الموفّرين
| الإمكانية | OpenAI | Google | fal | MiniMax | ComfyUI | Vydra |
|---|
| الإنشاء | نعم (حتى 4) | نعم (حتى 4) | نعم (حتى 4) | نعم (حتى 9) | نعم (مخرجات يحددها workflow) | نعم (1) |
| التحرير/المرجع | نعم (حتى 5 صور) | نعم (حتى 5 صور) | نعم (صورة واحدة) | نعم (صورة واحدة، مرجع موضوع) | نعم (صورة واحدة، وفق تهيئة workflow) | لا |
| التحكم بالحجم | نعم | نعم | نعم | لا | لا | لا |
| نسبة الأبعاد | لا | نعم | نعم (للإنشاء فقط) | نعم | لا | لا |
| الدقة (1K/2K/4K) | لا | نعم | نعم | لا | لا | لا |
ذو صلة