إنشاء الصور
تتيح أداة image_generate للوكيل إنشاء الصور وتحريرها باستخدام الموفّرين المهيئين لديك. وتُسلَّم الصور المُنشأة تلقائيًا كمرفقات وسائط في رد الوكيل.
لا تظهر الأداة إلا عند توفر موفّر واحد على الأقل لإنشاء الصور. إذا لم ترَ image_generate ضمن أدوات الوكيل لديك، فقم بتهيئة agents.defaults.imageGenerationModel أو إعداد مفتاح API لأحد الموفّرين.
البدء السريع
- اضبط مفتاح API لموفّر واحد على الأقل (مثل
OPENAI_API_KEY أو GEMINI_API_KEY).
- اختياريًا، اضبط النموذج المفضل لديك:
{
agents: {
defaults: {
imageGenerationModel: "openai/gpt-image-1",
},
},
}
- اطلب من الوكيل: “أنشئ صورة لتميمة كركند ودودة.”
يستدعي الوكيل image_generate تلقائيًا. لا حاجة إلى قائمة سماح للأدوات — فهي مفعلة افتراضيًا عندما يكون هناك موفّر متاح.
الموفّرون المدعومون
| الموفّر | النموذج الافتراضي | دعم التحرير | مفتاح API |
|---|
| OpenAI | gpt-image-1 | نعم (حتى 5 صور) | OPENAI_API_KEY |
| Google | gemini-3.1-flash-image-preview | نعم | GEMINI_API_KEY أو GOOGLE_API_KEY |
| fal | fal-ai/flux/dev | نعم | FAL_KEY |
| MiniMax | image-01 | نعم (مرجع للعنصر) | MINIMAX_API_KEY أو OAuth لـ MiniMax (minimax-portal) |
استخدم action: "list" لفحص الموفّرين والنماذج المتاحة في وقت التشغيل:
/tool image_generate action=list
معلمات الأداة
| المعلمة | النوع | الوصف |
|---|
prompt | string | مطالبة إنشاء الصورة (مطلوبة لـ action: "generate") |
action | string | "generate" (الافتراضي) أو "list" لفحص الموفّرين |
model | string | تجاوز provider/model، مثل openai/gpt-image-1 |
image | string | مسار صورة مرجعية واحدة أو عنوان URL لوضع التحرير |
images | string[] | صور مرجعية متعددة لوضع التحرير (حتى 5) |
size | string | تلميح الحجم: 1024x1024 أو 1536x1024 أو 1024x1536 أو 1024x1792 أو 1792x1024 |
aspectRatio | string | نسبة الأبعاد: 1:1 أو 2:3 أو 3:2 أو 3:4 أو 4:3 أو 4:5 أو 5:4 أو 9:16 أو 16:9 أو 21:9 |
resolution | string | تلميح الدقة: 1K أو 2K أو 4K |
count | number | عدد الصور المطلوب إنشاؤها (1–4) |
filename | string | تلميح اسم ملف الإخراج |
لا يدعم جميع الموفّرين جميع المعلمات. تمرر الأداة ما يدعمه كل موفّر وتتجاهل الباقي.
التكوين
اختيار النموذج
{
agents: {
defaults: {
// String form: primary model only
imageGenerationModel: "google/gemini-3.1-flash-image-preview",
// Object form: primary + ordered fallbacks
imageGenerationModel: {
primary: "openai/gpt-image-1",
fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
},
},
},
}
ترتيب اختيار الموفّر
عند إنشاء صورة، يحاول OpenClaw استخدام الموفّرين بهذا الترتيب:
- المعلمة
model من استدعاء الأداة (إذا حددها الوكيل)
imageGenerationModel.primary من التكوين
imageGenerationModel.fallbacks بالترتيب
- الكشف التلقائي — يستخدم فقط افتراضيات الموفّرين المدعومة بالمصادقة:
- الموفّر الافتراضي الحالي أولًا
- بقية موفّري إنشاء الصور المسجلين حسب ترتيب معرّف الموفّر
إذا فشل أحد الموفّرين (خطأ مصادقة، أو حد معدل، وما إلى ذلك)، تُجرَّب المحاولة التالية تلقائيًا. وإذا فشل الجميع، يتضمن الخطأ تفاصيل من كل محاولة.
ملاحظات:
- يعتمد الكشف التلقائي على حالة المصادقة. لا يدخل الافتراضي الخاص بأي موفّر إلى قائمة المرشحين
إلا عندما يتمكن OpenClaw فعلًا من المصادقة على ذلك الموفّر.
- استخدم
action: "list" لفحص الموفّرين المسجلين حاليًا،
ونماذجهم الافتراضية، وتلميحات متغيرات بيئة المصادقة.
تحرير الصور
يدعم OpenAI وGoogle وfal وMiniMax تحرير الصور المرجعية. مرّر مسار صورة مرجعية أو عنوان URL:
"أنشئ نسخة بالألوان المائية من هذه الصورة" + image: "/path/to/photo.jpg"
يدعم OpenAI وGoogle حتى 5 صور مرجعية عبر المعلمة images. ويدعم fal وMiniMax صورة واحدة.
يتوفر إنشاء الصور في MiniMax عبر مساري المصادقة المضمّنين في MiniMax:
minimax/image-01 لإعدادات مفتاح API
minimax-portal/image-01 لإعدادات OAuth
قدرات الموفّرين
| القدرة | OpenAI | Google | fal | MiniMax |
|---|
| الإنشاء | نعم (حتى 4) | نعم (حتى 4) | نعم (حتى 4) | نعم (حتى 9) |
| التحرير/المرجع | نعم (حتى 5 صور) | نعم (حتى 5 صور) | نعم (صورة واحدة) | نعم (صورة واحدة، مرجع عنصر) |
| التحكم في الحجم | نعم | نعم | نعم | لا |
| نسبة الأبعاد | لا | نعم | نعم (للإنشاء فقط) | نعم |
| الدقة (1K/2K/4K) | لا | نعم | نعم | لا |
ذو صلة