Passer au contenu principal

Génération d’images

L’outil image_generate permet à l’agent de créer et de modifier des images à l’aide de vos fournisseurs configurés. Les images générées sont automatiquement livrées en tant que pièces jointes multimédias dans la réponse de l’agent.
L’outil n’apparaît que lorsqu’au moins un fournisseur de génération d’images est disponible. Si vous ne voyez pas image_generate dans les outils de votre agent, configurez agents.defaults.imageGenerationModel ou définissez une clé API de fournisseur.

Démarrage rapide

  1. Définissez une clé API pour au moins un fournisseur (par exemple OPENAI_API_KEY ou GEMINI_API_KEY).
  2. Définissez éventuellement votre modèle préféré :
{
  agents: {
    defaults: {
      imageGenerationModel: "openai/gpt-image-1",
    },
  },
}
  1. Demandez à l’agent : “Generate an image of a friendly lobster mascot.”
L’agent appelle image_generate automatiquement. Aucune allow-list d’outils n’est nécessaire : il est activé par défaut lorsqu’un fournisseur est disponible.

Fournisseurs pris en charge

ProviderDefault modelEdit supportAPI key
OpenAIgpt-image-1Yes (up to 5 images)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewYesGEMINI_API_KEY or GOOGLE_API_KEY
falfal-ai/flux/devYesFAL_KEY
MiniMaximage-01Yes (subject reference)MINIMAX_API_KEY or MiniMax OAuth (minimax-portal)
Utilisez action: "list" pour inspecter les fournisseurs et modèles disponibles à l’exécution :
/tool image_generate action=list

Paramètres de l’outil

ParameterTypeDescription
promptstringPrompt de génération d’image (obligatoire pour action: "generate")
actionstring"generate" (par défaut) ou "list" pour inspecter les fournisseurs
modelstringRemplacement fournisseur/modèle, par ex. openai/gpt-image-1
imagestringChemin ou URL d’image de référence unique pour le mode édition
imagesstring[]Plusieurs chemins d’images de référence pour le mode édition (jusqu’à 5)
sizestringIndication de taille : 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostringRatio d’aspect : 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstringIndication de résolution : 1K, 2K ou 4K
countnumberNombre d’images à générer (1–4)
filenamestringIndication de nom de fichier de sortie
Tous les fournisseurs ne prennent pas en charge tous les paramètres. L’outil transmet ce que chaque fournisseur prend en charge et ignore le reste.

Configuration

Sélection du modèle

{
  agents: {
    defaults: {
      // Forme chaîne : modèle principal uniquement
      imageGenerationModel: "google/gemini-3.1-flash-image-preview",

      // Forme objet : principal + fallbacks ordonnés
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

Ordre de sélection du fournisseur

Lors de la génération d’une image, OpenClaw essaie les fournisseurs dans cet ordre :
  1. Paramètre model de l’appel d’outil (si l’agent en spécifie un)
  2. imageGenerationModel.primary depuis la configuration
  3. imageGenerationModel.fallbacks dans l’ordre
  4. Détection automatique — utilise uniquement les valeurs par défaut de fournisseur adossées à l’authentification :
    • d’abord le fournisseur par défaut actuel
    • puis les autres fournisseurs de génération d’images enregistrés, dans l’ordre des ids de fournisseur
Si un fournisseur échoue (erreur d’authentification, limite de débit, etc.), le candidat suivant est essayé automatiquement. Si tous échouent, l’erreur inclut les détails de chaque tentative. Remarques :
  • La détection automatique tient compte de l’authentification. Une valeur par défaut de fournisseur n’entre dans la liste des candidats que lorsque OpenClaw peut effectivement authentifier ce fournisseur.
  • Utilisez action: "list" pour inspecter les fournisseurs actuellement enregistrés, leurs modèles par défaut et les indications de variables d’environnement d’authentification.

Édition d’image

OpenAI, Google, fal et MiniMax prennent en charge l’édition d’images de référence. Transmettez un chemin ou une URL d’image de référence :
"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"
OpenAI et Google prennent en charge jusqu’à 5 images de référence via le paramètre images. fal et MiniMax en prennent en charge 1. La génération d’images MiniMax est disponible via les deux chemins d’authentification MiniMax intégrés :
  • minimax/image-01 pour les configurations avec clé API
  • minimax-portal/image-01 pour les configurations avec OAuth

Capacités des fournisseurs

CapabilityOpenAIGooglefalMiniMax
GenerateYes (up to 4)Yes (up to 4)Yes (up to 4)Yes (up to 9)
Edit/referenceYes (up to 5 images)Yes (up to 5 images)Yes (1 image)Yes (1 image, subject ref)
Size controlYesYesYesNo
Aspect ratioNoYesYes (generate only)Yes
Resolution (1K/2K/4K)NoYesYesNo

Liens associés