L’outilDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
image_generate permet à l’agent de créer et de modifier des images avec vos
fournisseurs configurés. Les images générées sont livrées automatiquement sous forme de pièces jointes
multimédias dans la réponse de l’agent.
L’outil n’apparaît que lorsqu’au moins un fournisseur de génération d’images est
disponible. Si vous ne voyez pas
image_generate dans les outils de votre agent,
configurez agents.defaults.imageGenerationModel, définissez une clé d’API de fournisseur,
ou connectez-vous avec OpenAI Codex OAuth.Démarrage rapide
Configurer l’authentification
Définissez une clé d’API pour au moins un fournisseur (par exemple
OPENAI_API_KEY,
GEMINI_API_KEY, OPENROUTER_API_KEY) ou connectez-vous avec OpenAI Codex OAuth.Choisir un modèle par défaut (facultatif)
openai/gpt-image-2. Lorsqu’un
profil OAuth openai-codex est configuré, OpenClaw achemine les requêtes
d’image via ce profil OAuth au lieu d’essayer d’abord
OPENAI_API_KEY. Une configuration explicite models.providers.openai (clé d’API,
URL de base personnalisée/Azure) réactive l’acheminement direct via l’API OpenAI Images.Routes courantes
| Objectif | Référence de modèle | Authentification |
|---|---|---|
| Génération d’images OpenAI avec facturation API | openai/gpt-image-2 | OPENAI_API_KEY |
| Génération d’images OpenAI avec authentification par abonnement Codex | openai/gpt-image-2 | OpenAI Codex OAuth |
| PNG/WebP à arrière-plan transparent OpenAI | openai/gpt-image-1.5 | OPENAI_API_KEY ou OpenAI Codex OAuth |
| Génération d’images DeepInfra | deepinfra/black-forest-labs/FLUX-1-schnell | DEEPINFRA_API_KEY |
| Génération d’images OpenRouter | openrouter/google/gemini-3.1-flash-image-preview | OPENROUTER_API_KEY |
| Génération d’images LiteLLM | litellm/gpt-image-2 | LITELLM_API_KEY |
| Génération d’images Google Gemini | google/gemini-3.1-flash-image-preview | GEMINI_API_KEY ou GOOGLE_API_KEY |
image_generate gère le texte-vers-image et la modification avec image de référence.
Utilisez image pour une référence ou images pour plusieurs références.
Les indications de sortie prises en charge par le fournisseur, telles que quality, outputFormat et
background, sont transmises lorsqu’elles sont disponibles et signalées comme ignorées lorsqu’un
fournisseur ne les prend pas en charge. La prise en charge intégrée des arrière-plans transparents est
spécifique à OpenAI ; d’autres fournisseurs peuvent tout de même préserver l’alpha PNG si leur
backend l’émet.
Fournisseurs pris en charge
| Fournisseur | Modèle par défaut | Prise en charge de la modification | Authentification |
|---|---|---|---|
| ComfyUI | workflow | Oui (1 image, configurée par le workflow) | COMFY_API_KEY ou COMFY_CLOUD_API_KEY pour le cloud |
| DeepInfra | black-forest-labs/FLUX-1-schnell | Oui (1 image) | DEEPINFRA_API_KEY |
| fal | fal-ai/flux/dev | Oui (limites propres au modèle) | FAL_KEY |
gemini-3.1-flash-image-preview | Oui | GEMINI_API_KEY ou GOOGLE_API_KEY | |
| LiteLLM | gpt-image-2 | Oui (jusqu’à 5 images d’entrée) | LITELLM_API_KEY |
| MiniMax | image-01 | Oui (référence du sujet) | MINIMAX_API_KEY ou MiniMax OAuth (minimax-portal) |
| OpenAI | gpt-image-2 | Oui (jusqu’à 4 images) | OPENAI_API_KEY ou OpenAI Codex OAuth |
| OpenRouter | google/gemini-3.1-flash-image-preview | Oui (jusqu’à 5 images d’entrée) | OPENROUTER_API_KEY |
| Vydra | grok-imagine | Non | VYDRA_API_KEY |
| xAI | grok-imagine-image | Oui (jusqu’à 5 images) | XAI_API_KEY |
action: "list" pour inspecter les fournisseurs et modèles disponibles au moment de l’exécution :
Capacités des fournisseurs
| Capacité | ComfyUI | DeepInfra | fal | MiniMax | OpenAI | Vydra | xAI | |
|---|---|---|---|---|---|---|---|---|
| Génération (nombre max.) | Définie par le workflow | 4 | 4 | 4 | 9 | 4 | 1 | 4 |
| Modification / référence | 1 image (workflow) | 1 image | Flux : 1 ; GPT : 10 ; NB2 : 14 | Jusqu’à 5 images | 1 image (réf. sujet) | Jusqu’à 5 images | - | Jusqu’à 5 images |
| Contrôle de la taille | - | ✓ | ✓ | ✓ | - | Jusqu’à 4K | - | - |
| Rapport d’aspect | - | - | ✓ | ✓ | ✓ | - | - | ✓ |
| Résolution (1K/2K/4K) | - | - | ✓ | ✓ | - | - | - | 1K, 2K |
Paramètres de l’outil
Invite de génération d’image. Requise pour
action: "generate".Utilisez
"list" pour inspecter les fournisseurs et modèles disponibles au moment de l’exécution.Remplacement de fournisseur/modèle (par ex.
openai/gpt-image-2). Utilisez
openai/gpt-image-1.5 pour les arrière-plans OpenAI transparents.Chemin ou URL d’une seule image de référence pour le mode modification.
Plusieurs images de référence pour le mode modification (jusqu’à 5 chez les fournisseurs compatibles).
Indication de taille :
1024x1024, 1536x1024, 1024x1536, 2048x2048, 3840x2160.Rapport d’aspect :
1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9.Indication de résolution.
Indication de qualité lorsque le fournisseur la prend en charge.
Indication de format de sortie lorsque le fournisseur la prend en charge.
Indication d’arrière-plan lorsque le fournisseur la prend en charge. Utilisez
transparent avec
outputFormat: "png" ou "webp" pour les fournisseurs compatibles avec la transparence.Nombre d’images à générer (1-4).
Délai d’expiration facultatif de la requête fournisseur, en millisecondes. Lorsque Codex appelle
image_generate via des outils dynamiques, cette valeur par appel remplace toujours
la valeur par défaut configurée et est plafonnée à 600000 ms.Indication de nom de fichier de sortie.
Indications propres à OpenAI :
background, moderation, outputCompression et user.Tous les fournisseurs ne prennent pas en charge tous les paramètres. Lorsqu’un fournisseur de secours prend en charge une
option de géométrie proche plutôt que celle demandée exactement, OpenClaw remappe vers
la taille, le rapport d’aspect ou la résolution pris en charge les plus proches avant l’envoi.
Les indications de sortie non prises en charge sont supprimées pour les fournisseurs qui ne déclarent pas leur
prise en charge et signalées dans le résultat de l’outil. Les résultats de l’outil indiquent les paramètres
appliqués ;
details.normalization capture toute traduction entre la demande et l’application.Configuration
Sélection du modèle
Ordre de sélection des fournisseurs
OpenClaw essaie les fournisseurs dans cet ordre :- Paramètre
modelde l’appel d’outil (si l’agent en spécifie un). imageGenerationModel.primarydepuis la configuration.imageGenerationModel.fallbacksdans l’ordre.- Détection automatique : valeurs par défaut de fournisseur adossées à l’authentification uniquement :
- fournisseur par défaut actuel en premier ;
- autres fournisseurs de génération d’images enregistrés dans l’ordre des identifiants de fournisseur.
Les remplacements de modèle par appel sont exacts
Les remplacements de modèle par appel sont exacts
Un remplacement
model par appel essaie uniquement ce fournisseur/modèle et ne
poursuit pas vers les fournisseurs primary/fallback configurés ou détectés automatiquement.La détection automatique tient compte de l’authentification
La détection automatique tient compte de l’authentification
Une valeur par défaut de fournisseur n’entre dans la liste des candidats que lorsqu’OpenClaw peut
effectivement authentifier ce fournisseur. Définissez
agents.defaults.mediaGenerationAutoProviderFallback: false pour utiliser uniquement
les entrées explicites model, primary et fallbacks.Délais d’expiration
Délais d’expiration
Définissez
agents.defaults.imageGenerationModel.timeoutMs pour les backends d’images lents.
Un paramètre d’outil timeoutMs par appel remplace la valeur par défaut configurée.
Les appels d’outils dynamiques Codex respectent le même budget de délai d’expiration, limité
par le maximum de 600000 ms du pont d’outils dynamiques d’OpenClaw.Inspecter au moment de l’exécution
Inspecter au moment de l’exécution
Utilisez
action: "list" pour inspecter les fournisseurs actuellement enregistrés,
leurs modèles par défaut et les indications de variables d’environnement d’authentification.Modification d’images
OpenAI, OpenRouter, Google, DeepInfra, fal, MiniMax, ComfyUI et xAI prennent en charge la modification d’images de référence. Fournissez un chemin ou une URL d’image de référence :images. fal prend en charge 1 image de référence pour le Flux image-to-image, jusqu’à 10 pour les modifications GPT Image 2, et jusqu’à 14 pour les modifications Nano Banana 2. MiniMax et ComfyUI en prennent en charge 1.
Analyses approfondies des fournisseurs
OpenAI gpt-image-2 (and gpt-image-1.5)
OpenAI gpt-image-2 (and gpt-image-1.5)
La génération d’images OpenAI utilise
openai/gpt-image-2 par défaut. Si un
profil OAuth openai-codex est configuré, OpenClaw réutilise le même
profil OAuth utilisé par les modèles de chat avec abonnement Codex et envoie la
requête d’image via le backend Codex Responses. Les anciennes URL de base Codex,
comme https://chatgpt.com/backend-api, sont canonisées en
https://chatgpt.com/backend-api/codex pour les requêtes d’image. OpenClaw
ne se rabat pas silencieusement sur OPENAI_API_KEY pour cette requête -
pour forcer un routage direct vers l’API OpenAI Images, configurez
explicitement models.providers.openai avec une clé d’API, une URL de base
personnalisée ou un endpoint Azure.Les modèles openai/gpt-image-1.5, openai/gpt-image-1 et
openai/gpt-image-1-mini peuvent toujours être sélectionnés explicitement. Utilisez
gpt-image-1.5 pour une sortie PNG/WebP à arrière-plan transparent ; l’API
gpt-image-2 actuelle rejette background: "transparent".gpt-image-2 prend en charge à la fois la génération texte-vers-image et
la modification avec image de référence via le même outil image_generate.
OpenClaw transmet prompt, count, size, quality, outputFormat
et les images de référence à OpenAI. OpenAI ne reçoit pas
directement aspectRatio ni resolution ; lorsque c’est possible, OpenClaw
les mappe vers une size prise en charge, sinon l’outil les signale comme
remplacements ignorés.Les options propres à OpenAI se trouvent sous l’objet openai :openai.background accepte transparent, opaque ou auto ;
les sorties transparentes nécessitent un outputFormat png ou webp et un
modèle d’image OpenAI compatible avec la transparence. OpenClaw route les requêtes
par défaut gpt-image-2 à arrière-plan transparent vers gpt-image-1.5.
openai.outputCompression s’applique aux sorties JPEG/WebP.L’indice de premier niveau background est indépendant du fournisseur et se mappe
actuellement vers le même champ de requête OpenAI background lorsque le fournisseur OpenAI
est sélectionné. Les fournisseurs qui ne déclarent pas la prise en charge des arrière-plans le renvoient
dans ignoredOverrides au lieu de recevoir le paramètre non pris en charge.Pour router la génération d’images OpenAI via un déploiement Azure OpenAI
au lieu de api.openai.com, consultez
endpoints Azure OpenAI.OpenRouter image models
OpenRouter image models
La génération d’images OpenRouter utilise la même OpenClaw transmet
OPENROUTER_API_KEY et
passe par l’API d’images des complétions de chat d’OpenRouter. Sélectionnez
les modèles d’image OpenRouter avec le préfixe openrouter/ :prompt, count, les images de référence, ainsi que les
indices aspectRatio / resolution compatibles Gemini à OpenRouter.
Les raccourcis intégrés actuels de modèles d’image OpenRouter incluent
google/gemini-3.1-flash-image-preview,
google/gemini-3-pro-image-preview et openai/gpt-5.4-image-2. Utilisez
action: "list" pour voir ce qu’expose votre plugin configuré.MiniMax dual-auth
MiniMax dual-auth
La génération d’images MiniMax est disponible via les deux chemins d’authentification MiniMax
intégrés :
minimax/image-01pour les configurations avec clé d’APIminimax-portal/image-01pour les configurations OAuth
xAI grok-imagine-image
xAI grok-imagine-image
Le fournisseur xAI intégré utilise
/v1/images/generations pour les requêtes
avec prompt uniquement et /v1/images/edits lorsque image ou images est présent.- Modèles :
xai/grok-imagine-image,xai/grok-imagine-image-pro - Nombre : jusqu’à 4
- Références : une
imageou jusqu’à cinqimages - Formats d’image :
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - Résolutions :
1K,2K - Sorties : renvoyées sous forme de pièces jointes d’image gérées par OpenClaw
quality, mask,
user ni les formats d’image supplémentaires propres à xAI tant que ces contrôles n’existent pas
dans le contrat partagé inter-fournisseurs image_generate.Exemples
- Generate (4K landscape)
- Generate (transparent PNG)
- Generate (two square)
- Edit (one reference)
- Edit (multiple references)
--output-format et --background sont disponibles sur
openclaw infer image edit ; --openai-background reste un alias
spécifique à OpenAI. Les fournisseurs intégrés autres qu’OpenAI ne déclarent
pas aujourd’hui de contrôle explicite de l’arrière-plan ; background: "transparent" est donc signalé
comme ignoré pour eux.
Voir aussi
- Vue d’ensemble des outils - tous les outils d’agent disponibles
- ComfyUI - configuration des workflows ComfyUI local et Comfy Cloud
- fal - configuration du fournisseur d’images et de vidéos fal
- Google (Gemini) - configuration du fournisseur d’images Gemini
- MiniMax - configuration du fournisseur d’images MiniMax
- OpenAI - configuration du fournisseur OpenAI Images
- Vydra - configuration des images, vidéos et de la parole Vydra
- xAI - configuration de Grok pour l’image, la vidéo, la recherche, l’exécution de code et TTS
- Référence de configuration - configuration
imageGenerationModel - Modèles - configuration des modèles et basculement en cas d’échec