Vai al contenuto principale

Generazione di immagini

Lo strumento image_generate consente all’agente di creare e modificare immagini usando i provider configurati. Le immagini generate vengono recapitate automaticamente come allegati multimediali nella risposta dell’agente.
Lo strumento appare solo quando è disponibile almeno un provider per la generazione di immagini. Se non vedi image_generate tra gli strumenti del tuo agente, configura agents.defaults.imageGenerationModel oppure imposta una chiave API del provider.

Avvio rapido

  1. Imposta una chiave API per almeno un provider (per esempio OPENAI_API_KEY o GEMINI_API_KEY).
  2. Facoltativamente imposta il modello preferito:
{
  agents: {
    defaults: {
      imageGenerationModel: "openai/gpt-image-1",
    },
  },
}
  1. Chiedi all’agente: “Genera un’immagine di una mascotte aragosta amichevole.”
L’agente chiama automaticamente image_generate. Nessuna allow-listing dello strumento necessaria: è abilitato per impostazione predefinita quando è disponibile un provider.

Provider supportati

ProviderModello predefinitoSupporto modificaChiave API
OpenAIgpt-image-1Sì (fino a 5 immagini)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewGEMINI_API_KEY o GOOGLE_API_KEY
falfal-ai/flux/devFAL_KEY
MiniMaximage-01Sì (riferimento soggetto)MINIMAX_API_KEY o OAuth MiniMax (minimax-portal)
Usa action: "list" per ispezionare provider e modelli disponibili a runtime:
/tool image_generate action=list

Parametri dello strumento

ParametroTipoDescrizione
promptstringPrompt per la generazione dell’immagine (obbligatorio per action: "generate")
actionstring"generate" (predefinito) oppure "list" per ispezionare i provider
modelstringOverride provider/modello, per esempio openai/gpt-image-1
imagestringSingolo percorso immagine di riferimento o URL per la modalità modifica
imagesstring[]Più immagini di riferimento per la modalità modifica (fino a 5)
sizestringSuggerimento dimensione: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostringProporzioni: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstringSuggerimento risoluzione: 1K, 2K o 4K
countnumberNumero di immagini da generare (1–4)
filenamestringSuggerimento per il nome file di output
Non tutti i provider supportano tutti i parametri. Lo strumento passa quelli supportati da ciascun provider e ignora gli altri.

Configurazione

Selezione del modello

{
  agents: {
    defaults: {
      // Forma stringa: solo modello primario
      imageGenerationModel: "google/gemini-3.1-flash-image-preview",

      // Forma oggetto: primario + fallback ordinati
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

Ordine di selezione del provider

Quando genera un’immagine, OpenClaw prova i provider in questo ordine:
  1. Parametro model dalla chiamata dello strumento (se l’agente ne specifica uno)
  2. imageGenerationModel.primary dalla configurazione
  3. imageGenerationModel.fallbacks in ordine
  4. Rilevamento automatico — usa solo i valori predefiniti dei provider supportati da auth:
    • prima il provider predefinito corrente
    • poi i restanti provider di generazione immagini registrati in ordine di ID provider
Se un provider fallisce (errore auth, limite di frequenza, ecc.), il candidato successivo viene provato automaticamente. Se tutti falliscono, l’errore include i dettagli di ciascun tentativo. Note:
  • Il rilevamento automatico è consapevole dell’auth. Un valore predefinito del provider entra nell’elenco dei candidati solo quando OpenClaw può effettivamente autenticare quel provider.
  • Usa action: "list" per ispezionare i provider attualmente registrati, i loro modelli predefiniti e i suggerimenti sulle variabili d’ambiente di auth.

Modifica delle immagini

OpenAI, Google, fal e MiniMax supportano la modifica di immagini di riferimento. Passa un percorso immagine di riferimento o un URL:
"Genera una versione ad acquerello di questa foto" + image: "/path/to/photo.jpg"
OpenAI e Google supportano fino a 5 immagini di riferimento tramite il parametro images. fal e MiniMax ne supportano 1. La generazione di immagini MiniMax è disponibile tramite entrambi i percorsi auth MiniMax bundled:
  • minimax/image-01 per configurazioni con chiave API
  • minimax-portal/image-01 per configurazioni OAuth

Capacità del provider

CapacitàOpenAIGooglefalMiniMax
GenerazioneSì (fino a 4)Sì (fino a 4)Sì (fino a 4)Sì (fino a 9)
Modifica/riferimentoSì (fino a 5 immagini)Sì (fino a 5 immagini)Sì (1 immagine)Sì (1 immagine, riferimento soggetto)
Controllo dimensioneNo
ProporzioniNoSì (solo generazione)
Risoluzione (1K/2K/4K)NoNo

Correlati