Naar hoofdinhoud gaan

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

De tool image_generate laat de agent afbeeldingen maken en bewerken met je geconfigureerde providers. Gegenereerde afbeeldingen worden automatisch als media- bijlagen in het antwoord van de agent geleverd.
De tool verschijnt alleen wanneer er ten minste één provider voor afbeeldingsgeneratie beschikbaar is. Als je image_generate niet ziet in de tools van je agent, configureer dan agents.defaults.imageGenerationModel, stel een provider-API-sleutel in, of meld je aan met OpenAI Codex OAuth.

Snel aan de slag

1

Authenticatie configureren

Stel een API-sleutel in voor ten minste één provider (bijvoorbeeld OPENAI_API_KEY, GEMINI_API_KEY, OPENROUTER_API_KEY) of meld je aan met OpenAI Codex OAuth.
2

Kies een standaardmodel (optioneel)

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-2",
        timeoutMs: 180_000,
      },
    },
  },
}
Codex OAuth gebruikt dezelfde modelverwijzing openai/gpt-image-2. Wanneer een OAuth-profiel openai-codex is geconfigureerd, routeert OpenClaw afbeeldings- aanvragen via dat OAuth-profiel in plaats van eerst OPENAI_API_KEY te proberen. Expliciete configuratie van models.providers.openai (API-sleutel, aangepaste/Azure-basis-URL) kiest weer voor de directe route via de OpenAI Images API.
3

Vraag het de agent

“Genereer een afbeelding van een vriendelijke robotmascotte.”De agent roept image_generate automatisch aan. Er is geen toestemmingslijst voor tools nodig — het is standaard ingeschakeld wanneer er een provider beschikbaar is.
Voor OpenAI-compatibele LAN-eindpunten zoals LocalAI behoud je de aangepaste models.providers.openai.baseUrl en kies je expliciet voor browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true. Privé- en interne afbeeldingseindpunten blijven standaard geblokkeerd.

Algemene routes

DoelModelverwijzingAuth
OpenAI-afbeeldingsgeneratie met API-factureringopenai/gpt-image-2OPENAI_API_KEY
OpenAI-afbeeldingsgeneratie met Codex-abonnementsauthopenai/gpt-image-2OpenAI Codex OAuth
OpenAI PNG/WebP met transparante achtergrondopenai/gpt-image-1.5OPENAI_API_KEY of OpenAI Codex OAuth
DeepInfra-afbeeldingsgeneratiedeepinfra/black-forest-labs/FLUX-1-schnellDEEPINFRA_API_KEY
OpenRouter-afbeeldingsgeneratieopenrouter/google/gemini-3.1-flash-image-previewOPENROUTER_API_KEY
LiteLLM-afbeeldingsgeneratielitellm/gpt-image-2LITELLM_API_KEY
Google Gemini-afbeeldingsgeneratiegoogle/gemini-3.1-flash-image-previewGEMINI_API_KEY of GOOGLE_API_KEY
Dezelfde tool image_generate verwerkt tekst-naar-afbeelding en bewerking met referentieafbeeldingen. Gebruik image voor één referentie of images voor meerdere referenties. Door de provider ondersteunde uitvoerhints zoals quality, outputFormat en background worden doorgestuurd wanneer beschikbaar en gerapporteerd als genegeerd wanneer een provider ze niet ondersteunt. Gebundelde ondersteuning voor transparante achtergronden is specifiek voor OpenAI; andere providers kunnen PNG-alpha nog steeds behouden als hun backend die uitvoert.

Ondersteunde providers

ProviderStandaardmodelBewerkingsondersteuningAuth
ComfyUIworkflowJa (1 afbeelding, workflow-geconfigureerd)COMFY_API_KEY of COMFY_CLOUD_API_KEY voor cloud
DeepInfrablack-forest-labs/FLUX-1-schnellJa (1 afbeelding)DEEPINFRA_API_KEY
falfal-ai/flux/devJaFAL_KEY
Googlegemini-3.1-flash-image-previewJaGEMINI_API_KEY of GOOGLE_API_KEY
LiteLLMgpt-image-2Ja (tot 5 invoerafbeeldingen)LITELLM_API_KEY
MiniMaximage-01Ja (onderwerpreferentie)MINIMAX_API_KEY of MiniMax OAuth (minimax-portal)
OpenAIgpt-image-2Ja (tot 4 afbeeldingen)OPENAI_API_KEY of OpenAI Codex OAuth
OpenRoutergoogle/gemini-3.1-flash-image-previewJa (tot 5 invoerafbeeldingen)OPENROUTER_API_KEY
Vydragrok-imagineNeeVYDRA_API_KEY
xAIgrok-imagine-imageJa (tot 5 afbeeldingen)XAI_API_KEY
Gebruik action: "list" om beschikbare providers en modellen tijdens runtime te inspecteren:
/tool image_generate action=list

Providermogelijkheden

MogelijkheidComfyUIDeepInfrafalGoogleMiniMaxOpenAIVydraxAI
Genereren (max. aantal)Workflow-gedefinieerd4449414
Bewerken / referentie1 afbeelding (workflow)1 afbeelding1 afbeeldingTot 5 afbeeldingen1 afbeelding (onderwerpreferentie)Tot 5 afbeeldingenTot 5 afbeeldingen
GrootteregelingTot 4K
Beeldverhouding✓ (alleen genereren)
Resolutie (1K/2K/4K)1K, 2K

Toolparameters

prompt
string
vereist
Prompt voor afbeeldingsgeneratie. Vereist voor action: "generate".
action
"generate" | "list"
standaard:"generate"
Gebruik "list" om beschikbare providers en modellen tijdens runtime te inspecteren.
model
string
Provider-/modeloverride (bijv. openai/gpt-image-2). Gebruik openai/gpt-image-1.5 voor transparante OpenAI-achtergronden.
image
string
Pad of URL naar één referentieafbeelding voor bewerkingsmodus.
images
string[]
Meerdere referentieafbeeldingen voor bewerkingsmodus (tot 5 bij ondersteunende providers).
size
string
Groottehint: 1024x1024, 1536x1024, 1024x1536, 2048x2048, 3840x2160.
aspectRatio
string
Beeldverhouding: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9.
resolution
"1K" | "2K" | "4K"
Resolutiehint.
quality
"low" | "medium" | "high" | "auto"
Kwaliteitshint wanneer de provider die ondersteunt.
outputFormat
"png" | "jpeg" | "webp"
Hint voor uitvoerindeling wanneer de provider die ondersteunt.
background
"transparent" | "opaque" | "auto"
Achtergrondhint wanneer de provider die ondersteunt. Gebruik transparent met outputFormat: "png" of "webp" voor providers die transparantie ondersteunen.
count
number
Aantal te genereren afbeeldingen (1–4).
timeoutMs
number
Optionele time-out voor providerverzoek in milliseconden.
filename
string
Hint voor uitvoerbestandsnaam.
openai
object
Alleen-OpenAI-hints: background, moderation, outputCompression en user.
Niet alle providers ondersteunen alle parameters. Wanneer een fallbackprovider een verwante geometrieoptie ondersteunt in plaats van de exact aangevraagde, wijst OpenClaw vóór indiening opnieuw toe naar de dichtstbijzijnde ondersteunde grootte, beeldverhouding of resolutie. Niet-ondersteunde uitvoerhints worden weggelaten voor providers die ondersteuning niet declareren en worden in het toolresultaat gerapporteerd. Toolresultaten rapporteren de toegepaste instellingen; details.normalization legt elke vertaling van aangevraagd naar toegepast vast.

Configuratie

Modelselectie

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-2",
        timeoutMs: 180_000,
        fallbacks: [
          "openrouter/google/gemini-3.1-flash-image-preview",
          "google/gemini-3.1-flash-image-preview",
          "fal/fal-ai/flux/dev",
        ],
      },
    },
  },
}

Providerselectievolgorde

OpenClaw probeert providers in deze volgorde:
  1. model-parameter uit de toolaanroep (als de agent er een opgeeft).
  2. imageGenerationModel.primary uit configuratie.
  3. imageGenerationModel.fallbacks op volgorde.
  4. Automatische detectie — alleen auth-gedekte providerstandaarden:
    • huidige standaardprovider eerst;
    • resterende geregistreerde providers voor afbeeldingsgeneratie op volgorde van provider-id.
Als een provider faalt (authenticatiefout, snelheidslimiet, enz.), wordt de volgende geconfigureerde kandidaat automatisch geprobeerd. Als alles faalt, bevat de fout details van elke poging.
Een model-override per aanroep probeert alleen die provider/dat model en gaat niet door naar geconfigureerde primaire/fallback- of automatisch gedetecteerde providers.
Een providerstandaard komt alleen in de kandidatenlijst wanneer OpenClaw die provider daadwerkelijk kan authenticeren. Stel agents.defaults.mediaGenerationAutoProviderFallback: false in om alleen expliciete vermeldingen voor model, primary en fallbacks te gebruiken.
Stel agents.defaults.imageGenerationModel.timeoutMs in voor trage afbeeldings- backends. Een timeoutMs-toolparameter per aanroep overschrijft de geconfigureerde standaardwaarde.
Gebruik action: "list" om de momenteel geregistreerde providers, hun standaardmodellen en auth-env-var-hints te inspecteren.

Afbeeldingen bewerken

OpenAI, OpenRouter, Google, DeepInfra, fal, MiniMax, ComfyUI en xAI ondersteunen het bewerken van referentieafbeeldingen. Geef een pad of URL naar een referentieafbeelding door:
"Genereer een aquarelversie van deze foto" + image: "/path/to/photo.jpg"
OpenAI, OpenRouter, Google en xAI ondersteunen tot 5 referentieafbeeldingen via de parameter images. fal, MiniMax en ComfyUI ondersteunen er 1.

Diepgaande informatie per provider

OpenAI-afbeeldingsgeneratie gebruikt standaard openai/gpt-image-2. Als er een openai-codex OAuth-profiel is geconfigureerd, hergebruikt OpenClaw hetzelfde OAuth-profiel dat door Codex-abonnementschatmodellen wordt gebruikt en stuurt het de afbeeldingsaanvraag via de Codex Responses-backend. Verouderde Codex-basis- URL’s zoals https://chatgpt.com/backend-api worden voor afbeeldingsaanvragen gecanoniseerd naar https://chatgpt.com/backend-api/codex. OpenClaw valt voor die aanvraag niet stilzwijgend terug op OPENAI_API_KEY — configureer models.providers.openai expliciet met een API-sleutel, aangepaste basis-URL of Azure-eindpunt om directe routering via de OpenAI Images API af te dwingen.De modellen openai/gpt-image-1.5, openai/gpt-image-1 en openai/gpt-image-1-mini kunnen nog steeds expliciet worden geselecteerd. Gebruik gpt-image-1.5 voor PNG/WebP-uitvoer met transparante achtergrond; de huidige gpt-image-2-API weigert background: "transparent".gpt-image-2 ondersteunt zowel tekst-naar-afbeelding-generatie als bewerking met referentieafbeeldingen via dezelfde image_generate-tool. OpenClaw stuurt prompt, count, size, quality, outputFormat en referentieafbeeldingen door naar OpenAI. OpenAI ontvangt aspectRatio of resolution niet rechtstreeks; waar mogelijk zet OpenClaw deze om naar een ondersteunde size, anders meldt de tool ze als genegeerde overrides.OpenAI-specifieke opties staan onder het object openai:
{
  "quality": "low",
  "outputFormat": "jpeg",
  "openai": {
    "background": "opaque",
    "moderation": "low",
    "outputCompression": 60,
    "user": "end-user-42"
  }
}
openai.background accepteert transparent, opaque of auto; transparante uitvoer vereist outputFormat png of webp en een OpenAI-afbeeldingsmodel dat transparantie ondersteunt. OpenClaw routeert standaard gpt-image-2-aanvragen met transparante achtergrond naar gpt-image-1.5. openai.outputCompression is van toepassing op JPEG/WebP-uitvoer.De hint background op het hoogste niveau is providerneutraal en wordt momenteel gekoppeld aan hetzelfde OpenAI-aanvraagveld background wanneer de OpenAI-provider is geselecteerd. Providers die geen achtergrondondersteuning declareren, retourneren deze in ignoredOverrides in plaats van de niet-ondersteunde parameter te ontvangen.Zie Azure OpenAI-eindpunten om OpenAI-afbeeldingsgeneratie via een Azure OpenAI-implementatie te routeren in plaats van via api.openai.com.
OpenRouter-afbeeldingsgeneratie gebruikt dezelfde OPENROUTER_API_KEY en routeert via OpenRouter’s chat completions-afbeeldings-API. Selecteer OpenRouter-afbeeldingsmodellen met het voorvoegsel openrouter/:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openrouter/google/gemini-3.1-flash-image-preview",
      },
    },
  },
}
OpenClaw stuurt prompt, count, referentieafbeeldingen en Gemini-compatibele hints voor aspectRatio / resolution door naar OpenRouter. Huidige ingebouwde snelkoppelingen voor OpenRouter-afbeeldingsmodellen omvatten google/gemini-3.1-flash-image-preview, google/gemini-3-pro-image-preview en openai/gpt-5.4-image-2. Gebruik action: "list" om te zien wat je geconfigureerde Plugin blootstelt.
MiniMax-afbeeldingsgeneratie is beschikbaar via beide gebundelde MiniMax- authenticatiepaden:
  • minimax/image-01 voor configuraties met API-sleutel
  • minimax-portal/image-01 voor configuraties met OAuth
De gebundelde xAI-provider gebruikt /v1/images/generations voor aanvragen met alleen een prompt en /v1/images/edits wanneer image of images aanwezig is.
  • Modellen: xai/grok-imagine-image, xai/grok-imagine-image-pro
  • Aantal: tot 4
  • Referenties: één image of maximaal vijf images
  • Beeldverhoudingen: 1:1, 16:9, 9:16, 4:3, 3:4, 2:3, 3:2
  • Resoluties: 1K, 2K
  • Uitvoer: geretourneerd als door OpenClaw beheerde afbeeldingsbijlagen
OpenClaw stelt bewust geen xAI-native quality, mask, user of extra native-only beeldverhoudingen beschikbaar totdat die bedieningselementen bestaan in het gedeelde provideroverschrijdende image_generate-contract.

Voorbeelden

/tool image_generate action=generate model=openai/gpt-image-2 prompt="A clean editorial poster for OpenClaw image generation" size=3840x2160 count=1
Dezelfde flags --output-format en --background zijn beschikbaar op openclaw infer image edit; --openai-background blijft een OpenAI-specifieke alias. Andere gebundelde providers dan OpenAI declareren momenteel geen expliciete achtergrondbediening, dus background: "transparent" wordt voor hen als genegeerd gemeld.

Gerelateerd

  • Toolsoverzicht — alle beschikbare agenttools
  • ComfyUI — configuratie van lokale ComfyUI- en Comfy Cloud-workflows
  • fal — configuratie van de fal-provider voor afbeeldingen en video
  • Google (Gemini) — configuratie van de Gemini-afbeeldingsprovider
  • MiniMax — configuratie van de MiniMax-afbeeldingsprovider
  • OpenAI — configuratie van de OpenAI Images-provider
  • Vydra — configuratie van Vydra voor afbeeldingen, video en spraak
  • xAI — configuratie van Grok voor afbeeldingen, video, zoeken, code-uitvoering en TTS
  • ConfiguratiereferentieimageGenerationModel-configuratie
  • Modellen — modelconfiguratie en failover