Bildgenerierung
Mit dem Tool image_generate kann der Agent Bilder mit Ihren konfigurierten Providern erstellen und bearbeiten. Generierte Bilder werden automatisch als Medienanhänge in der Antwort des Agenten zugestellt.
Das Tool wird nur angezeigt, wenn mindestens ein Provider für die Bildgenerierung verfügbar ist. Wenn image_generate nicht in den Tools Ihres Agenten erscheint, konfigurieren Sie agents.defaults.imageGenerationModel oder richten Sie einen API-Key für einen Provider ein.
Schnellstart
- Legen Sie für mindestens einen Provider einen API-Key fest (zum Beispiel
OPENAI_API_KEY oder GEMINI_API_KEY).
- Legen Sie optional Ihr bevorzugtes Modell fest:
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-1",
},
},
},
}
- Fragen Sie den Agenten: „Erstelle ein Bild eines freundlichen Hummer-Maskottchens.“
Der Agent ruft image_generate automatisch auf. Keine Tool-Allowlist nötig — es ist standardmäßig aktiviert, wenn ein Provider verfügbar ist.
Unterstützte Provider
| Provider | Standardmodell | Unterstützung für Bearbeitung | API-Key |
|---|
| OpenAI | gpt-image-1 | Ja (bis zu 5 Bilder) | OPENAI_API_KEY |
| Google | gemini-3.1-flash-image-preview | Ja | GEMINI_API_KEY oder GOOGLE_API_KEY |
| fal | fal-ai/flux/dev | Ja | FAL_KEY |
| MiniMax | image-01 | Ja (Subjektreferenz) | MINIMAX_API_KEY oder MiniMax OAuth (minimax-portal) |
| ComfyUI | workflow | Ja (1 Bild, workflowkonfiguriert) | COMFY_API_KEY oder COMFY_CLOUD_API_KEY für Cloud |
| Vydra | grok-imagine | Nein | VYDRA_API_KEY |
Verwenden Sie action: "list", um verfügbare Provider und Modelle zur Laufzeit zu prüfen:
/tool image_generate action=list
| Parameter | Typ | Beschreibung |
|---|
prompt | string | Prompt für die Bildgenerierung (erforderlich für action: "generate") |
action | string | "generate" (Standard) oder "list" zum Prüfen von Providern |
model | string | Provider-/Modellüberschreibung, z. B. openai/gpt-image-1 |
image | string | Einzelner Referenzbildpfad oder URL für den Bearbeitungsmodus |
images | string[] | Mehrere Referenzbilder für den Bearbeitungsmodus (bis zu 5) |
size | string | Größenhinweis: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024 |
aspectRatio | string | Seitenverhältnis: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
resolution | string | Auflösungshinweis: 1K, 2K oder 4K |
count | number | Anzahl der zu generierenden Bilder (1–4) |
filename | string | Hinweis für den Ausgabedateinamen |
Nicht alle Provider unterstützen alle Parameter. Wenn ein Fallback-Provider statt der exakt angeforderten Geometrieoption eine ähnliche unterstützt, mappt OpenClaw vor dem Absenden auf die nächstunterstützte Größe, das nächstunterstützte Seitenverhältnis oder die nächstunterstützte Auflösung um. Wirklich nicht unterstützte Überschreibungen werden weiterhin im Tool-Ergebnis gemeldet.
Tool-Ergebnisse melden die angewendeten Einstellungen. Wenn OpenClaw die Geometrie während eines Provider-Fallbacks ummappt, spiegeln die zurückgegebenen Werte size, aspectRatio und resolution wider, was tatsächlich gesendet wurde, und details.normalization erfasst die Umwandlung von angefordert zu angewendet.
Konfiguration
Modellauswahl
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-1",
fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
},
},
},
}
Reihenfolge der Providerauswahl
Bei der Generierung eines Bildes versucht OpenClaw Provider in dieser Reihenfolge:
- Parameter
model aus dem Tool-Aufruf (wenn der Agent einen angibt)
imageGenerationModel.primary aus der Konfiguration
imageGenerationModel.fallbacks in Reihenfolge
- Automatische Erkennung — verwendet nur auth-gestützte Provider-Standards:
- aktueller Standard-Provider zuerst
- verbleibende registrierte Provider für Bildgenerierung in Provider-ID-Reihenfolge
Wenn ein Provider fehlschlägt (Auth-Fehler, Ratenlimit usw.), wird automatisch der nächste Kandidat versucht. Wenn alle fehlschlagen, enthält der Fehler Details aus jedem Versuch.
Hinweise:
- Die automatische Erkennung ist auth-bewusst. Ein Provider-Standard gelangt nur dann in die Kandidatenliste,
wenn OpenClaw diesen Provider tatsächlich authentifizieren kann.
- Die automatische Erkennung ist standardmäßig aktiviert. Setzen Sie
agents.defaults.mediaGenerationAutoProviderFallback: false, wenn Sie möchten, dass die Bild-
generierung nur die expliziten Einträge model, primary und fallbacks
verwendet.
- Verwenden Sie
action: "list", um die aktuell registrierten Provider, ihre
Standardmodelle und Hinweise zu Auth-Env-Variablen zu prüfen.
Bildbearbeitung
OpenAI, Google, fal, MiniMax und ComfyUI unterstützen die Bearbeitung von Referenzbildern. Übergeben Sie einen Pfad oder eine URL zu einem Referenzbild:
"Erzeuge eine Aquarellversion dieses Fotos" + image: "/path/to/photo.jpg"
OpenAI und Google unterstützen über den Parameter images bis zu 5 Referenzbilder. fal, MiniMax und ComfyUI unterstützen 1.
Die Bildgenerierung von MiniMax ist über beide gebündelten MiniMax-Auth-Pfade verfügbar:
minimax/image-01 für Setups mit API-Key
minimax-portal/image-01 für Setups mit OAuth
Provider-Fähigkeiten
| Fähigkeit | OpenAI | Google | fal | MiniMax | ComfyUI | Vydra |
|---|
| Generieren | Ja (bis zu 4) | Ja (bis zu 4) | Ja (bis zu 4) | Ja (bis zu 9) | Ja (workflowdefinierte Ausgaben) | Ja (1) |
| Bearbeiten/Referenz | Ja (bis zu 5 Bilder) | Ja (bis zu 5 Bilder) | Ja (1 Bild) | Ja (1 Bild, Subjektreferenz) | Ja (1 Bild, workflowkonfiguriert) | Nein |
| Größensteuerung | Ja | Ja | Ja | Nein | Nein | Nein |
| Seitenverhältnis | Nein | Ja | Ja (nur generieren) | Ja | Nein | Nein |
| Auflösung (1K/2K/4K) | Nein | Ja | Ja | Nein | Nein | Nein |
Verwandt
- Tools Overview — alle verfügbaren Agenten-Tools
- fal — Einrichtung des Bild- und Video-Providers fal
- ComfyUI — Einrichtung von lokalem ComfyUI und Comfy Cloud-Workflows
- Google (Gemini) — Einrichtung des Bild-Providers Gemini
- MiniMax — Einrichtung des Bild-Providers MiniMax
- OpenAI — Einrichtung des Providers OpenAI Images
- Vydra — Einrichtung von Bild, Video und Speech für Vydra
- Configuration Reference — Konfiguration
imageGenerationModel
- Models — Modellkonfiguration und Failover