Zum Hauptinhalt springen

Bildgenerierung

Mit dem Tool image_generate kann der Agent Bilder mit Ihren konfigurierten Providern erstellen und bearbeiten. Generierte Bilder werden automatisch als Medienanhänge in der Antwort des Agenten zugestellt.
Das Tool wird nur angezeigt, wenn mindestens ein Provider für die Bildgenerierung verfügbar ist. Wenn image_generate nicht in den Tools Ihres Agenten erscheint, konfigurieren Sie agents.defaults.imageGenerationModel oder richten Sie einen API-Key für einen Provider ein.

Schnellstart

  1. Legen Sie für mindestens einen Provider einen API-Key fest (zum Beispiel OPENAI_API_KEY oder GEMINI_API_KEY).
  2. Legen Sie optional Ihr bevorzugtes Modell fest:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
      },
    },
  },
}
  1. Fragen Sie den Agenten: „Erstelle ein Bild eines freundlichen Hummer-Maskottchens.“
Der Agent ruft image_generate automatisch auf. Keine Tool-Allowlist nötig — es ist standardmäßig aktiviert, wenn ein Provider verfügbar ist.

Unterstützte Provider

ProviderStandardmodellUnterstützung für BearbeitungAPI-Key
OpenAIgpt-image-1Ja (bis zu 5 Bilder)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewJaGEMINI_API_KEY oder GOOGLE_API_KEY
falfal-ai/flux/devJaFAL_KEY
MiniMaximage-01Ja (Subjektreferenz)MINIMAX_API_KEY oder MiniMax OAuth (minimax-portal)
ComfyUIworkflowJa (1 Bild, workflowkonfiguriert)COMFY_API_KEY oder COMFY_CLOUD_API_KEY für Cloud
Vydragrok-imagineNeinVYDRA_API_KEY
Verwenden Sie action: "list", um verfügbare Provider und Modelle zur Laufzeit zu prüfen:
/tool image_generate action=list

Tool-Parameter

ParameterTypBeschreibung
promptstringPrompt für die Bildgenerierung (erforderlich für action: "generate")
actionstring"generate" (Standard) oder "list" zum Prüfen von Providern
modelstringProvider-/Modellüberschreibung, z. B. openai/gpt-image-1
imagestringEinzelner Referenzbildpfad oder URL für den Bearbeitungsmodus
imagesstring[]Mehrere Referenzbilder für den Bearbeitungsmodus (bis zu 5)
sizestringGrößenhinweis: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostringSeitenverhältnis: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstringAuflösungshinweis: 1K, 2K oder 4K
countnumberAnzahl der zu generierenden Bilder (1–4)
filenamestringHinweis für den Ausgabedateinamen
Nicht alle Provider unterstützen alle Parameter. Wenn ein Fallback-Provider statt der exakt angeforderten Geometrieoption eine ähnliche unterstützt, mappt OpenClaw vor dem Absenden auf die nächstunterstützte Größe, das nächstunterstützte Seitenverhältnis oder die nächstunterstützte Auflösung um. Wirklich nicht unterstützte Überschreibungen werden weiterhin im Tool-Ergebnis gemeldet. Tool-Ergebnisse melden die angewendeten Einstellungen. Wenn OpenClaw die Geometrie während eines Provider-Fallbacks ummappt, spiegeln die zurückgegebenen Werte size, aspectRatio und resolution wider, was tatsächlich gesendet wurde, und details.normalization erfasst die Umwandlung von angefordert zu angewendet.

Konfiguration

Modellauswahl

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

Reihenfolge der Providerauswahl

Bei der Generierung eines Bildes versucht OpenClaw Provider in dieser Reihenfolge:
  1. Parameter model aus dem Tool-Aufruf (wenn der Agent einen angibt)
  2. imageGenerationModel.primary aus der Konfiguration
  3. imageGenerationModel.fallbacks in Reihenfolge
  4. Automatische Erkennung — verwendet nur auth-gestützte Provider-Standards:
    • aktueller Standard-Provider zuerst
    • verbleibende registrierte Provider für Bildgenerierung in Provider-ID-Reihenfolge
Wenn ein Provider fehlschlägt (Auth-Fehler, Ratenlimit usw.), wird automatisch der nächste Kandidat versucht. Wenn alle fehlschlagen, enthält der Fehler Details aus jedem Versuch. Hinweise:
  • Die automatische Erkennung ist auth-bewusst. Ein Provider-Standard gelangt nur dann in die Kandidatenliste, wenn OpenClaw diesen Provider tatsächlich authentifizieren kann.
  • Die automatische Erkennung ist standardmäßig aktiviert. Setzen Sie agents.defaults.mediaGenerationAutoProviderFallback: false, wenn Sie möchten, dass die Bild- generierung nur die expliziten Einträge model, primary und fallbacks verwendet.
  • Verwenden Sie action: "list", um die aktuell registrierten Provider, ihre Standardmodelle und Hinweise zu Auth-Env-Variablen zu prüfen.

Bildbearbeitung

OpenAI, Google, fal, MiniMax und ComfyUI unterstützen die Bearbeitung von Referenzbildern. Übergeben Sie einen Pfad oder eine URL zu einem Referenzbild:
"Erzeuge eine Aquarellversion dieses Fotos" + image: "/path/to/photo.jpg"
OpenAI und Google unterstützen über den Parameter images bis zu 5 Referenzbilder. fal, MiniMax und ComfyUI unterstützen 1. Die Bildgenerierung von MiniMax ist über beide gebündelten MiniMax-Auth-Pfade verfügbar:
  • minimax/image-01 für Setups mit API-Key
  • minimax-portal/image-01 für Setups mit OAuth

Provider-Fähigkeiten

FähigkeitOpenAIGooglefalMiniMaxComfyUIVydra
GenerierenJa (bis zu 4)Ja (bis zu 4)Ja (bis zu 4)Ja (bis zu 9)Ja (workflowdefinierte Ausgaben)Ja (1)
Bearbeiten/ReferenzJa (bis zu 5 Bilder)Ja (bis zu 5 Bilder)Ja (1 Bild)Ja (1 Bild, Subjektreferenz)Ja (1 Bild, workflowkonfiguriert)Nein
GrößensteuerungJaJaJaNeinNeinNein
SeitenverhältnisNeinJaJa (nur generieren)JaNeinNein
Auflösung (1K/2K/4K)NeinJaJaNeinNeinNein

Verwandt

  • Tools Overview — alle verfügbaren Agenten-Tools
  • fal — Einrichtung des Bild- und Video-Providers fal
  • ComfyUI — Einrichtung von lokalem ComfyUI und Comfy Cloud-Workflows
  • Google (Gemini) — Einrichtung des Bild-Providers Gemini
  • MiniMax — Einrichtung des Bild-Providers MiniMax
  • OpenAI — Einrichtung des Providers OpenAI Images
  • Vydra — Einrichtung von Bild, Video und Speech für Vydra
  • Configuration Reference — Konfiguration imageGenerationModel
  • Models — Modellkonfiguration und Failover