Zum Hauptinhalt springen

Bildgenerierung

Das Tool image_generate ermöglicht dem Agenten, mit Ihren konfigurierten Providern Bilder zu erstellen und zu bearbeiten. Generierte Bilder werden automatisch als Medienanhänge in der Antwort des Agenten bereitgestellt.
Das Tool erscheint nur, wenn mindestens ein Provider für Bildgenerierung verfügbar ist. Wenn image_generate in den Tools Ihres Agenten nicht angezeigt wird, konfigurieren Sie agents.defaults.imageGenerationModel oder richten Sie einen API-Key für einen Provider ein.

Schnellstart

  1. Setzen Sie einen API-Key für mindestens einen Provider (zum Beispiel OPENAI_API_KEY oder GEMINI_API_KEY).
  2. Legen Sie optional Ihr bevorzugtes Model fest:
{
  agents: {
    defaults: {
      imageGenerationModel: "openai/gpt-image-1",
    },
  },
}
  1. Fragen Sie den Agenten: “Generate an image of a friendly lobster mascot.”
Der Agent ruft image_generate automatisch auf. Keine Allowlist für Tools nötig — es ist standardmäßig aktiviert, wenn ein Provider verfügbar ist.

Unterstützte Provider

ProviderStandard-ModelUnterstützung für BearbeitungAPI-Key
OpenAIgpt-image-1Ja (bis zu 5 Bilder)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewJaGEMINI_API_KEY oder GOOGLE_API_KEY
falfal-ai/flux/devJaFAL_KEY
MiniMaximage-01Ja (Subjektreferenz)MINIMAX_API_KEY oder MiniMax OAuth (minimax-portal)
Verwenden Sie action: "list", um verfügbare Provider und Models zur Laufzeit zu prüfen:
/tool image_generate action=list

Tool-Parameter

ParameterTypBeschreibung
promptstringPrompt für die Bildgenerierung (erforderlich für action: "generate")
actionstring"generate" (Standard) oder "list" zum Prüfen von Providern
modelstringOverride für Provider/Model, z. B. openai/gpt-image-1
imagestringEinzelner Referenzbildpfad oder URL für den Bearbeitungsmodus
imagesstring[]Mehrere Referenzbilder für den Bearbeitungsmodus (bis zu 5)
sizestringGrößenhinweis: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostringSeitenverhältnis: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstringAuflösungshinweis: 1K, 2K oder 4K
countnumberAnzahl der zu generierenden Bilder (1–4)
filenamestringHinweis für den Ausgabedateinamen
Nicht alle Provider unterstützen alle Parameter. Das Tool übergibt, was jeder Provider unterstützt, und ignoriert den Rest.

Konfiguration

Model-Auswahl

{
  agents: {
    defaults: {
      // String form: primary model only
      imageGenerationModel: "google/gemini-3.1-flash-image-preview",

      // Object form: primary + ordered fallbacks
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

Reihenfolge der Provider-Auswahl

Beim Generieren eines Bildes versucht OpenClaw Provider in dieser Reihenfolge:
  1. Parameter model aus dem Tool-Aufruf (wenn der Agent einen angibt)
  2. imageGenerationModel.primary aus der Konfiguration
  3. imageGenerationModel.fallbacks in Reihenfolge
  4. Automatische Erkennung — verwendet nur authentifizierungsgestützte Standardwerte von Providern:
    • zuerst den aktuellen Standard-Provider
    • verbleibende registrierte Provider für Bildgenerierung in Provider-ID-Reihenfolge
Wenn ein Provider fehlschlägt (Authentifizierungsfehler, Rate Limit usw.), wird automatisch der nächste Kandidat versucht. Wenn alle fehlschlagen, enthält der Fehler Details aus jedem Versuch. Hinweise:
  • Die automatische Erkennung ist authentifizierungsbewusst. Ein Provider-Standard gelangt nur dann in die Kandidatenliste, wenn OpenClaw diesen Provider tatsächlich authentifizieren kann.
  • Verwenden Sie action: "list", um die aktuell registrierten Provider, ihre Standard-Models und Hinweise zu Authentifizierungs-Env-Variablen zu prüfen.

Bildbearbeitung

OpenAI, Google, fal und MiniMax unterstützen die Bearbeitung von Referenzbildern. Übergeben Sie einen Referenzbildpfad oder eine URL:
"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"
OpenAI und Google unterstützen bis zu 5 Referenzbilder über den Parameter images. fal und MiniMax unterstützen 1. MiniMax-Bildgenerierung ist über beide gebündelten MiniMax-Authentifizierungspfade verfügbar:
  • minimax/image-01 für API-Key-Setups
  • minimax-portal/image-01 für OAuth-Setups

Fähigkeiten der Provider

FähigkeitOpenAIGooglefalMiniMax
GenerierenJa (bis zu 4)Ja (bis zu 4)Ja (bis zu 4)Ja (bis zu 9)
Bearbeiten/ReferenzJa (bis zu 5 Bilder)Ja (bis zu 5 Bilder)Ja (1 Bild)Ja (1 Bild, Subjektreferenz)
GrößensteuerungJaJaJaNein
SeitenverhältnisNeinJaJa (nur Generierung)Ja
Auflösung (1K/2K/4K)NeinJaJaNein

Verwandt