Przejdź do głównej treści

Generowanie obrazów

Narzędzie image_generate pozwala agentowi tworzyć i edytować obrazy przy użyciu skonfigurowanych providerów. Wygenerowane obrazy są automatycznie dostarczane jako załączniki multimedialne w odpowiedzi agenta.
Narzędzie pojawia się tylko wtedy, gdy dostępny jest co najmniej jeden provider generowania obrazów. Jeśli nie widzisz image_generate w narzędziach agenta, skonfiguruj agents.defaults.imageGenerationModel albo ustaw klucz API providera.

Szybki start

  1. Ustaw klucz API dla co najmniej jednego providera (na przykład OPENAI_API_KEY albo GEMINI_API_KEY).
  2. Opcjonalnie ustaw preferowany model:
{
  agents: {
    defaults: {
      imageGenerationModel: "openai/gpt-image-1",
    },
  },
}
  1. Poproś agenta: „Wygeneruj obraz przyjaznej homarzej maskotki.”
Agent automatycznie wywoła image_generate. Nie trzeba dodawać go do allowlisty narzędzi — jest domyślnie włączone, gdy provider jest dostępny.

Obsługiwani providerzy

ProviderModel domyślnyObsługa edycjiKlucz API
OpenAIgpt-image-1Tak (do 5 obrazów)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewTakGEMINI_API_KEY albo GOOGLE_API_KEY
falfal-ai/flux/devTakFAL_KEY
MiniMaximage-01Tak (referencja obiektu)MINIMAX_API_KEY albo MiniMax OAuth (minimax-portal)
Użyj action: "list", aby w runtime sprawdzić dostępnych providerów i modele:
/tool image_generate action=list

Parametry narzędzia

ParametrTypOpis
promptstringPrompt do generowania obrazu (wymagany dla action: "generate")
actionstring"generate" (domyślnie) albo "list", aby sprawdzić providerów
modelstringNadpisanie provider/model, np. openai/gpt-image-1
imagestringŚcieżka albo URL pojedynczego obrazu referencyjnego dla trybu edycji
imagesstring[]Wiele obrazów referencyjnych dla trybu edycji (do 5)
sizestringWskazówka rozmiaru: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostringProporcje obrazu: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstringWskazówka rozdzielczości: 1K, 2K albo 4K
countnumberLiczba obrazów do wygenerowania (1–4)
filenamestringWskazówka nazwy pliku wyjściowego
Nie wszyscy providerzy obsługują wszystkie parametry. Narzędzie przekazuje to, co obsługuje dany provider, a resztę ignoruje.

Konfiguracja

Wybór modelu

{
  agents: {
    defaults: {
      // Forma string: tylko model primary
      imageGenerationModel: "google/gemini-3.1-flash-image-preview",

      // Forma object: primary + uporządkowane fallbacki
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

Kolejność wyboru providera

Podczas generowania obrazu OpenClaw próbuje providerów w tej kolejności:
  1. Parametr model z wywołania narzędzia (jeśli agent go poda)
  2. imageGenerationModel.primary z konfiguracji
  3. imageGenerationModel.fallbacks w podanej kolejności
  4. Auto-detection — używa tylko domyślnych providerów opartych na auth:
    • najpierw bieżący default provider
    • potem pozostali zarejestrowani providerzy generowania obrazów w kolejności provider-id
Jeśli provider zawiedzie (błąd auth, rate limit itd.), automatycznie próbowany jest kolejny kandydat. Jeśli zawiodą wszystkie, błąd będzie zawierał szczegóły każdej próby. Uwagi:
  • Auto-detection uwzględnia auth. Domyślny provider trafia na listę kandydatów tylko wtedy, gdy OpenClaw może faktycznie uwierzytelnić tego providera.
  • Użyj action: "list", aby sprawdzić aktualnie zarejestrowanych providerów, ich modele domyślne i wskazówki dotyczące auth env-var.

Edytowanie obrazów

OpenAI, Google, fal i MiniMax obsługują edytowanie obrazów referencyjnych. Przekaż ścieżkę albo URL obrazu referencyjnego:
"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"
OpenAI i Google obsługują do 5 obrazów referencyjnych przez parametr images. fal i MiniMax obsługują 1. Generowanie obrazów w MiniMax jest dostępne przez obie bundled ścieżki auth MiniMax:
  • minimax/image-01 dla konfiguracji z kluczem API
  • minimax-portal/image-01 dla konfiguracji OAuth

Możliwości providerów

MożliwośćOpenAIGooglefalMiniMax
GenerowanieTak (do 4)Tak (do 4)Tak (do 4)Tak (do 9)
Edycja/referencjaTak (do 5 obrazów)Tak (do 5 obrazów)Tak (1 obraz)Tak (1 obraz, referencja obiektu)
Kontrola rozmiaruTakTakTakNie
Proporcje obrazuNieTakTak (tylko generowanie)Tak
Rozdzielczość (1K/2K/4K)NieTakTakNie

Powiązane