Ana içeriğe atla

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

image_generate aracı, yapılandırdığınız sağlayıcıları kullanarak ajanın görsel oluşturmasına ve düzenlemesine olanak tanır. Oluşturulan görseller, ajanın yanıtında otomatik olarak medya ekleri olarak teslim edilir.
Araç yalnızca en az bir görsel oluşturma sağlayıcısı kullanılabilir olduğunda görünür. Ajanınızın araçlarında image_generate görmüyorsanız agents.defaults.imageGenerationModel yapılandırın, bir sağlayıcı API anahtarı ayarlayın veya OpenAI Codex OAuth ile oturum açın.

Hızlı başlangıç

1

Kimlik doğrulamayı yapılandır

En az bir sağlayıcı için API anahtarı ayarlayın (örneğin OPENAI_API_KEY, GEMINI_API_KEY, OPENROUTER_API_KEY) veya OpenAI Codex OAuth ile oturum açın.
2

Varsayılan model seçin (isteğe bağlı)

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-2",
        timeoutMs: 180_000,
      },
    },
  },
}
Codex OAuth aynı openai/gpt-image-2 model başvurusunu kullanır. Bir openai-codex OAuth profili yapılandırıldığında OpenClaw, görsel isteklerini önce OPENAI_API_KEY denemek yerine bu OAuth profili üzerinden yönlendirir. Açık models.providers.openai yapılandırması (API anahtarı, özel/Azure temel URL) doğrudan OpenAI Images API rotasına geri döner.
3

Ajana sorun

“Dost canlısı bir robot maskotunun görselini oluştur.”Ajan image_generate çağrısını otomatik olarak yapar. Araç izin listesine gerek yoktur; bir sağlayıcı kullanılabilir olduğunda varsayılan olarak etkindir.
LocalAI gibi OpenAI uyumlu LAN uç noktaları için özel models.providers.openai.baseUrl değerini koruyun ve browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true ile açıkça etkinleştirin. Özel ve dahili görsel uç noktaları varsayılan olarak engelli kalır.

Yaygın rotalar

AmaçModel başvurusuKimlik doğrulama
API faturalandırmasıyla OpenAI görsel oluşturmaopenai/gpt-image-2OPENAI_API_KEY
Codex abonelik kimlik doğrulamasıyla OpenAI görsel oluşturmaopenai/gpt-image-2OpenAI Codex OAuth
OpenAI saydam arka plan PNG/WebPopenai/gpt-image-1.5OPENAI_API_KEY veya OpenAI Codex OAuth
DeepInfra görsel oluşturmadeepinfra/black-forest-labs/FLUX-1-schnellDEEPINFRA_API_KEY
OpenRouter görsel oluşturmaopenrouter/google/gemini-3.1-flash-image-previewOPENROUTER_API_KEY
LiteLLM görsel oluşturmalitellm/gpt-image-2LITELLM_API_KEY
Google Gemini görsel oluşturmagoogle/gemini-3.1-flash-image-previewGEMINI_API_KEY veya GOOGLE_API_KEY
Aynı image_generate aracı metinden görsele ve referans görsel düzenlemeyi yönetir. Tek referans için image, birden fazla referans için images kullanın. quality, outputFormat ve background gibi sağlayıcı destekli çıktı ipuçları kullanılabilir olduğunda iletilir ve bir sağlayıcı bunları desteklemediğinde yok sayıldı olarak raporlanır. Paketlenmiş saydam arka plan desteği OpenAI’ye özeldir; diğer sağlayıcılar, arka uçları bunu yayıyorsa PNG alfasını yine de koruyabilir.

Desteklenen sağlayıcılar

SağlayıcıVarsayılan modelDüzenleme desteğiKimlik doğrulama
ComfyUIworkflowEvet (1 görsel, iş akışı yapılandırmalı)Bulut için COMFY_API_KEY veya COMFY_CLOUD_API_KEY
DeepInfrablack-forest-labs/FLUX-1-schnellEvet (1 görsel)DEEPINFRA_API_KEY
falfal-ai/flux/devEvet (modele özgü sınırlar)FAL_KEY
Googlegemini-3.1-flash-image-previewEvetGEMINI_API_KEY veya GOOGLE_API_KEY
LiteLLMgpt-image-2Evet (en fazla 5 giriş görseli)LITELLM_API_KEY
MiniMaximage-01Evet (konu referansı)MINIMAX_API_KEY veya MiniMax OAuth (minimax-portal)
OpenAIgpt-image-2Evet (en fazla 4 görsel)OPENAI_API_KEY veya OpenAI Codex OAuth
OpenRoutergoogle/gemini-3.1-flash-image-previewEvet (en fazla 5 giriş görseli)OPENROUTER_API_KEY
Vydragrok-imagineHayırVYDRA_API_KEY
xAIgrok-imagine-imageEvet (en fazla 5 görsel)XAI_API_KEY
Çalışma zamanında kullanılabilir sağlayıcıları ve modelleri incelemek için action: "list" kullanın:
/tool image_generate action=list

Sağlayıcı yetenekleri

YetenekComfyUIDeepInfrafalGoogleMiniMaxOpenAIVydraxAI
Oluşturma (en fazla sayı)İş akışı tanımlı4449414
Düzenleme / referans1 görsel (iş akışı)1 görselFlux: 1; GPT: 10; NB2: 14En fazla 5 görsel1 görsel (konu ref.)En fazla 5 görsel-En fazla 5 görsel
Boyut kontrolü--En fazla 4K--
En boy oranı----
Çözünürlük (1K/2K/4K)-----1K, 2K

Araç parametreleri

prompt
string
gerekli
Görsel oluşturma istemi. action: "generate" için gereklidir.
action
"generate" | "list"
varsayılan:"generate"
Çalışma zamanında kullanılabilir sağlayıcıları ve modelleri incelemek için "list" kullanın.
model
string
Sağlayıcı/model geçersiz kılması (örn. openai/gpt-image-2). Saydam OpenAI arka planları için openai/gpt-image-1.5 kullanın.
image
string
Düzenleme modu için tek referans görsel yolu veya URL’si.
images
string[]
Düzenleme modu için birden fazla referans görsel (destekleyen sağlayıcılarda en fazla 5).
size
string
Boyut ipucu: 1024x1024, 1536x1024, 1024x1536, 2048x2048, 3840x2160.
aspectRatio
string
En boy oranı: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9.
resolution
"1K" | "2K" | "4K"
Çözünürlük ipucu.
quality
"low" | "medium" | "high" | "auto"
Sağlayıcı desteklediğinde kalite ipucu.
outputFormat
"png" | "jpeg" | "webp"
Sağlayıcı desteklediğinde çıktı biçimi ipucu.
background
"transparent" | "opaque" | "auto"
Sağlayıcı desteklediğinde arka plan ipucu. Saydamlık destekleyen sağlayıcılar için outputFormat: "png" veya "webp" ile transparent kullanın.
count
number
Oluşturulacak görsel sayısı (1-4).
timeoutMs
number
İsteğe bağlı sağlayıcı isteği zaman aşımı, milisaniye cinsinden. Codex, dinamik araçlar üzerinden image_generate çağırdığında, bu çağrı başına değer yapılandırılan varsayılanı yine de geçersiz kılar ve 600000 ms ile sınırlandırılır.
filename
string
Çıktı dosya adı ipucu.
openai
object
Yalnızca OpenAI ipuçları: background, moderation, outputCompression ve user.
Tüm sağlayıcılar tüm parametreleri desteklemez. Bir yedek sağlayıcı tam olarak istenen seçenek yerine yakın bir geometri seçeneğini desteklediğinde OpenClaw, göndermeden önce en yakın desteklenen boyuta, en boy oranına veya çözünürlüğe yeniden eşler. Desteklenmeyen çıktı ipuçları, destek beyan etmeyen sağlayıcılar için çıkarılır ve araç sonucunda raporlanır. Araç sonuçları uygulanan ayarları raporlar; details.normalization istenenden uygulanana yapılan çevirileri yakalar.

Yapılandırma

Model seçimi

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-2",
        timeoutMs: 180_000,
        fallbacks: [
          "openrouter/google/gemini-3.1-flash-image-preview",
          "google/gemini-3.1-flash-image-preview",
          "fal/fal-ai/flux/dev",
        ],
      },
    },
  },
}

Sağlayıcı seçim sırası

OpenClaw sağlayıcıları şu sırayla dener:
  1. Araç çağrısından gelen model parametresi (ajan bir tane belirtiyorsa).
  2. Yapılandırmadan gelen imageGenerationModel.primary.
  3. Sırayla imageGenerationModel.fallbacks.
  4. Otomatik algılama - yalnızca kimlik doğrulama destekli sağlayıcı varsayılanları:
    • önce mevcut varsayılan sağlayıcı;
    • ardından sağlayıcı kimliği sırasına göre kalan kayıtlı görsel oluşturma sağlayıcıları.
Bir sağlayıcı başarısız olursa (kimlik doğrulama hatası, hız sınırı vb.), sonraki yapılandırılmış aday otomatik olarak denenir. Tümü başarısız olursa, hata her denemeden ayrıntılar içerir.
Çağrı başına model geçersiz kılması yalnızca o sağlayıcı/modeli dener ve yapılandırılmış birincil/yedek veya otomatik algılanan sağlayıcılarla devam etmez.
Bir sağlayıcı varsayılanı aday listesine yalnızca OpenClaw o sağlayıcıda gerçekten kimlik doğrulayabildiğinde girer. Yalnızca açık model, primary ve fallbacks girdilerini kullanmak için agents.defaults.mediaGenerationAutoProviderFallback: false ayarlayın.
Yavaş görsel arka uçları için agents.defaults.imageGenerationModel.timeoutMs ayarlayın. Çağrı başına timeoutMs araç parametresi yapılandırılan varsayılanı geçersiz kılar. Codex dinamik araç çağrıları, OpenClaw’ın 600000 ms dinamik araç köprüsü üst sınırıyla sınırlı olarak aynı zaman aşımı bütçesine uyar.
Şu anda kayıtlı sağlayıcıları, varsayılan modellerini ve kimlik doğrulama ortam değişkeni ipuçlarını incelemek için action: "list" kullanın.

Görsel düzenleme

OpenAI, OpenRouter, Google, DeepInfra, fal, MiniMax, ComfyUI ve xAI referans görsellerini düzenlemeyi destekler. Bir referans görsel yolu veya URL’si iletin:
"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"
OpenAI, OpenRouter, Google ve xAI, images parametresiyle en fazla 5 referans görseli destekler. fal, Flux image-to-image için 1 referans görseli, GPT Image 2 düzenlemeleri için en fazla 10 ve Nano Banana 2 düzenlemeleri için en fazla 14 referans görseli destekler. MiniMax ve ComfyUI 1 destekler.

Sağlayıcı ayrıntılı incelemeleri

OpenAI görsel üretimi varsayılan olarak openai/gpt-image-2 kullanır. Bir openai-codex OAuth profili yapılandırılmışsa OpenClaw, Codex abonelik sohbet modelleri tarafından kullanılan aynı OAuth profilini yeniden kullanır ve görsel isteğini Codex Responses backend üzerinden gönderir. https://chatgpt.com/backend-api gibi eski Codex temel URL’leri, görsel istekleri için https://chatgpt.com/backend-api/codex olarak standartlaştırılır. OpenClaw, bu istek için sessizce OPENAI_API_KEY değerine geri dönmez - doğrudan OpenAI Images API yönlendirmesini zorlamak için models.providers.openai öğesini açıkça bir API anahtarı, özel temel URL veya Azure uç noktasıyla yapılandırın.openai/gpt-image-1.5, openai/gpt-image-1 ve openai/gpt-image-1-mini modelleri hâlâ açıkça seçilebilir. Şeffaf arka planlı PNG/WebP çıktısı için gpt-image-1.5 kullanın; geçerli gpt-image-2 API’si background: "transparent" değerini reddeder.gpt-image-2, aynı image_generate aracı üzerinden hem metinden görsel üretimini hem de referans görsel düzenlemeyi destekler. OpenClaw, prompt, count, size, quality, outputFormat ve referans görselleri OpenAI’a iletir. OpenAI, aspectRatio veya resolution değerlerini doğrudan almaz; mümkün olduğunda OpenClaw bunları desteklenen bir size değerine eşler, aksi takdirde araç bunları yok sayılan geçersiz kılmalar olarak bildirir.OpenAI’a özgü seçenekler openai nesnesinin altında bulunur:
{
  "quality": "low",
  "outputFormat": "jpeg",
  "openai": {
    "background": "opaque",
    "moderation": "low",
    "outputCompression": 60,
    "user": "end-user-42"
  }
}
openai.background, transparent, opaque veya auto kabul eder; şeffaf çıktılar için outputFormat değerinin png veya webp olması ve şeffaflığı destekleyen bir OpenAI görsel modeli gerekir. OpenClaw, varsayılan gpt-image-2 şeffaf arka plan isteklerini gpt-image-1.5 modeline yönlendirir. openai.outputCompression, JPEG/WebP çıktılarına uygulanır.Üst düzey background ipucu sağlayıcıdan bağımsızdır ve şu anda OpenAI sağlayıcısı seçildiğinde aynı OpenAI background istek alanına eşlenir. Arka plan desteği beyan etmeyen sağlayıcılar, desteklenmeyen parametreyi almak yerine bunu ignoredOverrides içinde döndürür.OpenAI görsel üretimini api.openai.com yerine bir Azure OpenAI dağıtımı üzerinden yönlendirmek için bkz. Azure OpenAI uç noktaları.
OpenRouter görsel üretimi aynı OPENROUTER_API_KEY değerini kullanır ve OpenRouter’ın sohbet tamamlama görsel API’si üzerinden yönlendirilir. OpenRouter görsel modellerini openrouter/ önekiyle seçin:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openrouter/google/gemini-3.1-flash-image-preview",
      },
    },
  },
}
OpenClaw, prompt, count, referans görselleri ve Gemini uyumlu aspectRatio / resolution ipuçlarını OpenRouter’a iletir. Geçerli yerleşik OpenRouter görsel modeli kısayolları arasında google/gemini-3.1-flash-image-preview, google/gemini-3-pro-image-preview ve openai/gpt-5.4-image-2 bulunur. Yapılandırılmış plugin öğenizin neler sunduğunu görmek için action: "list" kullanın.
MiniMax görsel üretimi, paketle gelen iki MiniMax kimlik doğrulama yolu üzerinden kullanılabilir:
  • API anahtarı kurulumları için minimax/image-01
  • OAuth kurulumları için minimax-portal/image-01
Paketle gelen xAI sağlayıcısı, yalnızca istem içeren istekler için /v1/images/generations, image veya images mevcut olduğunda ise /v1/images/edits kullanır.
  • Modeller: xai/grok-imagine-image, xai/grok-imagine-image-pro
  • Sayı: en fazla 4
  • Referanslar: bir image veya en fazla beş images
  • En-boy oranları: 1:1, 16:9, 9:16, 4:3, 3:4, 2:3, 3:2
  • Çözünürlükler: 1K, 2K
  • Çıktılar: OpenClaw tarafından yönetilen görsel ekleri olarak döndürülür
OpenClaw, bu denetimler paylaşılan sağlayıcılar arası image_generate sözleşmesinde bulunana kadar xAI’a özgü quality, mask, user veya ek yalnızca yerel en-boy oranlarını bilinçli olarak kullanıma sunmaz.

Örnekler

/tool image_generate action=generate model=openai/gpt-image-2 prompt="A clean editorial poster for OpenClaw image generation" size=3840x2160 count=1
Aynı --output-format ve --background bayrakları openclaw infer image edit üzerinde de kullanılabilir; --openai-background, OpenAI’a özgü bir diğer ad olarak kalır. OpenAI dışındaki paketle gelen sağlayıcılar bugün açık arka plan denetimi beyan etmez, bu nedenle background: "transparent" onlar için yok sayılmış olarak bildirilir.

İlgili

  • Araçlara genel bakış - mevcut tüm ajan araçları
  • ComfyUI - yerel ComfyUI ve Comfy Cloud iş akışı kurulumu
  • fal - fal görsel ve video sağlayıcısı kurulumu
  • Google (Gemini) - Gemini görsel sağlayıcısı kurulumu
  • MiniMax - MiniMax görsel sağlayıcısı kurulumu
  • OpenAI - OpenAI Images sağlayıcısı kurulumu
  • Vydra - Vydra görsel, video ve konuşma kurulumu
  • xAI - Grok görsel, video, arama, kod yürütme ve TTS kurulumu
  • Yapılandırma referansı - imageGenerationModel yapılandırması
  • Modeller - model yapılandırması ve yük devretme