Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
image_generate aracı, yapılandırdığınız sağlayıcıları kullanarak ajanın görsel oluşturmasına ve düzenlemesine olanak tanır. Oluşturulan görseller, ajanın yanıtında otomatik olarak medya ekleri olarak teslim edilir.
Araç yalnızca en az bir görsel oluşturma sağlayıcısı kullanılabilir olduğunda görünür. Ajanınızın araçlarında
image_generate görmüyorsanız agents.defaults.imageGenerationModel yapılandırın, bir sağlayıcı API anahtarı ayarlayın veya OpenAI Codex OAuth ile oturum açın.Hızlı başlangıç
Kimlik doğrulamayı yapılandır
En az bir sağlayıcı için API anahtarı ayarlayın (örneğin
OPENAI_API_KEY,
GEMINI_API_KEY, OPENROUTER_API_KEY) veya OpenAI Codex OAuth ile oturum açın.Varsayılan model seçin (isteğe bağlı)
openai/gpt-image-2 model başvurusunu kullanır. Bir
openai-codex OAuth profili yapılandırıldığında OpenClaw, görsel
isteklerini önce OPENAI_API_KEY denemek yerine bu OAuth profili
üzerinden yönlendirir. Açık models.providers.openai yapılandırması
(API anahtarı, özel/Azure temel URL) doğrudan OpenAI Images API rotasına
geri döner.Yaygın rotalar
| Amaç | Model başvurusu | Kimlik doğrulama |
|---|---|---|
| API faturalandırmasıyla OpenAI görsel oluşturma | openai/gpt-image-2 | OPENAI_API_KEY |
| Codex abonelik kimlik doğrulamasıyla OpenAI görsel oluşturma | openai/gpt-image-2 | OpenAI Codex OAuth |
| OpenAI saydam arka plan PNG/WebP | openai/gpt-image-1.5 | OPENAI_API_KEY veya OpenAI Codex OAuth |
| DeepInfra görsel oluşturma | deepinfra/black-forest-labs/FLUX-1-schnell | DEEPINFRA_API_KEY |
| OpenRouter görsel oluşturma | openrouter/google/gemini-3.1-flash-image-preview | OPENROUTER_API_KEY |
| LiteLLM görsel oluşturma | litellm/gpt-image-2 | LITELLM_API_KEY |
| Google Gemini görsel oluşturma | google/gemini-3.1-flash-image-preview | GEMINI_API_KEY veya GOOGLE_API_KEY |
image_generate aracı metinden görsele ve referans görsel düzenlemeyi
yönetir. Tek referans için image, birden fazla referans için images
kullanın. quality, outputFormat ve background gibi sağlayıcı destekli
çıktı ipuçları kullanılabilir olduğunda iletilir ve bir sağlayıcı bunları
desteklemediğinde yok sayıldı olarak raporlanır. Paketlenmiş saydam arka plan
desteği OpenAI’ye özeldir; diğer sağlayıcılar, arka uçları bunu yayıyorsa PNG
alfasını yine de koruyabilir.
Desteklenen sağlayıcılar
| Sağlayıcı | Varsayılan model | Düzenleme desteği | Kimlik doğrulama |
|---|---|---|---|
| ComfyUI | workflow | Evet (1 görsel, iş akışı yapılandırmalı) | Bulut için COMFY_API_KEY veya COMFY_CLOUD_API_KEY |
| DeepInfra | black-forest-labs/FLUX-1-schnell | Evet (1 görsel) | DEEPINFRA_API_KEY |
| fal | fal-ai/flux/dev | Evet (modele özgü sınırlar) | FAL_KEY |
gemini-3.1-flash-image-preview | Evet | GEMINI_API_KEY veya GOOGLE_API_KEY | |
| LiteLLM | gpt-image-2 | Evet (en fazla 5 giriş görseli) | LITELLM_API_KEY |
| MiniMax | image-01 | Evet (konu referansı) | MINIMAX_API_KEY veya MiniMax OAuth (minimax-portal) |
| OpenAI | gpt-image-2 | Evet (en fazla 4 görsel) | OPENAI_API_KEY veya OpenAI Codex OAuth |
| OpenRouter | google/gemini-3.1-flash-image-preview | Evet (en fazla 5 giriş görseli) | OPENROUTER_API_KEY |
| Vydra | grok-imagine | Hayır | VYDRA_API_KEY |
| xAI | grok-imagine-image | Evet (en fazla 5 görsel) | XAI_API_KEY |
action: "list" kullanın:
Sağlayıcı yetenekleri
| Yetenek | ComfyUI | DeepInfra | fal | MiniMax | OpenAI | Vydra | xAI | |
|---|---|---|---|---|---|---|---|---|
| Oluşturma (en fazla sayı) | İş akışı tanımlı | 4 | 4 | 4 | 9 | 4 | 1 | 4 |
| Düzenleme / referans | 1 görsel (iş akışı) | 1 görsel | Flux: 1; GPT: 10; NB2: 14 | En fazla 5 görsel | 1 görsel (konu ref.) | En fazla 5 görsel | - | En fazla 5 görsel |
| Boyut kontrolü | - | ✓ | ✓ | ✓ | - | En fazla 4K | - | - |
| En boy oranı | - | - | ✓ | ✓ | ✓ | - | - | ✓ |
| Çözünürlük (1K/2K/4K) | - | - | ✓ | ✓ | - | - | - | 1K, 2K |
Araç parametreleri
Görsel oluşturma istemi.
action: "generate" için gereklidir.Çalışma zamanında kullanılabilir sağlayıcıları ve modelleri incelemek için
"list" kullanın.Sağlayıcı/model geçersiz kılması (örn.
openai/gpt-image-2). Saydam
OpenAI arka planları için openai/gpt-image-1.5 kullanın.Düzenleme modu için tek referans görsel yolu veya URL’si.
Düzenleme modu için birden fazla referans görsel (destekleyen sağlayıcılarda en fazla 5).
Boyut ipucu:
1024x1024, 1536x1024, 1024x1536, 2048x2048, 3840x2160.En boy oranı:
1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9.Çözünürlük ipucu.
Sağlayıcı desteklediğinde kalite ipucu.
Sağlayıcı desteklediğinde çıktı biçimi ipucu.
Sağlayıcı desteklediğinde arka plan ipucu. Saydamlık destekleyen sağlayıcılar için
outputFormat: "png" veya "webp" ile transparent kullanın.Oluşturulacak görsel sayısı (1-4).
İsteğe bağlı sağlayıcı isteği zaman aşımı, milisaniye cinsinden. Codex,
dinamik araçlar üzerinden
image_generate çağırdığında, bu çağrı başına
değer yapılandırılan varsayılanı yine de geçersiz kılar ve 600000 ms ile sınırlandırılır.Çıktı dosya adı ipucu.
Yalnızca OpenAI ipuçları:
background, moderation, outputCompression ve user.Tüm sağlayıcılar tüm parametreleri desteklemez. Bir yedek sağlayıcı tam olarak
istenen seçenek yerine yakın bir geometri seçeneğini desteklediğinde OpenClaw,
göndermeden önce en yakın desteklenen boyuta, en boy oranına veya çözünürlüğe
yeniden eşler. Desteklenmeyen çıktı ipuçları, destek beyan etmeyen sağlayıcılar
için çıkarılır ve araç sonucunda raporlanır. Araç sonuçları uygulanan ayarları
raporlar;
details.normalization istenenden uygulanana yapılan çevirileri yakalar.Yapılandırma
Model seçimi
Sağlayıcı seçim sırası
OpenClaw sağlayıcıları şu sırayla dener:- Araç çağrısından gelen
modelparametresi (ajan bir tane belirtiyorsa). - Yapılandırmadan gelen
imageGenerationModel.primary. - Sırayla
imageGenerationModel.fallbacks. - Otomatik algılama - yalnızca kimlik doğrulama destekli sağlayıcı varsayılanları:
- önce mevcut varsayılan sağlayıcı;
- ardından sağlayıcı kimliği sırasına göre kalan kayıtlı görsel oluşturma sağlayıcıları.
Çağrı başına model geçersiz kılmaları kesindir
Çağrı başına model geçersiz kılmaları kesindir
Çağrı başına
model geçersiz kılması yalnızca o sağlayıcı/modeli dener ve
yapılandırılmış birincil/yedek veya otomatik algılanan sağlayıcılarla devam etmez.Otomatik algılama kimlik doğrulama farkındadır
Otomatik algılama kimlik doğrulama farkındadır
Bir sağlayıcı varsayılanı aday listesine yalnızca OpenClaw o sağlayıcıda
gerçekten kimlik doğrulayabildiğinde girer. Yalnızca açık
model,
primary ve fallbacks girdilerini kullanmak için
agents.defaults.mediaGenerationAutoProviderFallback: false ayarlayın.Zaman aşımları
Zaman aşımları
Yavaş görsel arka uçları için
agents.defaults.imageGenerationModel.timeoutMs
ayarlayın. Çağrı başına timeoutMs araç parametresi yapılandırılan
varsayılanı geçersiz kılar. Codex dinamik araç çağrıları, OpenClaw’ın
600000 ms dinamik araç köprüsü üst sınırıyla sınırlı olarak aynı zaman
aşımı bütçesine uyar.Çalışma zamanında inceleyin
Çalışma zamanında inceleyin
Şu anda kayıtlı sağlayıcıları, varsayılan modellerini ve kimlik doğrulama
ortam değişkeni ipuçlarını incelemek için
action: "list" kullanın.Görsel düzenleme
OpenAI, OpenRouter, Google, DeepInfra, fal, MiniMax, ComfyUI ve xAI referans görsellerini düzenlemeyi destekler. Bir referans görsel yolu veya URL’si iletin:images parametresiyle en fazla 5 referans görseli destekler. fal, Flux image-to-image için 1 referans görseli, GPT Image 2 düzenlemeleri için en fazla 10 ve Nano Banana 2 düzenlemeleri için en fazla 14 referans görseli destekler. MiniMax ve ComfyUI 1 destekler.
Sağlayıcı ayrıntılı incelemeleri
OpenAI gpt-image-2 (ve gpt-image-1.5)
OpenAI gpt-image-2 (ve gpt-image-1.5)
OpenAI görsel üretimi varsayılan olarak
openai/gpt-image-2 kullanır. Bir
openai-codex OAuth profili yapılandırılmışsa OpenClaw, Codex abonelik sohbet modelleri tarafından kullanılan aynı OAuth profilini yeniden kullanır ve görsel isteğini Codex Responses backend üzerinden gönderir. https://chatgpt.com/backend-api gibi eski Codex temel URL’leri, görsel istekleri için
https://chatgpt.com/backend-api/codex olarak standartlaştırılır. OpenClaw, bu istek için sessizce OPENAI_API_KEY değerine geri dönmez -
doğrudan OpenAI Images API yönlendirmesini zorlamak için
models.providers.openai öğesini açıkça bir API anahtarı, özel temel URL veya Azure uç noktasıyla yapılandırın.openai/gpt-image-1.5, openai/gpt-image-1 ve
openai/gpt-image-1-mini modelleri hâlâ açıkça seçilebilir. Şeffaf arka planlı PNG/WebP çıktısı için gpt-image-1.5 kullanın; geçerli
gpt-image-2 API’si background: "transparent" değerini reddeder.gpt-image-2, aynı image_generate aracı üzerinden hem metinden görsel üretimini hem de referans görsel düzenlemeyi destekler.
OpenClaw, prompt, count, size, quality, outputFormat ve referans görselleri OpenAI’a iletir. OpenAI, aspectRatio veya resolution değerlerini doğrudan almaz; mümkün olduğunda OpenClaw bunları desteklenen bir size değerine eşler, aksi takdirde araç bunları yok sayılan geçersiz kılmalar olarak bildirir.OpenAI’a özgü seçenekler openai nesnesinin altında bulunur:openai.background, transparent, opaque veya auto kabul eder;
şeffaf çıktılar için outputFormat değerinin png veya webp olması ve şeffaflığı destekleyen bir OpenAI görsel modeli gerekir. OpenClaw, varsayılan
gpt-image-2 şeffaf arka plan isteklerini gpt-image-1.5 modeline yönlendirir.
openai.outputCompression, JPEG/WebP çıktılarına uygulanır.Üst düzey background ipucu sağlayıcıdan bağımsızdır ve şu anda OpenAI sağlayıcısı seçildiğinde aynı OpenAI background istek alanına eşlenir. Arka plan desteği beyan etmeyen sağlayıcılar, desteklenmeyen parametreyi almak yerine bunu ignoredOverrides içinde döndürür.OpenAI görsel üretimini api.openai.com yerine bir Azure OpenAI dağıtımı üzerinden yönlendirmek için bkz.
Azure OpenAI uç noktaları.OpenRouter görsel modelleri
OpenRouter görsel modelleri
OpenRouter görsel üretimi aynı OpenClaw,
OPENROUTER_API_KEY değerini kullanır ve OpenRouter’ın sohbet tamamlama görsel API’si üzerinden yönlendirilir. OpenRouter görsel modellerini openrouter/ önekiyle seçin:prompt, count, referans görselleri ve Gemini uyumlu aspectRatio / resolution ipuçlarını OpenRouter’a iletir.
Geçerli yerleşik OpenRouter görsel modeli kısayolları arasında
google/gemini-3.1-flash-image-preview,
google/gemini-3-pro-image-preview ve openai/gpt-5.4-image-2 bulunur. Yapılandırılmış plugin öğenizin neler sunduğunu görmek için
action: "list" kullanın.MiniMax çift kimlik doğrulama
MiniMax çift kimlik doğrulama
MiniMax görsel üretimi, paketle gelen iki MiniMax kimlik doğrulama yolu üzerinden kullanılabilir:
- API anahtarı kurulumları için
minimax/image-01 - OAuth kurulumları için
minimax-portal/image-01
xAI grok-imagine-image
xAI grok-imagine-image
Paketle gelen xAI sağlayıcısı, yalnızca istem içeren istekler için
/v1/images/generations, image veya images mevcut olduğunda ise /v1/images/edits kullanır.- Modeller:
xai/grok-imagine-image,xai/grok-imagine-image-pro - Sayı: en fazla 4
- Referanslar: bir
imageveya en fazla beşimages - En-boy oranları:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - Çözünürlükler:
1K,2K - Çıktılar: OpenClaw tarafından yönetilen görsel ekleri olarak döndürülür
image_generate sözleşmesinde bulunana kadar xAI’a özgü quality, mask,
user veya ek yalnızca yerel en-boy oranlarını bilinçli olarak kullanıma sunmaz.Örnekler
- Üret (4K yatay)
- Üret (şeffaf PNG)
- Üret (iki kare)
- Düzenle (tek referans)
- Düzenle (birden çok referans)
--output-format ve --background bayrakları
openclaw infer image edit üzerinde de kullanılabilir; --openai-background, OpenAI’a özgü bir diğer ad olarak kalır. OpenAI dışındaki paketle gelen sağlayıcılar bugün açık arka plan denetimi beyan etmez, bu nedenle background: "transparent" onlar için yok sayılmış olarak bildirilir.
İlgili
- Araçlara genel bakış - mevcut tüm ajan araçları
- ComfyUI - yerel ComfyUI ve Comfy Cloud iş akışı kurulumu
- fal - fal görsel ve video sağlayıcısı kurulumu
- Google (Gemini) - Gemini görsel sağlayıcısı kurulumu
- MiniMax - MiniMax görsel sağlayıcısı kurulumu
- OpenAI - OpenAI Images sağlayıcısı kurulumu
- Vydra - Vydra görsel, video ve konuşma kurulumu
- xAI - Grok görsel, video, arama, kod yürütme ve TTS kurulumu
- Yapılandırma referansı -
imageGenerationModelyapılandırması - Modeller - model yapılandırması ve yük devretme