Tools
การสร้างรูปภาพ
เครื่องมือ image_generate ช่วยให้เอเจนต์สร้างและแก้ไขรูปภาพโดยใช้ผู้ให้บริการที่คุณกำหนดค่าไว้ ในเซสชันแชต การสร้างรูปภาพทำงานแบบอะซิงโครนัส: OpenClaw บันทึกงานเบื้องหลัง ส่งคืน id ของงานทันที และปลุกเอเจนต์เมื่อผู้ให้บริการทำงานเสร็จ เอเจนต์ที่ทำงานเสร็จจะทำตามโหมดการตอบกลับแบบมองเห็นได้ตามปกติของเซสชัน: ส่งการตอบกลับสุดท้ายอัตโนมัติเมื่อกำหนดค่าไว้ หรือใช้ message(action="send") เมื่อเซสชันต้องใช้เครื่องมือข้อความ หากเซสชันของผู้ขอไม่ทำงานหรือการปลุกที่ใช้งานอยู่ล้มเหลว และยังมีรูปภาพที่สร้างแล้วบางส่วนหายไปจากการตอบกลับเมื่อเสร็จสมบูรณ์ OpenClaw จะส่ง fallback โดยตรงแบบ idempotent ที่มีเฉพาะรูปภาพที่หายไป
เริ่มต้นอย่างรวดเร็ว
กำหนดค่า auth
ตั้งค่าคีย์ API สำหรับผู้ให้บริการอย่างน้อยหนึ่งราย (เช่น OPENAI_API_KEY,
GEMINI_API_KEY, OPENROUTER_API_KEY) หรือลงชื่อเข้าใช้ด้วย OpenAI Codex OAuth
เลือกรุ่นเริ่มต้น (ไม่บังคับ)
{ agents: { defaults: { imageGenerationModel: { primary: "openai/gpt-image-2", timeoutMs: 180_000, }, }, },}ChatGPT/Codex OAuth ใช้ ref รุ่น openai/gpt-image-2 เดียวกัน เมื่อมีการกำหนดค่าโปรไฟล์ OAuth ของ openai แล้ว OpenClaw จะ route คำขอรูปภาพผ่านโปรไฟล์ OAuth นั้นแทนการลองใช้ OPENAI_API_KEY ก่อน การกำหนดค่า models.providers.openai แบบชัดเจน (คีย์ API, URL ฐานแบบกำหนดเอง/Azure) จะเลือกกลับไปใช้ route OpenAI Images API โดยตรง
ถามเอเจนต์
"สร้างรูปภาพมาสคอตหุ่นยนต์ที่เป็นมิตร"
เอเจนต์จะเรียก image_generate โดยอัตโนมัติ ไม่ต้องเพิ่มเครื่องมือนี้ใน allow-list เพราะเปิดใช้โดยค่าเริ่มต้นเมื่อมีผู้ให้บริการพร้อมใช้งาน เครื่องมือจะส่งคืน id ของงานเบื้องหลัง จากนั้นเอเจนต์ที่ทำงานเสร็จจะส่งไฟล์แนบที่สร้างแล้วผ่านเครื่องมือ message เมื่อพร้อม
Route ทั่วไป
| เป้าหมาย | Model ref | Auth |
|---|---|---|
| การสร้างรูปภาพด้วย OpenAI พร้อมการคิดค่าบริการผ่าน API | openai/gpt-image-2 |
OPENAI_API_KEY |
| การสร้างรูปภาพด้วย OpenAI พร้อม auth การสมัครสมาชิก Codex | openai/gpt-image-2 |
OpenAI ChatGPT/Codex OAuth |
| PNG/WebP พื้นหลังโปร่งใสด้วย OpenAI | openai/gpt-image-1.5 |
OPENAI_API_KEY หรือ OpenAI Codex OAuth |
| การสร้างรูปภาพด้วย DeepInfra | deepinfra/black-forest-labs/FLUX-1-schnell |
DEEPINFRA_API_KEY |
| การสร้างภาพ fal Krea 2 แบบสื่ออารมณ์/กำกับสไตล์ | fal/krea/v2/medium/text-to-image |
FAL_KEY |
| การสร้างรูปภาพด้วย OpenRouter | openrouter/google/gemini-3.1-flash-image-preview |
OPENROUTER_API_KEY |
| การสร้างรูปภาพด้วย LiteLLM | litellm/gpt-image-2 |
LITELLM_API_KEY |
| การสร้างรูปภาพด้วย Microsoft Foundry MAI | microsoft-foundry/<deployment-name> |
AZURE_OPENAI_API_KEY หรือ Entra ID |
| การสร้างรูปภาพด้วย Google Gemini | google/gemini-3.1-flash-image-preview |
GEMINI_API_KEY หรือ GOOGLE_API_KEY |
เครื่องมือ image_generate เดียวกันรองรับทั้ง text-to-image และการแก้ไขด้วยรูปภาพอ้างอิง ใช้ image สำหรับรูปภาพอ้างอิงหนึ่งรูป หรือ images สำหรับรูปภาพอ้างอิงหลายรูป สำหรับรุ่น Krea 2 บน fal รูปภาพอ้างอิงเหล่านั้นจะถูกส่งเป็นการอ้างอิงสไตล์แทนอินพุตแก้ไข
คำใบ้เอาต์พุตที่ผู้ให้บริการรองรับ เช่น quality, outputFormat และ background จะถูกส่งต่อเมื่อพร้อมใช้งาน และถูกรายงานว่าถูกละเว้นเมื่อผู้ให้บริการไม่รองรับ การรองรับพื้นหลังโปร่งใสที่รวมมาให้เป็นฟีเจอร์เฉพาะ OpenAI ผู้ให้บริการรายอื่นยังอาจคง alpha ของ PNG ไว้ได้หาก backend ของตนปล่อยออกมา
ผู้ให้บริการที่รองรับ
| ผู้ให้บริการ | รุ่นเริ่มต้น | รองรับการแก้ไข | Auth |
|---|---|---|---|
| ComfyUI | workflow |
ใช่ (1 รูปภาพ, กำหนดค่าด้วย workflow) | COMFY_API_KEY หรือ COMFY_CLOUD_API_KEY สำหรับ cloud |
| DeepInfra | black-forest-labs/FLUX-1-schnell |
ใช่ (1 รูปภาพ) | DEEPINFRA_API_KEY |
| fal | fal-ai/flux/dev |
ใช่ (ขีดจำกัดเฉพาะรุ่น) | FAL_KEY |
gemini-3.1-flash-image-preview |
ใช่ | GEMINI_API_KEY หรือ GOOGLE_API_KEY |
|
| LiteLLM | gpt-image-2 |
ใช่ (สูงสุด 5 รูปภาพอินพุต) | LITELLM_API_KEY |
| Microsoft Foundry | <deployment-name> |
ใช่ (เฉพาะรุ่น MAI-Image-2.5) | AZURE_OPENAI_API_KEY หรือ Entra ID (az login) |
| MiniMax | image-01 |
ใช่ (การอ้างอิง subject) | MINIMAX_API_KEY หรือ MiniMax OAuth (minimax-portal) |
| OpenAI | gpt-image-2 |
ใช่ (สูงสุด 4 รูปภาพ) | OPENAI_API_KEY หรือ OpenAI ChatGPT/Codex OAuth |
| OpenRouter | google/gemini-3.1-flash-image-preview |
ใช่ (สูงสุด 5 รูปภาพอินพุต) | OPENROUTER_API_KEY |
| Vydra | grok-imagine |
ไม่ | VYDRA_API_KEY |
| xAI | grok-imagine-image |
ใช่ (สูงสุด 5 รูปภาพ) | XAI_API_KEY |
ใช้ action: "list" เพื่อตรวจสอบผู้ให้บริการและรุ่นที่พร้อมใช้งานขณะรันไทม์:
/tool image_generate action=listใช้ action: "status" เพื่อตรวจสอบงานสร้างรูปภาพที่ใช้งานอยู่สำหรับเซสชันปัจจุบัน:
/tool image_generate action=statusความสามารถของผู้ให้บริการ
| ความสามารถ | ComfyUI | DeepInfra | fal | Microsoft Foundry | MiniMax | OpenAI | Vydra | xAI | |
|---|---|---|---|---|---|---|---|---|---|
| สร้าง (จำนวนสูงสุด) | กำหนดโดย workflow | 4 | 4 | 4 | 1 | 9 | 4 | 1 | 4 |
| แก้ไข / อ้างอิง | 1 รูปภาพ (workflow) | 1 รูปภาพ | Flux: 1; GPT: 10; Krea style refs: 10; NB2: 14 | สูงสุด 5 รูปภาพ | 1 รูปภาพ | 1 รูปภาพ (subject ref) | สูงสุด 5 รูปภาพ | - | สูงสุด 5 รูปภาพ |
| ควบคุมขนาด | - | ✓ | ✓ | ✓ | ✓ | - | สูงสุด 4K | - | - |
| อัตราส่วนภาพ | - | - | ✓ | ✓ | - | ✓ | - | - | ✓ |
| ความละเอียด (1K/2K/4K) | - | - | ✓ | ✓ | - | - | - | - | 1K, 2K |
พารามิเตอร์ของเครื่องมือ
promptstringrequiredพรอมป์สำหรับการสร้างรูปภาพ จำเป็นสำหรับ action: "generate"
action"generate" | "status" | "list"default: generateใช้ "status" เพื่อตรวจสอบงานของเซสชันที่ใช้งานอยู่ หรือ "list" เพื่อตรวจสอบผู้ให้บริการและรุ่นที่พร้อมใช้งานขณะรันไทม์
modelstringการแทนที่ผู้ให้บริการ/รุ่น (เช่น openai/gpt-image-2) ใช้ openai/gpt-image-1.5 สำหรับพื้นหลัง OpenAI แบบโปร่งใส
imagestringพาธหรือ URL ของรูปภาพอ้างอิงเดียวสำหรับโหมดแก้ไข
imagesstring[]รูปภาพอ้างอิงหลายรูปสำหรับโหมดแก้ไขหรือรุ่นที่ใช้ style-reference (สูงสุด 10 รูปผ่านเครื่องมือร่วม; ขีดจำกัดเฉพาะผู้ให้บริการยังคงมีผล)
sizestringคำใบ้ขนาด: 1024x1024, 1536x1024, 1024x1536, 2048x2048, 3840x2160
aspectRatiostringอัตราส่วนภาพ: 1:1, 2:3, 3:2, 2.35:1, 3:4, 4:3, 4:5,
5:4, 9:16, 16:9, 21:9, 4:1, 1:4, 8:1, 1:8 ผู้ให้บริการจะตรวจสอบ subset เฉพาะรุ่นของตน
resolution"1K" | "2K" | "4K"quality"low" | "medium" | "high" | "auto"คำใบ้คุณภาพเมื่อผู้ให้บริการรองรับ
outputFormat"png" | "jpeg" | "webp"คำใบ้รูปแบบเอาต์พุตเมื่อผู้ให้บริการรองรับ
background"transparent" | "opaque" | "auto"คำใบ้พื้นหลังเมื่อผู้ให้บริการรองรับ ใช้ transparent ร่วมกับ outputFormat: "png" หรือ "webp" สำหรับผู้ให้บริการที่รองรับความโปร่งใส
countnumbertimeoutMsnumbertimeout คำขอผู้ให้บริการแบบไม่บังคับ หน่วยเป็นมิลลิวินาที เมื่อ Codex เรียก image_generate ผ่านเครื่องมือแบบ dynamic ค่ารายการเรียกนี้ยังคงแทนที่ค่าเริ่มต้นที่กำหนดค่าไว้ และถูกจำกัดสูงสุดที่ 600000 ms
filenamestringopenaiobjectคำใบ้เฉพาะ OpenAI: background, moderation, outputCompression และ user
fal.creativity"raw" | "low" | "medium" | "high"การควบคุมความสร้างสรรค์ของ fal Krea 2 ค่าเริ่มต้นคือ medium
การกำหนดค่า
การเลือกรุ่น
{ agents: { defaults: { imageGenerationModel: { primary: "openai/gpt-image-2", timeoutMs: 180_000, fallbacks: [ "openrouter/google/gemini-3.1-flash-image-preview", "google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev", ], }, }, },}ลำดับการเลือกผู้ให้บริการ
OpenClaw จะลองผู้ให้บริการตามลำดับนี้:
- พารามิเตอร์
modelจากการเรียกใช้เครื่องมือ (หาก agent ระบุไว้) imageGenerationModel.primaryจาก configimageGenerationModel.fallbacksตามลำดับ- การตรวจจับอัตโนมัติ - ค่าเริ่มต้นของ provider ที่มี auth รองรับเท่านั้น:
- provider เริ่มต้นปัจจุบันก่อน
- provider สำหรับการสร้างภาพที่ลงทะเบียนไว้ที่เหลือ ตามลำดับ provider-id
หาก provider ล้มเหลว (ข้อผิดพลาด auth, rate limit เป็นต้น) candidate ที่กำหนดค่าไว้ถัดไป จะถูกลองโดยอัตโนมัติ หากทั้งหมดล้มเหลว ข้อผิดพลาดจะมีรายละเอียด จากแต่ละความพยายาม
การ override model ต่อการเรียกใช้มีผลตรงตัว
การ override model ต่อการเรียกใช้จะลองเฉพาะ provider/model นั้นเท่านั้น และ
จะไม่ดำเนินต่อไปยัง primary/fallback ที่กำหนดค่าไว้หรือ provider ที่ตรวจพบอัตโนมัติ
การตรวจจับอัตโนมัติคำนึงถึง auth
ค่าเริ่มต้นของ provider จะเข้าสู่รายการ candidate เฉพาะเมื่อ OpenClaw สามารถ
authenticate provider นั้นได้จริง ตั้งค่า
agents.defaults.mediaGenerationAutoProviderFallback: false เพื่อใช้เฉพาะ
รายการ model, primary และ fallbacks ที่ระบุไว้อย่างชัดเจน
Timeouts
ตั้งค่า agents.defaults.imageGenerationModel.timeoutMs สำหรับ backend รูปภาพที่ช้า
พารามิเตอร์เครื่องมือ timeoutMs ต่อการเรียกใช้จะ override ค่าเริ่มต้นที่กำหนดค่าไว้
และค่าเริ่มต้นที่กำหนดค่าไว้จะ override ค่าเริ่มต้นของ provider ที่ Plugin กำหนด
provider รูปภาพที่โฮสต์โดย Google และ OpenRouter ใช้ค่าเริ่มต้น 180 วินาที
การสร้างภาพของ Microsoft Foundry MAI, xAI และ Azure OpenAI ใช้
600 วินาที การเรียกใช้ dynamic-tool ของ Codex ใช้ค่าเริ่มต้น bridge
image_generate 120 วินาที และเคารพงบเวลา timeout เดียวกันเมื่อกำหนดค่าไว้
โดยถูกจำกัดด้วยค่าสูงสุดของ dynamic-tool bridge ของ OpenClaw ที่ 600000 ms
ตรวจสอบขณะ runtime
ใช้ action: "list" เพื่อตรวจสอบ provider ที่ลงทะเบียนอยู่ในปัจจุบัน
model เริ่มต้นของแต่ละรายการ และคำใบ้ env-var สำหรับ auth
การแก้ไขรูปภาพ
OpenAI, OpenRouter, Google, DeepInfra, fal, Microsoft Foundry, MiniMax,
ComfyUI และ xAI รองรับการแก้ไขรูปภาพอ้างอิง model Krea 2 บน fal ใช้ฟิลด์
image / images เดียวกันเป็นข้อมูลอ้างอิงสไตล์แทนอินพุตสำหรับแก้ไข ส่งผ่าน
พาธหรือ URL ของรูปภาพอ้างอิง:
"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"OpenAI, OpenRouter, Google และ xAI รองรับรูปภาพอ้างอิงสูงสุด 5 รูปผ่านพารามิเตอร์
images fal รองรับรูปภาพอ้างอิง 1 รูปสำหรับ Flux image-to-image,
สูงสุด 10 รูปสำหรับการแก้ไข GPT Image 2, สูงสุด 10 รายการอ้างอิงสไตล์สำหรับ Krea 2
และสูงสุด 14 รูปสำหรับการแก้ไข Nano Banana 2 ส่วน Microsoft Foundry, MiniMax
และ ComfyUI รองรับ 1 รูป
เจาะลึก Provider
OpenAI gpt-image-2 (และ gpt-image-1.5)
การสร้างภาพของ OpenAI มีค่าเริ่มต้นเป็น openai/gpt-image-2 หากกำหนดค่า
โปรไฟล์ OAuth ของ openai ไว้ OpenClaw จะใช้โปรไฟล์ OAuth เดียวกันกับที่ใช้โดย
model แชตแบบสมัครสมาชิกของ Codex และส่งคำขอรูปภาพผ่าน backend Codex Responses
URL ฐาน Codex แบบ legacy เช่น https://chatgpt.com/backend-api จะถูก canonicalize เป็น
https://chatgpt.com/backend-api/codex สำหรับคำขอรูปภาพ OpenClaw
จะไม่ fallback แบบเงียบไปยัง OPENAI_API_KEY สำหรับคำขอนั้น -
หากต้องการบังคับ routing ไปยัง OpenAI Images API โดยตรง ให้กำหนดค่า
models.providers.openai อย่างชัดเจนด้วย API key, URL ฐานแบบกำหนดเอง
หรือ endpoint ของ Azure
ยังสามารถเลือก model openai/gpt-image-1.5, openai/gpt-image-1 และ
openai/gpt-image-1-mini ได้อย่างชัดเจน ใช้
gpt-image-1.5 สำหรับเอาต์พุต PNG/WebP ที่มีพื้นหลังโปร่งใส API ปัจจุบันของ
gpt-image-2 ปฏิเสธ background: "transparent"
gpt-image-2 รองรับทั้งการสร้างภาพจากข้อความและ
การแก้ไขรูปภาพอ้างอิงผ่านเครื่องมือ image_generate เดียวกัน
OpenClaw ส่งต่อ prompt, count, size, quality, outputFormat
และรูปภาพอ้างอิงไปยัง OpenAI OpenAI จะไม่ได้รับ
aspectRatio หรือ resolution โดยตรง เมื่อเป็นไปได้ OpenClaw จะ map
สิ่งเหล่านั้นเป็น size ที่รองรับ มิฉะนั้นเครื่องมือจะรายงานว่าเป็น
override ที่ถูกละเว้น
ตัวเลือกเฉพาะของ OpenAI อยู่ภายใต้ออบเจ็กต์ openai:
{ "quality": "low", "outputFormat": "jpeg", "openai": { "background": "opaque", "moderation": "low", "outputCompression": 60, "user": "end-user-42" }}openai.background รับค่า transparent, opaque หรือ auto;
เอาต์พุตโปร่งใสต้องใช้ outputFormat เป็น png หรือ webp และ
model รูปภาพ OpenAI ที่รองรับความโปร่งใส OpenClaw route คำขอพื้นหลังโปร่งใสของ
gpt-image-2 เริ่มต้นไปยัง gpt-image-1.5
openai.outputCompression ใช้กับเอาต์พุต JPEG/WebP และจะถูกละเว้น
สำหรับเอาต์พุต PNG
คำใบ้ background ระดับบนสุดเป็นกลางต่อ provider และปัจจุบันจะ map
ไปยังฟิลด์คำขอ background เดียวกันของ OpenAI เมื่อเลือก provider OpenAI
provider ที่ไม่ได้ประกาศการรองรับพื้นหลังจะส่งคืนค่านี้ใน
ignoredOverrides แทนที่จะได้รับพารามิเตอร์ที่ไม่รองรับ
หากต้องการ route การสร้างภาพของ OpenAI ผ่าน deployment ของ Azure OpenAI
แทน api.openai.com โปรดดู
endpoint ของ Azure OpenAI
model รูปภาพ Microsoft Foundry MAI
การสร้างภาพของ Microsoft Foundry ใช้ชื่อ deployment รูปภาพ MAI ที่ deploy แล้ว
ภายใต้ prefix provider microsoft-foundry/ ไม่มี model เริ่มต้นระดับ provider
เพราะ MAI API คาดหวังชื่อ deployment ของคุณในฟิลด์
model:
{ agents: { defaults: { imageGenerationModel: { primary: "microsoft-foundry/<deployment-name>", timeoutMs: 600_000, }, }, },}provider ใช้ MAI API ของ Microsoft Foundry ไม่ใช่ OpenAI Images API:
- endpoint การสร้าง:
/mai/v1/images/generations - endpoint การแก้ไข:
/mai/v1/images/edits - Auth:
AZURE_OPENAI_API_KEY/ API key ของ provider หรือ Entra ID ผ่านaz login - เอาต์พุต: รูป PNG หนึ่งรูป
- ขนาด: ค่าเริ่มต้น
1024x1024; ความกว้างและความสูงต้องอย่างน้อย 768 px แต่ละด้าน และจำนวนพิกเซลรวมต้องไม่เกิน 1,048,576 - การแก้ไข: รูปภาพอ้างอิง PNG หรือ JPEG หนึ่งรูป รองรับเฉพาะโดย
deployment
MAI-Image-2.5-FlashและMAI-Image-2.5
การสร้างจาก prompt อย่างเดียวสามารถใช้ชื่อ deployment แบบกำหนดเองได้โดยมีเพียง
endpoint ของ Foundry ที่กำหนดค่าไว้ การแก้ไขด้วยชื่อ deployment แบบกำหนดเองต้องใช้
metadata การ onboarding/model เพื่อให้ OpenClaw ตรวจสอบได้ว่า deployment นั้น
รองรับโดย MAI-Image-2.5-Flash หรือ MAI-Image-2.5
model รูปภาพ MAI ปัจจุบันคือ MAI-Image-2.5-Flash, MAI-Image-2.5,
MAI-Image-2e และ MAI-Image-2 ดู
Plugin Microsoft Foundry สำหรับการตั้งค่า
และพฤติกรรมของ chat-model
model รูปภาพ OpenRouter
การสร้างภาพของ OpenRouter ใช้ OPENROUTER_API_KEY เดียวกัน และ
route ผ่าน chat completions image API ของ OpenRouter เลือก
model รูปภาพ OpenRouter ด้วย prefix openrouter/:
{ agents: { defaults: { imageGenerationModel: { primary: "openrouter/google/gemini-3.1-flash-image-preview", }, }, },}OpenClaw ส่งต่อ prompt, count, รูปภาพอ้างอิง และ
คำใบ้ aspectRatio / resolution ที่เข้ากันได้กับ Gemini ไปยัง OpenRouter
shortcut ของ model รูปภาพ OpenRouter ที่มีในตัวปัจจุบันรวมถึง
google/gemini-3.1-flash-image-preview,
google/gemini-3-pro-image-preview และ openai/gpt-5.4-image-2 ใช้
action: "list" เพื่อดูว่า Plugin ที่คุณกำหนดค่าไว้เปิดเผยอะไรบ้าง
fal Krea 2
model Krea 2 บน fal ใช้ schema Krea native ของ fal แทน schema
image_size ทั่วไปที่ Flux ใช้ OpenClaw ส่ง:
aspect_ratioสำหรับคำใบ้ aspect-ratiocreativityโดยมีค่าเริ่มต้นเป็นmediumimage_style_referencesเมื่อมีการระบุimageหรือimages
เลือก Krea 2 Medium สำหรับภาพประกอบเชิงสื่อสารที่เร็วกว่า และ Krea 2 Large สำหรับลุค photoreal และพื้นผิวที่ช้ากว่าและละเอียดกว่า:
{ agents: { defaults: { imageGenerationModel: { primary: "fal/krea/v2/medium/text-to-image", }, }, },}ปัจจุบัน Krea 2 ส่งคืนหนึ่งรูปต่อคำขอ ควรใช้ aspectRatio สำหรับ
Krea; OpenClaw map size ไปยัง aspect ratio ของ Krea ที่รองรับซึ่งใกล้ที่สุด และ
ปฏิเสธ resolution สำหรับ Krea แทนที่จะทิ้งค่าไป ใช้ fal.creativity
เมื่อคุณต้องการระดับความสร้างสรรค์ native ของ Krea:
{ "model": "fal/krea/v2/medium/text-to-image", "prompt": "A cyber zine portrait with risograph texture", "aspectRatio": "9:16", "fal": { "creativity": "high" }}MiniMax dual-auth
การสร้างภาพของ MiniMax พร้อมใช้งานผ่านเส้นทาง auth ของ MiniMax ที่ bundled ทั้งสองแบบ:
minimax/image-01สำหรับการตั้งค่าด้วย API keyminimax-portal/image-01สำหรับการตั้งค่าด้วย OAuth
xAI grok-imagine-image
provider xAI ที่ bundled ใช้ /v1/images/generations สำหรับคำขอที่มีเพียง prompt
และ /v1/images/edits เมื่อมี image หรือ images
- Model:
xai/grok-imagine-image,xai/grok-imagine-image-quality - จำนวน: สูงสุด 4
- ข้อมูลอ้างอิง:
imageหนึ่งรายการ หรือimagesสูงสุดห้ารายการ - Aspect ratio:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - ความละเอียด:
1K,2K - เอาต์พุต: ส่งคืนเป็นไฟล์แนบรูปภาพที่ OpenClaw จัดการ
OpenClaw ตั้งใจไม่เปิดเผย quality, mask, user หรือ aspect ratio
native-only เพิ่มเติมของ xAI จนกว่าการควบคุมเหล่านั้นจะมีอยู่
ใน contract image_generate แบบข้าม provider ที่ใช้ร่วมกัน
ตัวอย่าง
สร้าง (ภูมิทัศน์ 4K)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="A clean editorial poster for OpenClaw image generation" size=3840x2160 count=1สร้าง (PNG โปร่งใส)
/tool image_generate action=generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparentCLI ที่เทียบเท่า:
openclaw infer image generate \--model openai/gpt-image-1.5 \--output-format png \--background transparent \--prompt "A simple red circle sticker on a transparent background" \--jsonสร้าง (คุณภาพต่ำของ OpenAI)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Low-cost draft poster for a quiet productivity app" quality=low openai='{"moderation":"low"}'CLI ที่เทียบเท่า:
openclaw infer image generate \--model openai/gpt-image-2 \--quality low \--openai-moderation low \--prompt "Low-cost draft poster for a quiet productivity app" \--jsonสร้าง (สองภาพสี่เหลี่ยมจัตุรัส)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Two visual directions for a calm productivity app icon" size=1024x1024 count=2แก้ไข (ภาพอ้างอิงเดียว)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Keep the subject, replace the background with a bright studio setup" image=/path/to/reference.png size=1024x1536แก้ไข (หลายภาพอ้างอิง)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Combine the character identity from the first image with the color palette from the second" images='["/path/to/character.png","/path/to/palette.jpg"]' size=1536x1024ภาพอ้างอิงสไตล์ Krea
/tool image_generate action=generate model=fal/krea/v2/medium/text-to-image prompt="An expressive editorial portrait using this color palette and print texture" images='["/path/to/palette.png","/path/to/texture.jpg"]' aspectRatio=9:16 fal='{"creativity":"high"}'แฟล็ก --output-format, --background, --quality และ
--openai-moderation เดียวกันพร้อมใช้งานบน openclaw infer image edit;
--openai-background ยังคงเป็น alias เฉพาะของ OpenAI ผู้ให้บริการที่บันเดิลมา
นอกเหนือจาก OpenAI ยังไม่ได้ประกาศการควบคุมพื้นหลังอย่างชัดเจนในตอนนี้ ดังนั้น
background: "transparent" จะถูกรายงานว่าถูกละเว้นสำหรับผู้ให้บริการเหล่านั้น
ที่เกี่ยวข้อง
- ภาพรวมเครื่องมือ - เครื่องมือเอเจนต์ทั้งหมดที่พร้อมใช้งาน
- ComfyUI - การตั้งค่าเวิร์กโฟลว์ ComfyUI ภายในเครื่องและ Comfy Cloud
- fal - การตั้งค่าผู้ให้บริการรูปภาพและวิดีโอของ fal
- Google (Gemini) - การตั้งค่าผู้ให้บริการรูปภาพ Gemini
- Microsoft Foundry plugin - การตั้งค่าแชต Microsoft Foundry และรูปภาพ MAI
- MiniMax - การตั้งค่าผู้ให้บริการรูปภาพ MiniMax
- OpenAI - การตั้งค่าผู้ให้บริการ OpenAI Images
- Vydra - การตั้งค่ารูปภาพ วิดีโอ และเสียงพูดของ Vydra
- xAI - การตั้งค่ารูปภาพ วิดีโอ การค้นหา การดำเนินการโค้ด และ TTS ของ Grok
- ข้อมูลอ้างอิงการกำหนดค่า - การกำหนดค่า
imageGenerationModel - โมเดล - การกำหนดค่าโมเดลและการสลับเมื่อขัดข้อง