Skip to main content

图像生成

image_generate 工具让智能体能够使用你已配置的提供商创建和编辑图像。生成的图像会自动作为媒体附件随智能体的回复一并发送。
只有在至少有一个图像生成提供商可用时,此工具才会显示。如果你在智能体的工具中看不到 image_generate,请配置 agents.defaults.imageGenerationModel 或设置提供商 API 密钥。

快速开始

  1. 为至少一个提供商设置 API 密钥(例如 OPENAI_API_KEYGEMINI_API_KEY)。
  2. 可选:设置你偏好的模型:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
      },
    },
  },
}
  1. 向智能体提问:“生成一张友好的龙虾吉祥物图像。”
智能体会自动调用 image_generate。无需将工具加入允许列表——当有可用提供商时,它默认启用。

支持的提供商

提供商默认模型编辑支持API 密钥
OpenAIgpt-image-1是(最多 5 张图像)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewGEMINI_API_KEYGOOGLE_API_KEY
falfal-ai/flux/devFAL_KEY
MiniMaximage-01是(主体参考)MINIMAX_API_KEY 或 MiniMax OAuth(minimax-portal
ComfyUIworkflow是(1 张图像,由工作流配置)云端使用 COMFY_API_KEYCOMFY_CLOUD_API_KEY
Vydragrok-imagineVYDRA_API_KEY
使用 action: "list" 可在运行时查看可用的提供商和模型:
/tool image_generate action=list

工具参数

参数类型描述
promptstring图像生成提示词(action: "generate" 时必填)
actionstring"generate"(默认)或 "list",用于查看提供商
modelstring提供商/模型覆盖,例如 openai/gpt-image-1
imagestring编辑模式下的单个参考图像路径或 URL
imagesstring[]编辑模式下的多个参考图像(最多 5 张)
sizestring尺寸提示:1024x10241536x10241024x15361024x17921792x1024
aspectRatiostring宽高比:1:12:33:23:44:34:55:49:1616:921:9
resolutionstring分辨率提示:1K2K4K
countnumber要生成的图像数量(1–4)
filenamestring输出文件名提示
并非所有提供商都支持全部参数。当回退提供商支持的是接近的几何选项而不是精确请求的选项时,OpenClaw 会在提交前重新映射到最接近的受支持尺寸、宽高比或分辨率。确实不受支持的覆盖项仍会在工具结果中报告。 工具结果会报告实际应用的设置。当 OpenClaw 在提供商回退期间重新映射几何参数时,返回的 sizeaspectRatioresolution 值会反映实际发送的内容,而 details.normalization 会记录从请求值到应用值的转换。

配置

模型选择

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

提供商选择顺序

生成图像时,OpenClaw 会按以下顺序尝试提供商:
  1. 工具调用中的 model 参数(如果智能体指定了)
  2. 配置中的 imageGenerationModel.primary
  3. 按顺序使用 imageGenerationModel.fallbacks
  4. 自动检测 —— 仅使用基于认证的提供商默认值:
    • 先使用当前默认提供商
    • 然后按提供商 ID 顺序使用其余已注册的图像生成提供商
如果某个提供商失败(认证错误、速率限制等),系统会自动尝试下一个候选项。如果全部失败,错误中会包含每次尝试的详细信息。 说明:
  • 自动检测会感知认证状态。只有当 OpenClaw 实际能够验证该提供商时, 该提供商默认值才会进入候选列表。
  • 自动检测默认启用。如果你希望图像生成仅使用显式的 modelprimaryfallbacks 条目,请设置 agents.defaults.mediaGenerationAutoProviderFallback: false
  • 使用 action: "list" 可查看当前已注册的提供商、它们的 默认模型以及认证环境变量提示。

图像编辑

OpenAI、Google、fal、MiniMax 和 ComfyUI 支持编辑参考图像。传入参考图像路径或 URL:
"把这张照片生成为水彩风格版本" + image: "/path/to/photo.jpg"
OpenAI 和 Google 通过 images 参数最多支持 5 张参考图像。fal、MiniMax 和 ComfyUI 支持 1 张。 MiniMax 图像生成可通过两种内置的 MiniMax 认证路径使用:
  • minimax/image-01,用于 API 密钥配置
  • minimax-portal/image-01,用于 OAuth 配置

提供商能力

能力OpenAIGooglefalMiniMaxComfyUIVydra
生成是(最多 4 张)是(最多 4 张)是(最多 4 张)是(最多 9 张)是(输出由工作流定义)是(1 张)
编辑/参考是(最多 5 张图像)是(最多 5 张图像)是(1 张图像)是(1 张图像,主体参考)是(1 张图像,由工作流配置)
尺寸控制
宽高比是(仅生成)
分辨率(1K/2K/4K)

相关内容

  • 工具概览 — 所有可用的智能体工具
  • fal — fal 图像和视频提供商设置
  • ComfyUI — 本地 ComfyUI 和 Comfy Cloud 工作流设置
  • Google (Gemini) — Gemini 图像提供商设置
  • MiniMax — MiniMax 图像提供商设置
  • OpenAI — OpenAI Images 提供商设置
  • Vydra — Vydra 图像、视频和语音设置
  • 配置参考imageGenerationModel 配置
  • 模型 — 模型配置和故障转移