Saltar al contenido principal

Generación de imágenes

La herramienta image_generate permite al agente crear y editar imágenes usando tus proveedores configurados. Las imágenes generadas se entregan automáticamente como archivos multimedia adjuntos en la respuesta del agente.
La herramienta solo aparece cuando hay disponible al menos un proveedor de generación de imágenes. Si no ves image_generate en las herramientas de tu agente, configura agents.defaults.imageGenerationModel o establece una clave API de proveedor.

Inicio rápido

  1. Establece una clave API para al menos un proveedor (por ejemplo OPENAI_API_KEY o GEMINI_API_KEY).
  2. Opcionalmente, establece tu modelo preferido:
{
  agents: {
    defaults: {
      imageGenerationModel: "openai/gpt-image-1",
    },
  },
}
  1. Pídele al agente: “Genera una imagen de una amigable mascota langosta.”
El agente llama automáticamente a image_generate. No se necesita lista de permitidos de herramientas: está habilitada por defecto cuando hay un proveedor disponible.

Proveedores compatibles

ProveedorModelo predeterminadoCompatibilidad con ediciónClave API
OpenAIgpt-image-1Sí (hasta 5 imágenes)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewGEMINI_API_KEY o GOOGLE_API_KEY
falfal-ai/flux/devFAL_KEY
MiniMaximage-01Sí (referencia de sujeto)MINIMAX_API_KEY o OAuth de MiniMax (minimax-portal)
Usa action: "list" para inspeccionar los proveedores y modelos disponibles en tiempo de ejecución:
/tool image_generate action=list

Parámetros de la herramienta

ParámetroTipoDescripción
promptstringPrompt de generación de imagen (obligatorio para action: "generate")
actionstring"generate" (predeterminado) o "list" para inspeccionar proveedores
modelstringSobrescritura de proveedor/modelo, por ejemplo openai/gpt-image-1
imagestringRuta o URL de una sola imagen de referencia para el modo de edición
imagesstring[]Varias rutas de imágenes de referencia para el modo de edición (hasta 5)
sizestringSugerencia de tamaño: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostringRelación de aspecto: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstringSugerencia de resolución: 1K, 2K o 4K
countnumberNúmero de imágenes a generar (1–4)
filenamestringSugerencia de nombre de archivo de salida
No todos los proveedores admiten todos los parámetros. La herramienta pasa lo que admite cada proveedor e ignora el resto.

Configuración

Selección de modelo

{
  agents: {
    defaults: {
      // String form: primary model only
      imageGenerationModel: "google/gemini-3.1-flash-image-preview",

      // Object form: primary + ordered fallbacks
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

Orden de selección de proveedor

Al generar una imagen, OpenClaw prueba los proveedores en este orden:
  1. Parámetro model de la llamada a la herramienta (si el agente especifica uno)
  2. imageGenerationModel.primary de la configuración
  3. imageGenerationModel.fallbacks en orden
  4. Detección automática: usa solo los valores predeterminados de proveedores respaldados por autenticación:
    • primero el proveedor predeterminado actual
    • después los demás proveedores registrados de generación de imágenes en orden de id de proveedor
Si un proveedor falla (error de autenticación, límite de tasa, etc.), se prueba automáticamente el siguiente candidato. Si todos fallan, el error incluye detalles de cada intento. Notas:
  • La detección automática tiene en cuenta la autenticación. Un valor predeterminado de proveedor solo entra en la lista de candidatos cuando OpenClaw realmente puede autenticar ese proveedor.
  • Usa action: "list" para inspeccionar los proveedores registrados actualmente, sus modelos predeterminados y las sugerencias de variables de entorno de autenticación.

Edición de imágenes

OpenAI, Google, fal y MiniMax admiten edición de imágenes de referencia. Pasa una ruta o URL de imagen de referencia:
"Genera una versión en acuarela de esta foto" + image: "/path/to/photo.jpg"
OpenAI y Google admiten hasta 5 imágenes de referencia mediante el parámetro images. fal y MiniMax admiten 1. La generación de imágenes de MiniMax está disponible mediante ambas rutas de autenticación incluidas de MiniMax:
  • minimax/image-01 para configuraciones con clave API
  • minimax-portal/image-01 para configuraciones con OAuth

Capacidades del proveedor

CapacidadOpenAIGooglefalMiniMax
GenerarSí (hasta 4)Sí (hasta 4)Sí (hasta 4)Sí (hasta 9)
Edición/referenciaSí (hasta 5 imágenes)Sí (hasta 5 imágenes)Sí (1 imagen)Sí (1 imagen, referencia de sujeto)
Control de tamañoNo
Relación de aspectoNoSí (solo generación)
Resolución (1K/2K/4K)NoNo

Relacionado