Pular para o conteúdo principal

Geração de imagens

A ferramenta image_generate permite que o agente crie e edite imagens usando seus provedores configurados. As imagens geradas são entregues automaticamente como anexos de mídia na resposta do agente.
A ferramenta só aparece quando pelo menos um provedor de geração de imagens está disponível. Se você não vê image_generate nas ferramentas do seu agente, configure agents.defaults.imageGenerationModel ou defina uma chave de API de provedor.

Início rápido

  1. Defina uma chave de API para pelo menos um provedor (por exemplo OPENAI_API_KEY ou GEMINI_API_KEY).
  2. Opcionalmente, defina seu modelo preferido:
{
  agents: {
    defaults: {
      imageGenerationModel: "openai/gpt-image-1",
    },
  },
}
  1. Peça ao agente: “Gere uma imagem de um mascote lagosta amigável.”
O agente chama image_generate automaticamente. Não é necessário allow-listing da ferramenta — ela é habilitada por padrão quando um provedor está disponível.

Provedores compatíveis

ProvedorModelo padrãoSuporte a ediçãoChave de API
OpenAIgpt-image-1Sim (até 5 imagens)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewSimGEMINI_API_KEY ou GOOGLE_API_KEY
falfal-ai/flux/devSimFAL_KEY
MiniMaximage-01Sim (imagem de referência de assunto)MINIMAX_API_KEY ou OAuth do MiniMax (minimax-portal)
Use action: "list" para inspecionar os provedores e modelos disponíveis em runtime:
/tool image_generate action=list

Parâmetros da ferramenta

ParâmetroTipoDescrição
promptstringPrompt de geração de imagem (obrigatório para action: "generate")
actionstring"generate" (padrão) ou "list" para inspecionar provedores
modelstringSubstituição de provedor/modelo, por exemplo openai/gpt-image-1
imagestringCaminho ou URL de imagem de referência única para o modo de edição
imagesstring[]Várias imagens de referência para o modo de edição (até 5)
sizestringDica de tamanho: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostringProporção: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstringDica de resolução: 1K, 2K ou 4K
countnumberNúmero de imagens a gerar (1–4)
filenamestringDica de nome de arquivo de saída
Nem todos os provedores oferecem suporte a todos os parâmetros. A ferramenta passa o que cada provedor aceita e ignora o restante.

Configuração

Seleção de modelo

{
  agents: {
    defaults: {
      // Forma string: apenas modelo principal
      imageGenerationModel: "google/gemini-3.1-flash-image-preview",

      // Forma objeto: principal + fallbacks ordenados
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

Ordem de seleção de provedor

Ao gerar uma imagem, o OpenClaw tenta os provedores nesta ordem:
  1. Parâmetro model da chamada da ferramenta (se o agente especificar um)
  2. imageGenerationModel.primary da configuração
  3. imageGenerationModel.fallbacks em ordem
  4. Detecção automática — usa apenas padrões de provedor com autenticação:
    • provedor padrão atual primeiro
    • provedores restantes de geração de imagens registrados em ordem de id do provedor
Se um provedor falhar (erro de autenticação, limite de taxa etc.), o próximo candidato será tentado automaticamente. Se todos falharem, o erro incluirá detalhes de cada tentativa. Observações:
  • A detecção automática considera autenticação. Um padrão de provedor só entra na lista de candidatos quando o OpenClaw realmente consegue autenticar esse provedor.
  • Use action: "list" para inspecionar os provedores registrados no momento, seus modelos padrão e dicas de variáveis de ambiente de autenticação.

Edição de imagem

OpenAI, Google, fal e MiniMax oferecem suporte à edição de imagens de referência. Passe um caminho ou URL de imagem de referência:
"Gere uma versão em aquarela desta foto" + image: "/path/to/photo.jpg"
OpenAI e Google oferecem suporte a até 5 imagens de referência via o parâmetro images. fal e MiniMax oferecem suporte a 1. A geração de imagens MiniMax está disponível pelos dois caminhos de autenticação empacotados do MiniMax:
  • minimax/image-01 para configurações com chave de API
  • minimax-portal/image-01 para configurações com OAuth

Capacidades do provedor

CapacidadeOpenAIGooglefalMiniMax
GerarSim (até 4)Sim (até 4)Sim (até 4)Sim (até 9)
Editar/referênciaSim (até 5 imagens)Sim (até 5 imagens)Sim (1 imagem)Sim (1 imagem, ref de assunto)
Controle de tamanhoSimSimSimNão
ProporçãoNãoSimSim (apenas geração)Sim
Resolução (1K/2K/4K)NãoSimSimNão

Relacionado