메인 콘텐츠로 건너뛰기

이미지 생성

image_generate tool을 사용하면 에이전트가 구성된 제공자를 사용해 이미지를 생성하고 편집할 수 있습니다. 생성된 이미지는 에이전트 응답의 미디어 첨부파일로 자동 전달됩니다.
하나 이상의 이미지 생성 제공자를 사용할 수 있을 때만 이 tool이 표시됩니다. 에이전트의 도구에 image_generate가 보이지 않으면 agents.defaults.imageGenerationModel을 구성하거나 제공자 API 키를 설정하세요.

빠른 시작

  1. 최소 하나의 제공자에 대한 API 키를 설정합니다(예: OPENAI_API_KEY 또는 GEMINI_API_KEY).
  2. 필요하면 선호하는 모델을 설정합니다:
{
  agents: {
    defaults: {
      imageGenerationModel: "openai/gpt-image-1",
    },
  },
}
  1. 에이전트에게 요청합니다: “친근한 바닷가재 마스코트 이미지를 생성해줘.”
에이전트는 자동으로 image_generate를 호출합니다. tool allow-list 설정은 필요하지 않습니다. 제공자를 사용할 수 있으면 기본적으로 활성화됩니다.

지원되는 제공자

Provider기본 모델편집 지원API 키
OpenAIgpt-image-1예(최대 5개 이미지)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewGEMINI_API_KEY 또는 GOOGLE_API_KEY
falfal-ai/flux/devFAL_KEY
MiniMaximage-01예(subject reference)MINIMAX_API_KEY 또는 MiniMax OAuth (minimax-portal)
런타임에 사용 가능한 제공자와 모델을 확인하려면 action: "list"를 사용하세요:
/tool image_generate action=list

tool 매개변수

ParameterType설명
promptstring이미지 생성 프롬프트(action: "generate"일 때 필수)
actionstring"generate"(기본값) 또는 제공자를 확인하기 위한 "list"
modelstring제공자/모델 재정의(예: openai/gpt-image-1)
imagestring편집 모드용 단일 참조 이미지 경로 또는 URL
imagesstring[]편집 모드용 여러 참조 이미지(최대 5개)
sizestring크기 힌트: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostring종횡비: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstring해상도 힌트: 1K, 2K, 또는 4K
countnumber생성할 이미지 수(1–4)
filenamestring출력 파일 이름 힌트
모든 제공자가 모든 매개변수를 지원하는 것은 아닙니다. 이 tool은 각 제공자가 지원하는 값만 전달하고 나머지는 무시합니다.

구성

모델 선택

{
  agents: {
    defaults: {
      // 문자열 형식: 기본 모델만
      imageGenerationModel: "google/gemini-3.1-flash-image-preview",

      // 객체 형식: 기본 + 순서 있는 폴백
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

제공자 선택 순서

이미지를 생성할 때 OpenClaw는 다음 순서로 제공자를 시도합니다:
  1. tool 호출의 model 매개변수(에이전트가 지정한 경우)
  2. config의 imageGenerationModel.primary
  3. 순서대로 imageGenerationModel.fallbacks
  4. 자동 감지 — 인증이 가능한 제공자 기본값만 사용:
    • 현재 기본 제공자 우선
    • 나머지 등록된 이미지 생성 제공자를 provider-id 순서로
제공자가 실패하면(인증 오류, rate limit 등) 다음 후보가 자동으로 시도됩니다. 모두 실패하면 오류에 각 시도의 세부 정보가 포함됩니다. 참고:
  • 자동 감지는 인증 인식 방식으로 동작합니다. OpenClaw가 해당 제공자를 실제로 인증할 수 있을 때만 제공자 기본값이 후보 목록에 들어갑니다.
  • 현재 등록된 제공자, 기본 모델, 인증 env var 힌트를 확인하려면 action: "list"를 사용하세요.

이미지 편집

OpenAI, Google, fal, MiniMax는 참조 이미지 편집을 지원합니다. 참조 이미지 경로 또는 URL을 전달하세요:
"이 사진을 수채화 버전으로 생성해줘" + image: "/path/to/photo.jpg"
OpenAI와 Google은 images 매개변수를 통해 최대 5개의 참조 이미지를 지원합니다. fal과 MiniMax는 1개를 지원합니다. MiniMax 이미지 생성은 두 번들 MiniMax 인증 경로 모두에서 사용할 수 있습니다:
  • API 키 설정용 minimax/image-01
  • OAuth 설정용 minimax-portal/image-01

제공자 기능

CapabilityOpenAIGooglefalMiniMax
생성예(최대 4개)예(최대 4개)예(최대 4개)예(최대 9개)
편집/참조예(최대 5개 이미지)예(최대 5개 이미지)예(이미지 1개)예(이미지 1개, subject ref)
크기 제어아니요
종횡비아니요예(생성만)
해상도(1K/2K/4K)아니요아니요

관련 문서