이미지 생성
image_generate tool을 사용하면 에이전트가 구성된 제공자를 사용해 이미지를 생성하고 편집할 수 있습니다. 생성된 이미지는 에이전트 응답의 미디어 첨부파일로 자동 전달됩니다.
하나 이상의 이미지 생성 제공자를 사용할 수 있을 때만 이 tool이 표시됩니다. 에이전트의 도구에 image_generate가 보이지 않으면 agents.defaults.imageGenerationModel을 구성하거나 제공자 API 키를 설정하세요.
빠른 시작
- 최소 하나의 제공자에 대한 API 키를 설정합니다(예:
OPENAI_API_KEY 또는 GEMINI_API_KEY).
- 필요하면 선호하는 모델을 설정합니다:
{
agents: {
defaults: {
imageGenerationModel: "openai/gpt-image-1",
},
},
}
- 에이전트에게 요청합니다: “친근한 바닷가재 마스코트 이미지를 생성해줘.”
에이전트는 자동으로 image_generate를 호출합니다. tool allow-list 설정은 필요하지 않습니다. 제공자를 사용할 수 있으면 기본적으로 활성화됩니다.
지원되는 제공자
| Provider | 기본 모델 | 편집 지원 | API 키 |
|---|
| OpenAI | gpt-image-1 | 예(최대 5개 이미지) | OPENAI_API_KEY |
| Google | gemini-3.1-flash-image-preview | 예 | GEMINI_API_KEY 또는 GOOGLE_API_KEY |
| fal | fal-ai/flux/dev | 예 | FAL_KEY |
| MiniMax | image-01 | 예(subject reference) | MINIMAX_API_KEY 또는 MiniMax OAuth (minimax-portal) |
런타임에 사용 가능한 제공자와 모델을 확인하려면 action: "list"를 사용하세요:
/tool image_generate action=list
| Parameter | Type | 설명 |
|---|
prompt | string | 이미지 생성 프롬프트(action: "generate"일 때 필수) |
action | string | "generate"(기본값) 또는 제공자를 확인하기 위한 "list" |
model | string | 제공자/모델 재정의(예: openai/gpt-image-1) |
image | string | 편집 모드용 단일 참조 이미지 경로 또는 URL |
images | string[] | 편집 모드용 여러 참조 이미지(최대 5개) |
size | string | 크기 힌트: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024 |
aspectRatio | string | 종횡비: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
resolution | string | 해상도 힌트: 1K, 2K, 또는 4K |
count | number | 생성할 이미지 수(1–4) |
filename | string | 출력 파일 이름 힌트 |
모든 제공자가 모든 매개변수를 지원하는 것은 아닙니다. 이 tool은 각 제공자가 지원하는 값만 전달하고 나머지는 무시합니다.
모델 선택
{
agents: {
defaults: {
// 문자열 형식: 기본 모델만
imageGenerationModel: "google/gemini-3.1-flash-image-preview",
// 객체 형식: 기본 + 순서 있는 폴백
imageGenerationModel: {
primary: "openai/gpt-image-1",
fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
},
},
},
}
제공자 선택 순서
이미지를 생성할 때 OpenClaw는 다음 순서로 제공자를 시도합니다:
- tool 호출의
model 매개변수(에이전트가 지정한 경우)
- config의
imageGenerationModel.primary
- 순서대로
imageGenerationModel.fallbacks
- 자동 감지 — 인증이 가능한 제공자 기본값만 사용:
- 현재 기본 제공자 우선
- 나머지 등록된 이미지 생성 제공자를 provider-id 순서로
제공자가 실패하면(인증 오류, rate limit 등) 다음 후보가 자동으로 시도됩니다. 모두 실패하면 오류에 각 시도의 세부 정보가 포함됩니다.
참고:
- 자동 감지는 인증 인식 방식으로 동작합니다. OpenClaw가 해당 제공자를 실제로 인증할 수 있을 때만 제공자 기본값이 후보 목록에 들어갑니다.
- 현재 등록된 제공자, 기본 모델, 인증 env var 힌트를 확인하려면
action: "list"를 사용하세요.
이미지 편집
OpenAI, Google, fal, MiniMax는 참조 이미지 편집을 지원합니다. 참조 이미지 경로 또는 URL을 전달하세요:
"이 사진을 수채화 버전으로 생성해줘" + image: "/path/to/photo.jpg"
OpenAI와 Google은 images 매개변수를 통해 최대 5개의 참조 이미지를 지원합니다. fal과 MiniMax는 1개를 지원합니다.
MiniMax 이미지 생성은 두 번들 MiniMax 인증 경로 모두에서 사용할 수 있습니다:
- API 키 설정용
minimax/image-01
- OAuth 설정용
minimax-portal/image-01
제공자 기능
| Capability | OpenAI | Google | fal | MiniMax |
|---|
| 생성 | 예(최대 4개) | 예(최대 4개) | 예(최대 4개) | 예(최대 9개) |
| 편집/참조 | 예(최대 5개 이미지) | 예(최대 5개 이미지) | 예(이미지 1개) | 예(이미지 1개, subject ref) |
| 크기 제어 | 예 | 예 | 예 | 아니요 |
| 종횡비 | 아니요 | 예 | 예(생성만) | 예 |
| 해상도(1K/2K/4K) | 아니요 | 예 | 예 | 아니요 |
관련 문서
- 도구 개요 — 사용 가능한 모든 에이전트 도구
- 구성 참고 —
imageGenerationModel config
- 모델 — 모델 구성과 failover