Генерація зображень
Інструмент image_generate дає змогу агенту створювати та редагувати зображення за допомогою ваших налаштованих провайдерів. Згенеровані зображення автоматично доставляються як медіавкладення у відповіді агента.
Інструмент з’являється лише тоді, коли доступний принаймні один провайдер генерації зображень. Якщо ви не бачите image_generate серед інструментів вашого агента, налаштуйте agents.defaults.imageGenerationModel або задайте ключ API провайдера.
Швидкий старт
- Установіть ключ API щонайменше для одного провайдера (наприклад,
OPENAI_API_KEY або GEMINI_API_KEY).
- За потреби встановіть бажану модель:
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-1",
},
},
},
}
- Попросіть агента: “Згенеруй зображення дружнього лобстера-маскота.”
Агент автоматично викликає image_generate. Жодного списку дозволів для інструментів не потрібно — його ввімкнено за замовчуванням, коли провайдер доступний.
Підтримувані провайдери
| Провайдер | Модель за замовчуванням | Підтримка редагування | Ключ API |
|---|
| OpenAI | gpt-image-1 | Так (до 5 зображень) | OPENAI_API_KEY |
| Google | gemini-3.1-flash-image-preview | Так | GEMINI_API_KEY або GOOGLE_API_KEY |
| fal | fal-ai/flux/dev | Так | FAL_KEY |
| MiniMax | image-01 | Так (референс суб’єкта) | MINIMAX_API_KEY або MiniMax OAuth (minimax-portal) |
Використовуйте action: "list", щоб переглянути доступні провайдери та моделі під час виконання:
/tool image_generate action=list
Параметри інструмента
| Параметр | Тип | Опис |
|---|
prompt | string | Запит для генерації зображення (обов’язковий для action: "generate") |
action | string | "generate" (типово) або "list" для перегляду провайдерів |
model | string | Перевизначення провайдера/моделі, наприклад openai/gpt-image-1 |
image | string | Шлях або URL одного референсного зображення для режиму редагування |
images | string[] | Кілька референсних зображень для режиму редагування (до 5) |
size | string | Підказка розміру: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024 |
aspectRatio | string | Співвідношення сторін: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
resolution | string | Підказка роздільної здатності: 1K, 2K або 4K |
count | number | Кількість зображень для генерації (1–4) |
filename | string | Підказка для назви вихідного файла |
Не всі провайдери підтримують усі параметри. Інструмент передає те, що підтримує кожен провайдер, а решту ігнорує.
Конфігурація
Вибір моделі
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-1",
fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
},
},
},
}
Порядок вибору провайдера
Під час генерації зображення OpenClaw пробує провайдерів у такому порядку:
- Параметр
model з виклику інструмента (якщо агент його вказує)
imageGenerationModel.primary з конфігурації
imageGenerationModel.fallbacks у заданому порядку
- Автовиявлення — використовує лише типові значення провайдерів, підкріплені автентифікацією:
- спочатку поточний типовий провайдер
- решта зареєстрованих провайдерів генерації зображень у порядку ідентифікаторів провайдерів
Якщо провайдер завершується помилкою (помилка автентифікації, обмеження швидкості тощо), автоматично пробується наступний кандидат. Якщо всі завершаться помилкою, помилка міститиме подробиці кожної спроби.
Примітки:
- Автовиявлення враховує автентифікацію. Типове значення провайдера потрапляє до списку кандидатів лише тоді, коли OpenClaw справді може автентифікувати цей провайдер.
- Використовуйте
action: "list", щоб переглянути наразі зареєстрованих провайдерів, їхні типові моделі та підказки щодо змінних середовища для автентифікації.
Редагування зображень
OpenAI, Google, fal і MiniMax підтримують редагування референсних зображень. Передайте шлях або URL референсного зображення:
"Згенеруй акварельну версію цього фото" + image: "/path/to/photo.jpg"
OpenAI і Google підтримують до 5 референсних зображень через параметр images. fal і MiniMax підтримують 1.
Генерація зображень MiniMax доступна через обидва вбудовані шляхи автентифікації MiniMax:
minimax/image-01 для налаштувань із ключем API
minimax-portal/image-01 для налаштувань із OAuth
Можливості провайдерів
| Можливість | OpenAI | Google | fal | MiniMax |
|---|
| Генерація | Так (до 4) | Так (до 4) | Так (до 4) | Так (до 9) |
| Редагування/референс | Так (до 5 зображень) | Так (до 5 зображень) | Так (1 зображення) | Так (1 зображення, референс суб’єкта) |
| Керування розміром | Так | Так | Так | Ні |
| Співвідношення сторін | Ні | Так | Так (лише генерація) | Так |
| Роздільна здатність (1K/2K/4K) | Ні | Так | Так | Ні |
Пов’язане