Перейти до основного вмісту

Генерація зображень

Інструмент image_generate дає змогу агенту створювати та редагувати зображення за допомогою ваших налаштованих провайдерів. Згенеровані зображення автоматично доставляються як медіавкладення у відповіді агента.
Інструмент з’являється лише тоді, коли доступний принаймні один провайдер генерації зображень. Якщо ви не бачите image_generate серед інструментів вашого агента, налаштуйте agents.defaults.imageGenerationModel або задайте ключ API провайдера.

Швидкий старт

  1. Установіть ключ API щонайменше для одного провайдера (наприклад, OPENAI_API_KEY або GEMINI_API_KEY).
  2. За потреби встановіть бажану модель:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
      },
    },
  },
}
  1. Попросіть агента: “Згенеруй зображення дружнього лобстера-маскота.”
Агент автоматично викликає image_generate. Жодного списку дозволів для інструментів не потрібно — його ввімкнено за замовчуванням, коли провайдер доступний.

Підтримувані провайдери

ПровайдерМодель за замовчуваннямПідтримка редагуванняКлюч API
OpenAIgpt-image-1Так (до 5 зображень)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewТакGEMINI_API_KEY або GOOGLE_API_KEY
falfal-ai/flux/devТакFAL_KEY
MiniMaximage-01Так (референс суб’єкта)MINIMAX_API_KEY або MiniMax OAuth (minimax-portal)
Використовуйте action: "list", щоб переглянути доступні провайдери та моделі під час виконання:
/tool image_generate action=list

Параметри інструмента

ПараметрТипОпис
promptstringЗапит для генерації зображення (обов’язковий для action: "generate")
actionstring"generate" (типово) або "list" для перегляду провайдерів
modelstringПеревизначення провайдера/моделі, наприклад openai/gpt-image-1
imagestringШлях або URL одного референсного зображення для режиму редагування
imagesstring[]Кілька референсних зображень для режиму редагування (до 5)
sizestringПідказка розміру: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostringСпіввідношення сторін: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstringПідказка роздільної здатності: 1K, 2K або 4K
countnumberКількість зображень для генерації (1–4)
filenamestringПідказка для назви вихідного файла
Не всі провайдери підтримують усі параметри. Інструмент передає те, що підтримує кожен провайдер, а решту ігнорує.

Конфігурація

Вибір моделі

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

Порядок вибору провайдера

Під час генерації зображення OpenClaw пробує провайдерів у такому порядку:
  1. Параметр model з виклику інструмента (якщо агент його вказує)
  2. imageGenerationModel.primary з конфігурації
  3. imageGenerationModel.fallbacks у заданому порядку
  4. Автовиявлення — використовує лише типові значення провайдерів, підкріплені автентифікацією:
    • спочатку поточний типовий провайдер
    • решта зареєстрованих провайдерів генерації зображень у порядку ідентифікаторів провайдерів
Якщо провайдер завершується помилкою (помилка автентифікації, обмеження швидкості тощо), автоматично пробується наступний кандидат. Якщо всі завершаться помилкою, помилка міститиме подробиці кожної спроби. Примітки:
  • Автовиявлення враховує автентифікацію. Типове значення провайдера потрапляє до списку кандидатів лише тоді, коли OpenClaw справді може автентифікувати цей провайдер.
  • Використовуйте action: "list", щоб переглянути наразі зареєстрованих провайдерів, їхні типові моделі та підказки щодо змінних середовища для автентифікації.

Редагування зображень

OpenAI, Google, fal і MiniMax підтримують редагування референсних зображень. Передайте шлях або URL референсного зображення:
"Згенеруй акварельну версію цього фото" + image: "/path/to/photo.jpg"
OpenAI і Google підтримують до 5 референсних зображень через параметр images. fal і MiniMax підтримують 1. Генерація зображень MiniMax доступна через обидва вбудовані шляхи автентифікації MiniMax:
  • minimax/image-01 для налаштувань із ключем API
  • minimax-portal/image-01 для налаштувань із OAuth

Можливості провайдерів

МожливістьOpenAIGooglefalMiniMax
ГенераціяТак (до 4)Так (до 4)Так (до 4)Так (до 9)
Редагування/референсТак (до 5 зображень)Так (до 5 зображень)Так (1 зображення)Так (1 зображення, референс суб’єкта)
Керування розміромТакТакТакНі
Співвідношення сторінНіТакТак (лише генерація)Так
Роздільна здатність (1K/2K/4K)НіТакТакНі

Пов’язане

  • Огляд інструментів — усі доступні інструменти агента
  • fal — налаштування провайдера зображень і відео fal
  • Google (Gemini) — налаштування провайдера зображень Gemini
  • MiniMax — налаштування провайдера зображень MiniMax
  • OpenAI — налаштування провайдера OpenAI Images
  • Довідник із конфігурації — конфігурація imageGenerationModel
  • Моделі — конфігурація моделей і резервне перемикання