Генерація відео
Інструментvideo_generate дає змогу агенту створювати відео за допомогою ваших налаштованих провайдерів. У сеансах агента OpenClaw запускає генерацію відео як фонове завдання, відстежує її в журналі завдань, а потім знову пробуджує агента, коли кліп готовий, щоб агент міг опублікувати готове відео назад у вихідний канал.
Інструмент з’являється лише тоді, коли доступний принаймні один провайдер генерації відео. Якщо ви не бачите
video_generate в інструментах вашого агента, налаштуйте agents.defaults.videoGenerationModel або задайте API-ключ провайдера.У сеансах агента
video_generate повертається одразу з id завдання/run id. Фактичне завдання провайдера продовжується у фоновому режимі. Коли воно завершується, OpenClaw пробуджує той самий сеанс внутрішньою подією завершення, щоб агент міг надіслати звичайне подальше повідомлення разом із вкладенням згенерованого відео.Швидкий старт
- Задайте API-ключ принаймні для одного провайдера (наприклад,
OPENAI_API_KEY,GEMINI_API_KEY,MODELSTUDIO_API_KEY,QWEN_API_KEYабоRUNWAYML_API_SECRET). - За бажанням задайте бажану модель:
- Попросіть агента: “Згенеруй 5-секундне кінематографічне відео з дружнім лобстером, який катається на серфі на заході сонця.”
video_generate автоматично. Дозвільний список інструментів не потрібен — інструмент увімкнений за замовчуванням, коли доступний провайдер.
Для прямих синхронних контекстів без запуску агента на основі сеансу інструмент усе одно переходить до вбудованої генерації та повертає фінальний шлях до медіафайлу в результаті інструмента.
Підтримувані провайдери
| Провайдер | Модель за замовчуванням | Опорні вхідні дані | API-ключ |
|---|---|---|---|
| Alibaba | wan2.6-t2v | Так, віддалені URL | MODELSTUDIO_API_KEY, DASHSCOPE_API_KEY, QWEN_API_KEY |
| BytePlus | seedance-1-0-lite-t2v-250428 | 1 зображення | BYTEPLUS_API_KEY |
| fal | fal-ai/minimax/video-01-live | 1 зображення | FAL_KEY |
veo-3.1-fast-generate-preview | 1 зображення або 1 відео | GEMINI_API_KEY, GOOGLE_API_KEY | |
| MiniMax | MiniMax-Hailuo-2.3 | 1 зображення | MINIMAX_API_KEY |
| OpenAI | sora-2 | 1 зображення або 1 відео | OPENAI_API_KEY |
| Qwen | wan2.6-t2v | Так, віддалені URL | QWEN_API_KEY, MODELSTUDIO_API_KEY, DASHSCOPE_API_KEY |
| Runway | gen4.5 | 1 зображення або 1 відео | RUNWAYML_API_SECRET, RUNWAY_API_KEY |
| Together | Wan-AI/Wan2.2-T2V-A14B | 1 зображення | TOGETHER_API_KEY |
| xAI | grok-imagine-video | 1 зображення або 1 відео | XAI_API_KEY |
action: "list", щоб переглянути доступні провайдери та моделі під час виконання:
Параметри інструмента
| Параметр | Тип | Опис |
|---|---|---|
prompt | string | Запит для генерації відео (обов’язковий для action: "generate") |
action | string | "generate" (за замовчуванням) або "list" для перегляду провайдерів |
model | string | Перевизначення провайдера/моделі, наприклад qwen/wan2.6-t2v |
image | string | Шлях або URL одного опорного зображення |
images | string[] | Кілька опорних зображень (до 5) |
video | string | Шлях або URL одного опорного відео |
videos | string[] | Кілька опорних відео (до 4) |
size | string | Підказка щодо розміру, якщо провайдер це підтримує |
aspectRatio | string | Співвідношення сторін: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
resolution | string | Підказка щодо роздільної здатності: 480P, 720P або 1080P |
durationSeconds | number | Цільова тривалість у секундах. OpenClaw може округлити її до найближчого значення, яке підтримує провайдер |
audio | boolean | Увімкнути згенерований звук, якщо провайдер це підтримує |
watermark | boolean | Увімкнути або вимкнути водяні знаки провайдера, якщо підтримується |
filename | string | Підказка щодо імені вихідного файлу |
durationSeconds до найближчого підтримуваного значення та повідомляє нормалізовану тривалість у результаті інструмента.
Асинхронна поведінка
- Запуски агента на основі сеансу:
video_generateстворює фонове завдання, одразу повертає відповідь про запуск/завдання, а готове відео публікує пізніше в подальшому повідомленні агента. - Відстеження завдань: використовуйте
openclaw tasks list/openclaw tasks show <taskId>, щоб переглядати статуси генерації в черзі, у виконанні та кінцеві статуси. - Пробудження після завершення: OpenClaw вставляє внутрішню подію завершення назад у той самий сеанс, щоб модель могла сама написати подальше повідомлення для користувача.
- Резервний режим без сеансу: прямі/локальні контексти без реального сеансу агента все одно виконуються вбудовано та повертають фінальний результат відео в тому самому ході.
Конфігурація
Вибір моделі
Порядок вибору провайдерів
Під час генерації відео OpenClaw пробує провайдерів у такому порядку:- Параметр
modelз виклику інструмента (якщо агент його вказує) videoGenerationModel.primaryіз конфігураціїvideoGenerationModel.fallbacksу заданому порядку- Автовиявлення — використовує лише типові налаштування провайдерів, підкріплені автентифікацією:
- спочатку поточний провайдер за замовчуванням
- решта зареєстрованих провайдерів генерації відео в порядку id провайдера
Примітки щодо провайдерів
- Alibaba використовує асинхронну кінцеву точку відео DashScope / Model Studio і наразі вимагає віддалені URL
http(s)для опорних ресурсів. - Google використовує Gemini/Veo і підтримує один опорний вхід у вигляді зображення або відео.
- MiniMax, Together, BytePlus і fal наразі підтримують один опорний вхід у вигляді зображення.
- OpenAI використовує нативну кінцеву точку відео і наразі за замовчуванням використовує
sora-2. - Qwen підтримує опорні зображення/відео, але вхідна відеокінцева точка DashScope наразі вимагає віддалені URL
http(s)для цих опорних даних. - Runway використовує нативний API асинхронних завдань з опитуванням
GET /v1/tasks/{id}і наразі за замовчуванням використовуєgen4.5. - xAI використовує нативний API відео xAI і підтримує сценарії text-to-video, image-to-video та віддалене редагування/розширення відео.
- fal використовує потік відео fal на основі черги для довготривалих завдань замість одного блокувального запиту інференсу.
Опорні вхідні дані Qwen
Вбудований провайдер Qwen підтримує text-to-video, а також режими з опорними зображеннями/відео, але вхідна відеокінцева точка DashScope наразі вимагає віддалені URLhttp(s) для опорних вхідних даних. Шляхи до локальних файлів і вивантажені буфери відхиляються одразу, а не тихо ігноруються.
Пов’язане
- Огляд інструментів — усі доступні інструменти агента
- Фонові завдання — відстеження завдань для відокремлених запусків
video_generate - Alibaba Model Studio — пряме налаштування провайдера Wan
- Google (Gemini) — налаштування провайдера Veo
- MiniMax — налаштування провайдера Hailuo
- OpenAI — налаштування провайдера Sora
- Qwen — налаштування та обмеження, специфічні для Qwen
- Runway — налаштування Runway і поточні примітки щодо моделей/вхідних даних
- Together AI — налаштування провайдера Together Wan
- xAI — налаштування відеопровайдера Grok
- Довідник із конфігурації — конфігурація
videoGenerationModel - Моделі — конфігурація моделей і резервне перемикання