ІнструментDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
music_generate дає агенту змогу створювати музику або аудіо через
спільну можливість генерації музики з налаштованими провайдерами — наразі це
Google, MiniMax і ComfyUI, налаштований через робочі процеси.
Для запусків агента з підтримкою сеансу OpenClaw запускає генерацію музики як
фонове завдання, відстежує її в журналі завдань, а потім знову пробуджує агента,
коли трек готовий, щоб агент міг повідомити користувача й прикріпити готове
аудіо. У групових/канальних чатах, де видима доставка відбувається лише через
інструмент повідомлень, агент передає результат через інструмент повідомлень. Якщо
агент під час завершення пише лише приватну фінальну відповідь, OpenClaw
резервно надсилає згенеровані медіа напряму в канал. Пробудження після
завершення явно попереджає агента, що звичайні фінальні відповіді в цих маршрутах
є приватними.
Вбудований спільний інструмент з’являється лише тоді, коли доступний принаймні
один провайдер генерації музики. Якщо ви не бачите
music_generate серед
інструментів агента, налаштуйте agents.defaults.musicGenerationModel або
додайте ключ API провайдера.Швидкий старт
- Спільний із підтримкою провайдерів
- Робочий процес ComfyUI
Налаштуйте автентифікацію
Задайте ключ API принаймні для одного провайдера — наприклад
GEMINI_API_KEY або MINIMAX_API_KEY.Підтримувані провайдери
| Провайдер | Стандартна модель | Референсні вхідні дані | Підтримувані параметри керування | Автентифікація |
|---|---|---|---|---|
| ComfyUI | workflow | До 1 зображення | Музика або аудіо, визначені робочим процесом | COMFY_API_KEY, COMFY_CLOUD_API_KEY |
lyria-3-clip-preview | До 10 зображень | lyrics, instrumental, format | GEMINI_API_KEY, GOOGLE_API_KEY | |
| MiniMax | music-2.6 | Немає | lyrics, instrumental, durationSeconds, format=mp3 | MINIMAX_API_KEY або MiniMax OAuth |
Матриця можливостей
Явний контракт режимів, який використовуютьmusic_generate, контрактні тести
та спільна live-перевірка:
| Провайдер | generate | edit | Ліміт редагування | Спільні live-напрями |
|---|---|---|---|---|
| ComfyUI | ✓ | ✓ | 1 зображення | Не входить до спільної перевірки; покрито extensions/comfy/comfy.live.test.ts |
| ✓ | ✓ | 10 зображень | generate, edit | |
| MiniMax | ✓ | — | Немає | generate |
action: "list", щоб переглянути доступних спільних провайдерів
і моделі під час виконання:
action: "status", щоб переглянути активне сеансове завдання
генерації музики:
Параметри інструмента
Промпт для генерації музики. Обов’язковий для
action: "generate"."status" повертає поточне сеансове завдання; "list" переглядає провайдерів.Перевизначення провайдера/моделі (наприклад
google/lyria-3-pro-preview,
comfy/workflow).Необов’язковий текст пісні, коли провайдер підтримує явне введення тексту пісні.
Запит на лише інструментальний результат, коли провайдер це підтримує.
Шлях або URL одного референсного зображення.
Кілька референсних зображень (до 10 у провайдерів, які це підтримують).
Цільова тривалість у секундах, коли провайдер підтримує підказки тривалості.
Підказка формату виводу, коли провайдер це підтримує.
Підказка щодо імені вихідного файлу.
Необов’язковий тайм-аут запиту до провайдера в мілісекундах. Якщо його пропущено, OpenClaw використовує
agents.defaults.musicGenerationModel.timeoutMs, якщо це налаштовано. Значення нижче 10000ms підвищуються до 10000ms і повідомляються в результаті інструмента.Не всі провайдери підтримують усі параметри. OpenClaw однаково перевіряє жорсткі
обмеження, як-от кількість вхідних даних, перед надсиланням. Коли провайдер
підтримує тривалість, але має коротший максимум, ніж запитане значення, OpenClaw
обмежує його до найближчої підтримуваної тривалості. Справді непідтримувані
необов’язкові підказки ігноруються з попередженням, коли вибраний провайдер або
модель не може їх виконати. Результати інструмента повідомляють застосовані
налаштування;
details.normalization фіксує будь-яке відображення запитаних
значень у застосовані.Асинхронна поведінка
Генерація музики з підтримкою сеансу виконується як фонове завдання:- Фонове завдання:
music_generateстворює фонове завдання, негайно повертає відповідь про запуск/завдання, а пізніше публікує готовий трек у подальшому повідомленні агента. - Запобігання дублюванню: доки завдання має стан
queuedабоrunning, подальші викликиmusic_generateу тому самому сеансі повертають статус завдання замість запуску ще однієї генерації. Використовуйтеaction: "status"для явної перевірки. - Перегляд статусу:
openclaw tasks listабоopenclaw tasks show <taskId>переглядає статуси в черзі, виконання та кінцеві статуси. - Пробудження після завершення: OpenClaw впроваджує внутрішню подію завершення назад у той самий сеанс, щоб модель могла сама написати видиме користувачу подальше повідомлення.
- Підказка промпта: наступні користувацькі/ручні ходи в тому самому сеансі
отримують невелику runtime-підказку, коли завдання генерації музики вже
виконується, щоб модель не викликала
music_generateнаосліп знову. - Резервний шлях без сеансу: прямі/локальні контексти без справжнього сеансу агента виконуються вбудовано й повертають фінальний аудіорезультат у тому ж ході.
Життєвий цикл завдання
| Стан | Значення |
|---|---|
queued | Завдання створено, очікує, доки провайдер його прийме. |
running | Провайдер обробляє запит (зазвичай від 30 секунд до 3 хвилин залежно від провайдера й тривалості). |
succeeded | Трек готовий; агент пробуджується й публікує його в розмові. |
failed | Помилка провайдера або тайм-аут; агент пробуджується з деталями помилки. |
Конфігурація
Вибір моделі
Порядок вибору провайдера
OpenClaw пробує провайдерів у такому порядку:- Параметр
modelз виклику інструмента (якщо агент його вказує). musicGenerationModel.primaryз конфігурації.musicGenerationModel.fallbacksза порядком.- Автовиявлення лише за стандартними провайдерами з налаштованою автентифікацією:
- спочатку поточний стандартний провайдер;
- решта зареєстрованих провайдерів генерації музики в порядку ідентифікаторів провайдерів.
agents.defaults.mediaGenerationAutoProviderFallback: false, щоб
використовувати лише явні записи model, primary і fallbacks.
Примітки щодо провайдерів
ComfyUI
ComfyUI
Керується робочим процесом і залежить від налаштованого графа та
зіставлення вузлів для полів промпта/виводу. Вбудований plugin
comfy
під’єднується до спільного інструмента music_generate через реєстр
провайдерів генерації музики.Google (Lyria 3)
Google (Lyria 3)
Використовує пакетну генерацію Lyria 3. Поточний вбудований потік підтримує
промпт, необов’язковий текст пісні та необов’язкові референсні зображення.
MiniMax
MiniMax
Використовує пакетну кінцеву точку
music_generation. Підтримує промпт,
необов’язковий текст пісні, інструментальний режим, керування тривалістю та
вивід mp3 через автентифікацію minimax за ключем API або OAuth
minimax-portal.Вибір правильного шляху
- Спільний із підтримкою провайдерів, коли потрібні вибір моделі, резервне перемикання провайдерів і вбудований асинхронний потік завдань/статусу.
- Шлях Plugin (ComfyUI), коли потрібен власний граф робочого процесу або провайдер, який не є частиною спільної вбудованої можливості генерації музики.
Режими можливостей провайдера
Спільний контракт генерації музики підтримує явні оголошення режимів:generateдля генерації лише за промптом.edit, коли запит містить одне або кілька референсних зображень.
maxInputImages, supportsLyrics і
supportsFormat, недостатньо, щоб заявити підтримку редагування.
Провайдери мають явно оголошувати generate і edit, щоб live-тести,
контрактні тести та спільний інструмент music_generate могли
детерміновано перевіряти підтримку режимів.
Live-тести
Live-покриття для спільних вбудованих провайдерів, яке вмикається явно:~/.profile, за замовчуванням надає перевагу live/env API-ключам перед збереженими профілями автентифікації та запускає покриття і для generate, і для оголошеного edit, коли провайдер вмикає режим редагування. Поточне покриття:
google:generateплюсeditminimax: лишеgeneratecomfy: окреме live-покриття Comfy, не спільний обхід провайдерів
Пов’язане
- Фонові завдання — відстеження завдань для від’єднаних запусків
music_generate - ComfyUI
- Довідник конфігурації — конфігурація
musicGenerationModel - Google (Gemini)
- MiniMax
- Моделі — конфігурація моделей і аварійне перемикання
- Огляд інструментів