La herramientaDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
music_generate permite al agente crear música o audio mediante la
capacidad compartida de generación de música con proveedores configurados: Google,
MiniMax y ComfyUI configurado por workflow actualmente.
Para ejecuciones de agente respaldadas por sesión, OpenClaw inicia la generación
de música como una tarea en segundo plano, la registra en el libro de tareas y
luego vuelve a despertar al agente cuando la pista está lista para que el agente
pueda avisar al usuario y adjuntar el audio terminado. En chats de grupo/canal
que usan entrega visible solo mediante herramienta de mensajes, el agente
transmite el resultado mediante la herramienta de mensajes. Si el agente de
finalización escribe solo una respuesta final privada, OpenClaw recurre a un
envío directo por el canal con los medios generados. El despertar de finalización
advierte explícitamente al agente que las respuestas finales normales son
privadas en esas rutas.
La herramienta compartida integrada solo aparece cuando hay al menos un
proveedor de generación de música disponible. Si no ves
music_generate en las
herramientas de tu agente, configura agents.defaults.musicGenerationModel o
configura una clave de API de proveedor.Inicio rápido
- Respaldado por proveedor compartido
- Workflow de ComfyUI
Configurar autenticación
Define una clave de API para al menos un proveedor; por ejemplo,
GEMINI_API_KEY o MINIMAX_API_KEY.Proveedores compatibles
| Proveedor | Modelo predeterminado | Entradas de referencia | Controles compatibles | Autenticación |
|---|---|---|---|---|
| ComfyUI | workflow | Hasta 1 imagen | Música o audio definidos por el workflow | COMFY_API_KEY, COMFY_CLOUD_API_KEY |
lyria-3-clip-preview | Hasta 10 imágenes | lyrics, instrumental, format | GEMINI_API_KEY, GOOGLE_API_KEY | |
| MiniMax | music-2.6 | Ninguna | lyrics, instrumental, durationSeconds, format=mp3 | MINIMAX_API_KEY o OAuth de MiniMax |
Matriz de capacidades
El contrato de modo explícito usado pormusic_generate, las pruebas de contrato
y el barrido live compartido:
| Proveedor | generate | edit | Límite de edición | Carriles live compartidos |
|---|---|---|---|---|
| ComfyUI | ✓ | ✓ | 1 imagen | No está en el barrido compartido; cubierto por extensions/comfy/comfy.live.test.ts |
| ✓ | ✓ | 10 imágenes | generate, edit | |
| MiniMax | ✓ | — | Ninguno | generate |
action: "list" para inspeccionar proveedores y modelos compartidos
disponibles en tiempo de ejecución:
action: "status" para inspeccionar la tarea de música activa respaldada por
sesión:
Parámetros de la herramienta
Prompt de generación de música. Requerido para
action: "generate"."status" devuelve la tarea de sesión actual; "list" inspecciona proveedores.Anulación de proveedor/modelo (por ejemplo,
google/lyria-3-pro-preview,
comfy/workflow).Letra opcional cuando el proveedor admite entrada explícita de letra.
Solicita una salida solo instrumental cuando el proveedor lo admite.
Ruta o URL de una sola imagen de referencia.
Varias imágenes de referencia (hasta 10 en proveedores compatibles).
Duración objetivo en segundos cuando el proveedor admite indicaciones de duración.
Indicación de formato de salida cuando el proveedor lo admite.
Indicación de nombre de archivo de salida.
Tiempo de espera opcional de la solicitud al proveedor en milisegundos. Cuando se omite, OpenClaw usa
agents.defaults.musicGenerationModel.timeoutMs si está configurado. Los valores inferiores a 10000ms se elevan a 10000ms y se informan en el resultado de la herramienta.No todos los proveedores admiten todos los parámetros. OpenClaw aun así valida
límites estrictos, como los recuentos de entrada, antes del envío. Cuando un
proveedor admite duración pero usa un máximo más corto que el valor solicitado,
OpenClaw limita al valor compatible más cercano. Las indicaciones opcionales
realmente no compatibles se ignoran con una advertencia cuando el proveedor o
modelo seleccionado no puede cumplirlas. Los resultados de la herramienta
informan la configuración aplicada;
details.normalization captura cualquier
asignación de solicitado a aplicado.Comportamiento asíncrono
La generación de música respaldada por sesión se ejecuta como una tarea en segundo plano:- Tarea en segundo plano:
music_generatecrea una tarea en segundo plano, devuelve inmediatamente una respuesta iniciada/de tarea y publica la pista terminada más tarde en un mensaje de seguimiento del agente. - Prevención de duplicados: mientras una tarea está
queuedorunning, las llamadas posteriores amusic_generateen la misma sesión devuelven el estado de la tarea en lugar de iniciar otra generación. Usaaction: "status"para comprobarlo explícitamente. - Consulta de estado:
openclaw tasks listuopenclaw tasks show <taskId>inspecciona estados en cola, en ejecución y terminales. - Despertar de finalización: OpenClaw inyecta un evento interno de finalización de vuelta en la misma sesión para que el modelo pueda escribir por sí mismo el seguimiento visible para el usuario.
- Indicación de prompt: los turnos posteriores de usuario/manual en la misma
sesión reciben una pequeña indicación en tiempo de ejecución cuando una tarea
de música ya está en curso, para que el modelo no llame a
music_generatea ciegas de nuevo. - Reserva sin sesión: los contextos directos/locales sin una sesión real de agente se ejecutan en línea y devuelven el resultado de audio final en el mismo turno.
Ciclo de vida de la tarea
| Estado | Significado |
|---|---|
queued | Tarea creada, esperando a que el proveedor la acepte. |
running | El proveedor está procesando (normalmente de 30 segundos a 3 minutos según proveedor y duración). |
succeeded | Pista lista; el agente se despierta y la publica en la conversación. |
failed | Error del proveedor o tiempo de espera agotado; el agente se despierta con detalles del error. |
Configuración
Selección de modelo
Orden de selección de proveedor
OpenClaw prueba proveedores en este orden:- Parámetro
modelde la llamada de herramienta (si el agente especifica uno). musicGenerationModel.primaryde la configuración.musicGenerationModel.fallbacksen orden.- Detección automática usando solo valores predeterminados de proveedor respaldados por autenticación:
- primero el proveedor predeterminado actual;
- los proveedores de generación de música registrados restantes en orden de identificador de proveedor.
agents.defaults.mediaGenerationAutoProviderFallback: false para usar
solo entradas explícitas de model, primary y fallbacks.
Notas de proveedores
ComfyUI
ComfyUI
Controlado por workflow y depende del grafo configurado más la asignación de
nodos para campos de prompt/salida. El Plugin
comfy incluido se conecta a
la herramienta compartida music_generate mediante el registro de
proveedores de generación de música.Google (Lyria 3)
Google (Lyria 3)
Usa generación por lotes de Lyria 3. El flujo integrado actual admite
prompt, texto opcional de letra e imágenes de referencia opcionales.
MiniMax
MiniMax
Usa el endpoint por lotes
music_generation. Admite prompt, letra opcional,
modo instrumental, dirección de duración y salida mp3 mediante autenticación
con clave de API minimax u OAuth de minimax-portal.Elegir la ruta adecuada
- Respaldado por proveedor compartido cuando quieres selección de modelo, conmutación por error de proveedor y el flujo asíncrono integrado de tarea/estado.
- Ruta de Plugin (ComfyUI) cuando necesitas un grafo de workflow personalizado o un proveedor que no forma parte de la capacidad musical compartida incluida.
Modos de capacidad de proveedor
El contrato compartido de generación de música admite declaraciones explícitas de modo:generatepara generación solo con prompt.editcuando la solicitud incluye una o más imágenes de referencia.
maxInputImages, supportsLyrics y
supportsFormat no bastan para anunciar compatibilidad con edición. Los
proveedores deben declarar generate y edit explícitamente para que las
pruebas live, las pruebas de contrato y la herramienta compartida
music_generate puedan validar la compatibilidad de modo de forma determinista.
Pruebas live
Cobertura live con suscripción explícita para los proveedores integrados compartidos:~/.profile, prefiere
las claves de API de live/env antes que los perfiles de autenticación almacenados de forma predeterminada y ejecuta tanto
la cobertura de generate como la de edit declarada cuando el proveedor habilita el modo
edit. Cobertura actual:
google:generatemáseditminimax: sologeneratecomfy: cobertura live separada de Comfy, no el barrido compartido de proveedores
Relacionado
- Tareas en segundo plano — seguimiento de tareas para ejecuciones desvinculadas de
music_generate - ComfyUI
- Referencia de configuración — configuración de
musicGenerationModel - Google (Gemini)
- MiniMax
- Modelos — configuración de modelos y conmutación por error
- Resumen de herramientas