A ferramentaDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
music_generate permite que o agente crie música ou áudio por meio do
recurso compartilhado de geração de música com provedores configurados: Google,
MiniMax e ComfyUI configurado por workflow atualmente.
Para execuções de agente com sessão, o OpenClaw inicia a geração de música como uma
tarefa em segundo plano, acompanha-a no ledger de tarefas e então desperta o agente novamente
quando a faixa está pronta para que o agente possa avisar o usuário e anexar o
áudio finalizado. Em chats de grupo/canal que usam entrega visível somente por ferramenta
de mensagem, o agente retransmite o resultado pela ferramenta de mensagem. Se o
agente de conclusão escrever apenas uma resposta final privada, o OpenClaw recorre a um
envio direto pelo canal com a mídia gerada. O despertar de conclusão avisa explicitamente
o agente de que respostas finais normais são privadas nessas rotas.
A ferramenta compartilhada integrada só aparece quando pelo menos um provedor de geração de música
está disponível. Se você não vir
music_generate nas ferramentas do seu agente,
configure agents.defaults.musicGenerationModel ou configure uma
chave de API de provedor.Início rápido
- Com provedor compartilhado
- Workflow do ComfyUI
Configurar autenticação
Defina uma chave de API para pelo menos um provedor — por exemplo
GEMINI_API_KEY ou MINIMAX_API_KEY.Provedores compatíveis
| Provedor | Modelo padrão | Entradas de referência | Controles compatíveis | Autenticação |
|---|---|---|---|---|
| ComfyUI | workflow | Até 1 imagem | Música ou áudio definidos pelo workflow | COMFY_API_KEY, COMFY_CLOUD_API_KEY |
lyria-3-clip-preview | Até 10 imagens | lyrics, instrumental, format | GEMINI_API_KEY, GOOGLE_API_KEY | |
| MiniMax | music-2.6 | Nenhuma | lyrics, instrumental, durationSeconds, format=mp3 | MINIMAX_API_KEY ou OAuth da MiniMax |
Matriz de recursos
O contrato de modo explícito usado pormusic_generate, testes de contrato e a
varredura live compartilhada:
| Provedor | generate | edit | Limite de edição | Lanes live compartilhadas |
|---|---|---|---|---|
| ComfyUI | ✓ | ✓ | 1 imagem | Não incluído na varredura compartilhada; coberto por extensions/comfy/comfy.live.test.ts |
| ✓ | ✓ | 10 imagens | generate, edit | |
| MiniMax | ✓ | — | Nenhum | generate |
action: "list" para inspecionar provedores e modelos compartilhados disponíveis em
runtime:
action: "status" para inspecionar a tarefa ativa de música com sessão:
Parâmetros da ferramenta
Prompt de geração de música. Obrigatório para
action: "generate"."status" retorna a tarefa atual da sessão; "list" inspeciona provedores.Sobrescrita de provedor/modelo (por exemplo,
google/lyria-3-pro-preview,
comfy/workflow).Letra opcional quando o provedor oferece suporte a entrada explícita de letra.
Solicita saída apenas instrumental quando o provedor oferece suporte.
Caminho ou URL de uma única imagem de referência.
Várias imagens de referência (até 10 em provedores compatíveis).
Duração alvo em segundos quando o provedor oferece suporte a dicas de duração.
Dica de formato de saída quando o provedor oferece suporte.
Dica de nome do arquivo de saída.
Timeout opcional da solicitação ao provedor em milissegundos. Quando omitido, o OpenClaw usa
agents.defaults.musicGenerationModel.timeoutMs se configurado. Valores abaixo de 10000ms são elevados para 10000ms e informados no resultado da ferramenta.Nem todos os provedores oferecem suporte a todos os parâmetros. O OpenClaw ainda valida limites
estritos, como contagens de entrada, antes do envio. Quando um provedor oferece suporte a
duração, mas usa um máximo menor que o valor solicitado, o OpenClaw
limita ao valor de duração compatível mais próximo. Dicas opcionais realmente sem suporte
são ignoradas com um aviso quando o provedor ou modelo selecionado não consegue atendê-las.
Os resultados da ferramenta informam as configurações aplicadas;
details.normalization
captura qualquer mapeamento de solicitado para aplicado.Comportamento assíncrono
A geração de música com sessão é executada como uma tarefa em segundo plano:- Tarefa em segundo plano:
music_generatecria uma tarefa em segundo plano, retorna uma resposta de iniciada/tarefa imediatamente e publica a faixa finalizada posteriormente em uma mensagem de acompanhamento do agente. - Prevenção de duplicatas: enquanto uma tarefa está
queuedourunning, chamadasmusic_generateposteriores na mesma sessão retornam o status da tarefa em vez de iniciar outra geração. Useaction: "status"para verificar explicitamente. - Consulta de status:
openclaw tasks listouopenclaw tasks show <taskId>inspeciona status em fila, em execução e terminal. - Despertar de conclusão: o OpenClaw injeta um evento interno de conclusão de volta na mesma sessão para que o modelo possa escrever o acompanhamento voltado ao usuário por conta própria.
- Dica de prompt: turnos posteriores de usuário/manuais na mesma sessão recebem uma pequena
dica de runtime quando uma tarefa de música já está em andamento, para que o modelo
não chame
music_generatenovamente às cegas. - Fallback sem sessão: contextos diretos/locais sem uma sessão real de agente são executados inline e retornam o resultado final de áudio no mesmo turno.
Ciclo de vida da tarefa
| Estado | Significado |
|---|---|
queued | Tarefa criada, aguardando o provedor aceitá-la. |
running | O provedor está processando (normalmente de 30 segundos a 3 minutos, dependendo do provedor e da duração). |
succeeded | Faixa pronta; o agente desperta e a publica na conversa. |
failed | Erro ou timeout do provedor; o agente desperta com detalhes do erro. |
Configuração
Seleção de modelo
Ordem de seleção de provedores
O OpenClaw tenta os provedores nesta ordem:- Parâmetro
modelda chamada de ferramenta (se o agente especificar um). musicGenerationModel.primaryda configuração.musicGenerationModel.fallbacksem ordem.- Detecção automática usando apenas padrões de provedores com autenticação:
- provedor padrão atual primeiro;
- demais provedores de geração de música registrados em ordem de provider-id.
agents.defaults.mediaGenerationAutoProviderFallback: false para usar apenas
entradas explícitas de model, primary e fallbacks.
Observações de provedores
ComfyUI
ComfyUI
Orientado por workflow e depende do grafo configurado mais o mapeamento de nós
para campos de prompt/saída. O Plugin
comfy incluído se conecta à
ferramenta compartilhada music_generate por meio do registro de provedores
de geração de música.Google (Lyria 3)
Google (Lyria 3)
Usa geração em lote do Lyria 3. O fluxo incluído atual oferece suporte a
prompt, texto de letra opcional e imagens de referência opcionais.
MiniMax
MiniMax
Usa o endpoint em lote
music_generation. Oferece suporte a prompt, letras
opcionais, modo instrumental, direcionamento de duração e saída mp3 por meio de
autenticação por chave de API minimax ou OAuth minimax-portal.Escolhendo o caminho certo
- Com provedor compartilhado quando você quer seleção de modelo, failover de provedor e o fluxo assíncrono integrado de tarefa/status.
- Caminho de Plugin (ComfyUI) quando você precisa de um grafo de workflow personalizado ou de um provedor que não faz parte do recurso compartilhado incluído de música.
Modos de recurso do provedor
O contrato compartilhado de geração de música oferece suporte a declarações explícitas de modo:generatepara geração apenas por prompt.editquando a solicitação inclui uma ou mais imagens de referência.
maxInputImages, supportsLyrics e
supportsFormat não são suficientes para anunciar suporte a edição. Provedores
devem declarar generate e edit explicitamente para que testes live, testes de contrato
e a ferramenta compartilhada music_generate possam validar o suporte a modos
deterministicamente.
Testes live
Cobertura live opcional para os provedores compartilhados incluídos:~/.profile, prefere
chaves de API live/env a perfis de autenticação armazenados por padrão e executa tanto
a cobertura de generate quanto a de edit declarada quando o provedor habilita o
modo de edição. Cobertura hoje:
google:generatemaiseditminimax: apenasgeneratecomfy: cobertura live separada do Comfy, não a varredura compartilhada de provedores
Relacionado
- Tarefas em segundo plano — acompanhamento de tarefas para execuções desanexadas de
music_generate - ComfyUI
- Referência de configuração — configuração de
musicGenerationModel - Google (Gemini)
- MiniMax
- Modelos — configuração de modelos e failover
- Visão geral das ferramentas