Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
music_generate 工具讓代理程式透過已設定提供者的共用音樂生成能力建立音樂或音訊;目前支援 Google、MiniMax,以及以工作流程設定的 ComfyUI。
對於由工作階段支援的代理程式執行,OpenClaw 會將音樂生成啟動為背景任務,在任務帳本中追蹤,然後在曲目準備好時再次喚醒代理程式,讓代理程式能把完成的音訊送回原始頻道。
內建共用工具只會在至少有一個音樂生成提供者可用時出現。如果你在代理程式工具中看不到
music_generate,請設定 agents.defaults.musicGenerationModel 或設定提供者 API 金鑰。快速開始
範例提示:支援的提供者
| 提供者 | 預設模型 | 參考輸入 | 支援的控制項 | 驗證 |
|---|---|---|---|---|
| ComfyUI | workflow | 最多 1 張圖片 | 工作流程定義的音樂或音訊 | COMFY_API_KEY, COMFY_CLOUD_API_KEY |
lyria-3-clip-preview | 最多 10 張圖片 | lyrics, instrumental, format | GEMINI_API_KEY, GOOGLE_API_KEY | |
| MiniMax | music-2.6 | 無 | lyrics, instrumental, durationSeconds, format=mp3 | MINIMAX_API_KEY 或 MiniMax OAuth |
能力矩陣
music_generate、合約測試和共用即時掃描使用的明確模式合約:
| 提供者 | generate | edit | 編輯限制 | 共用即時通道 |
|---|---|---|---|---|
| ComfyUI | ✓ | ✓ | 1 張圖片 | 不在共用掃描中;由 extensions/comfy/comfy.live.test.ts 涵蓋 |
| ✓ | ✓ | 10 張圖片 | generate, edit | |
| MiniMax | ✓ | — | 無 | generate |
action: "list" 在執行階段檢查可用的共用提供者和模型:
action: "status" 檢查作用中的工作階段支援音樂任務:
工具參數
音樂生成提示。
action: "generate" 必填。"status" 會傳回目前的工作階段任務;"list" 會檢查提供者。提供者/模型覆寫(例如
google/lyria-3-pro-preview、comfy/workflow)。當提供者支援明確歌詞輸入時使用的選用歌詞。
當提供者支援時,要求僅輸出器樂。
單一參考圖片路徑或 URL。
多張參考圖片(在支援的提供者上最多 10 張)。
當提供者支援時,以秒為單位的目標時長提示。
當提供者支援時使用的輸出格式提示。
輸出檔名提示。
選用的提供者要求逾時,以毫秒為單位。
並非所有提供者都支援所有參數。OpenClaw 仍會在提交前驗證輸入數量等硬性限制。當提供者支援時長但使用的上限短於要求值時,OpenClaw 會箝制到最接近的支援時長。當所選提供者或模型無法遵循真正不支援的選用提示時,這些提示會被忽略並附上警告。工具結果會回報套用的設定;
details.normalization 會擷取任何從要求到套用的對應。非同步行為
由工作階段支援的音樂生成會以背景任務執行:- 背景任務:
music_generate會建立背景任務,立即傳回已啟動/任務回應,並稍後在後續代理程式訊息中張貼完成的曲目。 - 防止重複: 當任務處於
queued或running時,同一工作階段中後續的music_generate呼叫會傳回任務狀態,而不是啟動另一個生成。使用action: "status"明確檢查。 - 狀態查詢:
openclaw tasks list或openclaw tasks show <taskId>會檢查佇列中、執行中和終止狀態。 - 完成喚醒: OpenClaw 會將內部完成事件注入回同一個工作階段,讓模型能自行撰寫面向使用者的後續訊息。
- 提示提示: 同一工作階段中稍後的使用者/手動回合會在音樂任務已在進行中時收到一個小型執行階段提示,讓模型不會盲目再次呼叫
music_generate。 - 無工作階段退回: 沒有真正代理程式工作階段的直接/本機情境會行內執行,並在同一回合中傳回最終音訊結果。
任務生命週期
| 狀態 | 意義 |
|---|---|
queued | 任務已建立,正在等待提供者接受。 |
running | 提供者正在處理(通常依提供者和時長而定,約 30 秒到 3 分鐘)。 |
succeeded | 曲目已準備好;代理程式會被喚醒並將其張貼到對話中。 |
failed | 提供者錯誤或逾時;代理程式會帶著錯誤詳細資料被喚醒。 |
設定
模型選擇
提供者選擇順序
OpenClaw 會依下列順序嘗試提供者:- 工具呼叫中的
model參數(如果代理程式指定)。 - 設定中的
musicGenerationModel.primary。 - 依序使用
musicGenerationModel.fallbacks。 - 僅使用由驗證支援的提供者預設值進行自動偵測:
- 目前的預設提供者優先;
- 其餘已註冊的音樂生成提供者依提供者 ID 順序。
agents.defaults.mediaGenerationAutoProviderFallback: false,即可只使用明確的 model、primary 和 fallbacks 項目。
提供者附註
ComfyUI
ComfyUI
由工作流程驅動,並取決於已設定的圖形以及提示/輸出欄位的節點對應。內建的
comfy Plugin 會透過音樂生成提供者登錄表接入共用 music_generate 工具。Google (Lyria 3)
Google (Lyria 3)
使用 Lyria 3 批次生成。目前的內建流程支援提示、選用歌詞文字,以及選用參考圖片。
MiniMax
MiniMax
使用批次
music_generation 端點。支援提示、選用歌詞、器樂模式、時長導引,以及透過 minimax API 金鑰驗證或 minimax-portal OAuth 輸出 mp3。選擇正確路徑
- 共用提供者支援:當你需要模型選擇、提供者容錯移轉,以及內建非同步任務/狀態流程時使用。
- Plugin 路徑 (ComfyUI):當你需要自訂工作流程圖形,或需要未包含在共用內建音樂能力中的提供者時使用。
提供者能力模式
共用音樂生成合約支援明確的模式宣告:generate用於僅提示生成。edit用於要求包含一張或多張參考圖片時。
maxInputImages、supportsLyrics 和 supportsFormat)不足以宣告編輯支援。提供者應明確宣告 generate 和 edit,讓即時測試、合約測試,以及共用 music_generate 工具能以確定性方式驗證模式支援。
即時測試
共用內建提供者的選用即時覆蓋範圍:~/.profile 載入缺少的提供者環境變數,預設會優先使用即時/環境 API 金鑰,而不是已儲存的驗證設定檔,並在提供者啟用編輯模式時同時執行 generate 和已宣告的 edit 覆蓋範圍。目前覆蓋範圍:
google:generate加上editminimax: 僅generatecomfy: 獨立的 Comfy 即時覆蓋範圍,不在共用提供者掃描中