Przejdź do głównej treści

ComfyUI

OpenClaw dostarcza bundlowy Plugin comfy do uruchamiania ComfyUI sterowanego przepływami pracy. Plugin jest w pełni sterowany przepływem pracy, więc OpenClaw nie próbuje mapować ogólnych ustawień size, aspectRatio, resolution, durationSeconds ani kontrolek w stylu TTS na Twój graf.
WłaściwośćSzczegóły
Dostawcacomfy
Modelecomfy/workflow
Wspólne powierzchnieimage_generate, video_generate, music_generate
AuthBrak dla lokalnego ComfyUI; COMFY_API_KEY lub COMFY_CLOUD_API_KEY dla Comfy Cloud
APIComfyUI /prompt / /history / /view oraz Comfy Cloud /api/*

Co jest obsługiwane

  • Generowanie obrazów z JSON przepływu pracy
  • Edycja obrazów z 1 przesłanym obrazem referencyjnym
  • Generowanie wideo z JSON przepływu pracy
  • Generowanie wideo z 1 przesłanym obrazem referencyjnym
  • Generowanie muzyki lub audio przez wspólne narzędzie music_generate
  • Pobieranie danych wyjściowych ze skonfigurowanego węzła lub ze wszystkich pasujących węzłów wyjściowych

Pierwsze kroki

Wybierz między uruchamianiem ComfyUI na własnym komputerze a użyciem Comfy Cloud.
Najlepsze do: uruchamiania własnej instancji ComfyUI na komputerze lub w sieci LAN.
1

Uruchom ComfyUI lokalnie

Upewnij się, że lokalna instancja ComfyUI jest uruchomiona (domyślnie http://127.0.0.1:8188).
2

Przygotuj JSON przepływu pracy

Wyeksportuj lub utwórz plik JSON przepływu pracy ComfyUI. Zanotuj identyfikatory węzłów dla węzła wejścia promptu i węzła wyjściowego, z którego OpenClaw ma odczytywać dane.
3

Skonfiguruj dostawcę

Ustaw mode: "local" i wskaż plik przepływu pracy. Oto minimalny przykład dla obrazu:
{
  models: {
    providers: {
      comfy: {
        mode: "local",
        baseUrl: "http://127.0.0.1:8188",
        image: {
          workflowPath: "./workflows/flux-api.json",
          promptNodeId: "6",
          outputNodeId: "9",
        },
      },
    },
  },
}
4

Ustaw model domyślny

Skieruj OpenClaw na model comfy/workflow dla skonfigurowanej capability:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "comfy/workflow",
      },
    },
  },
}
5

Zweryfikuj

openclaw models list --provider comfy

Konfiguracja

Comfy obsługuje wspólne ustawienia połączenia najwyższego poziomu oraz sekcje przepływów pracy per capability (image, video, music):
{
  models: {
    providers: {
      comfy: {
        mode: "local",
        baseUrl: "http://127.0.0.1:8188",
        image: {
          workflowPath: "./workflows/flux-api.json",
          promptNodeId: "6",
          outputNodeId: "9",
        },
        video: {
          workflowPath: "./workflows/video-api.json",
          promptNodeId: "12",
          outputNodeId: "21",
        },
        music: {
          workflowPath: "./workflows/music-api.json",
          promptNodeId: "3",
          outputNodeId: "18",
        },
      },
    },
  },
}

Wspólne klucze

KluczTypOpis
mode"local" or "cloud"Tryb połączenia.
baseUrlstringDomyślnie http://127.0.0.1:8188 dla trybu lokalnego albo https://cloud.comfy.org dla trybu chmurowego.
apiKeystringOpcjonalny klucz podany bezpośrednio, alternatywa dla zmiennych env COMFY_API_KEY / COMFY_CLOUD_API_KEY.
allowPrivateNetworkbooleanZezwala na prywatny/LAN baseUrl w trybie chmurowym.

Klucze per capability

Te klucze obowiązują wewnątrz sekcji image, video albo music:
KluczWymaganeDomyślnieOpis
workflow lub workflowPathTakŚcieżka do pliku JSON przepływu pracy ComfyUI.
promptNodeIdTakIdentyfikator węzła odbierającego prompt tekstowy.
promptInputNameNie"text"Nazwa wejścia w węźle promptu.
outputNodeIdNieIdentyfikator węzła, z którego należy odczytać dane wyjściowe. Jeśli zostanie pominięty, używane są wszystkie pasujące węzły wyjściowe.
pollIntervalMsNieInterwał odpytywania w milisekundach dla ukończenia zadania.
timeoutMsNieLimit czasu w milisekundach dla uruchomienia przepływu pracy.
Sekcje image i video obsługują także:
KluczWymaganeDomyślnieOpis
inputImageNodeIdTak (przy przekazywaniu obrazu referencyjnego)Identyfikator węzła odbierającego przesłany obraz referencyjny.
inputImageInputNameNie"image"Nazwa wejścia w węźle obrazu.

Szczegóły przepływu pracy

Ustaw domyślny model obrazu na comfy/workflow:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "comfy/workflow",
      },
    },
  },
}
Przykład edycji z obrazem referencyjnym:Aby włączyć edycję obrazów z użyciem przesłanego obrazu referencyjnego, dodaj inputImageNodeId do konfiguracji obrazu:
{
  models: {
    providers: {
      comfy: {
        image: {
          workflowPath: "./workflows/edit-api.json",
          promptNodeId: "6",
          inputImageNodeId: "7",
          inputImageInputName: "image",
          outputNodeId: "9",
        },
      },
    },
  },
}
Ustaw domyślny model wideo na comfy/workflow:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "comfy/workflow",
      },
    },
  },
}
Przepływy pracy wideo Comfy obsługują text-to-video i image-to-video przez skonfigurowany graf.
OpenClaw nie przekazuje wejściowych plików wideo do przepływów pracy Comfy. Jako dane wejściowe obsługiwane są tylko prompty tekstowe i pojedyncze obrazy referencyjne.
Bundlowy Plugin rejestruje dostawcę generowania muzyki dla wyjść audio lub muzyki zdefiniowanych w przepływie pracy, udostępnianych przez wspólne narzędzie music_generate:
/tool music_generate prompt="Ciepła ambientowa pętla syntezatorowa z miękką fakturą taśmy"
Użyj sekcji konfiguracji music, aby wskazać JSON przepływu pracy audio i węzeł wyjściowy.
Istniejąca konfiguracja obrazu najwyższego poziomu (bez zagnieżdżonej sekcji image) nadal działa:
{
  models: {
    providers: {
      comfy: {
        workflowPath: "./workflows/flux-api.json",
        promptNodeId: "6",
        outputNodeId: "9",
      },
    },
  },
}
OpenClaw traktuje ten starszy kształt jako konfigurację przepływu pracy obrazu. Nie musisz migrować od razu, ale dla nowych konfiguracji zalecane są zagnieżdżone sekcje image / video / music.
Jeśli używasz tylko generowania obrazów, starsza płaska konfiguracja i nowa zagnieżdżona sekcja image są funkcjonalnie równoważne.
Dla bundlowego Pluginu istnieje opcjonalne pokrycie live:
OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts
Test live pomija poszczególne przypadki obrazów, wideo lub muzyki, chyba że skonfigurowana jest odpowiadająca im sekcja przepływu pracy Comfy.

Powiązane

Generowanie obrazów

Konfiguracja i użycie narzędzia do generowania obrazów.

Generowanie wideo

Konfiguracja i użycie narzędzia do generowania wideo.

Generowanie muzyki

Konfiguracja generowania muzyki i audio.

Katalog dostawców

Przegląd wszystkich dostawców i odwołań do modeli.

Informacje o konfiguracji

Pełne informacje o konfiguracji, w tym ustawienia domyślne agenta.