Passer au contenu principal

ComfyUI

OpenClaw inclut un Plugin comfy intégré pour les exécutions ComfyUI pilotées par workflow. Le Plugin est entièrement piloté par workflow, donc OpenClaw n’essaie pas de mapper des contrôles génériques comme size, aspectRatio, resolution, durationSeconds ou des contrôles de type TTS sur votre graphe.
PropertyDetail
Providercomfy
Modelscomfy/workflow
Shared surfacesimage_generate, video_generate, music_generate
AuthAucune pour ComfyUI local ; COMFY_API_KEY ou COMFY_CLOUD_API_KEY pour Comfy Cloud
APIComfyUI /prompt / /history / /view et Comfy Cloud /api/*

Ce qui est pris en charge

  • Génération d’images à partir d’un JSON de workflow
  • Édition d’images avec 1 image de référence téléversée
  • Génération vidéo à partir d’un JSON de workflow
  • Génération vidéo avec 1 image de référence téléversée
  • Génération de musique ou d’audio via l’outil partagé music_generate
  • Téléchargement des sorties depuis un nœud configuré ou tous les nœuds de sortie correspondants

Prise en main

Choisissez entre exécuter ComfyUI sur votre propre machine ou utiliser Comfy Cloud.
Idéal pour : exécuter votre propre instance ComfyUI sur votre machine ou sur votre LAN.
1

Démarrer ComfyUI localement

Assurez-vous que votre instance locale de ComfyUI est en cours d’exécution (par défaut sur http://127.0.0.1:8188).
2

Préparer votre JSON de workflow

Exportez ou créez un fichier JSON de workflow ComfyUI. Notez les IDs des nœuds pour le nœud d’entrée du prompt et le nœud de sortie que vous souhaitez qu’OpenClaw lise.
3

Configurer le fournisseur

Définissez mode: "local" et pointez vers votre fichier de workflow. Voici un exemple minimal pour l’image :
{
  models: {
    providers: {
      comfy: {
        mode: "local",
        baseUrl: "http://127.0.0.1:8188",
        image: {
          workflowPath: "./workflows/flux-api.json",
          promptNodeId: "6",
          outputNodeId: "9",
        },
      },
    },
  },
}
4

Définir le modèle par défaut

Pointez OpenClaw vers le modèle comfy/workflow pour la capacité que vous avez configurée :
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "comfy/workflow",
      },
    },
  },
}
5

Vérifier

openclaw models list --provider comfy

Configuration

Comfy prend en charge des paramètres de connexion partagés de premier niveau ainsi que des sections de workflow par capacité (image, video, music) :
{
  models: {
    providers: {
      comfy: {
        mode: "local",
        baseUrl: "http://127.0.0.1:8188",
        image: {
          workflowPath: "./workflows/flux-api.json",
          promptNodeId: "6",
          outputNodeId: "9",
        },
        video: {
          workflowPath: "./workflows/video-api.json",
          promptNodeId: "12",
          outputNodeId: "21",
        },
        music: {
          workflowPath: "./workflows/music-api.json",
          promptNodeId: "3",
          outputNodeId: "18",
        },
      },
    },
  },
}

Clés partagées

KeyTypeDescription
mode"local" or "cloud"Mode de connexion.
baseUrlstringVaut par défaut http://127.0.0.1:8188 en local ou https://cloud.comfy.org dans le cloud.
apiKeystringClé inline facultative, alternative aux variables d’environnement COMFY_API_KEY / COMFY_CLOUD_API_KEY.
allowPrivateNetworkbooleanAutorise un baseUrl privé/LAN en mode cloud.

Clés par capacité

Ces clés s’appliquent dans les sections image, video ou music :
KeyRequiredDefaultDescription
workflow or workflowPathYesChemin vers le fichier JSON du workflow ComfyUI.
promptNodeIdYesID du nœud qui reçoit le prompt textuel.
promptInputNameNo"text"Nom de l’entrée sur le nœud du prompt.
outputNodeIdNoID du nœud depuis lequel lire la sortie. S’il est omis, tous les nœuds de sortie correspondants sont utilisés.
pollIntervalMsNoIntervalle de polling en millisecondes pour l’achèvement de la tâche.
timeoutMsNoDélai d’expiration en millisecondes pour l’exécution du workflow.
Les sections image et video prennent également en charge :
KeyRequiredDefaultDescription
inputImageNodeIdYes (when passing a reference image)ID du nœud qui reçoit l’image de référence téléversée.
inputImageInputNameNo"image"Nom de l’entrée sur le nœud d’image.

Détails du workflow

Définissez le modèle d’image par défaut sur comfy/workflow :
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "comfy/workflow",
      },
    },
  },
}
Exemple d’édition avec image de référence :Pour activer l’édition d’image avec une image de référence téléversée, ajoutez inputImageNodeId à votre configuration d’image :
{
  models: {
    providers: {
      comfy: {
        image: {
          workflowPath: "./workflows/edit-api.json",
          promptNodeId: "6",
          inputImageNodeId: "7",
          inputImageInputName: "image",
          outputNodeId: "9",
        },
      },
    },
  },
}
Définissez le modèle vidéo par défaut sur comfy/workflow :
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "comfy/workflow",
      },
    },
  },
}
Les workflows vidéo Comfy prennent en charge le texte-vers-vidéo et l’image-vers-vidéo via le graphe configuré.
OpenClaw ne transmet pas de vidéos d’entrée dans les workflows Comfy. Seuls les prompts textuels et les images de référence uniques sont pris en charge en entrée.
Le Plugin intégré enregistre un fournisseur de génération musicale pour les sorties audio ou musicales définies par workflow, exposé via l’outil partagé music_generate :
/tool music_generate prompt="Warm ambient synth loop with soft tape texture"
Utilisez la section de configuration music pour pointer vers votre JSON de workflow audio et le nœud de sortie.
La configuration d’image existante de premier niveau (sans section image imbriquée) fonctionne toujours :
{
  models: {
    providers: {
      comfy: {
        workflowPath: "./workflows/flux-api.json",
        promptNodeId: "6",
        outputNodeId: "9",
      },
    },
  },
}
OpenClaw traite cette forme héritée comme la configuration du workflow d’image. Vous n’avez pas besoin de migrer immédiatement, mais les sections imbriquées image / video / music sont recommandées pour les nouvelles configurations.
Si vous utilisez uniquement la génération d’images, la configuration plate héritée et la nouvelle section image imbriquée sont fonctionnellement équivalentes.
Une couverture live sur opt-in existe pour le Plugin intégré :
OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts
Le test live ignore les cas individuels d’image, de vidéo ou de musique sauf si la section de workflow Comfy correspondante est configurée.

Connexe

Image Generation

Configuration et utilisation de l’outil de génération d’images.

Video Generation

Configuration et utilisation de l’outil de génération vidéo.

Music Generation

Configuration de la génération de musique et d’audio.

Provider Directory

Vue d’ensemble de tous les fournisseurs et références de modèles.

Configuration Reference

Référence complète de la configuration, y compris les valeurs par défaut des agents.