Saltar al contenido principal

ComfyUI

OpenClaw incluye un Plugin integrado comfy para ejecuciones de ComfyUI basadas en flujos de trabajo. El Plugin es completamente controlado por flujos de trabajo, por lo que OpenClaw no intenta asignar controles genéricos de size, aspectRatio, resolution, durationSeconds ni controles de estilo TTS a tu grafo.
PropiedadDetalle
Proveedorcomfy
Modeloscomfy/workflow
Superficies compartidasimage_generate, video_generate, music_generate
AutenticaciónNinguna para ComfyUI local; COMFY_API_KEY o COMFY_CLOUD_API_KEY para Comfy Cloud
API/prompt / /history / /view de ComfyUI y /api/* de Comfy Cloud

Qué admite

  • Generación de imágenes a partir de un JSON de flujo de trabajo
  • Edición de imágenes con 1 imagen de referencia subida
  • Generación de video a partir de un JSON de flujo de trabajo
  • Generación de video con 1 imagen de referencia subida
  • Generación de música o audio mediante la herramienta compartida music_generate
  • Descarga de salidas desde un nodo configurado o desde todos los nodos de salida coincidentes

Primeros pasos

Elige entre ejecutar ComfyUI en tu propia máquina o usar Comfy Cloud.
Ideal para: ejecutar tu propia instancia de ComfyUI en tu máquina o LAN.
1

Inicia ComfyUI localmente

Asegúrate de que tu instancia local de ComfyUI esté en ejecución (usa http://127.0.0.1:8188 de forma predeterminada).
2

Prepara tu JSON de flujo de trabajo

Exporta o crea un archivo JSON de flujo de trabajo de ComfyUI. Toma nota de los IDs de nodo del nodo de entrada del prompt y del nodo de salida del que quieres que OpenClaw lea.
3

Configura el proveedor

Establece mode: "local" y apunta a tu archivo de flujo de trabajo. Aquí tienes un ejemplo mínimo para imágenes:
{
  models: {
    providers: {
      comfy: {
        mode: "local",
        baseUrl: "http://127.0.0.1:8188",
        image: {
          workflowPath: "./workflows/flux-api.json",
          promptNodeId: "6",
          outputNodeId: "9",
        },
      },
    },
  },
}
4

Establece el modelo predeterminado

Haz que OpenClaw apunte al modelo comfy/workflow para la capacidad que configuraste:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "comfy/workflow",
      },
    },
  },
}
5

Verifica

openclaw models list --provider comfy

Configuración

Comfy admite ajustes de conexión compartidos de nivel superior más secciones de flujo de trabajo por capacidad (image, video, music):
{
  models: {
    providers: {
      comfy: {
        mode: "local",
        baseUrl: "http://127.0.0.1:8188",
        image: {
          workflowPath: "./workflows/flux-api.json",
          promptNodeId: "6",
          outputNodeId: "9",
        },
        video: {
          workflowPath: "./workflows/video-api.json",
          promptNodeId: "12",
          outputNodeId: "21",
        },
        music: {
          workflowPath: "./workflows/music-api.json",
          promptNodeId: "3",
          outputNodeId: "18",
        },
      },
    },
  },
}

Claves compartidas

ClaveTipoDescripción
mode"local" or "cloud"Modo de conexión.
baseUrlstringUsa http://127.0.0.1:8188 de forma predeterminada para local o https://cloud.comfy.org para cloud.
apiKeystringClave opcional en línea, alternativa a las variables de entorno COMFY_API_KEY / COMFY_CLOUD_API_KEY.
allowPrivateNetworkbooleanPermite un baseUrl privado/LAN en modo cloud.

Claves por capacidad

Estas claves se aplican dentro de las secciones image, video o music:
ClaveObligatoriaPredeterminadoDescripción
workflow o workflowPathRuta al archivo JSON del flujo de trabajo de ComfyUI.
promptNodeIdID del nodo que recibe el prompt de texto.
promptInputNameNo"text"Nombre de entrada en el nodo del prompt.
outputNodeIdNoID del nodo del que se leerá la salida. Si se omite, se usan todos los nodos de salida coincidentes.
pollIntervalMsNoIntervalo de sondeo en milisegundos para la finalización del trabajo.
timeoutMsNoTiempo de espera en milisegundos para la ejecución del flujo de trabajo.
Las secciones image y video también admiten:
ClaveObligatoriaPredeterminadoDescripción
inputImageNodeIdSí (cuando se pasa una imagen de referencia)ID del nodo que recibe la imagen de referencia subida.
inputImageInputNameNo"image"Nombre de entrada en el nodo de imagen.

Detalles del flujo de trabajo

Establece el modelo de imagen predeterminado en comfy/workflow:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "comfy/workflow",
      },
    },
  },
}
Ejemplo de edición con imagen de referencia:Para habilitar la edición de imágenes con una imagen de referencia subida, agrega inputImageNodeId a tu configuración de imagen:
{
  models: {
    providers: {
      comfy: {
        image: {
          workflowPath: "./workflows/edit-api.json",
          promptNodeId: "6",
          inputImageNodeId: "7",
          inputImageInputName: "image",
          outputNodeId: "9",
        },
      },
    },
  },
}
Establece el modelo de video predeterminado en comfy/workflow:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "comfy/workflow",
      },
    },
  },
}
Los flujos de trabajo de video de Comfy admiten texto a video e imagen a video a través del grafo configurado.
OpenClaw no pasa videos de entrada a los flujos de trabajo de Comfy. Solo se admiten prompts de texto e imágenes únicas de referencia como entradas.
El Plugin integrado registra un proveedor de generación de música para salidas de audio o música definidas por el flujo de trabajo, expuestas mediante la herramienta compartida music_generate:
/tool music_generate prompt="Warm ambient synth loop with soft tape texture"
Usa la sección de configuración music para apuntar a tu JSON de flujo de trabajo de audio y al nodo de salida.
La configuración de imagen existente de nivel superior (sin la sección anidada image) sigue funcionando:
{
  models: {
    providers: {
      comfy: {
        workflowPath: "./workflows/flux-api.json",
        promptNodeId: "6",
        outputNodeId: "9",
      },
    },
  },
}
OpenClaw trata esa estructura heredada como la configuración del flujo de trabajo de imagen. No necesitas migrar de inmediato, pero las secciones anidadas image / video / music son las recomendadas para configuraciones nuevas.
Si solo usas generación de imágenes, la configuración plana heredada y la nueva sección anidada image son funcionalmente equivalentes.
Existe cobertura en vivo opcional para el Plugin integrado:
OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts
La prueba en vivo omite los casos individuales de imagen, video o música a menos que la sección de flujo de trabajo de Comfy correspondiente esté configurada.

Relacionado

Image Generation

Configuración y uso de la herramienta de generación de imágenes.

Video Generation

Configuración y uso de la herramienta de generación de video.

Music Generation

Configuración de la herramienta de generación de música y audio.

Provider Directory

Resumen de todos los proveedores y referencias de modelos.

Configuration Reference

Referencia completa de configuración, incluidos los valores predeterminados del agente.