ComfyLab
Curso Completo de ComfyUI (All-in-One 2026)

Curso Completo de ComfyUI (All-in-One 2026)

6GB VRAM VRAM Intermedio 4 min
Savien

Entender ComfyUI no es aprender a usar un programa, es aprender a construir tus propias herramientas de IA. Este curso está organizado como una ruta de aprendizaje progresiva — de instalación a workflows de producción — en vez de una lista suelta de trucos. Si aún no lo has instalado, revisa nuestra guía de instalación en Windows. La documentación oficial y los ejemplos de referencia están en el repositorio de ComfyUI en GitHub y en comfyanonymous.github.io/ComfyUI_examples, mantenidos por el propio autor del proyecto.


Ruta de aprendizaje: los 4 niveles

NivelQué dominasTiempo estimado
1. FundamentosInstalación, los 4 pilares (Loader → Encoder → Sampler → Decoder), primer workflow de imagen1 tarde
2. ProducciónControlNet, IP-Adapter, inpainting selectivo, gestión de VRAM1-2 semanas de práctica
3. AutomatizaciónWorkflows API, batch processing, integración con scripts externos2-4 semanas
4. Vídeo/AudioWan 2.1/2.2, LTX-Video, ACE-Step — mismos principios de grafo aplicados a otras modalidadesVariable, requiere más VRAM

Nivel 1 — La Filosofía del Arquitecto de Nodos

A diferencia de interfaces como Automatic1111, aquí tú eres el responsable de cada conexión. Eso desorienta la primera semana. Pero es exactamente lo que te da ventaja real:

  • Aísla problemas: si un ojo sale mal, regeneras solo esa zona con un InpaintModelConditioning, sin tocar nada más del lienzo.
  • Ahorro de recursos: puedes tener varios checkpoints cargados en disco; ComfyUI solo activa en VRAM el que necesita el nodo en ejecución en ese momento (carga perezosa).
  • Reproducibilidad exacta: cada imagen guarda sus metadatos de workflow — arrastrar el PNG a la interfaz reconstruye el grafo completo, seed incluido.

Los cuatro pilares que aparecen en cualquier workflow, sin excepción, son: Loader (carga checkpoint/VAE/CLIP), Encoder (texto → condicionamiento, vía CLIP), Sampler (el proceso de difusión iterativo, KSampler) y Decoder (VAEDecode, latente → píxeles). Todo lo demás — ControlNet, LoRAs, IP-Adapter — se inserta entre estos cuatro pilares, no los sustituye.

Nivel 1 — Organización Visual: El Secreto del Orden

Un flujo desordenado es un flujo con errores. Usa estas tres herramientas desde el primer día:

  1. Grupos: encierra secciones en cajas de colores (ej. “Input”, “Sampling”, “Post-process”). Cuando el flujo tenga 40 nodos, te lo agradecerás.
  2. Nodos Reroute: para que los cables no crucen toda la pantalla y te impidan ver qué conecta con qué.
  3. Primitive Nodes: un solo punto de control para varios parámetros a la vez. Cambias el seed en un sitio y se propaga a todos los nodos que lo usan.

Para profundizar en la lógica de conexión, te recomendamos la guía de fundamentos de nodos.

Nivel 2 — Herramientas de Producción Esenciales

No reinventes la rueda. Estos paquetes los tiene instalado prácticamente todo usuario con más de un mes de experiencia, disponibles vía ComfyUI-Manager:

  • ComfyUI-Manager: el primero que instalas. Sin él, instalar el resto es copiar repositorios a mano, carpeta por carpeta.
  • Impact Pack: refinamiento iterativo por zonas y FaceSwap. Imprescindible si trabajas retratos.
  • RGThree Nodes: reorganiza la interfaz con nodos de gestión de modelos que la instalación base no incluye.

Si quieres saber cuáles instalar primero, lee nuestro artículo sobre los 10 nodos esenciales. Para llevar la gestión de VRAM al siguiente nivel (GGUF, offload, tiling), revisa la guía de reducir VRAM en ComfyUI.

Nivel 3 — Automatización

Una vez dominas los nodos a mano, el paso natural es dejar de repetir el mismo workflow manualmente. ComfyUI expone una API HTTP (/prompt, /queue, /history) que acepta el JSON exportado de cualquier grafo — así es como funcionan los pipelines de generación por lotes: se carga un workflow base, se sustituyen los campos variables (prompt, seed, imagen de entrada) por script, y se encola vía API en lugar de hacer clic en “Queue Prompt” cientos de veces. Ver automatizar ComfyUI con Claude Code para un ejemplo concreto de este flujo.

Nivel 4 — Más allá de la imagen fija

Dominar ComfyUI no termina en imágenes fijas. Los mismos cuatro pilares (Loader/Encoder/Sampler/Decoder) escalan hacia vídeo generativo (Wan 2.1/2.2, LTX-Video) o síntesis de audio (ACE-Step) con cambios mínimos de arquitectura — cambia el checkpoint y el decoder, la lógica del grafo es la misma. El siguiente paso lógico tras afianzar los nodos de imagen es explorar el upscaling profesional para dar un acabado cinematográfico a tus obras, y después dar el salto a generación de vídeo.

Preguntas frecuentes

¿Cuánto tiempo se tarda en aprender ComfyUI?
Los conceptos básicos se entienden en una tarde, pero dominar flujos avanzados como ControlNet múltiple o Inpainting con detección de rostros puede llevar varias semanas de práctica constante.
¿Es necesario saber programar?
No. Aunque ComfyUI es visualmente técnico y usa lógica de nodos, no necesitas escribir una sola línea de código para crear flujos potentes. Sin embargo, entender cómo funciona Python ayuda a depurar instalaciones.
¿Puedo exportar mis flujos para que otros los usen?
Sí, todos los flujos se guardan dentro de los metadatos de las imágenes generadas o como archivos `.json`. Solo tienes que arrastrar la imagen a la interfaz de otra persona para que cargue tu flujo.
Compartir X LinkedIn

También te puede interesar