ComfyUI no es solo un programa de “hacer dibujitos”, es un entorno de ejecución de grafos. Para el ojo inexperto, un flujo de trabajo parece un plato de espaguetis de cables; para un arquitecto de IA, es una serie de transformaciones lógicas precisas. En esta guía vamos a destripar el “porqué” de las conexiones. Si vienes de Automatic1111 y te sientes perdido, esta es tu base. Si aún no lo has instalado, empieza por nuestra guía de instalación en Windows.
El grafo básico en la práctica
Grafo real de ComfyUI: Checkpoint → CLIP Text Encode → KSampler → VAE Decode → Save Image
📡 El Concepto de “Señal” en la IA
Imagina que ComfyUI es un estudio de audio. El Checkpoint es el instrumento. El Prompt es la partitura. El KSampler es el amplificador. Y el VAE es el altavoz. Desconectas uno. La música se detiene.
Los 4 Estados de la Materia IA
Todo workflow se divide en estas cuatro fases obligatorias:
- Estado Físico (Checkpoints & Loaders): Aquí definimos los recursos. Cargamos los gigabytes de datos que contienen el “conocimiento” de la IA.
- Estado Verbal (Encoding): Convertimos nuestro lenguaje humano (texto) en vectores matemáticos (Conditioning). Es el puente más crítico de todo el grafo — si el texto no se codifica bien, el sampler trabaja con basura desde el primer paso.
- Estado Invisible (Sampling): Aquí ocurre la magia. Trabajamos en el Espacio Latente. Sin píxeles, solo probabilidades. Es donde se esculpe la imagen a partir del ruido puro.
- Estado Visible (Decoding): El decodificador (VAE) toma las matemáticas abstractas y las proyecta en una matriz de colores (RGB) que puedes guardar como archivo
.png. Sin este paso tienes un tensor flotando en memoria — un dato que ningún visor de imágenes puede abrir.
🏗️ Anatomía de un Nodo: Inputs, Outputs y Widgets
Un nodo parece una cajita simple. Por dentro tiene una estructura técnica rigurosa.
1. Inputs (Izquierda - Los Ingredientes)
Son los datos que el nodo necesita recibir para funcionar. Si falta un input obligatorio (marcado con un círculo sólido), el nodo no se ejecuta y el workflow se detiene en rojo. Sin advertencia, sin pista útil: solo rojo.
2. Widgets (Centro - Los Mandos)
Son parámetros “fijos” como números o selectores. No fluyen por cables, los configuras a mano.
- Tip Pro: Si haces clic derecho sobre un widget (como
seedosteps), puedes elegir “Convert to Input”. Esto crea un nuevo pin a la izquierda. Con ese pin conectado, controlas ese valor desde otro nodo — un generador aleatorio, un contador, o incluso un nodo de texto que lees desde archivo.
3. Outputs (Derecha - El Producto)
Es el resultado de la transformación del nodo. Siempre entrega el mismo tipo de dato que recibió, pero modificado.
🎨 El Código de Colores: Tu Mejor Aliado
Memoriza estos colores. Son el estándar universal de ComfyUI y te permiten leer cualquier workflow complejo de un vistazo, sin seguir cada cable uno a uno:
| Color | Tipo | Nodo de Origen Típico |
|---|---|---|
| Morado | MODEL | Checkpoint Loader |
| Amarillo | CLIP | Checkpoint Loader / LoRA Loader |
| Rojo | VAE | Checkpoint Loader / VAE Loader |
| Naranja | CONDITIONING | CLIP Text Encode |
| Rosa | LATENT | Empty Latent Image / KSampler |
| Azul | IMAGE | VAE Decode / Load Image |
Conclusión
Entender la arquitectura de nodos es lo que te permite diseñar tus propios flujos en lugar de descargar los de otros y rezar para que funcionen. Ya no eres un usuario; eres un ingeniero de flujos. El siguiente paso es poner en práctica esta lógica con los nuevos modelos de vanguardia en nuestra guía de FLUX.1.
Siguientes pasos en ComfyUI
Primeros pasos
Preguntas frecuentes
- ¿Por qué no puedo conectar un modelo directamente a un guardado de imagen?
- Porque los datos en la IA fluyen en estados diferentes. El modelo genera tensores matemáticos (ruido), no píxeles. Necesitas el nodo VAE Decode para 'traducir' esos números en una imagen real que tus ojos puedan ver.
- ¿Qué significa el término 'Latente'?
- El espacio latente es una representación comprimida de la imagen. Trabajar aquí permite que la IA sea rápida y eficiente. Es como trabajar con un plano técnico antes de construir la casa real.
- ¿Influye el orden de los nodos en el resultado?
- Totalmente. El flujo en ComfyUI es generalmente de izquierda a derecha. Alterar el orden de carga (por ejemplo, aplicar un LoRA después del Sampler) es físicamente imposible según la arquitectura del software.
- ¿Cómo sé si un cable está bien conectado?
- ComfyUI usa un sistema de tipos por colores. Si los colores coinciden (morado con morado, naranja con naranja), la señal es compatible. Si el cable aparece en rojo o no se conecta, hay un error de lógica de datos.