ComfyLab
FLUX.1 Dev en ComfyUI: Instalación, Nodos y Workflow Completo

FLUX.1 Dev en ComfyUI: Instalación, Nodos y Workflow Completo

16GB VRAM VRAM Intermedio 10 min FLUX.1 Dev
Savien

FLUX.1 Dev en ComfyUI: Instalación, Nodos y Workflow Completo

Trabajar con FLUX.1 Dev en ComfyUI abre posibilidades profesionales en generación de imágenes con IA, pero su arquitectura modular difiere significativamente de modelos anteriores. A diferencia de checkpoints monolíticos, FLUX Dev se distribuye en cuatro archivos separados que deben organizarse correctamente para obtener resultados óptimos. Esta guía te mostrará exactamente cómo instalar FLUX en ComfyUI, configurar los nodos esenciales y crear un workflow funcional con parámetros probados.

Ejemplo real generado con FLUX.1 Dev

Generado en local con FLUX.1 Dev Q8 GGUF, 20 pasos, RTX 3090 Generado en local con FLUX.1 Dev Q8 GGUF, 20 pasos, RTX 3090


De un vistazo: Requisitos de FLUX.1 Dev

ComponenteArchivoTamañoUbicación
Modelo de difusión (UNet)flux1-dev.safetensors o .gguf24GB / 7GBmodels/diffusion_models/
Text encoder T5-XXLt5xxl_fp16.safetensors9GBmodels/clip/
Text encoder CLIP-Lclip_l.safetensors250MBmodels/clip/
Decodificador (VAE)ae.safetensors335MBmodels/vae/
VRAM mínimoGPU de 16GB+ (Dev) o 8GB (Schnell)

Arquitectura de FLUX.1 Dev: Los Cuatro Componentes Esenciales

Antes de descargar, debes comprender que FLUX.1 Dev no es un modelo monolítico. Se compone de cuatro elementos independientes que trabajan en conjunto:

El Modelo de Difusión (UNet)

El archivo principal es el modelo de difusión, disponible en dos formatos según tu capacidad de VRAM:

  • flux1-dev.safetensors (~24GB): La versión completa en precisión FP16. Requiere una GPU con al menos 24GB de VRAM para ejecutarse sin problemas, aunque con optimizaciones puede funcionar en GPUs de 16GB.
  • flux1-dev-Q8_0.gguf (~13GB): Versión cuantizada de 8 bits. Ideal para GPUs con 12-16GB de VRAM.
  • flux1-dev-Q4_K_M.gguf (~7GB): Versión cuantizada de 4 bits. Funciona en GPUs de 8GB, aunque la calidad se reduce ligeramente.

Este archivo debe colocarse en la carpeta ComfyUI/models/diffusion_models/.

Los Codificadores de Texto (CLIP)

FLUX.1 Dev utiliza dos codificadores de texto simultáneamente, a diferencia de Stable Diffusion que usa solo uno:

  • t5xxl_fp16.safetensors (~9GB): El codificador T5-XXL en precisión completa. Proporciona la mejor comprensión del prompt natural.
  • t5xxl_fp8_e4m3fn.safetensors (~5GB): Versión cuantizada del T5-XXL. Reduce el consumo de VRAM sin pérdida significativa de calidad.
  • clip_l.safetensors (~250MB): El segundo codificador CLIP-L. Este archivo es mucho más pequeño y siempre se utiliza.

Ambos archivos van en ComfyUI/models/clip/.

El Decodificador de Imágenes (VAE)

El archivo ae.safetensors (~335MB) es el codificador-decodificador automático que convierte la representación latente en una imagen final. Se coloca en ComfyUI/models/vae/.

📌 A tener en cuenta: FLUX.1 Dev requiere cuatro archivos independientes en carpetas específicas. La versión del UNet (FP16 o GGUF) depende de tu VRAM disponible; los codificadores y VAE permanecen igual en cualquier configuración.


Pasos de Instalación Detallados para FLUX en ComfyUI

Paso 1: Preparar las Carpetas

Abre tu instalación de ComfyUI y verifica que existan estas carpetas:

ComfyUI/
├── models/
│   ├── diffusion_models/
│   ├── clip/
│   └── vae/

Si no existen, créalas manualmente.

Paso 2: Descargar los Archivos

Los archivos están disponibles en Hugging Face. Accede a los repositorios oficiales:

  • Modelo de difusión: Busca black-forest-labs/FLUX.1-dev en Hugging Face.
  • Codificadores y VAE: Están en el mismo repositorio o en repositorios de referencia como openai/clip-vit-large-patch14 y google/t5-v1_1-xxl.

Alternativamente, usa herramientas como huggingface-cli para descargar directamente desde terminal:

huggingface-cli download black-forest-labs/FLUX.1-dev flux1-dev.safetensors --local-dir ./ComfyUI/models/diffusion_models/

Paso 3: Verificar la Estructura de Carpetas

Una vez descargados, tu estructura debería verse así:

ComfyUI/models/
├── diffusion_models/
│   └── flux1-dev.safetensors (o flux1-dev-Q4_K_M.gguf)
├── clip/
│   ├── t5xxl_fp16.safetensors
│   └── clip_l.safetensors
└── vae/
    └── ae.safetensors

⚠️ Importante: La descarga puede tomar varias horas según tu conexión. Verifica que todos los archivos estén completos antes de continuar (compara el tamaño descargado con el esperado).


Nodos Esenciales para el Workflow de FLUX.1 Dev

ComfyUI requiere nodos específicos para trabajar con FLUX.1 Dev en ComfyUI. Estos nodos están disponibles en las custom nodes de la plataforma.

UNETLoader: Cargando el Modelo Principal

Este nodo carga el archivo flux1-dev.safetensors (o su variante GGUF). Configúralo así:

  • Model: Selecciona flux1-dev.safetensors del dropdown.
  • Weight dtype: Elige fp8 o fp16 según tu VRAM disponible.

Si usas archivos GGUF, necesitarás el nodo GGUFModelLoader en lugar de UNETLoader. Para esto, instala la custom node ComfyUI-GGUF (disponible en el gestor de custom nodes).

DualCLIPLoader: Los Dos Codificadores en Uno

Este nodo es crucial porque carga simultáneamente el T5-XXL y el CLIP-L. Es un nodo específico para FLUX:

  • Clip_name1: Selecciona t5xxl_fp16.safetensors (o t5xxl_fp8_e4m3fn.safetensors si necesitas ahorrar VRAM).
  • Clip_name2: Selecciona clip_l.safetensors.
  • Type: Debe estar en flux.

Este nodo devuelve un objeto CLIP que contiene ambos codificadores integrados.

CLIPTextEncodeFlux: Codificando el Prompt

Este nodo funciona diferente al estándar de Stable Diffusion:

  • Text: Tu prompt con las instrucciones de generación.
  • Guidance: Este parámetro es crítico. A diferencia de otros modelos, FLUX maneja la guidance de forma diferente. El valor recomendado es 3.5.
  • CLIP: Conecta la salida del DualCLIPLoader.

Nota importante: FLUX.1 Dev no utiliza prompts negativos de la manera tradicional. El campo “negative prompt” tiene un efecto mínimo, así que enfócate en describir exactamente lo que deseas en el prompt positivo.

VAELoader: Decodificador de Imágenes

Carga el archivo ae.safetensors:

  • Vae_name: Selecciona ae.safetensors.

KSampler o SamplerCustomAdvanced

Para generar imágenes, necesitas un sampler. Los parámetros recomendados son:

  • Steps: 20-30 pasos. Con menos de 20 notas degradación visible, con más de 30 mejoras marginales.
  • Cfg scale: 3.5 (este es el valor de guidance que mencionamos).
  • Sampler: euler es la opción estándar.
  • Scheduler: simple funciona mejor que otros schedulers.
  • Seed: Usa valores aleatorios o fija uno para reproducibilidad.

💡 Consejo: Los nodos clave son DualCLIPLoader (para los dos text encoders) y CLIPTextEncodeFlux (para procesar el prompt). Sin estos nodos específicos para FLUX, la calidad se degrada significativamente.


FLUX.1 Dev vs FLUX.1 Schnell: Comparativa Detallada

CaracterísticaFLUX.1 DevFLUX.1 Schnell
Pasos recomendados20-304-8
Calidad de salidaMuy alta, detalles precisosBuena, más rápida
Tiempo de generación30-60 segundos (RTX 4090)5-10 segundos
Tamaño del modelo24GB (FP16)12GB (FP16)
Uso comercialPermitido con licenciaLimitaciones de licencia
CodificadoresT5-XXL + CLIP-LT5-XXL + CLIP-L
Mejor paraProyectos profesionales, máxima calidadPrototipado rápido, iteración

Ambas versiones usan los mismos archivos de codificadores y VAE, lo que facilita cambiar entre ellas. La diferencia principal radica en el UNet: Schnell es una versión destilada más rápida pero menos precisa.


Optimizaciones para Diferentes Capacidades de Hardware

GPU con 24GB+ de VRAM (RTX 4090, A100)

Usa la configuración estándar sin restricciones:

  • Modelo: flux1-dev.safetensors (FP16)
  • T5-XXL: t5xxl_fp16.safetensors
  • Steps: 30
  • Batch size: Hasta 4 imágenes simultáneamente

GPU con 16GB de VRAM (RTX 4070 Ti, A10)

Implementa estas optimizaciones:

  • Modelo: flux1-dev.safetensors con fp8 dtype
  • T5-XXL: t5xxl_fp8_e4m3fn.safetensors
  • Steps: 25-28
  • Batch size: 1-2 imágenes

GPU con 8-12GB de VRAM (RTX 4070, RTX 3080)

Usa versiones cuantizadas:

  • Modelo: flux1-dev-Q4_K_M.gguf (requiere ComfyUI-GGUF)
  • T5-XXL: t5xxl_fp8_e4m3fn.safetensors
  • Steps: 20-24
  • Batch size: 1 imagen

💡 Consejo: La cuantización (GGUF) es tu aliada si tienes menos de 16GB VRAM. Reduce el tamaño del modelo de 24GB a 7GB sin pérdida crítica de calidad.


Estructura de un FLUX.1 Workflow Completo en ComfyUI

Un FLUX.1 workflow ComfyUI funcional sigue este orden:

  1. Nodo de entrada: Carga el prompt como texto.
  2. DualCLIPLoader: Carga ambos codificadores (T5-XXL + CLIP-L).
  3. CLIPTextEncodeFlux: Codifica el prompt con guidance 3.5.
  4. UNETLoader: Carga el modelo de difusión (flux1-dev).
  5. VAELoader: Carga el decodificador (ae.safetensors).
  6. KSampler: Genera la imagen latente con los parámetros configurados (20-30 steps, euler, simple).
  7. VAEDecode: Convierte la imagen latente a imagen final.
  8. SaveImage: Guarda el resultado en la carpeta de salida.

Conecta las salidas a las entradas correspondientes y ejecuta. El proceso tardará entre 30 y 60 segundos dependiendo de tu hardware.


Preguntas Frecuentes Verificadas

¿Cuántos archivos necesito descargar para usar FLUX en ComfyUI?

4 archivos mínimos: flux1-dev.safetensors (UNet, ~24GB), t5xxl_fp16.safetensors (text encoder, ~9GB), clip_l.safetensors (~250MB) y ae.safetensors (VAE, ~335MB). Si tienes menos de 16GB VRAM, usa la versión GGUF del UNet (flux1-dev-Q4_K_M.gguf ~7GB) con el mismo VAE y encoders.

¿Por qué FLUX usa DualCLIPLoader en lugar de CLIPLoader normal?

FLUX utiliza dos text encoders simultáneamente: T5-XXL (entiende lenguaje natural complejo) y CLIP-L (guía la generación). DualCLIPLoader los carga en un solo nodo seleccionando el tipo ‘flux’. Si conectas CLIPLoader normal solo cargas uno de los dos y la calidad se degrada significativamente.

¿Cuál es la diferencia entre FLUX.1 Dev y FLUX.1 Schnell?

FLUX Schnell es 4-8 veces más rápido (4-8 steps vs 20-30) pero con menor calidad en detalles finos. Usan los mismos encoders y VAE; solo cambia el UNet. Para producción y máxima calidad: Dev. Para iterar rápido y ver resultados preliminares: Schnell.

¿FLUX necesita prompt negativo?

No de forma efectiva. FLUX fue entrenado diferente a SD; el prompt negativo tiene muy poco impacto. Puedes dejarlo en blanco o usar una frase genérica. El campo guidance_scale en CLIPTextEncodeFlux (valor recomendado 3.5) cumple una función más relevante que el negative prompt.

¿Por qué mi GPU se queda sin memoria con FLUX.1 Dev?

Probablemente estés usando la versión FP16 del modelo o del T5-XXL sin optimizaciones. Cambia a versiones cuantizadas (FP8 o GGUF) y reduce los pasos a 20. También verifica que no tengas otros procesos consumiendo VRAM.

¿Es obligatorio usar guidance 3.5?

No, pero es el valor recomendado por Black Forest Labs. Puedes experimentar entre 3.0 y 4.0 para ajustar cuánto el modelo sigue tu prompt. Valores superiores a 5.0 pueden producir artefactos.

¿Debo instalar custom nodes especiales para FLUX.1 Dev?

Sí, necesitas custom nodes que incluyan DualCLIPLoader y CLIPTextEncodeFlux. Estas suelen venir en paquetes como “FLUX Support” en el gestor de ComfyUI.

¿Qué diferencia hay en el prompt entre FLUX.1 Dev y Stable Diffusion?

FLUX.1 Dev entiende mejor los prompts en lenguaje natural. Puedes escribir instrucciones más conversacionales sin necesidad de keywords específicos. Los prompts negativos tienen poco efecto, así que enfócate en describir positivamente lo que deseas.



Sigue leyendo

Si quieres profundizar en técnicas avanzadas de prompt engineering para FLUX, consulta nuestra guía sobre cómo optimizar descripciones para máxima coherencia semántica. Para comparativas detalladas con otros modelos de generación de imágenes, explora nuestro análisis sobre arquitecturas de difusión y sus diferencias prácticas. Si buscas resolver problemas específicos de VRAM o rendimiento, revisa nuestro artículo dedicado a optimizaciones de hardware para ComfyUI.


🏆 Nuestra recomendación

Si buscas máxima calidad y trabajas en proyectos profesionales → elige FLUX.1 Dev con la configuración estándar (flux1-dev.safetensors, 25-30 steps, guidance 3.5). Si priorizas velocidad de iteración y tienes limitaciones de VRAM → elige FLUX.1 Schnell o usa flux1-dev-Q4_K_M.gguf con 20 steps. Ambas opciones comparten los mismos codificadores, así que puedes cambiar entre ellas sin descargar archivos adicionales.

Preguntas frecuentes

¿Cuántos archivos necesito descargar para usar FLUX en ComfyUI?
4 archivos mínimos: flux1-dev.safetensors (UNet, ~24GB), t5xxl_fp16.safetensors (text encoder, ~9GB), clip_l.safetensors (~250MB) y ae.safetensors (VAE, ~335MB). Si tienes menos de 16GB VRAM, usa la versión GGUF del UNet (flux1-dev-Q4_K_M.gguf ~7GB) con el mismo VAE y encoders.
¿Por qué FLUX usa DualCLIPLoader en lugar de CLIPLoader normal?
FLUX usa dos text encoders simultáneamente: T5-XXL (entiende lenguaje natural complejo) y CLIP-L (guía la generación). DualCLIPLoader los carga en un solo nodo seleccionando el tipo 'flux'. Si conectas CLIPLoader normal solo cargas uno de los dos y la calidad se degrada significativamente.
¿Cuál es la diferencia entre FLUX.1 Dev y FLUX.1 Schnell?
FLUX Schnell es 4-8 veces más rápido (4-8 steps vs 20-30) pero con menor calidad en detalles finos. Usan los mismos encoders y VAE; solo cambia el UNet. Para producción y máxima calidad: Dev. Para iterar rápido y ver resultados preliminares: Schnell.
¿FLUX necesita prompt negativo?
No de forma efectiva. FLUX fue entrenado diferente a SD; el prompt negativo tiene muy poco impacto. Puedes dejarlo en blanco o usar una frase genérica. El campo guidance_scale en CLIPTextEncodeFlux (valor recomendado 3.5) cumple una función más relevante que el negative prompt.
Compartir X LinkedIn

También te puede interesar