Automatic1111 vs ComfyUI: qué elegir para retocadores y fotógrafos en 2026


gdefoto article

Automatic1111 vs ComfyUI: qué elegir para retocadores y fotógrafos en 2026

Cuando instalas Stable Diffusion en local por primera vez, te encuentras con una bifurcación que define los próximos seis meses de trabajo. A la izquierda, Automatic1111 con sus pestañas conocidas, bo

Intro

Cuando instalas Stable Diffusion en local por primera vez, te encuentras con una bifurcación que define los próximos seis meses de trabajo. A la izquierda, Automatic1111 con sus pestañas conocidas, botones y deslizadores. A la derecha, ComfyUI con un lienzo en blanco en el que tienes que montar un grafo de nodos, como un esquema eléctrico. Las dos herramientas generan imágenes con el mismo modelo de SD, las dos soportan ControlNet, LoRA, inpaint y upscale. Pero la jornada de trabajo dentro de cada una está estructurada de manera radicalmente distinta.

Este artículo está dirigido a retocadores, fotógrafos de marketplace y profesionales de IA que ya saben qué es Stable Diffusion y que ahora eligen la interfaz en la que van a construir su pipeline comercial. Sin guerras de religión, sin el tópico de "lo mejor es lo que te conviene a ti". Habrá escenarios concretos, cifras y tablas.

Me apoyo en la experiencia de retocadores que usan SD a diario para fotografía de producto, joyería y catálogos de marketplaces. Estas personas no tienen tiempo para filosofía de interfaces, necesitan entregar lotes de 200 a 500 fotogramas sin perder la fecha de entrega. En consecuencia, el enfoque del artículo es estrictamente de producción.

De dónde salieron Automatic1111 y ComfyUI

Stable Diffusion se publicó en el verano de 2022 como modelo abierto, y casi de inmediato aparecieron varias interfaces web a su alrededor. La ganadora de la primera ola fue el AUTOMATIC1111 Stable Diffusion WebUI, al que se suele llamar A1111 o simplemente "Automatic". Es una aplicación Gradio en Python, que se lanza en local, se abre en el navegador y ofrece pestañas de txt2img, img2img, inpaint, extras, train y así sucesivamente. En esencia es un panel de control similar al de Photoshop, solo que para un modelo de difusión.

ComfyUI apareció más tarde, a principios de 2023, y tomó otro camino. En lugar de pestañas, propone un workflow basado en nodos: arrastras nodos al lienzo (Load Checkpoint, CLIP Text Encode, KSampler, VAE Decode, Save Image) y los conectas con líneas. El resultado es un grafo que describe todo el proceso de generación, desde la carga del modelo hasta el guardado del archivo. Este enfoque viene del software 3D (Houdini, Blender Shader Editor, Substance Designer) y de la composición de vídeo (Nuke, Fusion).

Durante mucho tiempo A1111 fue el valor por defecto para todos los principiantes, mientras que ComfyUI se consideraba una herramienta de gente especializada. Pero en 2025 el panorama cambió: ComfyUI recibió soporte de SDXL y FLUX antes que Automatic, se volvió más rápido en lotes y se asentó como estándar en estudios comerciales. A1111 se quedó como herramienta principal de quienes trabajan en solitario y de los que han llegado hace poco. Ahora, en 2026, los dos están vivos y la elección entre ellos es real, no algo decidido por defecto.

La diferencia conceptual: pestañas frente a grafo

La diferencia principal no es técnica sino mental. A1111 es una aplicación GUI en sentido clásico: abres una pestaña, rellenas campos, pulsas Generate. Los parámetros se esconden en desplegables, muchas cosas se hacen "por defecto" y no se te exige entender qué pasa dentro del pipeline.

ComfyUI te obliga a montar el pipeline tú mismo. Ves cada paso: dónde se carga el modelo, dónde se codifica el prompt, dónde trabaja el sampler, dónde el VAE decodifica el latente a píxeles. Esto es a la vez ventaja y desventaja. La ventaja es que entiendes de verdad cómo funciona la difusión. La desventaja es que para generar una sola imagen tienes que construir un grafo básico de al menos seis nodos.

Se puede expresar así. A1111 es una máquina expendedora de café: pulsas un botón y recibes un café con leche. ComfyUI es una cafetera espresso con portafiltro: tienes que moler tú el grano, prensar la pastilla, ajustar la presión, pero el café que obtienes es el que quieres tú, no el que ha fijado el fabricante.

A1111: por qué gusta y por qué se critica

Las ventajas de Automatic1111 desde el punto de vista de los retocadores profesionales.

Barrera de entrada baja. Lo lanzas, abres la pestaña txt2img, escribes un prompt y pulsas Generate. Eso es todo. Sin nodos, sin lógica de pipeline. Una hora después de la instalación ya estás obteniendo imágenes con sentido.

Un ecosistema enorme de extensiones. En más de tres años se han acumulado cientos de plugins alrededor de A1111: ControlNet, ADetailer, Regional Prompter, Dynamic Prompts, sd-webui-civitai-helper, ultimate upscaler y decenas más. La mayoría se instala con un clic desde la pestaña Extensions.

Pestañas img2img e inpaint claras. Para un retocador que trabaja sobre una imagen concreta del cliente, esto importa: cargas la foto, enmascaras la zona, repintas en inpaint, guardas. En ComfyUI esa misma tarea hay que armarla con un grafo.

Mejor integración con el entrenamiento de LoRA dentro de la propia interfaz. Mediante extensiones como Dreambooth o el GUI de kohya-ss puedes entrenar directamente en A1111.

Las desventajas.

Más lento en lotes. En tiradas de 100 a 500 fotogramas, A1111 pierde un 20 a 40% de tiempo frente a ComfyUI, sobre todo con SDXL y FLUX. Esto está ligado a cómo Automatic gestiona la memoria y la caché.

Difícil de versionar el workflow. Los ajustes están repartidos entre pestañas, scripts y extensiones. Para transmitirle a otra persona "así hago yo el catálogo de joyería para marketplace" hay que describirlo con palabras o capturas. En ComfyUI basta con enviar un archivo JSON del grafo.

El desarrollo se ha ralentizado. Las versiones mayores de Automatic salen pocas veces, y el soporte de nuevas arquitecturas (FLUX, SD3, SDXL Lightning, modelos de vídeo) llega con retraso respecto a ComfyUI. Ha aparecido el fork Forge, que cubre parcialmente este hueco, pero ya no es el propio A1111.

La API es limitada. A1111 tiene una API REST integrada, pero es menos flexible que la que ofrece ComfyUI con su cola de tareas y notificaciones por WebSocket.

ComfyUI: por qué gusta y por qué se critica

Ventajas.

Rendimiento. Sobre el mismo hardware, ComfyUI suele ser entre un 15 y un 40% más rápido que A1111 gracias a una gestión de memoria más inteligente, al cacheo de latentes intermedios y a la reutilización de modelos entre ejecuciones. En lotes la diferencia es aún más visible.

Reproducibilidad del workflow. El grafo se guarda en JSON o directamente en los metadatos del PNG. Abres una imagen ajena, pulsas Load y obtienes el mismo grafo. Esto cambia el trabajo del estudio: puedes construir un pipeline de referencia para una categoría de producto y reutilizarlo sin pérdidas.

Flexibilidad. Cualquier escenario no estándar, por ejemplo "pasa el latente por dos samplers distintos, combínalos con una máscara y termina con inpaint", se monta en Comfy en cinco minutos. En A1111 algo así exige apaños mediante scripts o pasadas en cadena.

Llegada temprana de modelos nuevos. FLUX.1, SD3 y los modelos de vídeo (Hunyuan, LTX, Wan) casi siempre se soportan antes en ComfyUI. Si quieres trabajar en la vanguardia, ComfyUI cierra mejor esa cuestión.

API y automatización. Cola de tareas, WebSocket, modo headless, integración sencilla en un backend en Python o Node.js. Sobre ComfyUI se construyen pipelines para servicios generativos, bots de Telegram y productos SaaS.

Desventajas.

Barrera de entrada más alta. Los dos primeros días gastarás más tiempo estudiando los nodos que generando. La documentación oficial es escasa y el conocimiento de base vive en YouTube y en los grafos ajenos de civitai.

Los nodos son excesivos para tareas simples. Si solo quieres generar una imagen a partir de un prompt y arreglar una cara, en A1111 son dos clics, mientras que en Comfy hablamos de un grafo de 8 a 12 nodos. Sí, se puede guardar como plantilla, pero el montaje inicial lleva su tiempo.

La gestión de extensiones está menos madura. ComfyUI Manager cubre las necesidades básicas, pero los conflictos entre custom nodes son más frecuentes que entre Extensions de A1111. Tras una actualización es habitual que algo se rompa.

La UX no está asentada. Menús contextuales, alineación de nodos, minimapa, búsqueda dentro del grafo: todo esto o ha aparecido hace poco o sigue funcionando de forma imperfecta. Un workflow de más de 50 nodos se convierte en buscar una aguja en un pajar.

Tabla comparativa por parámetros clave

| Parámetro | Automatic1111 | ComfyUI |

|---|---|---|

| Barrera de entrada | Baja, una hora hasta la primera imagen | Media, uno o dos días para dominar los nodos |

| Velocidad de generación (una imagen) | Base | 15-25% más rápido |

| Velocidad de generación (lote de 100+) | Base | 25-40% más rápido |

| Gestión de VRAM | Estándar | Descarga agresiva, funciona con 6-8 GB |

| ControlNet | Vía extensión, estable | Nativo, vía nodos, más flexible |

| LoRA | Cómodo desde UI y por tags | Vía nodo Load LoRA, se pueden encadenar varias |

| Inpainting | Punto fuerte | Se resuelve, pero lleva más en montar |

| Img2img | Pestaña nativa | Grafo de 5-7 nodos |

| Extensiones | Cientos, instalación de un clic | ComfyUI Manager, algo menos maduro |

| API | REST, básica | REST + WebSocket, avanzada |

| Versionado del workflow | Capturas y texto | JSON o metadatos del PNG |

| Soporte de FLUX, SD3 | Con retraso, vía Forge | Nativo, desde el primer día |

| Actualizaciones | Poco frecuentes | Frecuentes, a veces rompen cosas |

| Trabajo en equipo | Complicado | Intercambio de JSON lo resuelve |

| Apto para trabajo en solitario | Sí | Sí, tras aprender |

| Apto para estudio | Con matices | Sí, la mejor opción |

Ejemplo de retoque fotografico

Cuándo elegir Automatic1111

Retocador en solitario que hace encargos llave en mano, donde cada fotograma se procesa de forma individual. Volúmenes pequeños, sin requisitos de reproducibilidad, ControlNet e inpaint se usan de manera puntual. A1111 te ahorra tiempo en la fase de aprendizaje y no estorba al trabajo.

Fotógrafo que prueba la IA por primera vez. Si acabas de oír hablar de Stable Diffusion y quieres entender si te hace falta o no, instala A1111. En una hora tendrás una herramienta funcional. Si no te convence, la abandonas sin pena.

Profesor y bloguero. Cuando grabas un vídeo formativo, es más fácil explicar las pestañas de Automatic que un grafo. La audiencia repite los pasos más rápido.

Quien necesita de verdad la función Train. Dentro de A1111 es más cómodo entrenar embeddings, hypernetworks y LoRAs sencillas. ComfyUI exige herramientas externas como kohya-ss.

Cuándo elegir ComfyUI

Estudio de fotografía de producto o de joyería con flujo continuo. Si tienes de 200 a 500 fotogramas al día, una diferencia del 30% en velocidad son dos o tres horas de trabajo. En un mes acumulas tanto que un curso se amortiza por sí solo.

Vendedor de marketplace con sesiones de producto regulares. Construyes una vez un workflow de referencia para la categoría, y a partir de ahí cada nuevo lote de mercancía pasa por él sin ajuste manual. La reproducibilidad es dinero: una persona monta el grafo, el resto lo replica.

Desarrollador de pipelines de IA. Si construyes un servicio, un bot o una herramienta interna para una agencia, ComfyUI es el estándar de facto para el backend. API, cola, headless, soporte de modelos nuevos: todo está ahí.

Retocador que planea trabajar con IA como habilidad de largo plazo. Dentro de un año o dos, saber leer un workflow a partir de los metadatos de un PNG se volverá una destreza tan básica como leer capas de un PSD. Cuanto antes empieces, antes obtendrás ventaja.

Se puede cambiar más adelante

Se puede y se debe. El conocimiento se traslada entre las dos interfaces de forma casi total. Ingeniería de prompts, comprensión de los samplers, CFG, steps, denoising strength, condicionamiento por ControlNet, fuerza de las LoRA: son los mismos conceptos, solo envueltos en una UI distinta.

El camino típico de un profesional es así. Durante los dos o tres primeros meses la persona vive en Automatic1111, entiende qué es la difusión, acumula una base de prompts y de LoRAs. Después, para un proyecto concreto (tarea por lotes, pipeline no estándar, integración en producción), prueba ComfyUI y descubre que el grafo se monta más rápido de lo que parecía. A partir de ahí Comfy se convierte en herramienta principal y A1111 se queda para experimentos puntuales y para casos en los que viene bien mover deslizadores en una UI.

El camino inverso también ocurre, pero con menos frecuencia. Quienes empezaron con ComfyUI y se pasaron a Automatic suelen hacerlo por una extensión concreta o porque dan clases de IA y quieren simplificar el material para la audiencia.

Qué usan los profesionales en el ámbito comercial

En retoque comercial y postproducción con IA el reparto es más o menos así.

Estudios de fotografía de producto y de joyería. ComfyUI como herramienta principal, A1111 como reserva. Los workflows de referencia por categorías (anillos, pendientes, relojes, packaging, calzado, ropa sobre maniquí) se guardan en JSON y se aplican en cadena.

Fotógrafos de marketplaces. Aquí la separación es por volumen. Hasta 50 SKU al mes se puede vivir en Automatic. A partir de 50 la gente se pasa a ComfyUI por velocidad y reproducibilidad.

Agencias que hacen visuales con IA para marcas. ComfyUI casi al 100%, porque el cliente suele pedir "haznos cinco variantes más con otra iluminación" y sin un grafo reproducible eso se convierte en una pesadilla.

Retocadores en solitario que trabajan con fotógrafos por outsourcing. Más a menudo A1111, porque las tareas son puntuales y no hace falta integración en un pipeline.

Programas educativos de retoque con IA. La tendencia del último año: los cursos empiezan enseñando en Automatic como herramienta de arranque y, hacia el final del programa, llevan a los alumnos a ComfyUI. Es razonable, porque uno complementa al otro.

Conclusión: qué elegir en 2026

En pocas palabras: empieza con el que esté más cerca de tu nivel actual y no tengas miedo de cambiar de elección dentro de tres meses.

Para un principiante sin recorrido en IA, Automatic1111 es mejor. Menos frustración, resultado inicial más rápido, curva de aprendizaje más suave. Cuando llegues al techo (y vas a llegar si trabajas a nivel comercial), el paso a ComfyUI te llevará una semana.

Para un profesional con flujo de tareas, directamente ComfyUI. El tiempo invertido en aprender los nodos se amortiza con el primer lote de 200 fotogramas. La reproducibilidad del workflow es tu activo principal y es difícil de sobrestimar.

Variante intermedia: instalas las dos interfaces en paralelo. No entran en conflicto, comparten los mismos archivos de modelo mediante symlinks y puedes usar la misma LoRA en ambas. Es una práctica habitual y, además, la mejor manera de entender cuál de las dos es realmente tuya.

Y lo principal: la interfaz no es magia. La magia está en entender los modelos, los prompts, ControlNet, los stacks de LoRA, la corrección de color tras la generación, en la capacidad de armar un pipeline para un producto concreto. Sin ese conocimiento, A1111 te dará basura bonita y ComfyUI te dará basura bonita más rápido.

Dónde aprender retoque de producto con IA

Si eres fotógrafo de marketplace o retocador que quiere meter la IA en sesiones de joyería, relojes, packaging y producto, échale un vistazo al curso AI PRO en gdefoto.com.

El programa está construido alrededor de Automatic1111 como herramienta de arranque, porque con él se asimila más rápido la base: prompts para producto, ControlNet para conservar la forma del artículo, LoRAs para categorías concretas de mercancía, inpaint de elementos de fondo y de sombras. Después mostramos cómo migrar a ComfyUI cuando el flujo de pedidos crece y cómo conservar el workflow para el equipo.

A diferencia de los cursos genéricos de IA del estilo "te enseñamos a generar imágenes", AI PRO está afilado para la fotografía comercial: joyería con los brillos correctos, ángulos idénticos en una serie, conservación de la textura del metal y de la piedra, fondo apto para marketplace sin artefactos. No es "SD creativo para arte", es una herramienta para catálogo.

Detalles, programa y reserva para la próxima convocatoria en la página del curso: gdefoto.com/lk/ai-pro/buy/.