Automatic1111 vs ComfyUI: Was Retuschierer und Fotografen 2026 wählen sollten
Automatic1111 vs ComfyUI: Was Retuschierer und Fotografen 2026 wählen sollten
Wenn man Stable Diffusion zum ersten Mal lokal installiert, steht man vor einer Weggabelung, von der die nächsten sechs Monate Arbeit abhängen. Links Automatic1111 mit vertrauten Tabs, Buttons und Sch
Intro
Wenn man Stable Diffusion zum ersten Mal lokal installiert, steht man vor einer Weggabelung, von der die nächsten sechs Monate Arbeit abhängen. Links Automatic1111 mit vertrauten Tabs, Buttons und Schiebereglern. Rechts ComfyUI mit einer weißen Leinwand, auf der man einen Graphen aus Knoten zusammensetzen muss, wie einen Schaltplan. Beide Tools erzeugen Bilder aus demselben SD-Modell, beide unterstützen ControlNet, LoRA, Inpaint und Upscale. Aber der Arbeitstag innerhalb der beiden Programme ist grundlegend unterschiedlich strukturiert.
Dieser Artikel richtet sich an Retuschierer, Marktplatzfotografen und KI-Praktiker, die bereits wissen, was Stable Diffusion ist, und nun die Oberfläche wählen, in der sie ihre kommerzielle Pipeline aufbauen. Keine Glaubenskriege, kein abgegriffenes "das Beste ist das, was zu Ihnen passt". Es gibt konkrete Szenarien, Zahlen und Tabellen.
Ich stütze mich auf die Erfahrung von Retuschierern, die SD täglich für Produktfotografie, Schmuck und Marktplatzkataloge einsetzen. Diese Leute haben keine Zeit für Interface-Philosophie, sie müssen Chargen von 200 bis 500 Aufnahmen abliefern und dürfen die Deadline nicht reißen. Entsprechend ist die Optik des Artikels rein produktionsorientiert.
Woher Automatic1111 und ComfyUI stammen
Stable Diffusion erschien im Sommer 2022 als offenes Modell, und fast sofort entstanden mehrere Web-Oberflächen darum. Sieger der ersten Welle wurde das AUTOMATIC1111 Stable Diffusion WebUI, das man üblicherweise A1111 oder einfach "Automatic" nennt. Es ist eine Gradio-Anwendung in Python, die lokal startet, im Browser aufgeht und Tabs wie txt2img, img2img, inpaint, extras, train und so weiter bietet. Im Grunde ist es ein Bedienpanel ähnlich Photoshop, nur für ein Diffusionsmodell.
ComfyUI kam später, Anfang 2023, und ging einen anderen Weg. Statt Tabs gibt es dort einen knotenbasierten Workflow: Man zieht Knoten auf die Leinwand (Load Checkpoint, CLIP Text Encode, KSampler, VAE Decode, Save Image) und verbindet sie mit Linien. Heraus kommt ein Graph, der den gesamten Generierungsprozess vom Laden des Modells bis zum Schreiben der Datei beschreibt. Dieser Ansatz kommt aus 3D-Software (Houdini, Blender Shader Editor, Substance Designer) und dem Compositing (Nuke, Fusion).
Lange Zeit war A1111 die Voreinstellung für alle Einsteiger, während ComfyUI als Werkzeug von Spezialisten galt. Doch 2025 änderte sich das Bild: ComfyUI bekam Support für SDXL und FLUX früher als Automatic, wurde bei Stapelverarbeitung schneller und etablierte sich als Standard in kommerziellen Studios. A1111 blieb das Hauptwerkzeug für Einzelkämpfer und für jene, die erst kürzlich eingestiegen sind. Aktuell, im Jahr 2026, leben beide aktiv weiter, und die Wahl zwischen ihnen ist real und nicht von vornherein entschieden.
Der konzeptionelle Unterschied: Tabs gegen Graph
Der entscheidende Unterschied ist nicht technisch, sondern mental. A1111 ist eine GUI-Anwendung im klassischen Sinn: Man öffnet einen Tab, füllt Felder aus, drückt Generate. Parameter sind in Aufklappbereichen versteckt, vieles läuft "in der Voreinstellung", und man muss nicht verstehen, was innerhalb der Pipeline passiert.
ComfyUI zwingt einen, die Pipeline eigenhändig zusammenzusetzen. Man sieht jeden Schritt: wo das Modell geladen wird, wo der Prompt kodiert wird, wo der Sampler arbeitet, wo der VAE das Latent zu Pixeln dekodiert. Das ist Vorteil und Nachteil zugleich. Vorteil ist, dass man wirklich versteht, wie Diffusion funktioniert. Nachteil ist, dass man für eine einzige generierte Bild zumindest einen Basis-Graphen aus sechs Knoten bauen muss.
Man kann es so sagen. A1111 ist ein Kaffeeautomat: Knopf drücken, Latte bekommen. ComfyUI ist eine Siebträgermaschine: Man muss selbst die Bohnen mahlen, den Puck tampen, den Druck einstellen, aber der Kaffee, den man bekommt, ist auch der, den man wirklich will, und nicht der, den der Hersteller vorgegeben hat.
A1111: Wofür man es liebt und wofür man es kritisiert
Die Pluspunkte von Automatic1111 aus Sicht praktizierender Retuschierer.
Niedrige Einstiegshürde. Starten, txt2img-Tab öffnen, Prompt eintippen, Generate drücken. Das war es. Keine Knoten, keine Pipeline-Logik. Eine Stunde nach der Installation erhält man bereits sinnvolle Bilder.
Riesiges Erweiterungsökosystem. In über drei Jahren sind rund um A1111 hunderte Plug-ins entstanden: ControlNet, ADetailer, Regional Prompter, Dynamic Prompts, sd-webui-civitai-helper, Ultimate Upscaler und Dutzende weitere. Die meisten lassen sich per Klick aus dem Tab Extensions installieren.
Übersichtliche Tabs img2img und Inpaint. Für den Retuschierer, der an einem konkreten Kundenbild arbeitet, ist das wichtig: Foto laden, Bereich maskieren, im Inpaint übermalen, speichern. In ComfyUI muss man dieselbe Aufgabe per Graph zusammenbauen.
Bessere Integration des LoRA-Trainings in der Oberfläche selbst. Über Extensions wie Dreambooth oder das kohya-ss GUI lässt sich direkt in A1111 trainieren.
Die Minuspunkte.
Langsamer bei Batches. Bei Serien von 100 bis 500 Frames verliert A1111 gegenüber ComfyUI 20 bis 40% Zeit, vor allem bei SDXL und FLUX. Das hängt damit zusammen, wie Automatic Speicher und Cache verwaltet.
Workflow lässt sich schwer versionieren. Die Einstellungen verteilen sich über Tabs, Skripte und Extensions. Um einem anderen Menschen zu vermitteln "so mache ich den Schmuckkatalog für einen Marktplatz", muss man es in Worten oder Screenshots beschreiben. In ComfyUI reicht es, eine JSON-Datei des Graphen zu schicken.
Die Entwicklung hat sich verlangsamt. Major-Releases von Automatic erscheinen selten, und der Support neuer Architekturen (FLUX, SD3, SDXL Lightning, Videomodelle) trifft mit Verzögerung gegenüber ComfyUI ein. Es ist der Fork Forge entstanden, der diese Lücke teilweise schließt, aber das ist nicht mehr A1111 selbst.
Die API ist begrenzt. A1111 hat eine eingebaute REST-API, aber sie ist weniger flexibel als das, was ComfyUI mit seiner Task-Queue und WebSocket-Benachrichtigungen bietet.
ComfyUI: Wofür man es liebt und wofür man es kritisiert
Pluspunkte.
Performance. Bei gleicher Hardware ist ComfyUI in der Regel 15 bis 40% schneller als A1111 dank intelligenterem Speichermanagement, Caching von Zwischen-Latents und Wiederverwendung von Modellen zwischen Läufen. Bei Stapelverarbeitung wird der Unterschied noch deutlicher.
Reproduzierbarkeit des Workflows. Der Graph wird als JSON oder direkt in den Metadaten einer PNG-Datei gespeichert. Man öffnet ein fremdes Bild, drückt Load, erhält denselben Graphen. Das verändert die Studioarbeit: Man kann eine Referenz-Pipeline für eine Produktkategorie aufbauen und sie verlustfrei wiederverwenden.
Flexibilität. Jedes Sonderszenario, etwa "lass das Latent durch zwei verschiedene Sampler laufen, mische sie über eine Maske und schließe es mit Inpaint ab", lässt sich in Comfy in fünf Minuten bauen. In A1111 erfordert so etwas Krücken über Skripte oder aufeinanderfolgende Durchläufe.
Frühes Eintreffen neuer Modelle. FLUX.1, SD3 und Videomodelle (Hunyuan, LTX, Wan) werden fast immer zuerst in ComfyUI unterstützt. Wer am Puls der Zeit arbeiten will, wird mit ComfyUI besser bedient.
API und Automatisierung. Task-Queue, WebSocket, Headless-Modus, einfache Integration in ein Python- oder Node.js-Backend. Auf Basis von ComfyUI werden Pipelines für generative Services, Telegram-Bots und SaaS-Produkte gebaut.
Minuspunkte.
Höhere Einstiegshürde. Die ersten zwei Tage verbringt man mehr Zeit damit, die Knoten zu lernen, als zu generieren. Die offizielle Dokumentation ist dürftig, das Grundwissen liegt auf YouTube und in fremden Graphen von civitai.
Knoten sind für einfache Aufgaben überdimensioniert. Wer einfach nur ein Bild aus einem Prompt erzeugen und ein Gesicht reparieren will, hat in A1111 zwei Klicks, in Comfy einen Graphen aus 8 bis 12 Knoten. Ja, man kann eine Vorlage speichern, aber der erste Aufbau braucht Zeit.
Das Erweiterungsmanagement ist weniger ausgereift. ComfyUI Manager deckt die wichtigsten Bedürfnisse ab, doch Konflikte zwischen Custom Nodes sind häufiger als zwischen Extensions in A1111. Nach einem Update geht oft etwas kaputt.
Die UX ist nicht stabilisiert. Kontextmenüs, Knotenausrichtung, Minimap, Suche im Graphen: All das ist entweder erst kürzlich erschienen oder funktioniert bis heute nicht ideal. Ein Workflow mit über 50 Knoten verwandelt sich in eine "Nadel im Heuhaufen".
Vergleichstabelle nach Schlüsselparametern
| Parameter | Automatic1111 | ComfyUI |
|---|---|---|
| Einstiegshürde | Niedrig, eine Stunde bis zum ersten Bild | Mittel, ein bis zwei Tage zum Erlernen der Knoten |
| Generierungstempo (ein Bild) | Basis | 15-25% schneller |
| Generierungstempo (Batch ab 100) | Basis | 25-40% schneller |
| VRAM-Management | Standard | Aggressives Offloading, läuft mit 6-8 GB |
| ControlNet | Über Erweiterung, stabil | Nativ, über Knoten, flexibler |
| LoRA | Bequem über UI und Tags | Über Knoten Load LoRA, mehrere lassen sich hintereinander hängen |
| Inpainting | Starke Seite | Lösbar, aber aufwendiger im Aufbau |
| Img2img | Nativer Tab | Graph aus 5-7 Knoten |
| Erweiterungen | Hunderte, Ein-Klick | ComfyUI Manager, etwas weniger ausgereift |
| API | REST, Basis | REST + WebSocket, fortgeschritten |
| Workflow-Versionierung | Per Screenshot und Text | JSON oder PNG-Metadaten |
| Support FLUX, SD3 | Mit Verzögerung, über Forge | Nativ, ab Tag eins |
| Updates | Selten | Häufig, gelegentlich brechend |
| Teamarbeit | Schwierig | JSON-Austausch löst es |
| Geeignet für Einzelkämpfer | Ja | Ja, nach Einarbeitung |
| Geeignet für Studio | Bedingt | Ja, die beste Wahl |
Wann Automatic1111 wählen
Einzel-Retuschierer, der schlüsselfertige Aufträge annimmt und jedes Frame individuell bearbeitet. Volumen klein, keine Reproduzierbarkeitsanforderungen, ControlNet und Inpaint werden situativ eingesetzt. A1111 spart hier in der Einarbeitungsphase Zeit und steht der Arbeit nicht im Weg.
Fotograf, der KI zum ersten Mal ausprobiert. Wer gerade erst von Stable Diffusion gehört hat und wissen möchte, ob er es überhaupt braucht, sollte A1111 installieren. Nach einer Stunde hat man ein funktionierendes Werkzeug. Wenn es nicht gefällt, lässt man es ohne Bedauern fallen.
Dozent und Blogger. Wenn man ein Lehrvideo aufnimmt, ist es einfacher, die Tabs von Automatic zu erklären als einen Graphen. Das Publikum wiederholt die Schritte schneller.
Wer wirklich die Train-Funktion braucht. Innerhalb von A1111 lassen sich Embeddings, Hypernetworks und einfache LoRAs bequemer trainieren. ComfyUI verlangt externe Werkzeuge wie kohya-ss.
Wann ComfyUI wählen
Produkt- oder Schmuckstudio mit Durchsatz. Wer 200 bis 500 Frames am Tag fährt, bei dem entsprechen 30% Tempogewinn zwei bis drei Arbeitsstunden. Über einen Monat summiert sich das so, dass sich ein Kurs von selbst amortisiert.
Marktplatzverkäufer mit regelmäßigen Produktshootings. Einmal einen Referenz-Workflow für die Kategorie gebaut, läuft jede neue Warencharge ohne manuelle Nachjustage hindurch. Reproduzierbarkeit ist Geld: Eine Person setzt den Graphen auf, die anderen vervielfältigen ihn.
Entwickler von KI-Pipelines. Wer einen Service, einen Bot oder ein internes Tool für eine Agentur baut, dem bietet ComfyUI den De-facto-Standard für das Backend. API, Queue, Headless, Support neuer Modelle, alles vorhanden.
Retuschierer, der KI als langfristige Fähigkeit plant. In ein bis zwei Jahren wird das Lesen eines Workflows aus PNG-Metadaten ein ebenso grundlegendes Können sein wie das Lesen von PSD-Ebenen. Wer früher anfängt, bekommt früher einen Vorsprung.
Kann man später wechseln
Man kann und sollte. Wissen lässt sich zwischen den beiden Oberflächen nahezu vollständig übertragen. Prompt-Engineering, Verständnis von Samplern, CFG, Steps, Denoising-Strength, ControlNet-Conditioning, LoRA-Strength: das alles sind dieselben Konzepte, nur in unterschiedliche UI verpackt.
Der typische Profi-Weg sieht so aus. In den ersten zwei bis drei Monaten lebt der Mensch in Automatic1111, versteht, was Diffusion ist, baut eine Basis aus Prompts und LoRAs auf. Dann probiert er für ein konkretes Projekt (Batch-Aufgabe, Sonder-Pipeline, Integration in die Produktion) ComfyUI aus und stellt fest, dass sich der Graph schneller baut als gedacht. Danach wird Comfy zum Hauptwerkzeug, während A1111 für einmalige Experimente bleibt und für Fälle, in denen es bequem ist, Regler in einer UI zu schieben.
Der umgekehrte Weg kommt ebenfalls vor, aber seltener. Wer mit ComfyUI angefangen hat und zu Automatic gewechselt ist, tut dies meist wegen einer konkreten Erweiterung oder weil er KI unterrichtet und den Stoff für das Publikum vereinfachen möchte.
Was Profis im kommerziellen Bereich nutzen
In kommerzieller Retusche und KI-Postproduktion sieht die Aufstellung etwa so aus.
Produkt- und Schmuckstudios. ComfyUI als Hauptwerkzeug, A1111 als Backup. Referenz-Workflows pro Kategorie (Ringe, Ohrringe, Uhren, Verpackungen, Schuhe, Kleidung an der Schaufensterpuppe) werden als JSON gespeichert und im Fließband angewandt.
Marktplatzfotografen. Hier teilt sich das Feld nach Volumen. Bis 50 Artikel im Monat kann man in Automatic leben. Ab 50 wechseln die Leute zu ComfyUI wegen Tempo und Reproduzierbarkeit.
Agenturen, die KI-Visuals für Marken produzieren. ComfyUI nahezu zu 100%, weil der Kunde oft "macht uns noch fünf Varianten mit anderem Licht" verlangt, und ohne reproduzierbaren Graphen wird das zur Qual.
Einzel-Retuschierer, die mit Fotografen im Outsourcing arbeiten. Häufiger A1111, weil die Aufgaben einmalig sind und keine Integration in eine Pipeline nötig ist.
Bildungsprogramme für KI-Retusche. Trend des letzten Jahres: Kurse beginnen mit Automatic als Startwerkzeug und führen die Lernenden gegen Ende des Programms zu ComfyUI. Das ist sinnvoll, weil das eine das andere ergänzt.
Fazit: Was 2026 wählen
Kurz: Beginnen Sie mit dem, was näher an Ihrem aktuellen Niveau liegt, und scheuen Sie sich nicht, Ihre Wahl in drei Monaten zu ändern.
Für einen Einsteiger ohne KI-Background ist Automatic1111 besser. Weniger Frust, schnelleres erstes Ergebnis, sanftere Lernkurve. Wenn Sie an die Decke stoßen (und das werden Sie, falls Sie kommerziell arbeiten), dauert der Umstieg auf ComfyUI eine Woche.
Für einen Profi mit Auftragsstrom sofort ComfyUI. Die Zeit, die Sie ins Erlernen der Knoten stecken, hat sich nach der ersten Charge von 200 Frames amortisiert. Workflow-Reproduzierbarkeit ist Ihr Hauptkapital, das schwer zu überschätzen ist.
Eine Zwischenvariante: Sie installieren beide Oberflächen parallel. Sie kommen sich nicht ins Gehege, teilen sich dieselben Modelldateien über Symlinks, und Sie können dieselbe LoRA in beiden fahren. Das ist gängige Praxis und zugleich die beste Methode herauszufinden, welches Werkzeug wirklich Ihres ist.
Und das Wichtigste: Die Oberfläche ist keine Magie. Die Magie liegt im Verständnis von Modellen, Prompts, ControlNet, LoRA-Stacks, der Farbkorrektur nach der Generierung, in der Fähigkeit, eine Pipeline für ein konkretes Produkt zu bauen. Ohne dieses Wissen liefert A1111 hübschen Müll und ComfyUI liefert hübschen Müll schneller.
Wo man Produkt-orientierte KI-Retusche lernt
Wer Marktplatzfotograf oder Retuschierer ist und KI in Aufnahmen von Schmuck, Uhren, Verpackungen und Sachfotografie einbringen will, sollte sich den Kurs AI PRO auf gdefoto.com ansehen.
Das Programm ist um Automatic1111 als Startwerkzeug aufgebaut, weil man damit am schnellsten die Basis durchdringt: Prompts für Sachaufnahmen, ControlNet zur Wahrung der Produktform, LoRAs für konkrete Warenkategorien, Inpaint von Hintergrundelementen und Schatten. Anschließend zeigen wir, wie der Umzug auf ComfyUI gelingt, wenn der Auftragsfluss wächst, und wie man den Workflow für das Team konserviert.
Anders als allgemeine KI-Kurse vom Typ "wir bringen Ihnen das Generieren von Bildern bei" ist AI PRO auf kommerzielle Aufnahmen zugeschnitten: Schmuck mit korrekten Lichtreflexen, identische Blickwinkel in der Serie, Erhalt der Metall- und Steintextur, marktplatztauglicher Hintergrund ohne Artefakte. Das ist kein "kreatives SD für Kunst", sondern ein Werkzeug für den Katalog.
Details, Programm und Anmeldung für den nächsten Durchgang auf der Kursseite: gdefoto.com/lk/ai-pro/buy/.