Stable Diffusion

🎨 Bildgenerierung Freemium

Ideal für: Open-Source-Bildgenerierung, lokale Inferenz, Video-KI, Audio-Generierung

⚖️ Vergleichen Stable Diffusion vs Midjourney

Über Stable Diffusion

Stable Diffusion ist eine Familie von Bildgenerierungsmodellen mit offenen Gewichten von Stability AI. Anders als bei geschlossenen Diensten kann man die Gewichte herunterladen und auf eigener Hardware ausführen — deshalb wurde das Modell zur Basis eines riesigen Ökosystems aus Finetunes, LoRAs, ControlNets und lokalen Oberflächen.

Die aktuelle Version ist Stable Diffusion 3.5 und kommt in drei Varianten: Large mit 8,1 Mrd. Parametern, Large Turbo für schnelle Generierung in wenigen Schritten und Medium mit 2,5 Mrd. für schwächere Rechner. Nach Installationszahlen ist SD 3.5 das am weitesten verbreitete offene Bildmodell, führt bei der Qualität unter den offenen Gewichten aber nicht mehr — diese Position hält seit 2026 FLUX.2 von Black Forest Labs.

Zu den Fähigkeiten gehören Text-zu-Bild-Generierung, gegenüber SDXL verbesserte Prompt-Treue und Typografie sowie ein breites Werkzeugset zur Steuerung und Bearbeitung dank der Community. Zur selben Reihe zählen SDXL Turbo, Stable Audio und Stable Fast 3D.

Beim Preis: Das Selbsthosten der offenen Gewichte ist unter der Stability AI Community License für Einzelpersonen und Organisationen mit unter 1 Mio. US-Dollar Jahresumsatz kostenlos. Darüber ist eine Enterprise License mit individuellem Preis erforderlich. Es gibt auch den gehosteten Weg über die Developer Platform API (platform.stability.ai) mit Abrechnung pro Credit: 1 Credit entspricht etwa 0,01 US-Dollar, Stable Image Ultra kostet rund 0,08 US-Dollar pro Bild und Stable Image Core etwa 0,03, Credit-Pakete liegen bei rund 10 US-Dollar pro 1.000 Credits. Von Dritten wird zudem eine Mitgliedschaft von etwa 20 US-Dollar im Monat erwähnt.

Die wichtigsten Grenzen sind praktischer Natur. Die größeren Modelle brauchen eine leistungsfähige GPU, gute Ergebnisse erfordern meist Prompt-Arbeit und Nachbearbeitung, und die umsatzgebundene Lizenz bedeutet, dass größere Firmen es nicht einfach als kostenlos behandeln können. In der Spitze liegt die Qualität nun hinter FLUX.2.

Stable Diffusion ist die richtige Wahl, wenn man lokale Kontrolle, eine offene Pipeline zum Finetunen und keine Kosten pro Bild bei kleinem Umfang möchte — und bereit ist, die absolute Spitzenqualität gegen Offenheit und Flexibilität einzutauschen.

Aktualisiert: 2026-07-09

Vorteile

Offene Gewichte, die man herunterladen und lokal mit voller Kontrolle über die Pipeline betreiben kann
Kostenloses Selbsthosten unter der Community License für Einzelpersonen und Organisationen unter 1 Mio. Umsatz
Drei SD-3.5-Varianten (Large, Large Turbo, Medium) passend zur eigenen Hardware
Riesiges Ökosystem aus Finetunes, LoRAs, ControlNets und lokalen Oberflächen
Optionale gehostete API mit transparentem Preis pro Bild, falls man nicht selbst hosten will

Nachteile

Nicht mehr Qualitätsführer unter den offenen Gewichten — FLUX.2 liegt seit 2026 vorn
Die größeren Modelle brauchen zu Hause eine leistungsstarke GPU
Kostenloses Selbsthosten ist umsatzgebunden; über 1 Mio. ist eine kostenpflichtige Enterprise License nötig
Gute Ergebnisse erfordern meist Prompt-Feinschliff und Nachbearbeitung
Die Kosten der gehosteten API summieren sich bei Volumen (etwa 0,08 pro Bild bei Ultra, 0,03 bei Core)

Besuchen Stable Diffusion →

Stable Diffusion wählen wenn…

Sie wollen ein Bildmodell lokal mit voller Kontrolle betreiben
Sie brauchen eine offene Basis zum Finetunen mit LoRAs oder ControlNets
Ihr Umsatz liegt unter 1 Mio. und Sie wollen keine Kosten pro Bild
Ihnen sind Offenheit und Flexibilität wichtiger als das absolute Qualitätsmaximum
Sie möchten die Option einer kostenpflichtigen gehosteten API ohne Anbieterbindung

Häufig gestellte Fragen

ComfyUI vs Automatic1111: Was soll ich wählen?

Für Einsteiger — Automatic1111: einfachere Oberfläche, mehr Tutorials, leichter zu verstehen. Für Fortgeschrittene — ComfyUI: mächtiger, schneller, flexibler für komplexe Workflows. Viele Power-User beginnen mit A1111 und wechseln zu ComfyUI.

Ist ComfyUI kostenlos?

Ja. Beide sind Open-Source und kostenlos. Sie benötigen eigene Hardware (GPU mit mindestens 6-8 GB VRAM empfohlen) oder Cloud-Dienste. Die einzigen Kosten sind Strom und ggf. Cloud-Computing.

Was ist ein Node-Graph in ComfyUI?

ComfyUI verwendet ein visuelles Node-basiertes System: Jeder Schritt der Bildgenerierung (Modell laden, Text encodieren, Sampling, Decoding) ist ein Node. Sie verbinden Nodes mit Kabeln um den Workflow zu definieren. Das gibt maximale Kontrolle über jeden Aspekt.

Kann ComfyUI Flux-Modelle nutzen?

Ja. ComfyUI hat exzellente Flux-Unterstützung und viele veröffentlichte Flux-Workflows. ComfyUI ist für Flux oft besser geeignet als Automatic1111 da es flexibler mit verschiedenen Modell-Architekturen umgeht.

Auch erwägen

ChatGPT Images 2.0

Image generation, character consistency, prompt accuracy

ComfyUI

open-source AI image generation, node workflows, local GPU, 4K video

FLUX

AI image generation, sub-second speed, text rendering, multi-reference

Nutzerbewertungen