Es gibt endlich wieder News von Stability AI, dem Unternehmen hinter Stable Diffusion. Seit heute ist das neue Modell „Stable Diffusion 3.5“ verfügbar.
Genauer gesagt gibt es hier gleich drei Modelle, die angebotenen werden.
- Das Stable Diffusion Large Modell mit 8 Milliarden Parameter und einer Auflösung von 1 Megapixel
- Eine definierter Version des Large Models (Stable Diffusion Turbo), welches hauptsächlich schnell sein soll
- Und ein Medium Modell, welches 2.5 Milliarden Parameter enthält und Bilder mit bis zu 2 Megapixel liefern soll
Stable Diffusion Modelle können lokal auf deinem System installiert werden und sind also OpenSource. Nebst vielen anderen und kostenpflichtigen Modellen wie zb. „Flux“ war und ist Stable Diffusion schon immer ein Pionier in der Demokratisierung von Bildgeneratoren.
Ich habe mit dem Large Modell auf replicate ein wenig experimentiert, insbesondere die Darstellung von Text und der Grad an Realismus hat mich interessiert.
Da ich vor ein paar Tagen den Klassiker Zurück in die Zukunft Teil 1 im Kino gesehen habe, war ich noch etwas angehaucht davon und habe mal eine weibliche Version von McFly vor einem DeLorean generieren lassen.
Hier ein paar Ergebnisse aus Stable Diffusion 3.5
Stable Diffusion 3.5 Prompt: full body shot of a girl, she is looking like a female version of marty mcfly, she has a glowing nine-panel sign in her hand on that reads “Stable Diffusion 3.5”, in the background is a delorean, #sunset light #photorealistic #photo #24mm
Die Parameter-Einstellungen über Replicate sind begrenzt, das ist wichtig zu wissen. Allerdings hat das Modell etwas Schwierigkeiten, die Schrift korrekt auf dem Schild darzustellen. Die Kohärenz zwischen Prompt und Ausgabe scheint mir nicht so hoch zu sein, wie bei den führenden Modellen wie Flux oder MidJourney. Auch ist der Text teilweise auf dem DeLorean vorn am Grill zu finden, dort müsste eigentlich das DMC Logo auftauchen.
Ein Vergleich des folgenden Prompts mit MidJourney sieht so aus:
Stable Diffusion 3.5 Prompt: full body shot of a girl, she is looking like a female version of marty mcfly, in the background is a delorean, sunset light, photorealistic, 24mm, f4
MidJourney 6.1 Prompt: full body shot of a girl, she is looking like a female version of marty mcfly, in the background is a delorean, sunset light, photorealistic, 24mm, f4 --ar 3:2 --style raw --v 6.1 --stylize 1000
Die Ergebnisse sind schon deutlich, während MidJourney etwas zu plastisch wirkt (war auch style 1000) sind die Ergebnisse vom SD 3.5 eher in Richtung „Analog“.
Ein paar Prompts, die ich probiert habe, in Stable Diffusion 3.5
Der Grad an Fotorealismus ist aber schon sehr hoch. Hier mal ein paar andere Beispiele dafür. Das Erste finde ich zb. besonders gut gelungen und wirkt sehr fotorealistisch.
SD 3.5 Prompt: a portrait of a man standing in front of a white wall. Natural sunlight is hidden his head. he is looking to the right, looking towards something beyond the frame
SD 3.5 Prompt: a men is walking down a street in the 1980, 35mm, analog film look, classic chrome
SD 3.5 Prompt: Portrait photo of a man in his mid 20s, he is sitting on a bench wearing blue jeans and a red plaid linen shirt, his gaze wanders into the distance, morning light, soft shadows
Die Interpretation des Prompts hat in diesem Versuch sehr gut funktioniert. Auch die Erfassung der natürlichen Beschreibung der Szene klappt hervorragend. Den Fotorealismus würde ich mit einer 8/10 bewerten.
Für das folgende Bild hab den original Prompt von Stable Diffusion und dem Titelbild zum neuen Modell leicht verändert. Hier hat mich die doch etwas zu freizügige Interpretation überrascht:
SD 3.5 Prompt: ~*~aesthetic~*~ #boho #fashion, full-body 30-something woman laying on beach sand, candid pose, overlay reads Stable Diffusion 3.5, cheerful cursive typography font
Ich vermute stark, in anderen Modellen wird Nacktheit deutlich stärker unterdrückt.
Vorerst bleiben Flux und MidJourney in meinen Augen die Vorreiter, insbesondere was die Ästhetik angeht. Ich werde mir Stable Diffusion 3.5 allerdings auch noch auf meinem lokalen System installieren und experimentieren.
Soweit ein erster Eindruck von mir.
Viele Grüße,
Stefan