Kaum habe ich meinen letzten Artikel zum Thema „Mein erstes Jahr mit KI in der Fotografie“ veröffentlicht, kommen die Entwickler von Midjourney mit der neuesten Version 6 (Alpha) um die Ecke und überraschen in vielerlei Hinsicht erneut.
Ich habe direkt mal einige Sachen ausprobiert und bin überrascht, über die Ergebnis. Einfach wirklich aufregend, was AI alles möglich macht. Es handelt sich aber um die Alpha Version, hier wird es sicher in den nächsten Tagen und Wochen noch Veränderungen/Verbesserungen geben.
Hier kurz, was verändert wurde:
Midjourney V6 (Alpha) – Verbesserte Funktionalitäten
Eines der hervorstechendsten Merkmale von Midjourney V6 ist die deutlich genauere Prompt-Gestaltung. Dies bedeutet, dass die KI jetzt längere und komplexere Anweisungen besser versteht und umsetzen kann. Zusätzlich zu dieser verbesserten Kohärenz (also die Steigerung der Fähigkeit der KI, logische, zusammenhängende und ästhetisch stimmige Bilder zu generieren, die genau den Angaben des Prompts entsprechen. Das heißt, die KI ist besser darin, die verschiedenen Elemente eines Prompts zu einem sinnvollen Ganzen zu verknüpfen). Richtig cool ist die Fähigkeit, Text zu generieren, was eine weitere Dimension der Kreativität eröffnet.
photography, big cinema sign with "V6" on it, neon lights, wide angle shot, colorfull, at night, 25mm, f.4, --ar 3:2 --v 6.0
Neue Vergrößerer und Bildverbesserung
Ein weiterer wichtiger Fortschritt sind die verbesserten Vergrößerer, die in zwei Modi verfügbar sind: ’subtle‘ und ‚creative‘. Diese erhöhen die Auflösung der Bilder um das Zweifache und ermöglichen so eine noch detailliertere Bildgestaltung.
Ich finde, hier Unterschied zwischen den beiden ist gar nicht so krass, wie der Name es vermuten ließe. Allerdings sind die Details schon deutlich verbessert und erhöht.
cinematic photography, a woman in a desert, river going through, sony a7iv, 24mm, golden hour, --ar 3:2 --style raw --v 6.0
Upscaling (Subtle)
Upscaling (Creative)
Midjourney V6 (Alpha) – Features bei Launch
Zum Start unterstützt V6 eine Vielzahl von Argumenten und Funktionen, darunter –ar, –chaos, –weird, –tile, –stylize, und –style raw.
Diese Features bieten dir eine breite Palette an Möglichkeiten, deine Kreativität auszudrücken und Ergebnisse anzupassen.
Kommende Funktionen
In den kommenden Monaten werden weitere spannende Funktionen wie Pan, Zoom, Vary (region), /tune und eine neue Version von /describe erwartet. Diese zukünftigen Updates versprechen, das Potenzial von V6 weiter zu erweitern.
Stil und Prompting für V6 – endlich keine überflüssigen Begriffe mehr
Ein wichtiger Aspekt von V6 ist, dass das Prompting sich deutlich von V5 unterscheidet. Die KI ist viel sensibler für die eingegebenen Prompts und versteht viel besser natürliche Sprache, weshalb klare und präzise Anweisungen wichtig sind. Für realistischere und weniger subjektive Ergebnisse empfehle ich dir –style raw zu verwenden. Es werden auch keine ungenauen Begriffe wie „4K“ oder „unsplash“ mehr benötigt. Fand ich ohnehin immer ziemlich blöd.
portrait photography, woman with freckles in a bar, closeup, sunrise, hasselblad x1d, 50mm --ar 3:2 --style raw --v 6.0
Ein praktisches Beispiel mit Midjourney V6 Alpha im Webdesign
Da ich nicht nur Fotograf bin, sondern auch als Webdesigner aktiv bin, ist hier regelmäßig das Problem gutes und vor allem passendes Bildmaterial zu bekommen. Für große Fotoshootings ist meist das Budget nicht vorhanden, hier ist AI ein Paradebeispiel dafür, wie es den Arbeitsablauf von Designern stark verkürzt, ohne beim Ergebnis einzusparen.
Bei Produktseiten oder abstrakten Projekten war Midjourney bisher schon eine gute Hilfe. Mit der V6 und der starken Verbesserung in puncto „realistischer Darstellung von Fotos“ ist hier erneut ein großer Sprung gelungen.
Ich entwickle für einen Kunden einen Webauftritt, dabei geht es um „Coaching für Gewaltprävention“ geht. Ein Thema, was schwierig zu bebildern ist. Im „Hero-Bereich“ (das Erste, was du auf einer Webseite siehst) sollen drei Bilder den Prozess eins Coachings illustrieren. Wie das mit Midjourney V6 aussehen kann, ist beeindruckend. Insbesondere die Möglichkeit, Texte in die Bilder zu setzen, ist einfach nur bemerkenswert. Die Bilder wirken verdammt realistisch und ich bin überzeugt, solche Ergebnisse können (mit dem entsprechenden AI-Hinweis) verwendet werden. Eine Webseite erhält so in der Entwicklungsphase bereits einen sehr hohen Authentizität-Grad. Gerade am Anfang, wo echte Bilder bisher nicht vorliegen, sehe ich hier eine tolle Möglichkeit, AI in der Praxis zu verwenden.
editorial photography, five people are sitting together a bright room, one male person is captures from side profile and waring a blue shirt::2 , in the style of coaching, friendly, natural light, 35mm, f.5.6 --ar 3:2 --style raw --v 6.0
editorial photography, a man holds index cards in his hand with "Empathie" written on the front one, sitting on a wood desk, close up, hands on the left side in the frame, natural light, 50mm, --ar 3:2 --style raw --v 6.0
editorial photography, happy people sitting together, in german office::2 , empathy among each other, high angle view, natural light, sunrise::4 , 50mm, a7iv, f2.8 --ar 3:2 --style raw --v 6.0
Im Entwurfs-Design der Webseite sieht das dann so aus:
Ich bin beeindruckt, welche ungeheure Geschwindigkeit die Entwicklung der AI Modelle nimmt. Design wird fortan noch ein großes Stück dynamischer und komprimierter. Natürlich würde ich als Fotograf diese Bilder selbst machen und ich würde das auch jedem Unternehmen mittelfristig empfehlen – Stichwort: Warum Unternamensfotografie sich lohnt.
Danke fürs Reinschauen und Lesen 🙂