Google hat diese Woche einen echten Supersprint hingelegt, würde ich sagen, und neben Gemini 3 auch NanoBanana Pro, aka NanoBanana Version 2, veröffentlicht. Ich hatte es ja schon vor ein paar Wochen in meinem kurzen Artikel dazu erwähnt, welche tiefgreifenden Auswirkungen dieses neue Bildmodell für die kreative Landschaft haben wird. Die allerersten Eindrücke, die ich sammeln konnte, sind dabei a) weniger überraschend und b) nur die logische Konsequenz dessen, was sich schon vor einigen Wochen abgezeichnet hatte. Ich werde diesen Artikel sehr zeitnah mit ein paar Bildbeispielen und Tests erweitern.
Die neue „Denkkraft“ in der Bilderzeugung: Gemini 3 und NanoBanana Pro
NanoBanana Pro ist nun direkt an Gemini 3 gekoppelt, Googles leistungsstarkes Frontier-Sprachmodell, und profitiert somit von dessen voller Denkpower. Der Clou ist im Grunde ganz einfach und super spannend:
- Intelligente Iterationen: Wenn ein Prompt an das Bildmodell gesendet wird, durchläuft die Bilderstellung mehrere Iterationen.
- Korrektheitsprüfung: Das Modell überprüft das generierte Bild auf seine Korrektheit, denkt nach und passt es gegebenenfalls an.
- Lösung komplexer Prompts: Somit werden Bilder möglich, die vor wenigen Wochen noch schwierig umzusetzen waren. Zuvor hatte NanoBanana manchmal Probleme: Prompts richtig zu verstehen, Einzelheiten zu wurden missinterpretiert oder es ist einfach gar nichts passiert.
Verbesserte Flexibilität und Auflösung
Zwei weitere, extrem hilfreiche Verbesserungen sind dazugekommen, die uns Kreativen das Leben erleichtern:
- Aspect Ratio behoben: Die Aspect Ratio-Problematik wurde behoben. Nun können alle gängigen Formate konkret angesprochen werden, was eine große Hilfe für jeden Workflow ist.
- 4K-Upscale (Aussicht): Im AI Studio soll es die Möglichkeit geben, ein Upscale-Ergebnis von bis zu 4K einzustellen. Das ist für mich der logische und konsequente Schritt, um die Auflösungsproblematik zu beheben. Ich bin überzeugt, dass wir schon in naher Zukunft hochauflösende Bilder erstellen können, deren Detailtreue nicht mehr von Bildern zu unterscheiden ist, die mit einer klassischen Kamera aufgenommen wurden.
Die Geschwindigkeit des Wandels: Faszination und Herausforderung
Diese Entwicklungen sind für mich faszinierend, aber gleichzeitig auch erschreckend, weil sie einfach so schnell und überraschend kommen. Google hat keine große Ankündigung gemacht, sondern das Modell einfach veröffentlicht und somit von jetzt auf gleich eine ganze Branche wieder einmal in eine neue Richtung geschoben.
Ich bin gespannt, wie Firmen wie Adobe darauf reagieren werden, denn Adobe mit seiner Photoshop-Linie und seinen Bildbearbeitungsprogrammen wird ernsthafte Probleme bekommen. Ich selbst ertappe mich dabei, wie ich bei Bearbeitungsanfragen – gerade was das Thema Composing betrifft – eher einen Bildgenerator benutze, anstatt komplex in Photoshop zu arbeiten.
Erste Praxistests: Springende Katzen und Karotten
Da das Modell noch sehr frisch und erst seit wenigen Stunden verfügbar ist, habe ich aktuell keine großen Tests, die ich euch zeigen kann. Das werde ich aber nach und nach ausprobieren und hier im Blog veröffentlichen.
Mein allererster Test gestern war ein ganz simpler Prompt, in dem ich eine springende Katze mit einem roten Mantel angefragt habe. Was dabei herauskam, hat mich im ersten Moment schon überrascht. Beim genauen Hinsehen fällt auf, wie das Modell selbst die Bewegungsunschärfe der Katze erwischt hat.
Eine springende Katze wird in der Regel eine gewisse Bewegungsunschärfe erzeugen. Das Bild wirkt so besonders authentisch.
Noch schöner war zu sehen, wie ich den Prompt danach einfach verändert habe, indem ich gebeten habe, der Katze eine Möhre in den Mund zu stecken. Ich war überrascht, wie gut NanoBanana das verstanden und umgesetzt hat. Gleichzeitig habe ich das Bild in seiner Aspect Ratio von 16:9 auf 9:16 geändert, und das hat auf Anhieb geklappt. Also, der erste Eindruck ist wirklich großartig!


Die kritische Stimme: Fotografie vs. generative Bilderzeugung
An dieser Stelle muss ich aber auch wieder die kritischen Stimmen hervorheben. So faszinierend diese Entwicklung auch ist, ich bin selbst Fotograf und merke mehr und mehr, wie ein Stück weit die Arbeit zum einen wegrationalisiert wird und zum anderen aber wertloser erscheint.
Ich plädiere deshalb dafür, hier ganz klar zwischen Fotografie und generativer Bilderzeugung zu unterscheiden, denn das sind zwei völlig verschiedene Dinge. Echte Fotografie bleibt für mich die bewusste Entscheidung, einen Moment im Leben einzufangen und zu dokumentieren und mit Licht zu fotografieren. Also das Echte einzufangen.
Viele dieser echten, oft beiläufigen Momente sammle ich in meiner Kategorie Lichtnotizen.
Ich bin gespannt, wie die Entwicklungen weitergehen, und werde diesen Artikel sehr zeitnah mit ein paar Bildbeispielen und Tests erweitern.