KI-Foto-Report 2025 (Teil 2): Bildgeneratoren und ihre Folgen

Lesezeit 13 Minute(n)

KI-Foto-Report 2025 (Teil 2): Bildgeneratoren und ihre Folgen

Im zweiten Teil meines KI-Foto-Reports 2025 geht es um die bahnbrechende Technologie von Bildgeneratoren und ihre Folgen. Wie beeinflussen sie unsere Wahrnehmung, die Arbeit von Fotografen und unsere Verantwortung im Umgang mit Bildern? Die Grenzen zwischen Realität und Fiktion verschwimmen – doch wie erkennen wir, was echt ist? Erfahre, warum Authentizität und Medienkompetenz in einer Welt voller KI-Bilder wichtiger denn je sind.

Im zweiten Teil meines KI-Foto-Reports 2025 dreht es sich im Kern um die Technologie von Bildgeneratoren. Ich versuche, Fragen zu beantworten und zu erzeugen. Inwiefern verändern Bildgeneratoren unsere Wahrnehmung von Bildern? Welchen Einfluss haben Sie auf die Arbeit von Fotografen und wie wichtig die Bedeutung der Verantwortung in dem Zusammenhang ist. 

Die Fotografie als die eine und echte Wahrheit

Einen erlebten Moment einzufrieren und festzuhalten, sei es ein geliebter Mensch, ein flüchtiger Augenblick oder ein besonderes Ereignis, ist eine tief verwurzelte menschliche Sehnsucht. Menschen neigen dazu, an Dingen und Gegebenheiten festzuhalten, dieser innere Wunsch hat in der Gesellschaft und Forschung einen großen Antrieb geschaffen. Ein Antrieb, der es den Pionieren der Fotografie ermöglichte, zu entdecken, wie man einen Moment für die Ewigkeit festhalten kann. 

Der entscheidende Schritt in dieser Entwicklung wurde 1839 durch die Daguerreotypie von Louis Daguerre gelegt. Dieses Verfahren, bei dem eine versilberte Kupferplatte verwendet wird, die mit einer lichtempfindlichen Schicht aus Silberiodid beschichtet ist, revolutionierte die Art und Weise, wie Bilder erstellt wurden. Eine chemische Reaktion mit Licht, die in weiteren Schritten fixiert wird, führt dazu, dass das erste „gespeicherte“ seitenverkehrte Positiv entsteht. Dies war ein bahnbrechender Moment in der Geschichte der Bildproduktion.

Hätte Daguerre und alle weiteren großen Pioniere auf dem Weg in die digitale Fotografie geahnt, was mehr als 200 Jahre später möglich ist, wäre ihnen wahrscheinlich sprichwörtlich der Augapfel ausgefallen. Die Vorstellung, dass wir heute mithilfe von Computer und künstlicher Intelligenz Bilder generieren können, die einst nur in unserer Vorstellung existierten, ist schlichtweg verblüffend.

stan87. A dark baroque inspired oil painting depicting Louis d7b72088 498d 455c bf35 565620293183 3)
stan87. A dark baroque inspired oil painting depicting Louis d7b72088 498d 455c bf35 565620293183 3)

Ein Bild, wie Daguerre einen Augapfel ausfällt – Ein Bild, das wir heute wohl genau so generieren könnten, ist das Ergebnis eines komplexen Prozesses, der weit über die traditionellen Methoden hinausgeht. Es ist verrückt, dass gesprochenes Wort und Gedanken nun in faszinierende Bildwelten transformiert werden. Die klassischen Elemente der Fotografie – Kameras, Licht, Entwicklerlösungen und lange chemische Reaktionen – haben mit der Bildgenerierung keine Gemeinsamkeiten mehr aufzuweisen.

Es hat sich sozusagen eine visuelle Parallelwelt entwickelt, in der Kreativität und Technologie auf neue Weise miteinander verschmelzen.

Die Herausforderung dabei ist:
Wie unterscheiden wir, was echt ist und was nicht? War die Fotografie überhaupt das Abbild eines echten Moments, oder hat sie immer schon eine subjektive Realität geschaffen? Diese Fragen sollten zur zentralen Herausforderung in unserer Gesellschaft werden. Welche Narrative wir erzählen, wird maßgeblich von Bildern begleitet – damals und heute. Fotografie und Malerei waren bis heute die wichtigsten Medien zur Erzeugung glaubhafter Informationen. Sei es in der Reportagefotografie, Sozialdokumentation, Familien- und Alltagsfotografie oder Porträtfotografie. Wir vertrauen darauf, dass das, was wir sehen, echt ist.

Ein Vertrauen, das im Jahr 2025 endgültig zerstört ist, die eine und echte Wahrheit gibt es nicht mehr! Wir stehen vor der Herausforderung, kritisch zu hinterfragen, was wir sehen und konsumieren. In diesem neuen Zeitalter der Bildproduktion ist es entscheidend, Medienkompetenz zu entwickeln und ein Bewusstsein für die Machenschaften hinter den Bildern zu schaffen. Nur so können wir uns in dieser komplexen visuellen Landschaft zurechtfinden und die Bedeutung von Bildern in unserem Leben neu definieren.

Massenrauschen: KI-Bildgeneratoren und wie sie funktionieren

Künstliche Intelligenz ist ein Teilbereich der Informatik und ist schon deutlich älter, als die meisten von uns denken. Schon 1956 gab es ein erstes Treffen renommierter Wissenschaftler, welche den Begriff „Künstliche Intelligenz“ (KI) geprägt haben. Im Übrigen ist der englische Begriff „Artificial Intelligence“ (AI) und meint das Gleiche.

Die heute bekannte Dartmouth Summer Research Project on Artificial Intelligence Konferenz war also der erste dokumentierte Konsens und Grundstein vieler weiterer Jahrzehnte an Entwicklung und Forschung. 

Bildgeneratoren bestehen dabei aus mehreren, ineinandergreifenden Technologien der Künstlichen Intelligenz. Damit ein Text in ein Bild generiert werden kann, sind 2025 eine Kombination aus Deep Learning (Tiefe neuronale Netze im Bereich des Maschinen-Lernens) und Sprachmodelle (LLMs, als Teil des Natural Language Processing) notwendig. 

Moderne Bildgeneratoren kombinieren oft verschiedene dieser Verfahren, um möglichst realistische und vielfältige Bilder zu erzeugen. Ein typischer Aufbau besteht aus einem Transformer, der die Bedeutung des Prompts erfasst, CLIP, das Text- und Bildvektoren in einem gemeinsamen Raum repräsentiert, und einem Diffusionsmodell, das aus dem Endvektor ein Bild erzeugt. 

Hier ein Schaubild, das den Prozess leichter verständlich macht:

image generator vertical
KI-Foto-Report 2025 (Teil 2): Bildgeneratoren und ihre Folgen 14

1. Prompt (Texteingabe)

Der Prompt ist die textuelle Beschreibung des gewünschten Bildes. Diese Eingabe ist entscheidend für das Endergebnis und sollte möglichst präzise und detailliert sein. Je klarer und spezifischer die Beschreibung, desto besser kann das System die gewünschten Elemente und den Stil umsetzen. Es gibt hierfür verschiedenste Konzepte, wichtig ist, dass du verstehst, dass ein Bildgenerator nicht weiß, wie ein bspw. Kirschbaum aussieht, sondern anhand großer Datenmengen Eigenschaften verknüpft. Möchtest du einen guten Prompt erstellen, sind fotografische Konzepte und Techniken (Stil, Perspektiven, Farben, Brennweiten, Gestaltungsregeln etc.) wichtig für die Richtung (Siehe Punkt „CLIP“).

Beispiel:
photo, half-body shot, a portrait of a man. the man's gaze goes out of the picture to the right, he stands facing the camera, the man stands in a futuristic scene, subtle colors, soft warm light hits his body sideways from the direction he is looking. editorial look

Das ist ein konkreter Prompt mit viel Kontext, ich gehe weiter unten erneut im Detail darauf ein.

stan87. photo half body shot a portrait of a man. the mans ga 24ae3f89 26c0 435b b861 d673d9b2ff23 3
KI-Foto-Report 2025 (Teil 2): Bildgeneratoren und ihre Folgen 15

2. Transformer (Textverständnis)

Der Transformer ist ein neuronales Netzwerk, das auf Sprachverständnis spezialisiert ist. Seine Hauptaufgaben sind:

  • Analyse der Bedeutung des eingegebenen Texts
  • Erkennung von Schlüsselkonzepten und deren Beziehungen
  • Umwandlung der textuellen Beschreibung in eine maschinenverständliche Form
  • Berücksichtigung des Kontexts und der Abhängigkeiten zwischen verschiedenen Begriffen

OpenAI’s GPT ist das wohl bekannteste Transformermodell, es gibt allerdings viele weitere…

CLIP (Text-Bild-Vektorraum)

Stell dir CLIP (Contrastive Language-Image Pre-training) wie einen persönlichen Bibliothekar vor, der dir hilft, deine Textideen in Bilder zu übersetzen.

  • In seiner Bibliothek findest du zwei Arten von Büchern: Bildbände und Textbücher
  • Dein Bibliothekar hat Millionen von Bilderbüchern mit ihren Beschreibungen studiert
  • Wenn du ihm einen Text gibst (deinen Prompt), weiß er sofort, welche Bilder dazu passen
  • Er kann dir auch zu jedem Bild die passenden Beschreibungen nennen

So versteht CLIP deine Ideen

Wenn du beispielsweise „Sonnenuntergang“ eingibst, denkt CLIP nicht nur an eine Sonne, sondern an ein ganzes Netzwerk von Eigenschaften:

  • Welche Farben du erwarten kannst (Orange, Rot, Gold)
  • Wie das Licht aussehen sollte
  • Was typischerweise dazugehört (Wolken, Horizont, Silhouetten)
  • Welche Stimmung entstehen soll

Unser oben erwähntes Prompt-Beispiel im Detail

4. Diffusionsmodell (Bilderzeugung)

Ein Transformermodell in einem Bildgenerator (Diffusionsmodell) arbeitet wie eine Taschenlampe in einem dunklen Raum, der das Rauschen darstellt. Das Modell entfernt schrittweise dieses Rauschen, indem es gezielt Muster beleuchtet, die durch Trainingsdaten vorgegeben sind, wie zum Beispiel Millionenbilder von Katzen. Deine Text-Eingabe beeinflusst, welche Bereiche in diesem Raum ausgewählt werden. Durch dieses schrittweise Entfernen des Rauschens erzeugt das Modell ein neues Bild (technisch gesehen nähert es sich an, aufgrund statistischer Verteilungen), indem es die relevanten Muster hervorhebt.

Wichtig zu verstehen: Dieser Raum mit Milliarden von Datenpunkten unterliegt allerdings einer wichtigen Grundlage: Es können keine neuen Informationen hinzugefügt werden, die nicht bereits im Raum enthalten sind. Genau dieser Aspekt ist die Gretchenfrage: Wem gehören generierte Bilddaten?

5. Die fertige Pixel-Kombination

Am Ende stehen die komponierten Pixel, die das Bild ergeben. Ich formuliere das bewusst so, da das Bild, das du siehst, nicht in der Realität existiert. Keine Photonen haben dafür gesorgt, dass es festgehalten wurde.

Es ist also nicht Fotografie, sondern ein künstlicher, erzeugter Pixelhaufen.

a photo of a pixel art piece the pixel art piece h z0 7FG0HQk2cAMTUGfHCEA eO4lzDOKS OgM4cGtQ13ww
Generiert in Ideogram

Tools für das generative Erstellen von Bildern

Folgende Generatoren habe ich seither am häufigsten verwendet. Das ist allerdings nur eine Momentaufnahme, die Entwicklungen sind rasant und können schon in wenigen Wochen gänzlich anders sein.

Flux.1 auf Freepik

Das erste KI-Tool, das mich seit 2024 wirklich begeistert und meine Arbeit als Fotograf verändert hat, ist der Bildgenerator von Freepik, Pikaso. Pikaso nutzt verschiedene Sprachmodelle wie Flux und Mystique, die fotorealistische Bildgenerierungen auf einem beeindruckenden Niveau ermöglichen. Freepik bietet zudem eine Vielzahl weiterer Modelle, mit denen unterschiedliche Stile imitiert werden können. Die Modelle variieren hauptsächlich in ihrer Geschwindigkeit und der Bildqualität.

Für mich als Fotograf sind die Flux-Modelle besonders interessant, da sie realistische Aufnahmen liefern, die ich in vielen Projekten einsetzen kann. Sei es im Webdesign, für Moodboards oder um Szenen zu visualisieren, die ich im Kopf habe, aber nicht in der Realität umsetzen kann. Der Detailgrad und der Realismus, den diese KI-Modelle erreichen, sind beeindruckend. Man muss sich bewusst machen, dass die aktuell genutzten KI-Tools nur den Anfang darstellen. Die Entwicklung schreitet in einer rasanten Geschwindigkeit voran und wird weiterhin exponentiell wachsen. Es ist faszinierend zu überlegen, welche Fortschritte in nur einem Jahr möglich sein werden.

Des Weiteren bietet Freepik einen integrierten Upscaling-Generator, der Bilder hochrechnen kann. Upscaling bedeutet nichts weiter, als Bilder in ihrer Auflösung zu verbessern, und ist gerade im Kontext von Bildgenerierungen oft sehr wichtig. Ich nutze es aber auch gern, um Bilder hochzurechnen, die nicht aus der KI stammen, sondern die ich selbst fotografiert habe. Das erlaubt mir, die Möglichkeiten auszuloten und gelegentlich auch Auflösungsproblematiken von Kameras zu umgehen. Die Qualität des Upscalings ist dabei beeindruckend, allerdings neigt die KI dazu, Elemente neu zu interpretieren oder zu ersetzen, anstatt die Pixel einfach zu vergrößern. Dies kann manchmal störend sein, führt aber insgesamt zu sehr guten Ergebnissen.

Midjourney

Kommen wir nun zum nächsten Punkt: MidJourney. MidJourney ist sicherlich der bekannteste Bildgenerator und gehört auch im Jahr 2025 zu den Besten. Die Plattform hat eine bemerkenswerte Transformation durchlaufen, indem sie das Bildgenerator-Modell aus dem Discord-Kontext gelöst und auf eine benutzerfreundliche Web-Oberfläche übertragen hat. Dies ermöglicht es nun, Bilder direkt und komfortabel im Webbrowser zu erzeugen. Für mich persönlich ist das ein entscheidender Schritt, denn die Bedienung über Discord war immer etwas kompliziert, und ich denke, für viele war es eine Hürde zu viel.

MidJourney entwickelt sich ständig weiter, insbesondere in Bezug auf fotorealistische Bildgenerierungen. Es ist beeindruckend zu sehen, wie sich die Qualität stetig verbessert und wie MidJourney seine Vorreiterrolle in der KI-Bildgenerierungswelt behauptet. Diese kontinuierliche Weiterentwicklung ist ein wichtiger Faktor, der die Branche weiter vorantreibt und MidJourney zu einem unverzichtbaren Tool für kreative Projekte macht.

Neu in Midjourney ist der Editor-Modus, der vollkommen neue Verwendungen ermöglicht. Ganze Bildszenen können via Prompt verändert werden, und du kannst jetzt auch eigene Fotos manipulieren. Das ist der logische nächste Schritt und wird schon in Kürze der Standard sein, da bin ich mir sicher.

Preis-Leistungs-Vergleich: Pikaso (Freepik) vs. MidJourney – Welches Modell bietet mehr?

Natürlich sind alle Bildgenerierungstools im Grunde erst einmal kostenlos zugänglich, bieten aber sehr schnell Einschränkungen in Bezug auf ihre Funktionen und die Anzahl der generierten Bilder. Ich kann dir deshalb nur empfehlen, ein Abo abzuschließen, um das volle Potenzial dieser Tools auszuschöpfen.

Der Hauptunterschied zwischen MidJourney und Pikaso von Freepik liegt im Preismodell. Während MidJourney ein Abo-Modell verwendet, arbeitet Freepik auf Basis von Credits. Bei Freepik erhältst du zwar schneller und mehr Bilder, aber deine Credits werden auch relativ zügig aufgebraucht. Meiner Meinung nach reicht das kleinste Abo für 8 Euro hier nicht aus – es lohnt sich, direkt auf das mittlere Paket zu setzen, um mehr Flexibilität und Bilder zu erhalten.

MidJourney hingegen rechnet nach Sessions ab, und das kleine Paket hat mir bisher immer ausgereicht, es sei denn, du benötigst eine größere Menge an Bildern oder vor allem lizenzfreie Inhalte, die kommerziell nutzbar sind. Insgesamt bewegen sich die Preise bei beiden Tools zwischen 10 und 50 Euro, was ich für die gebotene Leistung absolut fair finde.

Fazit: Meine Favoriten unter den Bildgeneratoren 2025

Ein Fazit zu ziehen, fällt sicherlich nicht leicht, da auch im Jahr 2025 eine Vielzahl neuer Tools auf den Markt gekommen ist und es schwer ist, den Überblick zu behalten. Viele dieser Programme bieten innovative Funktionen, die den kreativen Prozess unterstützen, aber eine umfassende Betrachtung aller Optionen würde den Rahmen dieses Artikels sprengen.

Für mich haben sich MidJourney und Pikaso als die klaren Favoriten herauskristallisiert. Beide überzeugen nicht nur durch ihre Benutzerfreundlichkeit und ihre herausragenden Ergebnisse, sondern auch durch ihr Preis-Leistungs-Verhältnis. Diese Kombination macht sie zu den stärksten Werkzeugen, die ich in meinen Projekten einsetze.

Mein Tipp: Konzentriere dich auf ein bis zwei dieser Tools, um Kosten zu sparen und gleichzeitig den Überblick zu behalten. So kannst du das Beste aus den jeweiligen Programmen herausholen und dich auf das Wesentliche fokussieren, ohne in der Vielzahl der Möglichkeiten verloren zu gehen.

KI verändert unseren Blick auf die Fotografie

Stell dir vor, du betrachtest zwei Bilder: beide atmosphärische Porträts. Beide sehen professionell aus, transportieren Emotionen und erzählen Geschichten. Doch eines stammt von einem erfahrenen Fotografen, das andere wurde von einer KI generiert. Die Unterscheidung fällt zunehmend schwerer und wird mehr und mehr unmöglich, insbesondere für Laien – und genau das verändert unsere gesamte Wahrnehmung von Fotografie und Medienwelt.

Wie KI die fotografische Landschaft umgestaltet

Die Bildgenerierung durch KI revolutioniert nicht nur die Erstellung von Bildern, sondern auch unseren Umgang damit. Besonders in der kommerziellen Fotografie siehst du bereits massive Veränderungen: Produktbilder entstehen in Sekundenschnellen, Kampagnen werden mit KI-generierten Models geschossen, und die Nachbearbeitung übernimmt größtenteils die künstliche Intelligenz.

Was bedeutet das für dich als Fotograf oder Bildschaffenden?

  • Du kannst Arbeitsabläufe drastisch beschleunigen
  • Deine kreativen Möglichkeiten erweitern sich exponentiell
  • Die Grenze zwischen „echt“ und „generiert“ verschwimmt zusehends

Der menschliche Faktor wird wichtiger denn je

Gerade weil KI-Systeme immer besser werden, gewinnt der menschliche Aspekt der Fotografie an Bedeutung. Der renommierte Architekturfotograf Hans Georg Esch bringt es auf den Punkt: „Das ehrliche Bild wird enorm an Bedeutung gewinnen.“ Er spricht damit etwas Fundamentales an – die Authentizität deiner Arbeit wird zu deinem wichtigsten Unterscheidungsmerkmal.

„Das Ende der Authentizität wäre das Ende der Demokratie“

Was macht den Unterschied?

  • Dein individueller Blick auf die Welt
  • Die Emotionen, die du im direkten Kontakt mit Menschen einfängst
  • Die Geschichte hinter jedem Bild
  • Die nicht perfekte, aber dafür echte Momentaufnahme
authentisches foto
KI-Foto-Report 2025 (Teil 2): Bildgeneratoren und ihre Folgen 18

Die neue fotografische Realität

Die Grenzen zwischen traditioneller Fotografie und KI-generierter Bilderwelt verschwimmen zunehmend. Dabei kristallisieren sich zwei zentrale Entwicklungen heraus:

  1. Der Markt polarisiert sich:
    • Das Massensegment wird zunehmend von KI-Bildern dominiert
    • Hochwertige, authentische Fotografie entwickelt sich zum Premium-Produkt
    • Der Wert echter fotografischer Expertise steigt
  2. Neue Kompetenzen werden wichtig:
    • Du musst beide Welten verstehen: traditionelle Fotografie und KI-Tools
    • Deine Fähigkeit, echte Emotionen einzufangen, wird entscheidend
    • Die Geschichten hinter deinen Bildern gewinnen an Bedeutung
FELIX BARTH 56
KI-Foto-Report 2025 (Teil 2): Bildgeneratoren und ihre Folgen 19

Neue Geschäftsmodelle: Chancen statt Konkurrenz

Diese Perspektive auf „die neue fotografische Realität“ beschäftigt alle Fotografen umso mehr, die davon leben, genauer gesagt es beruflich ausüben. Deshalb habe ich mich gefragt, wie sieht die berufliche Zukunft in der Bildproduktion aus? Ist es das Ende der Fotografie? Im Gegenteil. Es entstehen neue, lukrative Geschäftsfelder an der Schnittstelle zwischen traditioneller Fotografie und KI-Technologie. Hier zeichnen sich drei vielversprechende Entwicklungen ab:

Fotografie Geschäftsmodelle im Zeitalter der KI
KI-Foto-Report 2025 (Teil 2): Bildgeneratoren und ihre Folgen 20

1. Hybride Bildproduktion

Stell dir vor, du fotografierst eine Produktserie. Statt jede Variation einzeln zu shooten, erstellst du einige Hauptaufnahmen und nutzt KI (wie den Midjourney Editor), um Farbvarianten oder kleine Produktanpassungen zu generieren. Das spart Zeit und Ressourcen, ohne die Qualität zu kompromittieren. Als Fotograf bist du hier der Experte für:

  • Die perfekte Basis-Aufnahme
  • Die richtige Kombination aus echten und generierten Bildern
  • Qualitätskontrolle und konsistente Bildsprache

2. „Verified Authentic“ als Premium-Segment

In einer Welt voller KI-generierter Bilder wird echte, authentische Fotografie zum Luxusgut. Fotografen können sich als Garanten für:

  • Nachweisbar echte Momente
  • Authentische Emotionen
  • Nachvollziehbare Bildgeschichten positionieren und dies als Premium-Service vermarkten
Celardor StefanFrankeFotografie A7405908
Celardor StefanFrankeFotografie A7405908

3. KI-Integration als Beratungsleistung

Dein Fachwissen ist wertvoll: Du verstehst sowohl die traditionelle Fotografie als auch die Möglichkeiten der KI. Daraus entstehen neue Dienstleistungen:

  • Beratung bei der Integration von KI-Tools in Fotoprojekte
  • Entwicklung hybrider Bildstrategien für Unternehmen
  • Schulungen für effektives Prompt-Engineering

Die Zukunft gehört den Fotografen, die diese Welten clever verbinden – nicht als Konkurrenz, sondern als ergänzende Werkzeuge in ihrem kreativen Portfolio.

Ein Blick in die Zukunft (Post-Fotografie)

Die Zukunft der Fotografie liegt nicht im Kampf gegen die KI, sondern in der intelligenten Symbiose. Als Fotograf der Zukunft wirst du beide Welten beherrschen müssen: Die technische Perfektion der KI und die emotionale Tiefe der traditionellen Fotografie. Besonders in Bereichen wie der Porträtfotografie, wo der menschliche Kontakt unersetzlich ist, wird sich der Wert echter fotografischer Expertise noch deutlicher zeigen.

Fazit

Die KI-Revolution in der Bilderwelt stellt dich vor neue Herausforderungen, eröffnet aber auch spannende Möglichkeiten. Der Schlüssel zum Erfolg liegt darin, das Beste aus beiden Welten zu verbinden: Die Effizienz und Präzision der KI mit der Authentizität und emotionalen Tiefe deiner persönlichen fotografischen Vision. Die Zukunft gehört denen, die diese Balance meistern.

Dieser Artikel ist Teil der Serie „KI Foto-Report 2025“. Hier geht es zu Teil 1

Interessiert?

Picture of Stefan Franke

Stefan Franke

Fotograf & Marketer

News

Erhalte monatlich spannende Insights zu Fotografie, KI und allem, was mich bewegt. Kostenlos und garantiert ohne Spam!
Weitere Blog Beiträge
cropped stefan franke logo black retina
KI-Foto-Report 2025 (Teil 2): Bildgeneratoren und ihre Folgen