Vor wenigen Tagen hat das Team um Sam Altman und OpenAI „Sora“ präsentiert, und ich war zunächst sehr skeptisch, als ich die ersten Zeilen darüber gelesen habe.
Text zu Video schien mir lange Zeit als „noch sehr weit weg“, die Tools und Videos, die ich bisher gesehen habe, waren alle eher zu belächeln. Der Status quo, den OpenAI und Sora jetzt gesetzt haben, hat aber nichts mehr mit dem zu tun, was ich davor gesehen habe.
Ich bin total begeistert von den technologischen Möglichkeiten, die sich in den vergangenen Jahren entwickelt haben. Als ein Kind der 90er habe ich die Verbreitung des Internets hautnah erlebt, die ersten Pentium-Rechner, die von Fuß bis Knie hoch waren, und natürlich die Welt der Spielekonsolen. Alles Dinge, die mich weit über meine Kindheit geprägt haben. KI und AI sind da der nächste logische Schritt, so fühlt es sich zumindest an.
Ich beschäftige mich seit Langem viel mit KI und AI in meinem Blog habe ich aber noch nie über Video-KI gesprochen. Zugegeben, ich fotografiere nach wie vor mehr, als dass ich filme. Was Sora aber so krass spannend macht, ist die Fähigkeit, verdammt realistisch wirkende kurze Clips zu produzieren. Die Vorstellung, dass Video-KI vor einem Jahr gefühlt bis jetzt nicht ernst zu nehmen war, macht das Ganze noch viel surrealer.
Technische Details zu Sora:
Ich habe ChatGPT gebeten, Sora so zu erklären, dass es auch ein 5-Jähriger versteht. Das ist die KI-Antwort: Stell dir vor, Sora ist wie ein sehr talentierter Künstler, der unglaubliche Bilder nur mit Worten als Anleitung malen kann. Wenn du Sora sagst, dass es ein Bild von einem Park malen soll, mit Kindern, die Fangen spielen, und einem Hund, der einem Ball hinterherjagt, dann kann Sora genau das tun. Es weiß, wie der Park aussehen soll, wo die Bäume und Bänke sind, wie Kinder beim Spielen aussehen, und sogar, wie der Hund aussieht, wenn er fröhlich dem Ball nachläuft.
Sora ist so klug, dass es versteht, wie Dinge in der echten Welt aussehen und sich bewegen. Also, wenn du sagst, der Hund soll springen, dann weiß Sora genau, wie es diesen Sprung zeichnen muss, sodass es aussieht, als würde der Hund wirklich in der Luft schweben. Es ist, als ob Sora eine magische Malerei erschafft, die genau das zeigt, was du dir vorstellst, mit allen kleinen Details, die das Bild lebendig machen.
Sora und der Status quo – aber wie lange?
Genau darum geht es mir im Kern: Die massive Geschwindigkeit der Weiterentwicklungen im Bereich der generativen KI bedrückt mich zurzeit mehr, als dass sie mich fasziniert. Es ist schwer zu begreifen, wie solch komplexe Szenen innerhalb von Sekunden durch ein wenig Text generiert werden können.
Der Status quo, die aktuellen Fähigkeiten der KI-Modelle, ist doch morgen schon wieder überholt; das ist das komische Gefühl im Bauch. Wie schnell AI und KI unsere Gesellschaft verändern, bringt große Schwierigkeiten mit sich. Ich bin sehr technikaffin und beobachte die Entwicklungen, aber selbst mir geht das nun schon zu schnell. Die meisten Menschen da draußen ahnen nicht einmal, was da schon jetzt möglich ist. Umso wichtiger ist es, darüber zu schreiben und zu reden – den Status quo nicht einfach hinzunehmen, sondern aufmerksam dabei zu bleiben. Um mehr zu verstehen und sich der Möglichkeiten, aber auch der Gefahren bewusst zu werden!
Die pure Faszination
Dennoch, in mir schlägt ein begeistertes Herz, die magische Faszination der virtuellen Welten zieht mich auf der anderen Seite magnetisch an. Ich kann es kaum abwarten, „Sora“ selbst auszuprobieren und meiner Kreativität neue Höhen zu verleihen. Falls du es bisher nicht gesehen hast, hier ist der LinkedIn-Post von OpenAI mit vielen Beispiel-Videos: