«Sora» klingt harmlos, ist aber der aktuell fortschrittlichste Video-Generator. Er kann aus simplen Textanweisungen nahezu fotorealistische Videos von Menschen, Tieren oder Landschaften mit komplexen Kamerabewegungen erstellen.
Das sieht beispielsweise so aus:
Die veröffentlichten Beispielvideos wurden den Angaben zufolge komplett von künstlicher Intelligenz erstellt. Im oben stehenden Video mit der Frau lautete die Textanweisung demnach, sie solle eine Lederjacke und ein rotes Kleid tragen und selbstbewusst eine Strasse in Tokio entlanggehen. Die Strasse sei nass und reflektierend, was einen Spiegeleffekt der bunten Neonlichter erzeuge.
Entwickelt wurde das KI-Modell hinter Sora von OpenAI, dem von Microsoft mitfinanzierten Tech-Unternehmen, das den Chatbot ChatGPT und den KI-Bildgenerator DALL-E entwickelt hat. Letzteres ist ein Computerprogramm, das Bilder aus Textbeschreibungen aufgrund von maschinellem Lernen erstellt. Nun geht OpenAI mit KI-generierten Videos einen Schritt weiter.
This video was made with the not-yet-released Sora AI technology just announced from OpenAi. This changes everything. It's 27 seconds from a text prompt.
— Ben Nash (@bennash) February 15, 2024
Here is their prompt:
Prompt: A white and orange tabby cat is seen happily darting through a dense garden, as if chasing… pic.twitter.com/8XxxFqiywC
Sora kann auch bestehende Videos verändern oder aus Bildern kurze Clips generieren. All das ist nicht neu, aber auf einem zuvor nie gesehenen Niveau. Die meisten Menschen reagieren daher mit einer Mischung aus Faszination und Angst. Dies völlig zurecht. OpenAIs neuster Wurf ist beeindruckend, das Potenzial im Positiven wie negativen Sinn gewaltig.
Von Kritikern häufig geäusserte Befürchtungen sind vereinfachte Wahlmanipulation durch Deepfakes von Politikern, KI-generierte Rachepornos auf Knopfdruck und eine Flut an Urheberrechtsverletzungen. Kurz: Sora ist brandgefährlich. Denn die Geschichte lehrt uns, dass jede Technologie für Schlechtes missbraucht werden kann und wird.
OpenAI ist sich der Gefahren bewusst. Wasserzeichen sollen KI-Videos kenntlich machen. Rachepornos will das Unternehmen verhindern, indem Sora keine Aufforderungen akzeptiere, die extreme Gewalt, sexuelle Inhalte oder Ähnlichkeit zu echten Personen einfordern. Zudem erhält die Öffentlichkeit, abgesehen von handverlesenen Personen, bislang keinen Zugang. Expertinnen und Experten sollen zunächst mögliche Sicherheitsrisiken ausloten, bevor das Programm veröffentlicht wird.
Es ist also nur eine Frage der Zeit, bis Sora freigegeben wird. In absehbarer Zeit will OpenAI damit Geld verdienen. Auch dies ein verständliches Ansinnen, schliesslich dürften die allermeisten Kunden den KI-Generator redlich nutzen.
Um die Fähigkeiten von Sora zu vermitteln, hat OpenAI Dutzende Beispielvideos veröffentlicht. Ein Überblick.
Browsing Sora's AI model examples is mindblowing. The speed this is coming is crazy...
— PedroPCMR (@PedroPCMR) February 16, 2024
"A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors." pic.twitter.com/4euRvqGoKm
Die Qualität der KI-Videos bringt auch bekannte YouTuber ins Grübeln. Als Reaktion schrieb etwa MrBeast, der erfolgreichste YouTuber der Welt, der für aufwendige Videos bekannt ist, an OpenAI-CEO Sam Altman gerichtet: «Sam, mach mich bitte nicht obdachlos.» Altman antworte: «Kann dir ein Video erstellen, was möchtest du?»
will generate you a video, what would you like?
— Sam Altman (@sama) February 15, 2024
— Sam Altman (@sama) February 15, 2024
Sora wird mit diesen 60-Sekunden-Clips in den nächsten Monaten nicht die Filmbranche umkrempeln, aber Video-Plattformen wie YouTube und TikTok könnten sich gehörig verändern. Die KI dürfte es sehr vielen Menschen ermöglichen, hochwertig aussehende Inhalte für soziale Plattformen zu produzieren.
Technische Massnahmen sollen dabei verhindern, dass User zum Beispiel historisch anmutende KI-Videos als echte Aufnahmen inszenieren. Menschen mit genug krimineller Energie finden jedoch erfahrungsgemäss fast immer einen Weg, solche Barrieren auszutricksen.
"pov footage of an ant navigating the inside of an ant nest"
— Aditya Ramesh (@model_mechanic) February 18, 2024
Video generated by Sora pic.twitter.com/N3Ik9QBinU
"nighttime footage of a hermit crab using an incandescent lightbulb as its shell"
— Aditya Ramesh (@model_mechanic) February 18, 2024
Video generated by Sora pic.twitter.com/YcsxCeE5W2
"The camera lowers and widens to a grand panoramic view overlooking the beautiful ocean and the historical buildings along the a stunning coastal picturesque town perched on the cliffs..."
— Bill Peebles (@billpeeb) February 17, 2024
Video generated by Sora. pic.twitter.com/d35Zebo4vc
"realistic video of people relaxing at beach, then a shark jumps out of the water halfway through and surprises everyone"
— Tim Brooks (@_tim_brooks) February 17, 2024
Video generated by Sora pic.twitter.com/WRVnrguCif
Will Smith eating spaghetti is only 12 months old.
— Victor Riparbelli (@vriparbelli) February 16, 2024
2024 will be the year of AI video, voice and 3D.
SORA / OpenAI kicking it off.
LFG 🫡 pic.twitter.com/oFVlLxKeJG
OpenAI just dropped the bomb on video generation.
— Dogan Ural (@doganuraldesign) February 16, 2024
But how do they compare to their closest rival?
OpenAI: Sora vs Runway: Gen2 pic.twitter.com/JYbnCqm6Dd
Sora 和 Stable Video,文本到视频的比较。pic.twitter.com/mUiivTvnec
— Will (@FinanceYF5) February 18, 2024
As you know, my explorations of the Gen AI space is ultimately all about creative control. You should be able to shape the generative matter using all your artistic sensibilities and your aesthetic sense.
— Martin Nebelong (@MartinNebelong) February 16, 2024
OpenAI's Sora is a huge technological leap, but what excites me the most… pic.twitter.com/NQGfLRiq75
Prompt: keep the video the same but make it be winter. 🧵 pic.twitter.com/eAMwRlqx7N
— Martin Nebelong (@MartinNebelong) February 16, 2024
Prompt: change the setting to the 1920s with an old school car. make sure to keep the red color. 🧵 pic.twitter.com/vfZWNZMUmp
— Martin Nebelong (@MartinNebelong) February 16, 2024
Prompt: rewrite the video in a pixel art style. 🧵 pic.twitter.com/HrP8aFMILp
— Martin Nebelong (@MartinNebelong) February 16, 2024
SORA can animate images pretty amazingly.
— AP (@angrypenguinPNG) February 16, 2024
Prompt: "In an ornate, historical hall, a massive tidal wave peaks and begins to crash. Two surfers, seizing the moment, skillfully navigate the face of the wave." pic.twitter.com/rNDB98jTe2
Diese Videos und viele weitere auf der OpenAI-Webseite zeigen: Der Geist ist aus der Flasche. Und Sora ist nur die Speerspitze, weitere KI-Tools werden folgen. Es liegt an den Menschen, etwas Kreatives damit zu erschaffen.
Entsprechend werden Foto und Videomaterial nichts mehr wert sein, da alles gefälscht sein könnte.
Interessante Perspektiven.
Fans können dann eigene Staffeln erstellen mit Drehbuch-Scripts die so wohl auch nicht mehr schreiben müssen (oder zumindest nicht mehr ganz).
“Sora, mir dauert die Wartezeit auf den neuen 007 zu lange. Erstelle mir zwei Varianten eines klassischen Bond-Films, einmal mit einer weiblichen und einmal mit einem männlichen Hauptdarsteller. Drehorte: Kuba, Australien, Russland und England. Bösewicht: KI-Unternehmer mit Allmachts-Fantasien.“