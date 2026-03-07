Interview

Grittibänz-Macher: «Der KI-Backlash wirkt für mich manchmal ein wenig inszeniert»

Kürzlich teilte der irische Filmregisseur Ruairi Robinson auf X eine 15-sekündige Filmsequenz, in der sich Brad Pitt und Tom Cruise einen Faustkampf liefern. Die gesamte Prügel-Szene zwischen Ruinen wurde mit einem 2-Zeilen-Befehl und dem KI-Modell Seedance 2.0 kreiert. Hollywood-Drehbuchautor Rhett Reese («Deadpool & Wolverine», «Zombieland») reagierte darauf mit: «Ich sage es nur ungern, aber es ist wahrscheinlich vorbei für uns.»

Ob das wirklich so ist, wollten wir von Severin Gamper wissen. Gamper ist Art Director der Zürcher Werbe- und Kreativagentur ESE und kennt die gesamte digitale Produktionskette aus dem Effeff. Seit über fünf Jahren beschäftigt er sich intensiv mit den Fortschritten der generativen KI und trug entscheidend dazu bei, dass ESE heute zu den KI-Vorreitern in der Werbung gehört. Seine Agentur produzierte nicht nur die Plakatkampagne für watson.ch, sondern auch den viralen Hit «Grittibänz im Benz» für die Migros. Zu dritt gestartet, beschäftigt die Agentur heute 30 Mitarbeitende.

Der Grittibänz wirbelte im Benz für die Migros in den sogenannt sozialen Medien viel Staub auf Video: YouTube/Migros

Herr Gamper, war's das für Hollywood?

Severin Gamper: Es ist ein bisschen reisserisch formuliert. Solange Leute Filme oder Serien schauen wollen, in irgendeiner Form, wird es immer Filmproduzenten brauchen. Die Frage ist, wie diese hergestellt werden.

Hatten Sie auch so einen Moment wie Reese, als Sie erkannten, dass jetzt ein neues Zeitalter eingeläutet wird?

Wenn man mit KI arbeitet, gibt es immer wieder solche überwältigenden Momente. Beispielsweise, als vor ein paar Monaten Nano Banana Pro von Google herauskam. Um die neuen Funktionen zu testen, kreierte ich ein Kampagnen-Visual. Den Output habe ich dann mit einem echten Foto aus einer Mittelformatkamera, also mit dem Besten, was die Fotografie zu bieten hat, verglichen. Fazit: Das KI-Bild war dem echten Foto qualitativ massiv überlegen und konnte nicht mal mehr von unserem Team als KI-Bild erkannt werden. Jedes Detail war perfekt. Man muss dazu wissen: Für uns reicht ein beeindruckendes Resultat nicht – das Resultat muss so gut sein, dass es für die Werbung verwendbar ist, ohne den KI-Sensor des Betrachters zu triggern. Das ist ein grosser Unterschied. Dieses Level ist nun erreicht. Heute können wir KI-Bilder auf Plakate drucken und niemand merkt es.

Wenn es die Leute aber bemerken, dann wird gemotzt.

Ich verstehe, woher der Backlash kommt. Da schwingt die Angst mit, dass mit der KI viele Prozesse wegsterben. Der Backlash wirkt für mich manchmal aber ein wenig inszeniert … ein wenig performativ.

Severin Gamper ist Co-Founder und Art Director der Zürcher Werbe- und Kreativagentur ESE bild: ese

Dass Prozesse wegsterben, bedeutet ja auch, dass Leute ihren Job verlieren.

Wenn eine Aufnahme am Computer gemacht wird und nicht mehr physisch, fällt Handarbeit weg. Wenn die entsprechenden Personen dafür nicht mehr gebraucht werden, ist das natürlich sehr, sehr schade – und ein tragischer Moment. Aber es ist nichts Neues. Solche Veränderungen gibt es immer wieder – gerade im Filmbereich. Was man aber sagen kann: Entgegen der Meinung vieler verringert sich die Menge der Arbeit mit der KI nicht wirklich. Es ist einfach so, dass sich der Schwerpunkt der Arbeitsbelastung verschiebt. Solche Momente gibt es immer wieder. Beispielsweise als Spezialeffekte aufkamen, die den Szenenbildnern das Leben schwer machten … aber: Gewisse Handarbeit wird weiter bestehen. Davon bin ich überzeugt.

Warum?

Wenn jemand am Set eine Stunde an einem Hintergrundelement arbeitet, gezielt eine Schauspielerin castet, mit der Maske über eine Schramme im Gesicht diskutiert – wenn so viel Brainpower in Details fliesst, führt dieser aufwendige Produktionsprozess zu einer ganz anderen Wahrnehmung. Und ich behaupte, dass man das dem Endprodukt ansieht. Wir sehen das immer wieder bei KI-Prozessen. Manchmal wünschten wir uns solche Zwischenschritte. Wenn ich mit einem Klick ein Visual generieren kann, dann verleitet das dazu, sich gewisse Gedanken zu sparen … Aber: Auch mit der KI ist es nicht so, dass man ihr einfach sagen kann: So, mach mal Film. Auch ein KI-Film ist viel Handwerk.

Hat der Laie falsche Vorstellungen, wenn er glaubt, mit der KI werde das Filmemachen viel einfacher?

Ein gutes Resultat ist immer viel Arbeit. Die eigenen Vorstellungen präzise umzusetzen bedeutet mit der KI sehr viel Finetuning. Und gerade beim Finetuning ist die Bedienung mit Text-Prompts doch noch sehr altbacken – dort tut sich nun aber viel.

Statt Photoshop gibt es dann KI-Shop?

Genau. Sie veröffentlichen Ihren Artikel ja auch nicht, indem Sie einen HTML-Code schreiben. Die Zeiten sind vorbei … Sie bedienen vermutlich ein Content-Management-System. Aktuell ist es aber noch so, dass wir die KI mit Textbefehlen steuern. Das wird sich ändern. Werkzeuge sind auch für KI-Bild- und Videogenerierung in der Entstehung. Sie werden die KI-Videoproduktion weiter vereinfachen. Das wird noch einmal ein riesiger Game-Changer.

Wir sind damit bei den Schwächen angekommen. Was können KI-Bild- und Videogeneratoren noch nicht?

Videos generieren, die länger als 15 Sekunden sind (lacht). Ehrlich. Was geht und was nicht, ist teilweise überraschend. Komplexe Aufgaben, die schwierig wirken, können perfekt gelingen. Dann versagt die KI aber wieder bei den scheinbar einfachsten Dingen.

Können Sie uns ein Beispiel geben?

Wir hatten kürzlich ein Rendering eines 3D-Modells und wollten nur ein wenig die Perspektive verändern. Wir sind fast daran verzweifelt. Und spezifisch bei Videos gibt es noch immer das Problem des Uncanny Valley – das Problem des unheimlichen Tals.

Der Begriff sagt mir jetzt nichts.

Unsere Augen und unser Gehirn sind extrem darauf trainiert, Menschen und die Finessen, die ein Gesicht ausmachen, zu erkennen. Wenn eine Personendarstellung nahezu real ist – aber eben nicht ganz –, dann merken wir das und reagieren mit Unbehagen. Eindeutig künstlich akzeptieren wir, komplett real auch, dazwischen befindet sich das Uncanny Valley. Ein Trick ist, künstlich erzeugte Figuren klar zu überzeichnen – Gollum in «Herr der Ringe» ist so ein Beispiel. Das Uncanny Valley ist ein Riesenproblem für die Werbung, das zeigten auch vergangene Kampagnen: Die KI-Werbungen mit dem grössten Backlash waren solche mit beinahe perfekten Menschendarstellungen – Menschen im Uncanny Valley. Unser Grittibänz – deutlicher kann KI nicht sein – wurde im Gegenteil sogar sehr wohlwollend aufgenommen.

Das Uncanny Valley – oder welche Menschendarstellung wir akzeptieren und wo es uns gruselt. Die Charaktere des Films «Polar Express» (2004) sind oft genannte Beispiele für Bewohner des Uncanny Valley. bild: wikipedia.com

Es wird nicht mehr lange dauern, und KI-Modelle werden das Uncanny Valley durchschreiten und es wird keine SchauspielerInnen und Models mehr benötigen?

Prognosen im Zusammenhang mit KI sind schwierig (lacht). Aktuell ist es noch so, dass wir uns vor jedem Einsatz von KI überlegen müssen, ob die Kundenwünsche mit dem aktuellen Stand der Technik erreicht werden können. Wenn nicht, shooten wir konventionell. Und wissen Sie was? Das ist auch gut so.

Wie lange werden Sie sich die Frage noch stellen müssen? Wie lange können SchauspielerInnen noch hoffen?

Wie gesagt, Prognosen sind schwierig. Vielleicht verändert sich in Zukunft die Einsatzweise von SchauspielerInnen. Vielleicht filmen wir die Person hier im Büro und danach übertragen wir die Performance auf Hollywood-Level-Produktion.

Konkret bedeutet das, dass ich mich als SchauspielerIn … oder als Onlyfans-Model … jetzt digital konservieren lassen sollte. So kann ich garantieren, dass ich auch in 25 Jahren noch Content kreieren kann.

Würden Sie das machen, um Ihren Körper zu schützen – oder um Aufwand zu sparen?



Aufwand, Kosten … ich müsste ein bisschen weniger ins Gym, nicht jeden Pickel abdecken und den Coiffeur könnte ich mir auch sparen. Und ich könnte den Alterungsprozess aufhalten oder gar steuern – wenigstens digital.

Die Frage, die sich dann stellt: Warum müssen sie dann überhaupt noch selbst diese digitale Person sein? Es gibt bereits virtuelle Models und Schauspielerinnen – die auch KI-Musik herausbrachten.

Im Fall von Brad Pitt: Weil er sich einen Brand aufgebaut hat, den er so unendlich melken kann … wie Khaby Lame, der das Recht seiner digitalen Verwertung für eine Milliarde verkaufte.

Das ist ein schwieriges Thema … ein extrem eigenartiger Gedanke. Aber es würde mich nicht wundern, wenn das bereits massenhaft gemacht wird. Ein Problem bleibt: Der Charakter bleibt digital. Er wird nicht an Veranstaltungen teilnehmen oder über den roten Teppich gehen können – physische Events sind noch unmöglich. Auf der digitalen Ebene ist aber bereits vieles möglich – und es braucht dafür keinen Ganzkörperscan. Ein Foto reicht.

Also Vorsicht, was man im Internet teilt.

Früher wurde für Deepfakes viel Material benötigt. Heute reicht ein Foto. Vielleicht, um Ihnen noch ein Praxisbeispiel zu geben, das zum vorher Besprochenen passt: Es gibt verschiedene Anbieter und Apps, die produzieren aus einem einzigen Foto von Ihnen 26 Instagram-Posts aus aller Welt. Die kann man dann schön während eines faulen Monats posten.

Das ist ja vielleicht auch nicht so schlecht. Dann hört der Overtourism auf … vielleicht.

(Lacht) Ich mag Ihren Optimismus … grundsätzlich müssen wir uns darauf einstellen, dass digitale Bilder und Videos fake sind – von der KI gemacht. Vielleicht konzentrieren wir uns ja dann im echten Leben wieder vermehrt auf die Realität.

Wir malen gerade ziemlich schwarz. Aus einer positiveren Perspektive könnte man anmerken, dass mit der KI eine Dezentralisierung stattfindet. Die Einstiegshürden für Filmemacher sind aktuell enorm. Um noch einmal auf Rhett Reese zurückzukommen – sein Zitat geht nämlich noch weiter. Er sagt:

«Schon bald wird eine einzelne Person am Computer in der Lage sein, einen Film zu erschaffen, der von dem, was Hollywood derzeit veröffentlicht, nicht zu unterscheiden ist. Wenn diese Person kein Talent hat, wird das Ergebnis schlecht sein, aber wenn jemand mit dem Talent und Geschmack von Christopher Nolan auftaucht, und so jemanden wird es schnell geben, wird es fantastisch sein.» Rhett Reese auf X

Ich bin mir sicher, dass diverse unentdeckte Regietalente irgendwo schlummern.

Der Punkt mit der geringeren Einstiegshürde ist richtig. KI ist ein Riesenschritt in diese Richtung. Vor 30 Jahren oder 40 Jahren war es normalen Menschen unmöglich, einen Film zu drehen. Allein eine Kamera kostete ein Vermögen. Seither ist vieles passiert. Im neuen Formel-1-Streifen «F1» wurden teilweise iPhones als Kameras eingesetzt. Mit KI sinkt die Hürde weiter.

Also wird passieren, was immer passiert mit neuer Technik. Es wird damit eine riesige Menge Schrott produziert – aber es wird auch herausragende Werke geben.

Ja, das sehe ich ähnlich. (Lacht) Aber es ist tatsächlich so, dass wir uns auf einen Riesenhaufen Schrott gefasst machen müssen.

Wo wird sich der Einsatz von KI am schnellsten flächendeckend durchsetzen? Mein Tipp wäre Pornografie.

Wie kommen Sie darauf?

Keine Hemmungen, keine Skrupel, keine Lobby, kein Mitleid – und die Pornographie war schon immer Trendsetter.

Mein Einwand wäre: Die besten KI-Modelle sind Closed-Source und unterstützen keine erotischen Inhalte. Ausserdem fällt das 15-Sekunden-Limit bei der Pornographie wohl noch mehr ins Gewicht ....

… das wäre dann die Kategorie unfreiwilliger Realismus …

… vielleicht ist die These nicht so falsch. Ich glaube aber etwas anderes: KI wird sich zuerst bei Inhalten durchsetzen, die primär auf kleinen Screens konsumiert werden – Social Media … alles auf dem Smartphone. Die Kinoleinwand fällt als Letztes.

Was raten Sie jungen Menschen, die sich fürs Filmemachen interessieren?

Jungen Leuten, die jetzt in eine Branche einsteigen wollen, in der mit KI gearbeitet wird, sei es die Filmindustrie, Werbeindustrie, Grafikdesign und so weiter, würde ich raten, diese neue Technologie mit offenen Armen in Empfang zu nehmen. Es ist eine Chance. Wer KI beherrscht, kann sich abheben. Die genannten Branchen haben eine Zukunft. Es wird sich einfach vieles verändern. Und wer nicht flexibel ist, droht auf dem Abstellgleis zu landen. Wer hingegen mit offenen Augen neue Möglichkeiten erkennt und versucht, sie anzuwenden, ist im Vorteil. Ich glaube, gerade für junge Leute ist das super.

Wenn jemand KI-Bild- und Videogeneratoren ausprobieren will … welche Modelle sind aktuell die besten?

Für Fotografie hat Midjourney noch immer eine gewisse Berechtigung. Einfach wegen der kreativen Resultate – qualitativ aber nicht mehr. Nano Banana Pro ist in Sachen Bildgenerierung mit Abstand das Beste. Da kann man 4000 x 4000 Pixel in bester Qualität generieren. Auch im Hinblick auf Feinmodifikationen ist Google da top.

Bei der Video-Generierung sind die Veränderungen so rasant, dass bei Erscheinen des Interviews sich die Situation vielleicht schon wieder geändert hat. Kling ist aktuell stark. Seedance 2.0 ist noch nicht einmal öffentlich verfügbar. Die Demos sind beeindruckend, mal schauen, wie es aussieht, wenn man selbst damit herumspielen kann. VEO 3.1 von Google ist auch sehr stark. Wir werden grosse Schritte sehen in der nächsten Zeit.

Gibt es noch ein Thema, das wir noch nicht angeschnitten haben?

Vielleicht etwas Überraschendes: Ich behaupte, die Arbeit mit KI sorgt für anstrengendere Arbeitstage.

Das kommt jetzt tatsächlich überraschend.

Ich glaube, das an mir beobachten zu können. Die Verschnaufpausen, die repetitiven Tätigkeiten, bei denen man auch mal kurz abschalten, mit den Gedanken abschweifen kann – mal etwas freistellen bei einem Bild beispielsweise – die fallen mit KI weg. Das passiert nun mit einem Klick. Dafür treten die komplexesten Teile der Arbeit gehäuft auf – die Arbeit am Bild selbst und der Frage: Was ist das Beste für mein Projekt, was macht ein gutes Bild überhaupt aus? Hinzu kommt das Infinite Junior Problem.

Noch so ein Begriff.

Die KI ist im Prinzip wie ein Junior-Angestellter, dem man eine Aufgabe gibt. Aber weil es halt noch ein Junior ist, muss man jeden Schritt kontrollieren. Der Unterschied liegt im Tempo. Die KI erstellt mir ein Visual aus Referenzbildern in einer Minute. Nach einer Minute muss ich den Junior bereits wieder kontrollieren und korrigieren. Mir tut mein Team manchmal leid. Dazwischen kommt man ja zu nichts mehr.

Dann überlasse ich Sie wieder Ihren Junior-Angestellten und beeile mich mit der Produktion. Damit dieses Interview bei Erscheinen nicht schon wieder veraltet ist. Vielen Dank für die Zeit, die Sie sich genommen haben.​