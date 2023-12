Können nicht mehr von echten Menschen unterschieden werden: Kreationen von Stable Diffusion. Mehr nackte Haut wird es in diesem Artikel allerdings nicht geben. bild: stable diffusion/watson.ch

Diese Gratis-KI produziert perfekte Menschen. Auch nackte

Aitana Lopez hat auf Instagram 204’000 Follower (Stand 5.12.2023). In ihrer Instagram-Biografie steht, dass sie Videospiele und Fitness liebt, und, diskret hinter einem Hashtag versteckt, dass die gesamte Beschreibung nur Bauernfängerei ist. Aitana existiert nicht. Die Frau mit den pinkfarbenen Haaren ist eine Illusion, geschaffen von einer künstlichen Intelligenz. Ihre Story ging kürzlich durch die Medien.

Die Text-Prompts für Aitana stammen von der spanischen Agentur the clueless. Sie sei kreiert worden, weil die Nachfrage an menschlichen Models zurückgehe. In einem guten Monat schafft Aitana nun 10’000 Euro an. Quasi netto. Denn ganz im Gegensatz zu menschlichen Influencerinnen produziert Aitana keine Spesen, benötigt keine Verpflegung, keine Proteinshakes, keine Hyaluron-Crèmes, keine Gewerkschaft, keine Pinkelpausen, keinen Schlaf, keinen Lohn.

Nun sind virtuelle Influencerinnen nichts Neues. Manche davon haben eine siebenstellige Followerzahl auf Instagram. Das Neue – und Überraschende – ist: Es braucht keine Skills mehr, Aitanas zu kreieren. Jeder und jede kann heute Aitanas schaffen. Und das (fast) gratis.

Möglich macht das der Text–zu–Bild–Generator Stable Diffusion. Die Open–Source–Software stand lange Zeit im Schatten von Midjourney und Co. Zu schlecht war die Qualität, zu kompliziert die Installation, zu hakelig die Handhabung. Doch während bei Midjourney und Co. ein paar Dutzend Programmierer mit Sonderschichten, Eigenheiten von Grosskonzernen und Regulierungen kämpfen, wird Stable Diffusion von einem weltweiten Heer von Freiwilligen bewirtschaftet. Es ist ein ungleicher Kampf. Gerade bei der Darstellung von Menschen ist Stable Diffusion heute mindestens auf Augenhöhe mit der Konkurrenz. In Sachen Benutzerfreundlichkeit hat Stable Diffusion die Konkurrenz im Sprint überholt.

Stable Diffusion verfügt über ein GUI (Graphical User Interface), von dem man bei Midjourney nur träumen kann.

Es gibt weitere markante Unterschiede. Midjourney, DALL-E oder der Bing Image Creator funktionieren per Cloud-Computing. Heisst: User bedienen die Tools übers Internet. Das ermöglicht den Anbietern eine gewisse Kontrolle. Wer gegen die Richtlinien verstösst, wird sanktioniert. Nicht so bei Stable Diffusion. Die Software kann auf einem (leistungsstarken) Heimrechner installiert werden, und – auch das im Unterschied zu allen anderen populären Bildgeneratoren – selbständig mit Erweiterungen versehen werden. Diese Erweiterungen, genannt Modelle, bügeln Schwächen der KI aus oder spezialisieren diese auf bestimmte Bildeigenschaften. Kreiert werden sie von der Fangemeinde. Und die ist gross und enorm fleissig.

Wer beispielsweise Bilder von Lego-Bauten produzieren will, installiert eines der zahlreichen Lego-Modelle. Über zehn gibt es bereits davon. Wer besonders schöne und realistische Vögel kreieren will, der installiert eines der zahlreichen Vogel-Modelle.

12 Mal Legoschweiz, erstellt mit Stable Diffusion 1 / 14 12 Mal Legoschweiz, erstellt mit Stable Diffusion Alle Bilder kreiert mit Stable Diffusion

Mit ein paar Befehlen und Mausklicks lassen sich innerhalb von wenigen Minuten dutzende Bilder generieren. Noch ist ein Grossteil davon unbrauchbar. Doch in der Masse findet sich auch immer mal wieder Klasse. Wie man sich denken kann, sind es nicht Lego-Bilder, welche die Community hauptsächlich antreiben. Die deutliche Mehrheit der Erweiterungen verbessert die Darstellung von menschlichen Geschlechtsteilen, verkleinert oder entfernt Kleidung, vergrössert Umfänge. Wer einen KI-Mann mit mehr als nur einer Socke in der Hose will, installiert die «Beulen»-Erweiterung. Wer auf französische Dienstmädchen-Uniformen steht, findet auch dazu ein passendes Modell. Deine Kreation ist dir zu lauchig? Abhilfe schafft die Muskelerweiterung. Von Kambundji bis Schwarzenegger ist damit alles möglich – per Schieberegler zur ganz individuellen Traumperson. Mal angezogen, mal nicht. Auch KI-Influencerin Aitana bietet Bezahlinhalte an. Natürlich.

Nicht ganz so realistisch wie Aitana, aber so sieht das Resultat nach einer halbe Stunde Rumpröbeln aus. bild: stable diffusion/watson.ch

So weit, so gut. Wir leben glücklicherweise in einer liberalen Gesellschaft. Doch mit den Hüllen fallen auch die Hemmungen in Sachen Copyright und Persönlichkeitsrechte. Von jedem noch so unbekannten Sternchen gibt es mittlerweile Lora-Modelle – auch von Minderjährigen. Lora steht für Low Rank Adaptation (niederschwellige Veränderungen), mit denen sich verblüffend echte Falschbilder erstellen lassen. Der Hinweis unter dem Download-Button, dass die Nutzungsvorschriften eingehalten und der Respekt vor den Personen gewahrt werden sollen, wirkt angesichts der klaren Präferenz wie ein Hohn.

Auf wessen Gesichtern unser virtueller Mann basiert, wissen wir nicht. Aber wir haben den sowieso schon kräftigen Kollegen ins Gym geschickt. Muskeln hat er gewonnen, dafür ein paar Tattoos verloren. bild: stable diffusion/watson.ch

Das Missbrauchspotential von Stable Diffusion ist enorm – auch das ist nicht neu. Neu ist, dass es dafür kein Informatik-Studium braucht. Auch die Erstellung neuer Lora-Modelle wird immer einfacher. Hinz und Kunz verstehen es, übermütige Teenager verstehen es, auch der Quartiergrüsel versteht es. «Trainiert» werden die Lora-Modelle anhand von Fotos. Jeder und jede mit einem öffentlichen Instagram-Kanal und einem Hang zu Selfies liefert dafür mehr als genug Material.

Wo die Verletzung des Bild-Copyrights beginnt, werden Gerichte entscheiden müssen. Ein Problem der Bildgeneratoren ist, dieselbe Person zu reproduzieren. Abhelfen können sich User damit, dass sie verschiedene bekannte Gesichter ineinander verweben: ein Viertel Cage, ein Viertel Chalamet, ein Viertel Hemsworth. So entstehen mehr oder weniger konsistente Gesichter. Ob die drei Modelle der Schauspieler mit geschütztem Bildmaterial trainiert wurden, entzieht sich den Kenntnissen des Anwenders. Untersuchungen haben aber ergeben, dass bei verschiedenen Modellen Copyright-geschütztes Material zum Einsatz kam.

Die Texteingaben für diese Frau waren: Frau, 32-jährig, realistische Haut, realistische Haare, ernsthafter Blick, farbige Kleidung in einer modernen Stadtumgebung. Den Rest besorgt die KI. bild: stable diffusion/watson.ch

Wohin wird das führen? Zweifelsohne zu einer Flut von Aitanas. Masse und Qualität von fiktiven Inhalten werden derart zunehmen, dass es für Konsumentinnen und Konsumenten immer schwieriger und vor allem aufwendiger wird, Fiktion und Realität zu unterscheiden. Sofern das überhaupt erwünscht ist. Influencer haben schon immer mit Bildbearbeitung getrickst; retuschiert, was nicht gefiel. Stable Diffusion liefert nun das ultimative Retusche-Tool: Es wird tausende reale Influencerinnen und Influencer ausradieren. Professionelle Agenturen werden sich auf fiktive Charaktere spezialisieren; ungepflegte Couchpotatoes, Heerscharen von billigen Arbeitskräften werden Myriaden von fiktiven Profilen kreieren und unterhalten (bis sie von Bots abgelöst werden). Clevere Influencer werden Abbilder von sich selbst schaffen, um noch mehr Jobs gleichzeitig zu erledigen – und um endlich nicht mehr täglich ins Gym gehen zu müssen. Selbstverständlich wird sich dieser Tsunami nicht auf Social Media beschränken. Ich sehe die Schlagzeilen bereits vor mir: «Japaner heiratet virtuelle Person.»

Dieselben Eingaben, aber für einen Mann. bild: stable diffusion/watson.ch

Welche gesellschaftlichen Auswirkungen das haben wird, wird sich zeigen. Natürlich wird es neue Probleme geben und alte akzentuieren: Der Jugendwahn wird kaum zurückgehen, der Schönheitswahn auch nicht – ebenso wenig wie die Vereinsamung. Es wird zu Verschmelzungen mit anderen KI-Bereichen kommen: Digitale Begleiter werden immer lebensechter.

Gleichzeitig löst jede Bewegung eine Gegenbewegung aus. Und meist geht es dann doch nicht so schnell wie antizipiert. Sicher ist: Der Zug ist angefahren. Stoppen lässt er sich nicht mehr. Und er rollt nur noch in eine Richtung. Stable Diffusion ist etwas mehr als ein Jahr alt, steckt noch nicht einmal in den Kinderschuhen, sondern immer noch in den Windeln. Die aktuelle Version ist die schlechteste, mit der je Bilder erzeugt werden. Die virtuelle Zukunft wird noch realistischer. Der nächste grosse Schritt werden Bewegtbilder sein.

Man kann die Technologie verteufeln. Aber wir werden mit ihr leben (müssen). Gerade aufgrund des Open-Source-Charakters hat Stable Diffusion enormes Potenzial. Auch wenn private Konzerne Regulierungen schneller und effizienter umsetzen können – dass sie alleine über solch mächtige Tools verfügen, kann nicht im Interesse der Allgemeinheit sein.