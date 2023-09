«Tubelisicher» wie ChatGPT: OpenAI stellt neuen KI-Bildgenerator DALL-E 3 vor

Glaubt man den Versprechungen des US-Unternehmens, dann muss sich die Konkurrenz um Midjourney und Co. warm anziehen.

Mehr «Digital»

Das US-Unternehmen OpenAI, Entwicklerin und Anbieterin von ChatGPT, bringt eine mächtige neue Version seines KI-Bildgenerators heraus: «DALL-E 3».

Das Techportal futurezone.at konstatiert:

«Die Bildgeneratoren Midjourney und Stable Diffusion waren bisher im Vergleich führend, wenn es darum ging, die besten Bilder mit künstlicher Intelligenz (KI) zu erstellen. DALL-E 2, zuletzt im November 2022 veröffentlicht, hinkte immer ein wenig hinterher. So hat der Bildgenerator gerne manche längere Befehle ‹verschluckt› und bei der Bilderzeugung einfach ignoriert.» quelle: futurezone.at

Dieses Bild wurde von DALL-E 3 erzeugt. Der Prompt hierzu lautete: «Tiny potato kings wearing majestic crowns, sitting on thrones, overseeing their vast potato kingdom filled with potato subjects and potato castles.» Bild: OpenAI

Was bietet DALL-E 3?

Die wichtigste Neuerung ist die Integration von ChatGPT. Neu soll es genügen, ein paar einfache Sätze einzugeben, damit der Bildgenerator überzeugende «Werke» erstellt. Und dabei werde der Kontext der User-Eingabe berücksichtigt.

OpenAI verspricht:

Moderne Text-zu-Bild-Systeme neigen dazu, Wörter oder Beschreibungen zu ignorieren, so dass die User gezwungen sind, Prompttechnik zu lernen. DALL-E 3 ist ein grosser Fortschritt in unserer Fähigkeit, Bilder zu generieren, die sich genau an den von Ihnen eingegebenen Text halten.

Demnach braucht es in Zukunft kein aufwendiges Suchen nach der richtigen Formulierung, Prompt Engineering genannt, um überzeugende Resultate zu erhalten.

Es folgen ein paar Beispiele, die ebenfalls von OpenAI selbst stammen und bei X veröffentlicht wurden. Interessant ist jeweils vor allem der relativ kurze «Prompt», also die Texteingabe, mit der die Bilder von der KI generiert wurden.

Screenshot: twitter.com

Screenshot: twitter.com

Hierzu lautete der Prompt: «Photo of a lychee-inspired spherical chair, with a bumpy white exterior and plush interior, set against a tropical wallpaper.» Bild: OpenAI

Wann und für wen ist DALL-E 3 verfügbar?

Die neue Version von DALL-E-3 werde zuerst bei den kostenpflichtigen Abos ChatGPT Plus und ChatGPT Enterprise integriert und soll «im Oktober» verfügbar sei. Wann der neue Bildgenerator gratis genutzt werden kann, ist offen.

Wie sicher ist der neue Bildgenerator?

OpenAI hat gemäss eigenen Angaben bei DALL-E 3 Sicherheitsmechanismen integriert, die verhindern sollen, dass der Bildgenerator «hassvolle Botschaften» ausspuckt. Dazu habe man mit externen Fachleuten zusammengearbeitet. Der KI sei beigebracht worden, bestimmte Wörter zu ignorieren, die Gewalt beinhalten. Auch die Namen von einigen Promis seien auf dieser Schwarzen Liste gelandet. Demnach wäre es nicht mehr möglich, Bilder bekannter Persönlichkeiten zu generieren, wie es etwa mit dem Papst geschehen war.

Dann ist da noch die Problematik der Urheberrechtsverletzungen durch generative KI, die OpenAI mit zusätzlichen Vorkehrungen verhindern möchte. Dazu futurezone.at:

«Um Urheberrechtsstreitigkeiten zu umgehen und Gerichtsverfahren zu vermeiden, will OpenAI auch eine Option für Künstler*innen anbieten, dass ihre Bilder nicht als Grundlage verwendet werden dürfen, um die KI-Generatoren damit zu trainieren. Ergebnisse, die einem bestimmten Stil dann zu nahe kommen, könnten dann geblockt werden, heisst es.»

The Verge ruft in Erinnerung, dass in den USA bereits Klagen laufen. Die DALL-E-Konkurrenten Stability AI und Midjourney sowie die Kunst-Website DeviantArt wurden verklagt, weil sie angeblich urheberrechtlich geschützten Werke für das Training ihrer KI-Bildgeneratoren verwendet hätten.

Quellen

(dsc)