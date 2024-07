GPT-4 ist in (fast) aller Munde. meme: mastodon/ grumpyplauze

Review

Was du über das neue ChatGPT unbedingt wissen solltest

OpenAI hat die nächste Generation seines KI-Chatbots vorgestellt. GPT-4 ist laut Ankündigung «multimodal». Und die gehypte künstliche Intelligenz dringt in immer mehr Lebensbereiche vor.

Das amerikanische KI-Unternehmen OpenAI hat am Dienstag GPT-4 vorgestellt – die neue Version seines Chatbots, der nicht nur menschliche Sprache versteht, sondern auch Bilder.

Während das Internet überschäumt vor Begeisterung, gilt es auch die kritischen Punkte in Erinnerung zu rufen.

Das Wichtigste in Kürze

ChatGPT basiert auf dem Sprachmodell GPT. Und nun hat die US-Entwicklerfirma OpenAI am Dienstag die Version 4 seiner gehypten Software vorgestellt.

Mit GPT-4 sind deutlich längere Texteingaben möglich, was die Einsatzmöglichkeiten und das Output-Potenzial massiv erweitert. ChatGPT soll nun «bis zu 50 Seiten Text» über das Eingabefeld verarbeiten können.

GPT-4 verarbeitet nicht nur (menschliche) Sprache, die Software «versteht» bis zu einem gewissen Grad auch Bilder. Die Entwickler bezeichnen dies als multimodal.

Die Software kann Wissen logisch verknüpfen und daraus Schlüsse ziehen, obwohl sie eigentlich gar nicht dafür konzipiert wurde. «Die GPT-Modelle wurden allein für die Aufgabe optimiert, das jeweils nächste Wort im Internet vorauszusagen», sagt der deutsche KI-Experte Florian Gallwitz, Professor für Informatik in Nürnberg.

Das Missbrauchspotenzial steigt massiv, etwa wenn es um Desinformations-Kampagnen und Cyberattacken geht. Die ChatGPT-Macher warnen: «GPT-4 kann plausibel realistische und zielgerichtete Inhalte generieren, darunter Nachrichtenartikel, Tweets, Dialoge und E-Mails.»

Bevor es richtig ernst wird, ist Humor gefragt ...

So reagiert ChatGPT auf KI-Witze

So reagiert ChatGPT auf KI-Witze

Die in der Bildstrecke (oben) getesteten Witze bestätigen, dass GPT-4 bereits in die neue Microsoft-Suchmaschine Bing respektive deren KI-Chatbot integriert ist. Denn die Antworten beider KI-Chatbots fallen nahezu identisch aus. Wobei anzumerken ist, dass der Bing-Chatbot nicht mit Emojis spart, während man ChatGPT zuerst danach fragen muss.

screenshot: watson

Die KI erkennt Bildinhalte

Greg Brokman, Präsident und Mitgründer von OpenAI, sagte bei der offiziellen Präsentation am Dienstag:

«GPT-4 ist nicht nur ein Sprachmodell, sondern auch ein visuelles Modell.»

Zwei verblüffende Beispiele:

Wenn man der Software ein Foto von einem Bündel Luftballons zeigt, erkennt GPT-4 nicht nur die Ballons, sondern kann auch die Frage beantworten, was passieren würde, wenn man ihre Befestigungsleinen durchschneidet: «Die Ballons würden davonfliegen.»

Was passiert, wenn die Leine gekappt wird? screenshot: openai.com

Aus einer einfachen per Hand erstellten Skizze für eine Webseite liess sich mit GPT-4 ein passender Programmcode und damit die fertige Webseite erstellen. Die eindrückliche Demonstration dazu gibt's hier bei YouTube.

Der Haken: Solche Bild-zu-Text-Eingaben sind noch nicht öffentlich zugänglich, sondern stehen nur ausgewählten Testern («Research Preview») zur Verfügung.

Eine sinnvolle Anwendung der KI-Technologie planen die Macher der Smartphone-App «Be My Eyes», die sich an blinde und sehbehinderte Menschen richtet. Bislang hilft eine weltweite Community mit Millionen Freiwilligen beim Erkennen von Bildern, die per Live-Chat übermittelt werden. Neu soll die «Virtual Volunteer»-Funktion auf dem GPT-4-Sprachmodell von OpenAI basieren. Die Testphase läuft bereits.

«Welches Hemd hat die roten Streifen?» Solche Fragen kann die in die App integrierte KI beantworten. screenshot: bemyeyes.com

🤑 🤑 🤑

Wer ChatGPT ausprobieren will, kann das kostenlos tun. Doch das ändert sich mit der neuen Version, GPT-4. Um mit dem laut den Entwicklern massiv aufgemotzten KI-Chatbot zu plaudern, gilt es mindestens 20 US-Dollar hinzublättern: So viel kostet das monatlich kündbare «ChatGPT Plus»-Abo.

Ausgenommen ist die Wissenschaft:

«Forscher, die sich mit den gesellschaftlichen Auswirkungen von KI oder Fragen der KI-Anpassung befassen, können über unser ‹Researcher Access Program› einen subventionierten Zugang beantragen.»

GPT-4 ist aber auch, wie bereits erwähnt, in die neue Bing-Suchmaschine von Microsoft integriert. Um die KI dort gratis auszuprobieren, muss man den Zugang beantragen.

OpenAI wird GPT-4 als Programmierschnittstelle (API) unabhängigen Software-Entwicklerinnen und -Entwicklern zur Verfügung stellen, damit sie die KI in eigene Anwendungen und Dienste integrieren können. Auch da gibt's eine Warteliste, in die sich Interessierte eintragen. Der Haken: Es ist Geduld gefordert. Das «Rollout» erfolge schrittweise und OpenAI behält sich vor, interessante Projekte vorzuziehen.

ChatGPT wird immer mehr zum Sprachgenie

GPT-4 verarbeitet (wie die vorangegangenen Software-Versionen) natürliche Sprache maschinell. Doch wie misst man diese Fähigkeit? Hier kommt das standardisierte wissenschaftliche Mess- und Bewertungsverfahren MMLU ins Spiel.

MMLU steht für ‹Massive Multitask Language Understanding› und ist ein Benchmark, mit dem sich das allgemeine Weltwissen und die Problemlösungsfähigkeiten von Sprachmodellen testen und beurteilen lassen.

Konkret muss die KI herausfordernde Fragestellungen beantworten, die mehrere Wissensgebiete umfassen. Für die Lösung werden tiefergehende Fähigkeiten vorausgesetzt. Ein einfaches linguistisches Verständnis reicht nicht.

Und da ist GPT-4 gemäss den Angaben von OpenAI anderen Sprachverarbeitungsmodellen weit voraus. Dies gelte für Englisch und viele andere Sprachen.

Chinchilla und PaLM sind Sprachverarbeitungsmodelle des OpenAI-Konkurrenten Google. screenshot: openai.com

Die KI halluziniert weiter

OpenAI weist selber darauf hin und warnt, dass das Sprachmodell immer noch dazu tendiert, Informationen zu erfinden und auch problematische Texte verfassen könnte.

Die KI spiegelt immer noch (menschliche) Vorurteile wider, die im riesigen Datensatz enthalten sind, mit dem sie trainiert wurde. Und sie halluziniert, das heisst, sie erfindet plausibel klingende Unwahrheiten. Oder anders ausgedrückt: Wer der KI eine schwierige Frage stellt, ohne die Antwort zu kennen, muss damit rechnen, Falschinformationen zu erhalten.

Der OpenAI-Chef twitterte zum neuen ChatGPT:

«Es ist immer noch fehlerhaft, immer noch begrenzt, und es scheint beim ersten Gebrauch immer noch beeindruckender zu sein, als wenn man mehr Zeit damit verbracht hat.» Sam Altman, CEO quelle: twitter

Hier wurde ChatGPT (GPT-4) vom watson-Redaktor in die Irre geführt, obwohl der Chatbot das richtige Datum genannt hatte. Er weiss also nicht, was wirklich stimmt. screenshot: watson

Das für ChatGPT verfügbare Wissen ist zeitlich massiv eingeschränkt. Der Chatbot hat keinen Zugriff auf neuere Informationen.

Wenn man nach dem Startdatum eines bestimmten Kinofilms fragt, reagiert ChatGPT im Gegensatz zum Bing-Chatbot zurückhaltend und weist auf die eigene Beschränktheit hin.

«Da mein Wissen bis September 2021 reicht, kann ich nicht das genaue Veröffentlichungsdatum von ‹Black Panther 2› nennen. Zu dieser Zeit war der Film unter dem Titel ‹Black Panther: Wakanda Forever› bekannt und seine Veröffentlichung war für den 8. Juli 2022 geplant. Bitte beachte, dass sich das Veröffentlichungsdatum seitdem geändert haben könnte (...).»

Statt des aggressiven Infragestellens von User-Eingaben wie bei Bing, haben die menschlichen ChatGPT-Operateure der KI also eine grosse Zurückhaltung «eingeimpft».

Blackbox bleibt Blackbox

«Leider ist es ein Geschäftsgeheimnis, wie viel Rechenleistung sie für das Training verwendet haben. So viel zur offenen KI.» Kommentar bei Mastodon

Im technischen Bericht zu GPT-4 schreibt OpenAI:

«In Anbetracht des Wettbewerbsumfelds und der Sicherheitsauswirkungen grosser Modelle wie GPT-4 enthält dieser Bericht keine weiteren Einzelheiten über die Architektur (einschliesslich der Modellgrösse), die Hardware, die Trainingsberechnungen, den Aufbau der Datensätze, die Trainingsmethode oder Ähnliches.»

Immerhin verspricht das gewinnorientierte US-Unternehmen ein bisschen Transparenz. Im Bericht heisst es:

«Wir verpflichten uns zu einer unabhängigen Prüfung unserer Technologien (...). Wir planen, weitere technische Details zusätzlichen Dritten zur Verfügung zu stellen, die uns bei der Abwägung zwischen den oben genannten Wettbewerbs- und Sicherheitserwägungen und dem wissenschaftlichen Wert einer weiteren Transparenz beraten können.»

Viele wollen vom KI-Hype profitieren – mit unabsehbaren Folgen

Die KI bleibt unberechenbar, doch das hält unzählige Start-ups und andere gewinnorientierte Unternehmen nicht davon ab, die Software in eigene Dienste zu integrieren.

Zwei Beispiele:

General Motors wolle Autos mit ChatGPT-Assistenten ausstatten , berichtet golem.de.

, berichtet golem.de. Die KI von Snapchat könnte der bisher gruseligste Chatbot sein, meint das US-Medium Fast Company. Der kostenpflichtige Zusatzdienst zur Social-Media-App soll Teenagern verstörende Ratschläge geben.

«Sprachmodelle werden schnell in die Wirtschaft Einzug halten», konstatiert der deutsche KI-Experte Gallwitz. Der Informatik-Professor sagt, in Zukunft werden wir mit Computern und anderer Hardware fast in so natürlicher Sprache umgehen wie mit den Mitmenschen. Und er meint:

«Ich habe den Eindruck, wir erleben gerade eine technische Revolution, die ähnlich tiefgreifend ist wie das Internet.»

Google kontert KI-Vorstoss von Microsoft Google hat am Dienstag eine umfassende Initiative vorgestellt, mit der Unternehmen und Organisationen ohne grossen Aufwand selbst Anwendungen für künstliche Intelligenz (KI) bauen können. Ausserdem wird das Office-System Google Workspace um KI-Funktionen erweitert.



Das Programm umfasst zum einen die Nutzung von Sprachmodellen, die von Google entwickelt wurden. Ausserdem bietet der Internet-Konzern eine Entwicklungsumgebung («MakerSuite») an, mit der man eigene KI-Anwendungen bauen kann.



Mit der KI-Initiative kontert Google einen Vorstoss von Microsoft. Der weltgrösste Softwarekonzern, der in wichtigen Geschäftsfeldern wie der Online-Werbung und Internet-Suche von Google abgehängt wurde, versucht mithilfe des kalifornischen Start-ups OpenAI die traditionelle Google-Suche durch Anfragen an ein KI-System zu ersetzen.



Die Google-Initiative umfasst auch die sogenannte generative KI, also das Generieren von Inhalten mithilfe künstlicher Intelligenz. Das prominenteste Beispiel für generative KI ist der Text-Roboter ChatGPT von OpenAI. Googles Textroboter heisst «Bart», steht aber im Gegensatz zu ChatGPT noch nicht einer breiten Öffentlichkeit zur Verfügung.



Google wird künftig seinen Kunden, die die Office-Suite «Google Workplace» nutzen, entsprechende Funktionen zur Verfügung stellen. Damit können beispielsweise längere E-Mail-Wechsel per Knopfdruck zusammengefasst oder die Ergebnisse in eine Präsentation überführt werden. Dabei können der Umfang und die Tonalität verändert werden.



Preise für die KI-Schnittstellen und Entwicklungsbaukästen hat Google am Dienstag noch nicht genannt. Diese sollen zu einem späteren Zeitpunkt veröffentlicht werden.



(awp/sda/dpa)