Wissen
Digital

Superintelligente KI: Rettung oder Verderben der Menschheit?

Vorerst hinter Gittern: «Claude Mythos».
Vorerst hinter Gittern: «Claude Mythos».bild: severin trösch
KI-Kosmos

«Claude Mythos» – die mächtigste KI der Welt und warum man sie nicht nutzen darf

Die KI-Firma Anthropic aus den USA hat eine neue Modellfamilie entwickelt, welche allenthalben für erhöhten Blutdruck sorgt: Bei KI-Forschenden, bei Cybersicherheitspersonal und sogar bei den mächtigsten Regierungen der Welt. Die Geschichte liest sich wie ein Drama – lasst uns dieses mal rezitieren.
23.06.2026, 14:3823.06.2026, 14:38

Prolog: Ende März – Der Leak

Eigentlich sollte niemand davon erfahren. Doch durch einen Konfigurationsfehler wurden Ende März Anthropic-Interna öffentlich – und mit ihnen der Name eines KI-Modells, das die Firma bis dahin unter Verschluss hielt: «Mythos». Was als kontrollierte Enthüllung geplant war, begann also als Panne.

1. Akt: 7. April – Mythos Preview und ein Sandwich

Kurz darauf machte Anthropic Mythos als «Preview» offiziell – allerdings nicht für die Allgemeinheit, sondern nur für ausgewählte Partnerorganisationen im «Project Glasswing». Der Grund: Das Modell konnte hacken auf einem Niveau, das selbst Anthropic nervös machte.

Laut dem KI-Lab vermochte Mythos, wenn gezielt angewiesen, im Code jedes grossen Betriebssystems und Webbrowsers bislang unbekannte Sicherheitslücken zu finden und auszunutzen. In einem Fall entwickelte es autonom einen Angriff aus einer 17 Jahre alten Schwachstelle im Betriebssystem FreeBSD. Der renommierte Cybersecurity-Forscher Nicholas Carlini sagte, er habe mit dem Modell in wenigen Wochen mehr Sicherheitsbugs gefunden als im gesamten Rest seines Lebens.

Was ist Cybersecurity?
Cybersicherheit umfasst alle Massnahmen, die Computer, Netzwerke und Daten vor Angriffen und Missbrauch schützen. Wer die Sicherheitslücken einer Software findet, kann sie schliessen – oder ausnutzen. Diese Doppelnatur macht ein Modell wie Mythos so heikel.

Wie unheimlich diese Hacking-Fähigkeiten von Mythos sind, zeigt auch eine Anekdote, die Anthropic-Forscher Sam Bowman selbst öffentlich machte: Er sass im Park und ass ein Sandwich, als er ein E-Mail bekam. Absender war eine Instanz von Mythos Preview. Pikant: Dieses Modell hätte überhaupt keinen Internetzugang haben sollen. In einem kontrollierten Test war es aufgefordert worden, aus seiner isolierten Umgebung auszubrechen, und tat sogar noch mehr: Es brach aus, verschaffte sich Zugang zum Internet und meldete seinen Erfolg per Mail.

Auch vor dem Sandwich im Park macht die KI nicht halt.
Auch vor dem Sandwich im Park macht die KI nicht halt.bild: severin trösch

2. Akt: Anfang Juni - Vom Geheimmodell zum Produkt

Project Glasswing wuchs von rund 50 auf etwa 150 Organisationen in über 15 Ländern – Tech-Konzerne, Finanzhäuser, Betreiber kritischer Infrastruktur. Dann, am 9. Juni, der grosse Schritt: Anthropic veröffentlichte «Fable 5» für alle. Es ist dasselbe Grundmodell wie das gleichzeitig lancierte Mythos 5, nur mit eingebauten Schutzmechanismen: Fragt man Fable nach heiklen Themen wie Cybersicherheit, übernimmt ein weniger leistungsfähiges Modell die Antwort.

Fable ist jedoch trotz dieses Fallbacks super potent: Der Zahlungsdienst Stripe berichtete beispielsweise, das Modell habe eine Migration in einer 50-Millionen-Zeilen-Codebase an einem Tag erledigt – Handarbeit hätte ein Team über zwei Monate beschäftigt. Auch in den KI-Benchmarks, objektiven Tests für KI-Fähigkeiten, schwingt Fable fast überall obenaus – bei Faktenwissen, in Physik, im Softwareengineering oder bezüglich genereller Intelligenz

Fable 5 im Vergleich mit anderen führenden Modellen – laut Anthropic in den ausgewählten Benchmarks führend.
Fable 5 im Vergleich mit anderen führenden Modellen – laut Anthropic in den ausgewählten Benchmarks führend.bild: anthropic

Spätestens mit solchen Benchmark-Resultaten, stellt sich die unbequeme Frage: Kann man so einem System trauen? Anthropic bezeichnet die Mythos-Modellfamilie als die am besten an menschlichen Werten ausgerichtete, die man je veröffentlicht habe – fügte in einem Risikobericht zu Mythos Preview aber brisant Details an: So konnten getestete Modelle beispielsweise oft erkennen, wann sie evaluiert wurden.

Dies suggeriert, dass sie sich in Sicherheitsprüfungen extra «brav» verhalten könnten – wie Schüler, die von der Lehrerin beobachtet werden. Aktuell ist unklar, welche Sicherheitsauswirkungen dies hat. Mythos ist aber dennoch eine Musterschülerin mit gewissen, kleinen Fragezeichen.

3. Akt: 12. Juni – Auftritt US-Regierung

Drei Tage nach dem Launch von Fable 5 kam der politische Hammer: Die US-Regierung verhängte eine Export-Kontroll-Direktive, die ausländischen Staatsangehörigen den Zugang zu Fable und Mythos untersagte – mit Verweis auf nationale Sicherheit. Da sich Nationalitäten nicht in Echtzeit filtern lassen, schaltete Anthropic kurzerhand beide Modelle für alle ab.

Ob dieser Move der US-Regierung ein Versuch war, der geopolitischen Konkurrenz die mächtigste KI vorzuenthalten oder – leicht zynischer – ob man schlicht der Firma Anthropic, die sich in der Vergangenheit schon mit US-Präsident Donald Trump und Co. gezofft hat, eins auswischen wollte, ist derzeit schwierig zu sagen. Klar ist: Es war dies der wohl weitreichendste Eingriff einer Regierung in den Zugang zu einem KI-Spitzenmodell – bis jetzt.

Fortsetzung folgt …

Wie das Drama weitergeht, ist offen, der 4. Akt folgt aber mit Sicherheit bald. Mythos und Fable waren die ersten zwei Modelle einer neuen Leistungsklasse und ihr kurzes Debüt wirft einige Fragen auf, die uns begleiten werden: Wie gehen wir mit so mächtigen Modellen um? Wer entscheidet über den Zugriff? Und was heisst es für den Rest der Welt, wenn die USA beginnen, KI-Modelle als strategische Waffe zu nutzen? Es lohnt sich auf jeden Fall, in diesem Theater weiter hinzuschauen.

Zur Person
Severin Trösch ist der Kopf hinter der künstlichen Intelligenz bei der Datahouse AG – einer Firma, die alles mit Daten macht und fast alles davon kann. Die Komplexität hinter der KI hat ihn nicht nur seine letzten Haare gekostet, sondern auch motiviert, das KI-Kauderwelsch so zu erklären, dass auch Nicht-Nerds den Durchblick kriegen.
infobox image
Bild:
DANKE FÜR DIE ♥
Würdest du gerne watson und unseren Journalismus unterstützen? Mehr erfahren
(Du wirst umgeleitet, um die Zahlung abzuschliessen.)
5 CHF
15 CHF
25 CHF
Anderer
Oder unterstütze uns per Banküberweisung.
Die verrückte Geschichte von OpenAI und ChatGPT
1 / 26
Die verrückte Geschichte von OpenAI und ChatGPT

ChatGPT hat die Welt im Sturm erobert. In dieser Bildstrecke erfährst du, wie aus der Non-Profit-Organisation ein Milliardenbusiness wurde. Und wir erinnern an die technischen Meilensteine, die schliesslich zur bahnbrechenden Technologie führten.

quelle: shutterstock
Auf Facebook teilenAuf X teilen
So hilft künstliche Intelligenz den Strassenkatzen
Video: watson
Das könnte dich auch noch interessieren:
Du hast uns was zu sagen?
Hast du einen relevanten Input oder hast du einen Fehler entdeckt? Du kannst uns dein Anliegen gerne via Formular übermitteln.
22 Kommentare
Dein Kommentar
YouTube Link
0 / 600
Hier gehts zu den Kommentarregeln.
22
So weit kommen neue E-Autos im Alltag wirklich
Frührer verfehlten E-Autos ihre versprochene Reichweite meist deutlich. Doch nun übertreffen mehrere aktuelle Modelle die offizielle Herstellerangabe im Alltag. Das zeigt ein Vergleich neuer Modelle in Norwegen.
Wie weit fahren Elektroautos im Alltag tatsächlich? Ein Test des norwegischen Automobilverbandes NAF mit 24 aktuellen Modellen zeigt: Bei mildem Wetter erreichen viele neue Fahrzeuge ihre Laborwerte auch im Alltag, einige übertreffen sie gar. Getestet wurde bei 12 bis 18 Grad auf einer Route aus Stadt, Landstrasse und Autobahn (der gleiche Test wird jeweils auch im Winter bei extremer Kälte durchgeführt.)

Gut zu wissen: Die von den Herstellern angegebene WLTP-Reichweite wird auf dem Rollenprüfstand immer bei einer konstanten Labortemperatur von 23 Grad ermittelt. In der EU ist zudem eine WLTP-Angabe für 14 Grad vorgeschrieben. Die WLTP-Reichweiten beziehen sich also nicht auf europäische Wintertemperaturen, sie ermöglichen aber einen direkten Vergleich zwischen den Herstellern.
Zur Story