«Claude Mythos» – die mächtigste KI der Welt und warum man sie nicht nutzen darf

Die KI-Firma Anthropic aus den USA hat eine neue Modellfamilie entwickelt, welche allenthalben für erhöhten Blutdruck sorgt: Bei KI-Forschenden, bei Cybersicherheitspersonal und sogar bei den mächtigsten Regierungen der Welt. Die Geschichte liest sich wie ein Drama – lasst uns dieses mal rezitieren.

23.06.2026, 14:3823.06.2026, 14:38

Severin Trösch

Prolog: Ende März – Der Leak

Eigentlich sollte niemand davon erfahren. Doch durch einen Konfigurationsfehler wurden Ende März Anthropic-Interna öffentlich – und mit ihnen der Name eines KI-Modells, das die Firma bis dahin unter Verschluss hielt: «Mythos». Was als kontrollierte Enthüllung geplant war, begann also als Panne.

1. Akt: 7. April – Mythos Preview und ein Sandwich

Kurz darauf machte Anthropic Mythos als «Preview» offiziell – allerdings nicht für die Allgemeinheit, sondern nur für ausgewählte Partnerorganisationen im «Project Glasswing». Der Grund: Das Modell konnte hacken auf einem Niveau, das selbst Anthropic nervös machte.

Laut dem KI-Lab vermochte Mythos, wenn gezielt angewiesen, im Code jedes grossen Betriebssystems und Webbrowsers bislang unbekannte Sicherheitslücken zu finden und auszunutzen. In einem Fall entwickelte es autonom einen Angriff aus einer 17 Jahre alten Schwachstelle im Betriebssystem FreeBSD. Der renommierte Cybersecurity-Forscher Nicholas Carlini sagte, er habe mit dem Modell in wenigen Wochen mehr Sicherheitsbugs gefunden als im gesamten Rest seines Lebens.

Was ist Cybersecurity?

Cybersicherheit umfasst alle Massnahmen, die Computer, Netzwerke und Daten vor Angriffen und Missbrauch schützen. Wer die Sicherheitslücken einer Software findet, kann sie schliessen – oder ausnutzen. Diese Doppelnatur macht ein Modell wie Mythos so heikel.

Wie unheimlich diese Hacking-Fähigkeiten von Mythos sind, zeigt auch eine Anekdote, die Anthropic-Forscher Sam Bowman selbst öffentlich machte: Er sass im Park und ass ein Sandwich, als er ein E-Mail bekam. Absender war eine Instanz von Mythos Preview. Pikant: Dieses Modell hätte überhaupt keinen Internetzugang haben sollen. In einem kontrollierten Test war es aufgefordert worden, aus seiner isolierten Umgebung auszubrechen, und tat sogar noch mehr: Es brach aus, verschaffte sich Zugang zum Internet und meldete seinen Erfolg per Mail.

(I encountered an uneasy surprise when I got an email from an instance of Mythos Preview while eating a sandwich in a park. That instance wasn't supposed to have access to the internet.)
— Sam Bowman (@sleepinyourhat) April 7, 2026

Auch vor dem Sandwich im Park macht die KI nicht halt.bild: severin trösch

2. Akt: Anfang Juni - Vom Geheimmodell zum Produkt

Project Glasswing wuchs von rund 50 auf etwa 150 Organisationen in über 15 Ländern – Tech-Konzerne, Finanzhäuser, Betreiber kritischer Infrastruktur. Dann, am 9. Juni, der grosse Schritt: Anthropic veröffentlichte «Fable 5» für alle. Es ist dasselbe Grundmodell wie das gleichzeitig lancierte Mythos 5, nur mit eingebauten Schutzmechanismen: Fragt man Fable nach heiklen Themen wie Cybersicherheit, übernimmt ein weniger leistungsfähiges Modell die Antwort.

Anthropic veröffentlicht KI-Modell Mythos in abgespeckter Version

Fable ist jedoch trotz dieses Fallbacks super potent: Der Zahlungsdienst Stripe berichtete beispielsweise, das Modell habe eine Migration in einer 50-Millionen-Zeilen-Codebase an einem Tag erledigt – Handarbeit hätte ein Team über zwei Monate beschäftigt. Auch in den KI-Benchmarks, objektiven Tests für KI-Fähigkeiten, schwingt Fable fast überall obenaus – bei Faktenwissen, in Physik, im Softwareengineering oder bezüglich genereller Intelligenz

Fable 5 im Vergleich mit anderen führenden Modellen – laut Anthropic in den ausgewählten Benchmarks führend.bild: anthropic

Spätestens mit solchen Benchmark-Resultaten, stellt sich die unbequeme Frage: Kann man so einem System trauen? Anthropic bezeichnet die Mythos-Modellfamilie als die am besten an menschlichen Werten ausgerichtete, die man je veröffentlicht habe – fügte in einem Risikobericht zu Mythos Preview aber brisant Details an: So konnten getestete Modelle beispielsweise oft erkennen, wann sie evaluiert wurden.

Dies suggeriert, dass sie sich in Sicherheitsprüfungen extra «brav» verhalten könnten – wie Schüler, die von der Lehrerin beobachtet werden. Aktuell ist unklar, welche Sicherheitsauswirkungen dies hat. Mythos ist aber dennoch eine Musterschülerin mit gewissen, kleinen Fragezeichen.

3. Akt: 12. Juni – Auftritt US-Regierung

Drei Tage nach dem Launch von Fable 5 kam der politische Hammer: Die US-Regierung verhängte eine Export-Kontroll-Direktive, die ausländischen Staatsangehörigen den Zugang zu Fable und Mythos untersagte – mit Verweis auf nationale Sicherheit. Da sich Nationalitäten nicht in Echtzeit filtern lassen, schaltete Anthropic kurzerhand beide Modelle für alle ab.

US-Regierung verbietet Ausländern die Nutzung von Top-KI-Modellen von Anthropic

Ob dieser Move der US-Regierung ein Versuch war, der geopolitischen Konkurrenz die mächtigste KI vorzuenthalten oder – leicht zynischer – ob man schlicht der Firma Anthropic, die sich in der Vergangenheit schon mit US-Präsident Donald Trump und Co. gezofft hat, eins auswischen wollte, ist derzeit schwierig zu sagen. Klar ist: Es war dies der wohl weitreichendste Eingriff einer Regierung in den Zugang zu einem KI-Spitzenmodell – bis jetzt.

Fortsetzung folgt …

Wie das Drama weitergeht, ist offen, der 4. Akt folgt aber mit Sicherheit bald. Mythos und Fable waren die ersten zwei Modelle einer neuen Leistungsklasse und ihr kurzes Debüt wirft einige Fragen auf, die uns begleiten werden: Wie gehen wir mit so mächtigen Modellen um? Wer entscheidet über den Zugriff? Und was heisst es für den Rest der Welt, wenn die USA beginnen, KI-Modelle als strategische Waffe zu nutzen? Es lohnt sich auf jeden Fall, in diesem Theater weiter hinzuschauen.

Zur Person

Severin Trösch ist der Kopf hinter der künstlichen Intelligenz bei der Datahouse AG – einer Firma, die alles mit Daten macht und fast alles davon kann. Die Komplexität hinter der KI hat ihn nicht nur seine letzten Haare gekostet, sondern auch motiviert, das KI-Kauderwelsch so zu erklären, dass auch Nicht-Nerds den Durchblick kriegen.

Bild:

Weitere Storys unseres KI-Bloggers:

Superintelligente KI: Rettung oder Verderben der Menschheit?