«Claude Mythos» – die mächtigste KI der Welt und warum man sie nicht nutzen darf
Prolog: Ende März – Der Leak
Eigentlich sollte niemand davon erfahren. Doch durch einen Konfigurationsfehler wurden Ende März Anthropic-Interna öffentlich – und mit ihnen der Name eines KI-Modells, das die Firma bis dahin unter Verschluss hielt: «Mythos». Was als kontrollierte Enthüllung geplant war, begann also als Panne.
1. Akt: 7. April – Mythos Preview und ein Sandwich
Kurz darauf machte Anthropic Mythos als «Preview» offiziell – allerdings nicht für die Allgemeinheit, sondern nur für ausgewählte Partnerorganisationen im «Project Glasswing». Der Grund: Das Modell konnte hacken auf einem Niveau, das selbst Anthropic nervös machte.
Laut dem KI-Lab vermochte Mythos, wenn gezielt angewiesen, im Code jedes grossen Betriebssystems und Webbrowsers bislang unbekannte Sicherheitslücken zu finden und auszunutzen. In einem Fall entwickelte es autonom einen Angriff aus einer 17 Jahre alten Schwachstelle im Betriebssystem FreeBSD. Der renommierte Cybersecurity-Forscher Nicholas Carlini sagte, er habe mit dem Modell in wenigen Wochen mehr Sicherheitsbugs gefunden als im gesamten Rest seines Lebens.
Wie unheimlich diese Hacking-Fähigkeiten von Mythos sind, zeigt auch eine Anekdote, die Anthropic-Forscher Sam Bowman selbst öffentlich machte: Er sass im Park und ass ein Sandwich, als er ein E-Mail bekam. Absender war eine Instanz von Mythos Preview. Pikant: Dieses Modell hätte überhaupt keinen Internetzugang haben sollen. In einem kontrollierten Test war es aufgefordert worden, aus seiner isolierten Umgebung auszubrechen, und tat sogar noch mehr: Es brach aus, verschaffte sich Zugang zum Internet und meldete seinen Erfolg per Mail.
(I encountered an uneasy surprise when I got an email from an instance of Mythos Preview while eating a sandwich in a park. That instance wasn't supposed to have access to the internet.)
— Sam Bowman (@sleepinyourhat) April 7, 2026
2. Akt: Anfang Juni - Vom Geheimmodell zum Produkt
Project Glasswing wuchs von rund 50 auf etwa 150 Organisationen in über 15 Ländern – Tech-Konzerne, Finanzhäuser, Betreiber kritischer Infrastruktur. Dann, am 9. Juni, der grosse Schritt: Anthropic veröffentlichte «Fable 5» für alle. Es ist dasselbe Grundmodell wie das gleichzeitig lancierte Mythos 5, nur mit eingebauten Schutzmechanismen: Fragt man Fable nach heiklen Themen wie Cybersicherheit, übernimmt ein weniger leistungsfähiges Modell die Antwort.
Fable ist jedoch trotz dieses Fallbacks super potent: Der Zahlungsdienst Stripe berichtete beispielsweise, das Modell habe eine Migration in einer 50-Millionen-Zeilen-Codebase an einem Tag erledigt – Handarbeit hätte ein Team über zwei Monate beschäftigt. Auch in den KI-Benchmarks, objektiven Tests für KI-Fähigkeiten, schwingt Fable fast überall obenaus – bei Faktenwissen, in Physik, im Softwareengineering oder bezüglich genereller Intelligenz
Spätestens mit solchen Benchmark-Resultaten, stellt sich die unbequeme Frage: Kann man so einem System trauen? Anthropic bezeichnet die Mythos-Modellfamilie als die am besten an menschlichen Werten ausgerichtete, die man je veröffentlicht habe – fügte in einem Risikobericht zu Mythos Preview aber brisant Details an: So konnten getestete Modelle beispielsweise oft erkennen, wann sie evaluiert wurden.
Dies suggeriert, dass sie sich in Sicherheitsprüfungen extra «brav» verhalten könnten – wie Schüler, die von der Lehrerin beobachtet werden. Aktuell ist unklar, welche Sicherheitsauswirkungen dies hat. Mythos ist aber dennoch eine Musterschülerin mit gewissen, kleinen Fragezeichen.
3. Akt: 12. Juni – Auftritt US-Regierung
Drei Tage nach dem Launch von Fable 5 kam der politische Hammer: Die US-Regierung verhängte eine Export-Kontroll-Direktive, die ausländischen Staatsangehörigen den Zugang zu Fable und Mythos untersagte – mit Verweis auf nationale Sicherheit. Da sich Nationalitäten nicht in Echtzeit filtern lassen, schaltete Anthropic kurzerhand beide Modelle für alle ab.
Ob dieser Move der US-Regierung ein Versuch war, der geopolitischen Konkurrenz die mächtigste KI vorzuenthalten oder – leicht zynischer – ob man schlicht der Firma Anthropic, die sich in der Vergangenheit schon mit US-Präsident Donald Trump und Co. gezofft hat, eins auswischen wollte, ist derzeit schwierig zu sagen. Klar ist: Es war dies der wohl weitreichendste Eingriff einer Regierung in den Zugang zu einem KI-Spitzenmodell – bis jetzt.
Fortsetzung folgt …
Wie das Drama weitergeht, ist offen, der 4. Akt folgt aber mit Sicherheit bald. Mythos und Fable waren die ersten zwei Modelle einer neuen Leistungsklasse und ihr kurzes Debüt wirft einige Fragen auf, die uns begleiten werden: Wie gehen wir mit so mächtigen Modellen um? Wer entscheidet über den Zugriff? Und was heisst es für den Rest der Welt, wenn die USA beginnen, KI-Modelle als strategische Waffe zu nutzen? Es lohnt sich auf jeden Fall, in diesem Theater weiter hinzuschauen.
- Wenn jemand sie baut, sterben alle – die radikale These über superintelligente KI
- OpenClaw: Wie ein KI-Wurm die Welt ins Verderben stürzen könnte
- KI entdeckt die Welt: «World Models» und was sie versprechen
- Kann KI wirklich kreativ sein? Ja, aber nicht so, wie du vielleicht denkst
- Das Ende des Internets? Warum so viel KI-Müll entsteht und wie wir ihn stoppen können
- Klimakillerin KI – was am Vorwurf dran ist und was nicht
