Chinese military personnel in a high tech government hacking room Chinese military personnel in a high tech government hacking room work on stealing state secrets from rival countries in hybrid war.

Mutmasslich chinesische Elitehacker missbrauchten ein KI-Programmiertool – mit weitreichenden Folgen.Bild: imago-images.de

Analyse

KI-gesteuerter Hackerangriff aus China zeigt: Jetzt wird es richtig ungemütlich

Das US-Unternehmen Anthropic hat nach eigenen Angaben die erste KI-gesteuerte Cyber-Spionagekampagne vereitelt. Was aufhorchen lässt: Die KI erledigte den Grossteil des Angriffs angeblich selbstständig.

15.11.2025, 14:5518.11.2025, 10:45

Daniel Schurter

Die Fachleute der KI-Entwicklerfirma Anthropic sprechen vom «ersten dokumentierten Fall eines grossangelegten Cyberangriffs, der ohne wesentliches menschliches Eingreifen durchgeführt wurde».

Gemäss dem am Donnerstag veröffentlichten Untersuchungsbericht handelt es sich bei den Angreifern mit «hoher Wahrscheinlichkeit» um eine vom chinesischen Staat geförderte Gruppe, die die Handlungsfähigkeit von KI in einem «beispiellosen Ausmass» nutzte.

Die wichtigsten Fragen und Antworten.

Inhaltsverzeichnis

Warum ist das wichtig?Wie wurden die Sicherheits-Vorkehrungen der KI überlistet?Wie lief der KI-gesteuerte Cyberangriff ab?Wer sind die Angreifer?Und die gute Nachricht?Quellen

Warum ist das wichtig?

Der Wettlauf zwischen Angreifern und Verteidigern, die beide KI einsetzen, nimmt Fahrt auf.

Laut Anthropic werden die mithilfe von generativer künstlicher Intelligenz geführten Cyberangriffe immer gefährlicher respektive durchschlagskräftiger.

Bislang nutzten Hacker KI quasi als Berater. Sie stellten Fragen und erhielten Vorschläge. Die eigentliche Arbeit wurde dann von Menschen erledigt. Doch nun übernimmt zunehmend eine «agentische» KI die meiste Arbeit. Die Menschen geben nur die Richtung vor und greifen gelegentlich ein.

«Produktivitäts-Tools»

Hier kommen sogenannte Programmierassistenten ins Spiel. Aktuell bringt jedes KI-Unternehmen solche Produktivitäts-Tools auf den Markt. OpenAI hat einen solchen Assistenten bei ChatGPT integriert, Microsoft bietet Copilot an und Google «Gemini Code Assist».

Trotz umfangreicher Sicherheitsvorkehrungen der Entwickler kann jedes verfügbare KI-Tool von Dritten geknackt und auf diese Weise missbraucht werden.

Die Ausnutzung von Sicherheitslücken bei Sprachmodellen (LLMs) wird als KI-Jailbreaking bezeichnet. Was Fachleuten Sorge bereitet: Auch weniger erfahrene Hacker können so ausgeklügelte Attacken durchführen.

«Wir veröffentlichen diesen Fall, um einen Beitrag zur Arbeit der breiteren KI-Sicherheits-Community zu leisten und den Akteuren in Industrie, Regierung und der breiteren Forschungsgemeinschaft zu helfen, ihre eigenen Abwehrmassnahmen gegen den Missbrauch von KI-Systemen zu stärken.»

quelle: anthropic.com

Wie wurden die Sicherheits-Vorkehrungen der KI überlistet?

Die Angreifer teilten den geplanten Cyberangriff in kleine, harmlos wirkende Aufgaben auf. Dann erklärten sie gegenüber dem KI-Chatbot Claude, es gehe um einen Angestellten einer seriösen Cybersicherheitsfirma, der Tests zur Abwehr von Hackerangriffen durchführe.

Claude hatte demnach keine Ahnung, dass in Wirklichkeit echte Unternehmen gehackt wurden. Wobei natürlich anzumerken ist, dass solche KI-Chatbots nicht über Intelligenz im engeren Sinn verfügen. Es sind Software-Maschinen, die trainiert wurden, auf jede Eingabe (Prompt) einen möglichst passenden Inhalt auszugeben.

Die Hacker verwendeten Claude Code, den Programmierassistenten von Anthropic. Diese Software kann das Internet durchsuchen, selbstständig Daten abrufen und Programme ausführen. Sie bietet Zugriff auf Passwort-Cracker, Netzwerkscanner und Sicherheitstools.

Bei Reddit kommentiert ein User:

«Es ist ein Wettrüsten. Die Bösen bekommen KI. Die Guten brauchen KI, um mithalten zu können.»

Wie lief der KI-gesteuerte Cyberangriff ab?

Mitte September 2025 stellten die Anthropic-Fachleute in ihren Systemen verdächtige Aktivitäten fest. Diese stellten sich als «hochkomplexe Spionagekampagne» heraus, wie es im Unternehmens-Blog heisst.

Kurz zusammengefasst: Die Hacker «überredeten» den KI-Chatbot Claude, für sie zu hacken. Daraufhin analysierte Claude das von den Angreifern genannte Ziel, entdeckte Sicherheitslücken, schrieb den nötigen Code – einen sogenannten Exploit –, um in das fremde System einzudringen, sammelte Passwörter, extrahierte Daten und dokumentierte alles. Und dies selbstständig, bis auf wenige Anweisungen der menschlichen Täter.

Phase 1: Claude untersuchte über das Internet die IT-Systeme des Opfers. Die KI fand die wichtigsten Datenbanken. Und das laut Bericht viel schneller, als es menschlichen Hackern möglich gewesen wäre.
Phase 2: Als Sicherheitslücken gefunden waren, schrieb der KI-Programmierassistent den Exploit-Code, um ins fremde System einzubrechen.
Phase 3: Nachdem er heimlich ins System eingedrungen war, sammelte er dort Zugangsdaten – also Benutzernamen und Passwörter – von Administratoren, um weitreichende Zugriffsrechte zu erlangen.
Phase 4: Die KI extrahierte grosse Mengen an privaten Daten aus dem fremden System und übermittelte diese an einen Server der Angreifer. Diese Beute sortierte er gleich nach ihrem Informationswert.
Phase 5: Nun wurden im fremden System «Hintertüren» für zukünftige heimliche Zugriffe geschaffen. Alles für die menschlichen User dokumentiert.

Ablauf eines KI-gesteuerte Cyberangriffs, Grafik: Anthropix

An verschiedenen Punkten während des Angriffs meldet sich die KI zur Überprüfung und weiteren Steuerung bei ihren menschlichen Bedienern zurück.grafik: Anthropic

Laut Anthropic konnten die Angreifer 80–90 Prozent der Kampagne mithilfe von KI durchführen, wobei menschliches Eingreifen nur sporadisch erforderlich war.

Die KI stellte Tausende von Anfragen, «oft mehrere pro Sekunde». Eine solche Angriffsgeschwindigkeit sei für Menschen unmöglich zu erreichen.

Aber: Das Problem der KI-Halluzinationen bleibt auch bei der Nutzung durch Cyberkriminelle bestehen:

«Claude funktionierte nicht immer einwandfrei. Gelegentlich erzeugte es falsche Zugangsdaten oder behauptete, geheime Informationen extrahiert zu haben, die in Wirklichkeit öffentlich zugänglich waren. Dies stellt weiterhin ein Hindernis für vollständig autonome Cyberangriffe dar.»

Wer sind die Angreifer?

Nach Einschätzung von Anthropic handelt es sich «mit hoher Wahrscheinlichkeit» um eine staatlich geförderte Elitehackergruppe der Volksrepublik China.

Ihre nun entdeckte Operation zielte laut Mitteilung auf grosse Tech-Unternehmen, Finanzinstitute, Chemieunternehmen und Regierungsbehörden ab.

Und die gute Nachricht?

Generative KI ist nicht nur auf der Täterseite äusserst hilfreich, sondern kommt auch der Abwehr von solchen Angriffen und der späteren Aufklärung zugute.

Laut den Anthropic-Entwicklern machen Claudes Fähigkeiten ihn für die Cyberabwehr unerlässlich.

«Wenn es unweigerlich zu komplexen Cyberangriffen kommt, ist es unser Ziel, dass Claude – in den wir starke Sicherheitsvorkehrungen integriert haben – Cybersicherheitsexperten dabei unterstützt, diese Angriffe zu erkennen, abzuwehren und sich auf zukünftige Varianten vorzubereiten.»

Was ist Vibe Hacking?

«Vibe Coding» steht für das automatisierte Erstellen von Programmcode, respektive Software, mithilfe von generativer künstlicher Intelligenz. Menschen geben einem KI-Chatbot in natürlicher Sprache Anweisungen und herauskommt eine Software. Beim «Vibe Hacking» wird diese Vorgehensweise auf kriminelle Aktivitäten angewendet: Eine KI plant die Aktionen, schreibt den Code, passt sich den Abwehrmechanismen an und wiederholt das Ganze in grossem Umfang.

KI hilft Angreifern also nicht nur dabei, effektivere Phishing-E-Mails oder Schadsoftware (Exploits) zu erstellen. Sie wirkt als Multiplikator und ermöglicht es Einzelpersonen, Angriffe in einem Umfang und mit einer Raffinesse durchzuführen, die bisher koordinierten Cyberkriminellengruppen vorbehalten waren.

Die KI-Enwicklerfirma Anthropic hat bereits Fälle dokumentiert, in denen der hauseigene KI-Programmierassistent Claude Code verwendet wurde.

Quellen

anthropic.com: Disrupting the first reported AI-orchestrated cyber espionage campaign
anthropic.com: Disrupting the first reported AI-orchestrated cyber espionage campaign (Bericht, PDF)
reddit.com: Thread zum Thema
anthropic.com: Detecting and countering misuse of AI: August 2025

Generative KI greift laut Entwicklerfirma zu User-Erpressung – «aus Selbstschutz»

Steibocktschingg

15.11.2025 15:31registriert Januar 2018

Irgendwie wird das mit der "Dead Internet"-Hypothese jeden Tag wahrscheinlicher. KI gegen KI, KIs die den Müll anderer KIs nehmen um noch mehr Müll zu produzieren, KIs, die andere KIs mit Schwachsinn zuspammen...

1515

Melden

Zum Kommentar

000614.06c54067@apple

15.11.2025 15:22registriert März 2024

Willkommen in der schönen neuen Welt. Nicht
Auszudenken was mit genügend krimineller Energie noch alles möglich wird. Stimm-,Bild-, Tonerstellung, -veränderung mit KI die immer besser und die Artefakte immer schwieriger von echten zu unterscheiden.
Und die Menschen verlieren das denken.

1149

Clife

15.11.2025 15:34registriert Juni 2018

Ich finde es wirklich unfassbar, dass die Superreichen und Mächtigen sich hier gegenseitig bekämpfen und anstatt Sicherheit einfach nur noch mehr Geld wollen…Trump ist ein Vollidiot und dass der Bundesrat vor ihm kuscht zeigt dass sie genauso verblödet sind…200 Mia in IT Sicherheit investieren wäre allemal besser als hier jetzt an die Zölle zu denken.

9126

KI-gesteuerter Hackerangriff aus China mit Programmiertool Claude Code