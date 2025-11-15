Mutmasslich chinesische Elitehacker missbrauchten ein KI-Programmiertool – mit weitreichenden Folgen. Bild: imago-images.de

Analyse

KI-gesteuerter Hackerangriff aus China zeigt: Jetzt wird es richtig ungemütlich

Das US-Unternehmen Anthropic hat nach eigenen Angaben die erste KI-gesteuerte Cyber-Spionagekampagne vereitelt. Was aufhorchen lässt: Die KI erledigte den Grossteil des Angriffs selbstständig.

Daniel Schurter Folge mir

Mehr «Digital»

Die Fachleute der KI-Entwicklerfirma Anthropic sprechen vom «ersten dokumentierten Fall eines grossangelegten Cyberangriffs, der ohne wesentliches menschliches Eingreifen durchgeführt wurde».

Gemäss dem am Donnerstag veröffentlichten Untersuchungsbericht handelt es sich bei den Angreifern mit «hoher Wahrscheinlichkeit» um eine vom chinesischen Staat geförderte Gruppe, die die Handlungsfähigkeit von KI in einem «beispiellosen Ausmass» nutzte.

Die wichtigsten Fragen und Antworten.

Warum ist das wichtig?

Der Wettlauf zwischen Angreifern und Verteidigern, die beide KI einsetzen, nimmt Fahrt auf.

Laut Anthropic werden die mithilfe von generativer künstlicher Intelligenz geführten Cyberangriffe immer gefährlicher, respektive durchschlagkräftiger.

Bislang nutzen Hacker KI quasi als Berater. Sie stellten Fragen und erhielten Vorschläge. Die eigentliche Arbeit wurde dann von Menschen erledigt. Doch nun erledigt die KI die meiste Arbeit. Die Menschen geben nur die Richtung vor und greifen gelegentlich ein.

«Produktivitätstools»

Hier kommen sogenannte Programmierassistenten ins Spiel. Aktuell bringt jedes KI-Unternehmen solche Produktivitätstools auf den Markt. OpenAI hat einen solchen Assistenten bei ChatGPT integriert, Microsoft bietet «Copilot» an und Google «Gemini Code Assist».

Trotz umfangreicher Sicherheitsvorkehrungen der Entwickler kann jedes verfügbare KI-Tool von Dritten geknackt und auf diese Weise missbraucht werden.

Die Ausnutzung von Sicherheitslücken bei Sprachmodellen (LLMs) wird als KI-Jailbreaking bezeichnet. Was Fachleuten Sorge bereitet: Auch weniger erfahrene Hacker können so ausgeklügelte Attacken durchführen.

«Wir veröffentlichen diesen Fall, um einen Beitrag zur Arbeit der breiteren KI-Sicherheits-Community zu leisten und den Akteuren in Industrie, Regierung und der breiteren Forschungsgemeinschaft zu helfen, ihre eigenen Abwehrmassnahmen gegen den Missbrauch von KI-Systemen zu stärken.» quelle: anthropic.com

Wie wurden die Sicherheits-Vorkehrungen der KI überlistet?

Die Angreifer teilten den geplanten Cyberangriff in kleine, harmlos wirkende Aufgaben auf. Dann erklärten sie gegenüber dem KI-Chatbot, es gehe um einen Angestellten einer seriösen Cybersicherheitsfirma, der Tests zur Abwehr von Hackerangriffen durchführe.

Claude hatte demnach keine Ahnung, dass in Wirklichkeit echte Unternehmen gehackt wurden. Wobei natürlich anzumerken ist, dass solche KI-Chatbots nicht über Intelligenz im engeren Sinn verfügen. Es sind Software-Maschinen, die trainiert wurden, auf jede Eingabe (Prompt) einen möglichst passenden Inhalt auszugeben.

Die Hacker verwendeten «Claude Code», den Programmierassistenten von Anthropic. Diese Software kann das Internet durchsuchen, selbstständig Daten abrufen und Programme ausführen. Es bietet Zugriff auf Passwort-Cracker, Netzwerkscanner und Sicherheitstools.

Bei Reddit kommentiert ein User:

«Es ist ein Wettrüsten. Die Bösen bekommen KI. Die Guten brauchen KI, um mithalten zu können.»

Wie lief der KI-gesteuerte Cyberangriff ab?

Mitte September 2025 stellten die Anthropic-Fachleute in ihren Systemen verdächtige Aktivitäten fest. Diese stellten sich als «hochkomplexe Spionagekampagne» heraus, wie es im Unternehmens-Blog heisst.

Kurz zusammengefasst: Die Hacker «überredeten» den KI-Chatbot Claude, für sie zu hacken. Daraufhin analysierte Claude das von den Angreifern genannten Ziel, entdeckte Sicherheitslücken, schrieb den nötigen Code, einen sogenannten Exploit, um in das fremde System einzudringen, sammelte Passwörter, extrahierte Daten und dokumentierte alles. Und dies selbstständig, bis auf wenige Anweisungen der menschlichen Täter.

Phase 1: Claude untersuchte über das Internet die IT-Systeme des Opfers. Die KI fand die wichtigsten Datenbanken. Und das laut Bericht viel schneller, als es menschlichen Hackern möglich gewesen wäre.

Claude untersuchte über das Internet die IT-Systeme des Opfers. Die KI fand die wichtigsten Datenbanken. Und das laut Bericht viel schneller, als es menschlichen Hackern möglich gewesen wäre. Phase 2: Als Sicherheitslücken gefunden waren, schrieb der KI-Programmierassistent den Exploit-Code, um ins fremde System einzubrechen.

Als Sicherheitslücken gefunden waren, schrieb der KI-Programmierassistent den Exploit-Code, um ins fremde System einzubrechen. Phase 3: Nachdem er heimlich ins System eingedrungen war, sammelte er dort Zugangsdaten, also Benutzernamen und Passwörter, von Administratoren. Um weitreichende Zugriffsrechte zu erlangen.

Nachdem er heimlich ins System eingedrungen war, sammelte er dort Zugangsdaten, also Benutzernamen und Passwörter, von Administratoren. Um weitreichende Zugriffsrechte zu erlangen. Phase 4: Die KI extrahierte grosse Mengen an privaten Daten aus dem fremden System und übermittelte diese an einen Server der Angreifer. Diese Beute sortierte er gleich nach ihrem Informationswert.

Die KI extrahierte grosse Mengen an privaten Daten aus dem fremden System und übermittelte diese an einen Server der Angreifer. Diese Beute sortierte er gleich nach ihrem Informationswert. Phase 5: Nun wurden im fremden System «Hintertüren» für zukünftige heimliche Zugriffe geschaffen. Alles für die menschlichen User dokumentiert.

An verschiedenen Punkten während des Angriffs meldet sich die KI zur Überprüfung und weiteren Steuerung bei ihren menschlichen Bedienern zurück. grafik: Anthropic

Laut Anthropic konnten die Angreifer 80–90 Prozent der Kampagne mithilfe von KI durchführen, wobei menschliches Eingreifen nur sporadisch erforderlich war.

Die KI stellte Tausende von Anfragen, «oft mehrere pro Sekunde». Eine solche Angriffsgeschwindigkeit sei für Menschen unmöglich zu erreichen.

Aber: Das Problem der KI-Halluzinationen bleibt auch bei der Nutzung durch Cyberkriminelle bestehen:

«Claude funktionierte nicht immer einwandfrei. Gelegentlich erzeugte es falsche Zugangsdaten oder behauptete, geheime Informationen extrahiert zu haben, die in Wirklichkeit öffentlich zugänglich waren. Dies stellt weiterhin ein Hindernis für vollständig autonome Cyberangriffe dar.»

Wer sind die Angreifer?

Nach Einschätzung von Anthropic handelt es sich «mit hoher Wahrscheinlichkeit» um eine staatlich geförderte Elitehackergruppe der Volksrepublik China.

Ihre nun entdeckte Operation zielte laut Mitteilung auf grosse Techunternehmen, Finanzinstitute, Chemieunternehmen und Regierungsbehörden ab.

Und die gute Nachricht?

Generative KI ist nicht nur auf der Täterseite äusserst hilfreich, sondern kommt auch der Abwehr von solchen Angriffen und der späteren Aufklärung zugute.

Laut den Anthropic-Entwicklern machen Claudes Fähigkeiten ihn für die Cyberabwehr unerlässlich.

«Wenn es unweigerlich zu komplexen Cyberangriffen kommt, ist es unser Ziel, dass Claude – in den wir starke Sicherheitsvorkehrungen integriert haben – Cybersicherheitsexperten dabei unterstützt, diese Angriffe zu erkennen, abzuwehren und sich auf zukünftige Varianten vorzubereiten.»

Was hat das mit «Vibe Hacking» zu tun? Sehr wenig. Der Begriff «Vibe Hacking» (vom englischen «Vibe» für Stimmung/Atmosphäre) bezeichnet die gezielte Manipulation von Personen oder Gruppen, oft unter Verwendung technischer Mittel wie künstlicher Intelligenz. Dabei verwenden menschliche Angreifer KI-Chatbots, um Inhalte zu erzeugen, die auf der Opferseite emotional etwas auslösen sollen.



Konkret wird dies beim Social Engineering eingesetzt, also bei Angriffen, bei denen das Gegenüber dazu gebracht werden soll, Informationen preiszugeben oder auf dem eigenen System etwas auszuführen, um dem Angreifer ungewollt Zugriff zu verschaffen. Generative KI hilft, Menschen zu täuschen. Bild: Shutterstock