Die KI kann schon jetzt vieles besser und effizienter als der Mensch.bild: severin trösch

KI-Kosmos

Die Lizenz zum Arbeiten: KI-Agenten und was sie mit James Bond zu tun haben

KI-Agenten können nicht nur Denkaufgaben, sondern auch echte Handlungen übernehmen. Sie erledigen Aufgaben wie E-Mails schreiben, Recherchen im Internet oder die Terminplanung ganz ohne menschliches Zutun. Das macht sie überaus praktisch, aber auch potenziell gefährlich.

09.08.2025, 11:1501.10.2025, 16:23

Severin Trösch

Zwar trinken die heutigen KI-Agenten noch keine Wodka Martinis und tragen keine Pistolen unter dem Smoking, dafür haben sie die grundsätzliche Arbeitsweise mit Agent 007 – aka James Bond – gemeinsam: Nämlich bekommen sie einen Auftrag und gehen selbstständig los, um ihn zu erledigen.

Was ist ein KI-Agent genau?

Ein KI-Agent ist ein Softwareprogramm, das künstliche Intelligenz nutzt, um im Namen eines Benutzers oder Systems Ziele zu verfolgen und Aufgaben zu erledigen. Diese Agenten zeigen logisches Denken, können planen, eigenständig Entscheidungen treffen und Aufgaben bewältigen.

Diese autonomen KI-Systeme lösen aktuell in vielen Bereichen grosses Interesse aus – und werfen dabei auch Fragen auf: Wie funktionieren sie? Wozu sind sie nützlich? Und vor allem: Wo führt uns die Entwicklung der KI-Agenten noch hin? Ein Antwortversuch in drei James-Bond-Begriffen.

Department Q – immer das richtige Tool parat

Reine Sprachmodelle – also KI-Systeme, die Sachtexte, Gedichte oder Kochrezepte verstehen und generieren können – kennen wir aus den letzten Jahren zur Genüge. Oft als Spielerei, manchmal als nützliche Assistenz. Die KI-Agenten heben die potenzielle Nützlichkeit nun auf ein neues Level: Sie können nämlich nicht «nur» Instruktionen verstehen und clevere Antworten geben, sondern auch gleich noch Arbeiten für uns erledigen – sie haben also quasi die Lizenz zum Arbeiten.

Im Prinzip kombiniert ein KI-Agent zwei Komponenten:

Ein state-of-the-art Sprachmodell (sogenannte «Large Language Model» oder einfach «LLM») wie GPT-4o oder Gemini 2.5 – quasi das Gehirn des Systems, welches menschliche Sprache interpretieren, Aufgaben verstehen und Handlungen dazu planen kann.
Toolzugang – also die Fähigkeit, eigenständig Werkzeuge wie Webbrowser, Kalender, E-Mail oder Code-Maschinen zu nutzen und so die geplanten Handlungen am Computer umzusetzen.

Die bisherigen Teile unseres KI-Blogs:

Ein KI-Agent orchestriert so potenziell eine ganze Reihe von Tools und setzt diese autonom ein, wenn sie für eine gegebene Aufgabe gebraucht werden.

Ein KI-Agent kombiniert das Denken und Planen eines Sprachmodells (LLM) mit der Fähigkeit, auf Tools zuzugreifen und Arbeiten am Computer auszuführen.bild: severin Trösch

Ein simples Beispiel: Ich lasse meinen KI-Agenten eine E-Mail formulieren – beispielsweise eine nette Einladung zu meinem Geburtstagsfest. Der Agent formuliert den Text und fragt mich dann, an wen ich die Mail senden möchte. Ich gebe die Einladungsliste an und das Senden frei. Der Agent, welcher im Hintergrund auf mein Mail-Programm zugreifen kann, sendet die Mail raus. Fertig.

Praktisch, nicht? Oder eher creepy? So oder so: Es hört bei den E-Mails noch lange nicht auf.

Die Welt ist nicht genug – Agenten können immer mehr

Schon 2024 wurde als «Year of AI Agents» bezeichnet und 2025 ist das Thema gar noch omnipräsenter. Einige sprechen nun sogar schon von der «Decade of AI Agents». Jedenfalls haben alle grossen Tech-Konzerne längst Lunte gerochen und positionieren sich im KI-Agenten-Markt: OpenAI gab Mitte Juli den «ChatGPT Agent» heraus, ein Tool, das die bisherigen Skills von ChatGPT erweitert und diesem Zugriff auf verschiedene Computerfunktionen gibt. Microsoft hat mit dem «Copilot Studio» – genau wie Google im «Agent Space» – gar einen Bereich geschaffen, in dem man ohne Code eigene Agenten erstellen kann. Man beschreibt in menschlicher Sprache, was der Agent können soll und gibt die nötigen Programmzugriffe frei.

Mit solchen Agenten sind eine ganze Reihe von Arbeiten automatisierbar:

Komplexe Webrecherchen über mehrere Homepages hinweg.
Erstellen von Slidedecks auf der Basis der Webrecherche.
Terminkoordination über mehrere Personen.
Gestalten, implementieren und veröffentlichen ganzer Webseiten.
Etc.

Zwar werden diese Tasks mit den heutigen Systemen nicht immer ganz perfekt gelöst, denn die KI-Agenten machen manchmal noch recht offensichtliche Fehler. Aber schaut man nur wenige Jahre zurück, scheint der aktuelle Grad der KI-Autonomie verblüffend. Und die Kette von Arbeitsschritten, welche durch KI-Agenten verlässlich vollführt werden können, wird sehr schnell länger. Gemäss einer Analyse des Think-Tanks «80'000 Hours» verdoppelt sich die Länge der machbaren Tasks durch KI-Agenten aktuell alle sieben Monate.

Die Tasks, welche durch KI-Agenten zuverlässig erledigt werden können, werden sehr schnell länger.bild: 80000hours.org

Die KI-Agenten werden also exponentiell leistungsfähiger. In der James-Bond-Analogie hiesse dies, dass Agent 007 es heute noch mit drei Gegnern aufnehmen kann, morgen schon mit 30 und in einer Woche mit der ganzen Menschheit gleichzeitig. Dies ist sicher sehr nützlich – solange sich unser Agent auf der richtigen Mission befindet.

Im Auftrag ihrer Majestät – Autonomie vs. Kontrolle

In der James-Bond-Saga spielt «M», die Chefin des britischen Geheimdienstes, eine wichtige Rolle: Nämlich gibt sie 007 die Missionen vor und steuert so den Agenten. Auch muss Bond in den Filmen ab und zu bei M antraben und seine Aktionen rechtfertigen – und manchmal wird ihm sogar der Doppelnull-Status, also die «Lizenz zum Töten», entzogen.

Analog sind es bei den KI-Agenten wir selbst, die den Systemen Missionen vorgeben und sie in der Ausführung kontrollieren. Im Beispiel oben erteilte ich meinem Agenten die Mission, eine E-Mail zu verfassen und musste nachher noch das OK geben, um diese abzusenden. Ich hatte also die volle Kontrolle.

Zur Person

Severin Trösch ist der Kopf hinter der künstlichen Intelligenz bei der Datahouse AG – einer Firma, die alles mit Daten macht und fast alles davon kann. Die Komplexität hinter der KI hat ihn nicht nur seine letzten Haare gekostet, sondern auch motiviert, das KI-Kauderwelsch so zu erklären, dass auch Nicht-Nerds den Durchblick kriegen.

Jedoch sind prinzipiell viel weniger zahme Agenten denkbar. Solche, die nicht bei jedem Schritt in einer Handlungskette die Zustimmung des Menschen einholen. Wenn diese zunehmende Autonomie mit exponentiell zunehmender Leistungsfähigkeit einhergeht, dann wird es – sagen wir – spannend. Wir sollten uns als Menschheit, die wir auf bestem Weg sind, solche Super-Agenten zu bauen, also einige Fragen sehr gut überlegen:

Welche Missionen geben wir der KI vor und wie stellen wir sicher, dass diese nicht missverstanden werden?
Wo sehen wir die Grenzen der KI-Autonomie beim Erfüllen dieser Missionen und welche Tools geben wir frei?
Bis zu welchem Grad sind wir bereit, Komfort gegen Kontrolle einzutauschen?
Und generell: Wo liegt die gesunde Mitte zwischen Blauäugigkeit und Überskepsis bezüglich dieser Systeme?

Diese und viele verwandte Fragen rund um die KI-Agenten sind noch nicht abschliessend beantwortet – und werden auch kaum öffentlich diskutiert. Damit wir aber unsere Rolle als «M» der KI-Agenten gut wahrnehmen und das enorme Potenzial dieser Technologie nutzen können, sollten wir uns dringend damit beschäftigen. Tun wir dies nicht, werden wir möglicherweise bald von den Entwicklungen im KI-Agenten-Bereich durchgeschüttelt – nicht gerührt.

Mehr zur Künstlichen Intelligenz: