Digital
Technik

Kassensturz testet Chatbots: Diese Modelle schneiden am besten ab

FILE - A girl uses her smartphone at home in Arizona on Friday, June 16, 2023. (AP Photo/Darryl Webb, File)
FTC Chatbot AI
KI verändert, wie wir arbeiten, lernen und forschen. Bild: keystone

Chatbot-Vergleich: ChatGPT enttäuscht, andere Modelle punkten

17.12.2025, 10:3717.12.2025, 12:47

Eine «Stange» ist ein langes Brot. Diese Antwort lieferten nach einer Anfrage gleich zwei KI-Chatbots.

Für den Kassensturz testete die Fachhochschule Nordwestschweiz FHNW zehn weitverbreitete Chatbots auf ihre Praxistauglichkeit. Dabei wurden über 300 Fragen aus den Bereichen Alltag, Wissen, Recht und Gesundheit gestellt.

«Vor allem bei Fragen mit Schweiz-Bezug stolpern mehrere Chatbots», sagt Simon Felix, Experte für künstliche Intelligenz an der FHNW, gegenüber der Sendung. «Entweder erfinden sie Antworten – oder sie beantworten die Fragen mit Fokus auf Deutschland.»

Am schlechtesten bewertet wurde der Chatbot Lumo des Schweizer Unternehmens Proton. «Teilweise liefert Lumo Antworten mit nur drei Wörtern – oder sehr lange oder erfundene Antworten», sagt Simon Felix.

Ebenfalls als «ungenügend» eingestuft wurden der chinesische Chatbot Deepseek sowie das Modell von Meta, dem Konzern hinter Facebook, Instagram und WhatsApp.

ChatGPT überzeugt im Test nicht

Das Unternehmen Lumo sagt in einer Stellungnahme: «Lumo ist seit weniger als fünf Monaten auf dem Markt, daher hatten wir im Vergleich zu US- und chinesischen Unternehmen weniger Zeit, die Leistung feinzujustieren.» Die kommenden Modell- und Websuche-Verbesserungen würden den Rückstand weiter verringern.

Auch der meistgenutzten KI-Chatbot ChatGPT konnte nicht überzeugen: «Das Produkt liefert keine schlechten, aber auch keine richtig guten Antworten», so der KI-Experte.

Bild
grafik: srf

Die brauchbarsten Antworten lieferte Chatbot Claude des Unternehmens Anthropic, der von den ehemaligen Forschern von Open AI gegründet wurde. Ebenfalls eine gute Note erhalten haben Copilot von Microsoft und Gemini von Google. (cst)

DANKE FÜR DIE ♥
Würdest du gerne watson und unseren Journalismus unterstützen? Mehr erfahren
(Du wirst umgeleitet, um die Zahlung abzuschliessen.)
5 CHF
15 CHF
25 CHF
Anderer
Oder unterstütze uns per Banküberweisung.
Das könnte dich auch noch interessieren:
Du hast uns was zu sagen?
Hast du einen relevanten Input oder hast du einen Fehler entdeckt? Du kannst uns dein Anliegen gerne via Formular übermitteln.
48 Kommentare
Weil wir die Kommentar-Debatten weiterhin persönlich moderieren möchten, sehen wir uns gezwungen, die Kommentarfunktion 24 Stunden nach Publikation einer Story zu schliessen. Vielen Dank für dein Verständnis!
Die beliebtesten Kommentare
avatar
Madison Pierce
17.12.2025 11:03registriert September 2015
Es ist nicht sinnvoll, bei solch komplexen Themen von "bester" und "schlechtester" zu sprechen. Es sagt auch niemand "das ist das beste Auto".

Ein LLM kann sich gut als virtueller Freund bewähren, aber bei Programmieraufgaben scheitern. Ein anderes erstellt gute Zusammenfassungen, löst aber Mathematikaufgaben nur schlecht.

Zudem ändert sich in diesem Bereich derzeit so viel, dass auch Ranglisten mit vielen Kriterien dauernd einen anderen Sieger ausweisen.
572
Melden
Zum Kommentar
avatar
Plusplus
17.12.2025 12:29registriert Dezember 2021
Für den alltäglichen Gebrauch funktioniert Mistral tiptop. Gute Europäische Alternative, Lumo ist auch ganz OK, das wird schon noch.
Und alle die sich über SBB-Aufträge ans Ausland aufregen sollen sich bitte zuerst selbst von dem Amifesseln lösen. Softmaker statt MS Office, Threema statt Whatsapp, Proton statt Gmail, Startpage statt Google, Mistral statt ChatGPT.
Es geht gut, wenn man denn will.
211
Melden
Zum Kommentar
avatar
creep
17.12.2025 20:02registriert Mai 2025
Warum spricht man hier von Chatbot? Das sind LLM. Ein Chatbot ist dieses nutzlose Ding das inzwischen die meisten Firmen auf ihrer Webseite haben und meistens nur standard Antworten beherrschen.
210
Melden
Zum Kommentar
48
Chatbot-Vergleich: ChatGPT enttäuscht, andere Modelle punkten
Eine «Stange» ist ein langes Brot. Diese Antwort lieferten nach einer Anfrage gleich zwei KI-Chatbots.
Zur Story