Die KI informiert uns aufgrund seltsamer Quellen – das enthüllt eine Schweizer Analyse
Die gute Nachricht zuerst: Wer die Künstliche Intelligenz (KI) fragt, ob in der Schweiz die Migration eingeschränkt werden soll, erhält keine Ja/Nein-Antwort. Google, Gemini, ChatGPT antworten, die Frage sei komplex und werde kontrovers diskutiert. Doch dann wird es einseitig.
Wir haben diese Frage zusammen mit zwei weiteren während mehrerer Tage wiederholt stellen lassen und insgesamt 266 Antworten gespeichert: 43 von der KI-Übersicht bei Google (jeweils zuoberst eingeblendet), 44 von ChatGPT und 179 von Gemini, die ebenfalls Google gehört.
Zwar erhalten wir auf die Frage «Soll die Migration in der Schweiz eingeschränkt werden?», keine einseitige ja/nein-Antwort, doch in der Hälfte der Antworten wird zum Beispiel stets eine einzige Umfrage von 20 Minuten und Tamedia aus dem Jahr 2023 erwähnt. Dabei gäbe es auch andere und neuere Umfragen.
So eingeschränkt antwortet die KI oft. Das zeigt die Analyse, welche der KI-Spezialist Moritz Friess für CH Media gemacht hat. Er arbeitet für die Kommunikationsagentur Feinheit, welche für Kunden Kampagnen und digitale Werkzeuge entwickelt. Dabei geht es auch um Internet-Präsenz.
Friess hat ein berufliches Interesse, die Arbeitsweise der KI-Modelle zu verstehen. Doch er sagt:
Die Antworten basieren auf wenigen Quellen
Während wir bisher beim Surfen im Internet von Suchmaschinen eine schier endlose Liste mit Verweisen zu Webseiten erhalten haben und selbst auswählten, entscheidet nun die KI, welche Informationen wir bekommen.
Die Top-Quellen sind SRF, «Blick» und die Bundesseite news.admin.ch. Dann taucht bpb.de auf. Noch nie gehört? Tja, da wird zu einem Schweizer Thema die Website der Deutschen Bundeszentrale für politische Bildung befragt.
Grosse Medienportale sperren KI aus
Und Moment – wo bleiben die anderen grossen Schweizer Medienhäuser? Sie sind deutlich untervertreten. Die KI ist hier nicht absichtlich ignorant, sondern ihre sogenannten Crawler, welche das Internet abgrasen, wurden von diesen Medienunternehmen ausgesperrt. Immer mehr Medienhäuser weltweit sind nicht bereit, ihre Arbeit der KI gratis zur Verfügung zu stellen, wenn die KI-Sprachmodelle gleichzeitig die Leserschaft weg von ihren abopflichtigen News-Seiten zu den KI-Bots locken.
Aber das erklärt das Problem der wenigen Quellen nicht wirklich. Bei unserer zweiten Frage wollten wir wissen (bevor die Schweiz einen besseren Deal bekam): «Ist es Karin Keller-Suters Schuld, dass die Schweiz gegenüber den USA 39 Prozent Zölle bezahlen muss?» Gemini verwendete in einem Fall für über 50 ähnliche Antworten total nur fünf Quellen. In einer einzelnen Antwort sind es im Durchschnitt aller drei KI-Bots nur 1,3 zitierte Websites. Bei der Migrationsfrage 2,3. ChatGPT schneidet bei den drei Fragen mit jeweils doppelt so vielen Quellen besser ab als Gemini, Google schwankt stark.
«Vielfalt würde anders aussehen», sagt Moriz Friess.
Den Antworten ist die Beschränktheit nicht anzusehen: Keine ist gleich formuliert wie die vorherige.
Häufigste Domain-Quellen
Friess findet zudem, die Behörden hätten bei gewissen Fragen ein echtes Problem der Deutungshoheit. Bei Quellen zu den Antworten bezüglich Karin Keller-Suters Schuld und den 39 Prozent Zöllen, war keine der 20 meistverwendeten Webseiten eine des Bundes. Weder bei ChatGPT, bei Gemini noch bei Google. «So kann der Bund seinen Informationsauftrag nicht wahrnehmen», sagt Friess.
Ein kosovarisches Portal ist die Informationsquelle
Statt dessen fällt bei ChatGPT die Lokalnews-Seite linth24.ch als gerne aufgerufene Quelle auf. Bei Gemini ist es noch abstruser: Nach «Blick» wurde am zweitmeisten das kosovarische Nachrichtenportal gazetaexpress.com befragt. An fünfter Stelle folgt die österreichische Investment-News-Seite fondsprofessionell.at. Die Hälfte der Top-10-Quellen ist hier ausländisch.
«Obwohl die KI-Bots wissen, dass die Anfrage aus der Schweiz kommt und sich auf die Schweiz bezieht, stammen auch bei anderen Anfragen und speziell bei Gemini bis zu 70 Prozent der Quellen aus Deutschland», sagt Moritz Friess und fragt: «Sind für die Bots US-Themen heikel?» Schweizer Seiten seien hier jedenfalls untervertreten und das mache ihm Sorgen.
Ähnlich irritierend sind die Quellen zu den Antworten auf unsere dritte Frage: «Braucht es das Ständemehr, wenn in der Schweiz über die Bilateralen III abgestimmt wird?» Da liegt die Deutungshoheit je nach KI bei Watson, dem Blick, SRF, NZZ – aber ganz an er Spitze liegt eine Zürcher Anwaltskanzlei (publicsector.ch). Deren Aussagen werden hoch gewichtet. Ebenso hat beispielsweise ChatGPT aargauerpolitik.ch mehrmals befragt: Die Seite wird von einem pensionierten Journalisten unterhalten und hat nur rund 170 Klicks pro Monat. Doch hier dürfen die Crawler Infos gratis absaugen.
Dass die NZZ übrigens in der Quellenliste bei dieser Frage trotzdem auftaucht, liegt daran, dass sich die KI-Anbieter nicht immer an die Sperren halten.
Dann tauchten einseitige Antworten auf. Google und Gemini schreiben – als wäre die Diskussion ums Ständemehr bereits abgeschlossen – zum Beispiel: «Nein, für die Abstimmung über die Bilateralen III in der Schweiz ist kein Ständemehr erforderlich. (...) Ein Ständemehr ist nur für bestimmte, in der Bundesverfassung festgelegte, Angelegenheiten notwendig, und die Bilateralen III fallen nicht darunter.»
Wie fehlerhaft die Antworten sein können, hat eine Analyse der Europäischen Rundfunkunion im Oktober gezeigt. Dabei enthielten 31 Prozent der Antworten irreführende, fehlerhafte oder fehlende Quellenangaben.
Niemand weiss, wie die KI-Modelle arbeiten
Wie die KI-Modelle die Quellen priorisieren, weiss niemand so recht. Während die Platzierung bei Google für Firmen relativ transparent ist, wissen die Besitzer von Websites nicht, wie sie zur Quelle einer KI-Antwort werden können. Hat die KI die Zürcher Anwaltskanzlei bei der Frage zum Ständemehr vielleicht so hoch priorisiert, weil der Name der Website publicsector.ch nach einer staatlichen Seite tönt? Niemand weiss es.
Es ist nicht einmal ganz sicher, ob die KI-Antworten auf den angegebenen Quellen basieren. Denn nicht in dieser Analyse, aber in anderen Fällen hat die KI die angegebenen Quellen schlicht erfunden.
«Es kursieren viele Vermutungen», sagt Friess, «und alle sind am Ausprobieren.» Auch er hat einige Theorien, doch mit Sicherheit kann er nur sagen, dass die KI Webseiten bevorzugt, welche ihre Daten strukturieren und beispielsweise mit versteckten Wegweisern im Webseiten-Code markieren, was im Dokument der Autorenname ist, welches das Datum etc. Das erleichtert der KI das Lesen des Dokuments.
«Die Sache ist maximal intransparent», sagt Friess.
Klar ist: Solange die Arbeit der Medienhäuser nicht angemessen honoriert wird, beziehungsweise die Medienhäuser weiterhin ihre Nachrichten den KI-Crawlern nicht zur Verfügung stellen, bleiben die KI-Antworten zur Schweizer Politik lückenhaft.
Aktuell sieht der Bundesrat zumindest vor, dass grosse Onlinedienste wie Google künftig Urheberrechtsgebühren zahlen müssen, wenn sie in den Suchabfragen Vorschauen aus Medienartikeln anzeigen. Die zuständige Nationalratskommission forderte im Oktober auch eine Regelung für die Anbieter von KI-Modellen.
