Wie eine freie Schweizer KI ChatGPT und Co. alt aussehen lässt

Das mit Blick auf das Gemeinwohl entwickelte KI-Sprachmodell «Apertus» überzeugt mit Schweizer Grundwerten. Und es ist die perfekte Antwort auf das rücksichtslose Vorgehen grosser Techkonzerne.

Wie tritt man gegen die reichsten und mächtigsten Techkonzerne der Welt an, die Milliarden in eigene KI-Software buttern und die Konkurrenz niederwalzen?

Am Dienstagmorgen gab es eine mutige Antwort – aus der kleinen Schweiz. Und diese kam von den beiden Eidgenössisch-Technischen Hochschulen in Lausanne (EPFL) und Zürich (ETH) und dem nationalen Supercomputing-Zentrum im Tessin (CSCS).

Die drei Standorte diesseits und jenseits des Rösti- und Polenta-Grabens illustrieren, dass es sich um eine einzigartige landesweite Kooperation handelt.

Die Verantwortlichen betonen, Apertus sei das Ergebnis einer gemeinsamen Anstrengung von Forschenden, Ingenieurinnen und Ingenieuren sowie Studierenden aus der ganzen Schweiz – unterstützt durch die Infrastruktur und das Know-how des CSCS. Wobei natürlich schlaue Köpfe aus aller Welt zum Gelingen beigetragen haben.

KI als öffentliche Infrastruktur

Das Ziel ist nicht weniger als revolutionär. Es geht im Gegensatz zum Silicon Valley nicht darum, mit neuen Produkten möglichst schnell zu wachsen und eine möglichst grosse Nutzerschaft davon abhängig zu machen, ohne Rücksicht auf gesellschaftliche Schäden. Vielmehr stehen zutiefst demokratische Werte wie absolute Transparenz und freie Zugänglichkeit im Zentrum.

«Derzeit ist Apertus das führende öffentliche KI-Modell: ein Modell, entwickelt von öffentlichen Institutionen im Dienste des Gemeinwohls. Es ist der bislang stärkste Beweis dafür, dass Künstliche Intelligenz eine öffentliche Infrastruktur sein kann – wie Autobahnen, Wasserleitungen oder Stromnetze.»

Das Zitat stammt von Joshua Tan, er ist Hauptverantwortlicher bei einem gemeinnützigen Open-Source-Projekt namens Public AI Inference Utility, das sich auf die Förderung von öffentlicher KI fokussiert. Auf der Website der Organisation können alle Interessierten Apertus kostenlos ausprobieren (dazu unten mehr).

Im Wettstreit mit den grossmäuligen Techgiganten ist falsche Bescheidenheit nicht angebracht.

Wie kann man Apertus ausprobieren?

Apertus ist derzeit über die KI-Plattform Hugging Face verfügbar, unter der Apache-2.0-Lizenz veröffentlicht. Das heisst, man darf die Software frei in jedem Umfeld verwenden, modifizieren und verteilen.

Dies dürfte vor allem Nerds und KI-Fachleute ansprechen. Sie können zwei unterschiedlich grosse Apertus-Sprachmodelle herunterladen, um sie auf eigenen Computern zu installieren und einzusetzen.

Bei der leistungsfähigeren 70B-Version von Apertus mit 70 Milliarden Parametern wird eine leistungsfähige KI-Infrastruktur mit viel Rechenkapazität benötigt. Die zweite, deutlich kleinere Apertus-Version mit 8 Milliarden Parametern (8B) läuft auf gewöhlichen Laptops.

ETH-Forscher Imanol Schlag ist technischer Leiter des Projekts. Er sagt, Apertus sei für die Forschung und für praxisnahe Anwendungen konzipiert. Bild: ETHZ

Einfach ausprobieren lässt sich Apertus auf der Website des oben erwähnten gemeinnützigen Open-Source-Projekts, und zwar unter https://publicai.co/apertus.

An den derzeit stattfindenden Swiss AI Weeks beschäftigen sich KI-Interessierte aus allen Landesteilen mit der neuen Schweizer KI und ihrem grossen Potenzial.

Ja, Apertus hat zig Kinderkrankheiten. Aber wer erinnert sich an die Anfänge von ChatGPT?

Was macht die KI so speziell?

Der Namen Apertus bedeutet auf Lateinisch «offen», ist also einer toten Sprache entlehnt, aber das muss kein schlechtes Omen sein, im Gegenteil. Die Verantwortlichen haben sie gewählt, weil das Wort nicht nur gut klingt, sondern weil man auf die Mehrsprachigkeit und Internationalität der eigenen KI verweisen will.

«Wir wollten die Neutralität betonen und dass das KI-Modell weltweit nutzbar ist», sagte Antoine Bosselut, Professor an der EPFL und Co-Leiter der Swiss AI Initiative, die sich für digitale Souveränität einsetzt.

Apertus beherrscht gemäss seinen stolzen Entwicklerinnen und Entwicklern über tausend verschiedene Sprachen. Im Vergleich zur Konkurrenz soll es auch Schweizerdeutsche Dialekte und Rumantsch sowie seltene afrikanische Sprachen besonders gut verstehen.

«Apertus ist nicht einfach ein weiteres englischsprachiges Modell mit einigen mehrsprachigen Ergänzungen – es wurde von Grund auf entwickelt, um Benutzern und Communitys über Sprachgrenzen hinweg zu dienen.» quelle: publicai.co

Ganz wichtig: Apertus ist im Gegensatz zu ChatGPT, Googles Gemini und Co. keine Blackbox. Das Schweizer Sprachmodell sei «vollständig überprüfbar und modifizierbar», sodass unabhängige Fachleute prüfen können, wie es erstellt wurde und wie es funktioniert.

Die Boulevardzeitung «Blick» hat Apertus noch am Tag der Veröffentlichung einem Praxistest unterzogen und kam zu einem durchzogenen ersten Fazit. Vor allem bei Wissensfragen müsse ChatGPT (vom US-Marktführer OpenAI) die Schweizer Konkurrenz nicht fürchten, beim Rätoromanisch-Übersetzen sei sie aber sehr gut.

Bei der Kritikfähigkeit klemmt es auch noch ... Das grosse Apertus-Sprachmodell (70B) erweist sich in einem ersten watson-Test als Plappermaul, das sich im Dialekt-Kauderwelsch äussert. screenshot: watson

Dies sei erst der Anfang, betonen die Verantwortlichen.

Hier ist an die Lancierung von ChatGPT 2022 zu erinnern und die massiven Kinderkrankheiten des KI-Chatbots, der auch heute noch halluziniert, also Antworten generiert, die klug klingen, aber kreuzfalsch sein können.

Die Swiss AI Initiative will Apertus regelmässig aktualisieren und spezifische Sprachmodelle in Bereichen wie Recht, Klima, Gesundheit und Bildung untersuchen. Zukünftige Versionen sollen mehr Funktionen bieten und gleichzeitig die Apertus-Grundwerte behalten. Und es sind auch multimodale Sprachmodelle geplant, also die Technologie für eigene KI-Bildgeneratoren.

Keine Blackbox

Sicher ist: Im Wettstreit mit den grossmäuligen Techgiganten ist falsche Bescheidenheit unangebracht. Vielmehr gilt es, die wichtigen grundlegenden Vorteile gegenüber ChatGPT und Co. herauszustreichen. Und dazu gehört auch der ethisch korrekte Umgang mit Inhalten im Internet, die nicht gemeinfrei sind.

Die allermeisten Techkonzerne geben aus rechtlichen Gründen möglichst wenig über ihre Trainingsdaten preis, weil darin Unmengen urheberrechtlich geschützter Inhalte stecken, die von Dritten stammen. Da kaum jemand von diesen Urheberrechtsinhabern vorab gefragt wurde, ob sie mit der KI-Verarbeitung ihrer Werke einverstanden sind, ist es zu zahlreichen Klagen gekommen.

Den Apertus-Machern hingegen ist es wichtig, rechtlich korrekt vorzugehen. Sie haben Quellen ausgeschlossen, die Hinweise gegen die Verwendung ihrer Inhalte für KI enthalten, wie die NZZ schreibt. Eine explizite Einwilligung einzelner Quellen wurde aber nicht eingeholt.

Was kostet es?

Wie teuer Apertus sei, lasse sich nicht genau sagen. Das Vortraining auf Alps habe 7 Millionen Franken gekostet, hinzu kommen beträchtliche Personalkosten.

Laut «Tages-Anzeiger» haben insgesamt über 100 Wissenschafterinnen und Wissenschafter am Projekt mitgearbeitet. Sie würden durch einen 20-Millionen-Franken-Zuschuss des ETH-Rates bezahlt, der die gesamte Swiss-KI-Initiative für vier Jahre finanziere.

Insgesamt sei die Realisierung von Apertus deutlich günstiger als die Sprachmodelle US-amerikanischer (und nicht zu vergessen chinesischer) Konzerne, die mehrstellige Milliardenbeträge investierten.

Die Swisscom kann Apertus dank einer «strategischen Partnerschaft» mit den Hochschulen EPFL und ETHZ – sprich einer finanziellen Beteiligung an den Kosten – als eines der ersten privaten Unternehmen anbieten. Dies sei für Geschäftskunden über die Ende 2024 lancierte KI-Entwicklerplattform Swiss AI Platform möglich.

Und der Stromverbrauch?

Entwickelt werden die Apertus-Sprachmodelle auf dem Supercomputer Alps des CSCS in Lugano. Gemäss den Verantwortlichen entspricht die für das Training benötigte Energie dem Stromverbrauch einer SBB-Lokomotive, die drei Monate lang ununterbrochen fährt.

Die NZZ hat die Stromkosten des Supercomputers in Lugano ausgerechnet. Mehr als 5 Gigawattstunden Energie seien hineingeflossen. Dies sei in etwa so viel, wie 1500 Haushalte in einem Jahr verbrauchen: bei 0,29 Rappen pro Kilowattstunde knapp 1,5 Millionen Franken.

Apertus sei «zu hundert Prozent von Menschen gemacht, die über ihre Arbeit in der KI-Küche sprechen dürfen», hält die konservative Tageszeitung erfreut fest.

Wird das ein Erfolg?

Ob das Schweizer KI-Sprachmodell ein Erfolg wird, hängt vom Interesse der Akteure in Wissenschaft und Wirtschaft ab. Und da sind die Vorzeichen gut. Nicht zuletzt richtet sich Apertus explizit auch an kleine und mittlere Unternehmen (KMU) – und diese bilden bekanntlich in der Schweiz das wirtschaftliche Rückgrat.

Gemäss dem technischen Bericht, den die Forschenden veröffentlicht haben, funktionierten «halboffene» KI-Modelle der US-Techkonzerne Meta und Google zwar noch besser. «Apertus liegt auf dem Niveau von Llama 3», erklärte ETH-Forscher Imanol Schlag.

Doch diese Resultate sind nicht in Stein gemeisselt, und Apertus lockt hoffentlich weiterhin genügend Fachkräfte an, die nicht nur aufs Portemonnaie schauen.

Wichtig ist auf jeden Fall, dass die Schweizer KI-Forschungs-Offensive auch die nötige Unterstützung aus der Politik erhält. Insbesondere ist zu erwarten, dass sich das nationale Parlament und die Regierung von ihrem Ruf als digitalpolitische Bremser lösen.