Forscherinnen und Forscher aus Lausanne haben ChatGPT für die chemische Forschung aufgepeppt. «Das wird die Art und Weise, wie wir Chemie betreiben, verändern», sagte EPFL-Forscher Berend Smit in einer Mitteilung der Hochschule.
Zusammen mit seinem Team an der Eidgenössischen Technischen Hochschule in Lausanne (EPFL) hat Smit das auf Künstlicher Intelligenz (KI) basierende Sprachmodell GPT-3, auf dem ChatGPT basiert, dafür mit einer Art Fragebogen ausgetrickst. Wie genau das funktioniert, zeigten sie in einer Studie, die am Dienstag in der Fachzeitschrift «Nature Machine Intelligence» veröffentlicht wurde.
Denn in seiner normalen Form taugt GPT-3 für die chemische Forschung nicht, wie die Forscherinnen und Forscher erklärten. Es kennt einen grossen Teil der wissenschaftlichen Literatur der Chemie nicht. Wenn man ihm Fragen stellt, sind die Antworten in der Regel auf das beschränkt, was man auf Wikipedia finden kann.
Die Forschenden der EPFL fügten GPT-3 deshalb einen kleinen Datensatz an. Dies, indem sie der KI die Daten als eine Art Fragebogen mit Antworten fütterten. «Bei Legierungen mit hoher Entropie ist es zum Beispiel wichtig zu wissen, ob eine Legierung eine oder mehrere Phasen hat», erklärte Smit in der Mitteilung. Um GPT-3 diese Information beizubringen, stellten sie also die Frage, «Besteht die <Name der Hochentropie-Legierung> aus einer einzigen Phase?», gefolgt von der Antwort Ja oder Nein.
Während der Tests beantwortete das so aufgepeppte KI-Modell über 95 Prozent der unterschiedlichsten chemischen Probleme richtig. Damit übertraf es laut den Forschenden oft die Genauigkeit anderer hochmoderner KI-Modelle.
Im Gegensatz zu diesen anderen Modellen war GPT-3 aber einfacher und schneller. Herkömmliche Modelle für maschinelles Lernen erfordern monatelange Entwicklungsarbeit und umfangreiche Kenntnisse, wie die EPFL in der Mitteilung schrieb. Im Gegensatz dazu dauert der neue Ansatz fünf Minuten und erfordert keine besonderen Kenntnisse.
In Zukunft könnte es laut Smit Routine werden, beim Start eines Forschungsprojekts ein solches KI-Modell zu konsultieren, um das kollektive Wissen, dass darin programmiert ist, zu nutzen.
Die EPFL-Medienmitteilung liegt noch nicht vor
(dsc/sda)