In seinem Klassiker «The Hitchhiker’s Guide to the Galaxy» («Per Anhalter durch die Galaxis») beschreibt der Schriftsteller Douglas Adams, wie die Delfine – nach den Mäusen die zweitintelligenteste Spezies der Erde – versuchen, die Menschen auf die bevorstehende Zerstörung des Planeten aufmerksam zu machen. Vergeblich, denn «die meisten ihrer Mitteilungen wurden als amüsante Versuche missverstanden, Fussbälle zu dreschen oder nach Leckerbissen zu pfeifen».
Tatsächlich verstehen die Menschen die «Sprache» der Meeressäuger nicht – es ist noch nicht einmal völlig klar, ob es sich bei ihren Lautäusserungen überhaupt um eine mit der menschlichen Sprache vergleichbare Kommunikation handelt. Schon länger aber versuchen Wissenschaftler, die Klick- und Pfeiflaute der intelligenten Meeresbewohner zu entschlüsseln und mit ihnen zu «sprechen». Mittlerweile geschieht dies immer mehr mithilfe von Künstlicher Intelligenz, namentlich mittels Large Language Models (LLM).
Solche Modelle, die auch dem Chatbot ChatGPT zugrunde liegen, werden etwa im Rahmen des Projekts CETI dazu eingesetzt, die Klicklaute der Pottwale zu enträtseln. Diese riesigen Meeressäuger gehören wie die Delfine zur Unterordnung der Zahnwale. Sie generieren Folgen von Klicklauten, die sie einerseits zur Echoortung einsetzen, andererseits aber auch untereinander austauschen. Der Austausch dieser sogenannten Codas erinnert stark an die Struktur einer Konversation.
Nun, rechtzeitig auf den nationalen Delfin-Tag in den USA am 14. April, hat auch der Tech-Gigant Google bekanntgegeben, an einem solchen KI-Modell zu arbeiten, jedoch nicht für die Kommunikation der Pottwale, sondern der Delfine. Diese Meeressäuger, die zu den intelligentesten Spezies gehören, bringen einander neue Fähigkeiten bei und können sich sogar in einem Spiegel erkennen. Sie nutzen komplexe Pfeif- und Klicklaute, um miteinander zu kommunizieren.
Das KI-Modell von Google heisst «DolphinGemma» und ist in Zusammenarbeit mit dem Georgia Institute of Technology (kurz «Georgia Tech») und dem Wild Dolphin Project (WDP) entstanden. Es basiert auf Gemma, den offenen, generativen KI-Modellen von Google, die wiederum auf derselben Grundlage aufgebaut sind wie die kommerziellen Gemini-Modelle des Tech-Konzerns.
Auch DolphinGemma basiert auf einem Large Language Model, jedoch wird es nicht mit menschlicher Sprache trainiert, sondern mit Tierlauten – es soll die Struktur der Klick-, Pfeif- und Impulsgeräusche von Delfinen erlernen und neuartige Tonfolgen erzeugen, die jenen der Delfine ähneln. Dabei berechnet das LLM den wahrscheinlichsten nächste Element der Folge, wie es etwa ChatGPT bei menschlichen Sprachen tut. Wenn ein Modell effektiv trainiert wurde, kann der Output so klingen, als stamme er von einem Menschen.
Bereits ermögliche es DolphinGemma etwa, Delfine auf Objekte hinzuweisen, mit denen sie gerne spielen, stellt Google fest. Das Ziel besteht darin, letztlich «Delfinisch» zu sprechen, falls es so etwas gibt, also eine speziesübergreifende Kommunikation.
Das KI-Tool funktioniert als Audio-In- und Audio-Out-Modell und verwendet eine von Google entwickelte Audiotechnologie namens «SoundStream», um aufgenommene Laute der Delfine in das Modell einzuspeisen. Diese Laute stammen aus der akustischen Datenbank des Wild Dolphin Projects (WDP) für wild lebende Atlantische Fleckendelfine, die Jahrzehnte von Aufnahmen umfasst.
Das WDP bringt überdies das Wissen über die Delfine ein, also den Kontext, in dem diese Meeressäuger leben und kommunizieren. Kontext ist unerlässlich, denn die Vokalisation muss mit dem Verhalten abgeglichen werden. Bereits liegen erste Erkenntnisse darüber vor, wie die Tiere ihre Laute einsetzen. So finden etwa Delfinmütter und Kälber durch Pfiffe zusammen, die nur sie verwenden. Bei Streit kommt es zu krächzenden Lauten und bei der Balz oder der Verfolgung von Haien zu Klickgeräuschen.
Bereits in der nächsten Forschungssaison wird das WDP mit dem Einsatz von DolphinGemma beginnen. Das KI-Modell mit rund 400 Millionen Parametern kann direkt auf den Pixel-Smartphones laufen, welche das WDP im Einsatz verwendet. Google will DolphinGemma noch in diesem Sommer als offenes Modell verfügbar machen. Der Tech-Konzern räumt zwar ein, dass das Modell mit den Lauten der Atlantischen Fleckendelfine trainiert worden ist, erwartet jedoch, dass es nach einem allfälligen Feintuning auch bei anderen Delfin-Arten eingesetzt werden kann.
Das WDP verfolgt zudem einen weiteren Weg, um potenzielle wechselseitige Interaktionen mit Delfinen zu erforschen: In Zusammenarbeit mit Georgia Tech hat es das CHAT-System (Cetacean Hearing Augmentation Telemetry) entwickelt. Es handelt sich um einen Unterwassercomputer, der nicht direkt die komplexe Sprache der Delfine entschlüsseln soll, sondern dem Aufbau eines einfachen gemeinsamen Vokabulars dient.
Das System erzeugt neuartige, synthetische Pfiffe, die sich von natürlichen Delfin-Lauten unterscheiden und mit bestimmten Objekten in Verbindung gebracht werden, die Delfine gerne mögen, etwa Seegras. Damit sollen die Meeressäuger auf klassische Weise konditioniert werden (wie der Pawlowsche Hund). Die Forscher hoffen, dass die von Natur aus neugierigen Delfine irgendwann lernen, diese Pfiffe zu imitieren, um die damit verbundenen Gegenstände anzufordern. Im Laufe der Zeit, wenn mehr natürliche Laute der Delfine entschlüsselt wurden, können auch diese in das CHAT-System aufgenommmen werden. (dhr)