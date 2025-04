Google hat ein KI-Modell lanciert, das die Kommunikation der Atlantischen Fleckendelfine entschlüsseln soll. Bild: Shutterstock

DolphinGemma – so will Google mit Delfinen sprechen

Mehr «Wissen»

In seinem Klassiker «The Hitchhiker’s Guide to the Galaxy» («Per Anhalter durch die Galaxis») beschreibt der Schriftsteller Douglas Adams, wie die Delfine – nach den Mäusen die zweitintelligenteste Spezies der Erde – versuchen, die Menschen auf die bevorstehende Zerstörung des Planeten aufmerksam zu machen. Vergeblich, denn «die meisten ihrer Mitteilungen wurden als amüsante Versuche missverstanden, Fussbälle zu dreschen oder nach Leckerbissen zu pfeifen».

Tatsächlich verstehen die Menschen die «Sprache» der Meeressäuger nicht – es ist noch nicht einmal völlig klar, ob es sich bei ihren Lautäusserungen überhaupt um eine mit der menschlichen Sprache vergleichbare Kommunikation handelt. Schon länger aber versuchen Wissenschaftler, die Klick- und Pfeiflaute der intelligenten Meeresbewohner zu entschlüsseln und mit ihnen zu «sprechen». Mittlerweile geschieht dies immer mehr mithilfe von Künstlicher Intelligenz, namentlich mittels Large Language Models (LLM).

Solche Modelle, die auch dem Chatbot ChatGPT zugrunde liegen, werden etwa im Rahmen des Projekts CETI dazu eingesetzt, die Klicklaute der Pottwale zu enträtseln. Diese riesigen Meeressäuger gehören wie die Delfine zur Unterordnung der Zahnwale. Sie generieren Folgen von Klicklauten, die sie einerseits zur Echoortung einsetzen, andererseits aber auch untereinander austauschen. Der Austausch dieser sogenannten Codas erinnert stark an die Struktur einer Konversation.

Google lanciert DolphinGemma

Nun, rechtzeitig auf den nationalen Delfin-Tag in den USA am 14. April, hat auch der Tech-Gigant Google bekanntgegeben, an einem solchen KI-Modell zu arbeiten, jedoch nicht für die Kommunikation der Pottwale, sondern der Delfine. Diese Meeressäuger, die zu den intelligentesten Spezies gehören, bringen einander neue Fähigkeiten bei und können sich sogar in einem Spiegel erkennen. Sie nutzen komplexe Pfeif- und Klicklaute, um miteinander zu kommunizieren.

Alle Delfinarten zeichnen sich – wie sämtliche Wale – durch aussergewöhnlich grosse Gehirne aus, auch relativ zu ihrer Körpergrösse. Die sozialen Tiere kennen einander und besitzen alle ihren eigenen Namen, eine Folge von Pfeiftönen. Bild: Shutterstock

Das KI-Modell von Google heisst «DolphinGemma» und ist in Zusammenarbeit mit dem Georgia Institute of Technology (kurz «Georgia Tech») und dem Wild Dolphin Project (WDP) entstanden. Es basiert auf Gemma, den offenen, generativen KI-Modellen von Google, die wiederum auf derselben Grundlage aufgebaut sind wie die kommerziellen Gemini-Modelle des Tech-Konzerns.

Mit Delfin-Lauten trainiertes LLM

Auch DolphinGemma basiert auf einem Large Language Model, jedoch wird es nicht mit menschlicher Sprache trainiert, sondern mit Tierlauten – es soll die Struktur der Klick-, Pfeif- und Impulsgeräusche von Delfinen erlernen und neuartige Tonfolgen erzeugen, die jenen der Delfine ähneln. Dabei berechnet das LLM den wahrscheinlichsten nächste Element der Folge, wie es etwa ChatGPT bei menschlichen Sprachen tut. Wenn ein Modell effektiv trainiert wurde, kann der Output so klingen, als stamme er von einem Menschen.

«Durch die Identifizierung von wiederkehrenden Klangmustern, Clustern und zuverlässigen Sequenzen kann das Modell den Forschern dabei helfen, verborgene Strukturen und potenzielle Bedeutungen in der natürlichen Kommunikation der Delfine aufzudecken – eine Aufgabe, die bisher einen immensen menschlichen Aufwand erforderte.» Mitteilung von Google

Bereits ermögliche es DolphinGemma etwa, Delfine auf Objekte hinzuweisen, mit denen sie gerne spielen, stellt Google fest. Das Ziel besteht darin, letztlich «Delfinisch» zu sprechen, falls es so etwas gibt, also eine speziesübergreifende Kommunikation.

Die Spektrografie zeigt ein delfinähnliches Pfeifen (links) sowie Klicks und Brummtöne (rechts, die DolphinGemma während Tests erzeugt hat. Bild: Google

Akustische Datenbank des WDP

Das KI-Tool funktioniert als Audio-In- und Audio-Out-Modell und verwendet eine von Google entwickelte Audiotechnologie namens «SoundStream», um aufgenommene Laute der Delfine in das Modell einzuspeisen. Diese Laute stammen aus der akustischen Datenbank des Wild Dolphin Projects (WDP) für wild lebende Atlantische Fleckendelfine, die Jahrzehnte von Aufnahmen umfasst.

Das WDP bringt überdies das Wissen über die Delfine ein, also den Kontext, in dem diese Meeressäuger leben und kommunizieren. Kontext ist unerlässlich, denn die Vokalisation muss mit dem Verhalten abgeglichen werden. Bereits liegen erste Erkenntnisse darüber vor, wie die Tiere ihre Laute einsetzen. So finden etwa Delfinmütter und Kälber durch Pfiffe zusammen, die nur sie verwenden. Bei Streit kommt es zu krächzenden Lauten und bei der Balz oder der Verfolgung von Haien zu Klickgeräuschen.

Bereits in der nächsten Forschungssaison wird das WDP mit dem Einsatz von DolphinGemma beginnen. Das KI-Modell mit rund 400 Millionen Parametern kann direkt auf den Pixel-Smartphones laufen, welche das WDP im Einsatz verwendet. Google will DolphinGemma noch in diesem Sommer als offenes Modell verfügbar machen. Der Tech-Konzern räumt zwar ein, dass das Modell mit den Lauten der Atlantischen Fleckendelfine trainiert worden ist, erwartet jedoch, dass es nach einem allfälligen Feintuning auch bei anderen Delfin-Arten eingesetzt werden kann.

«DolphinGemma: How Google AI is helping decode dolphin communication.» Video: YouTube/Google

Gemeinsames Vokabular dank CHAT

Das WDP verfolgt zudem einen weiteren Weg, um potenzielle wechselseitige Interaktionen mit Delfinen zu erforschen: In Zusammenarbeit mit Georgia Tech hat es das CHAT-System (Cetacean Hearing Augmentation Telemetry) entwickelt. Es handelt sich um einen Unterwassercomputer, der nicht direkt die komplexe Sprache der Delfine entschlüsseln soll, sondern dem Aufbau eines einfachen gemeinsamen Vokabulars dient.

Das System erzeugt neuartige, synthetische Pfiffe, die sich von natürlichen Delfin-Lauten unterscheiden und mit bestimmten Objekten in Verbindung gebracht werden, die Delfine gerne mögen, etwa Seegras. Damit sollen die Meeressäuger auf klassische Weise konditioniert werden (wie der Pawlowsche Hund). Die Forscher hoffen, dass die von Natur aus neugierigen Delfine irgendwann lernen, diese Pfiffe zu imitieren, um die damit verbundenen Gegenstände anzufordern. Im Laufe der Zeit, wenn mehr natürliche Laute der Delfine entschlüsselt wurden, können auch diese in das CHAT-System aufgenommmen werden. (dhr)

Was man auch noch über Delfine wissen sollte: Kommentar Sie begatten tote Fische und die Atemlöcher ihrer Brüder: Warum ich Delfine hasse