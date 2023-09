Pottwale sind die grössten bezahnten Tiere der Welt – und sie kommunizieren untereinander mit Klicks. Bild: Shutterstock

Wie das Projekt CETI die Sprache der Pottwale entschlüsseln will

Lange galt es als ausgemacht, dass Pottwale stumm sind. Diese Giganten, die grössten Predatoren des Planeten, wurden so gnadenlos gejagt – in den 1960er und 1970er Jahren fielen jährlich mehr als 20'000 Pottwale dem industriellen Walfang zum Opfer –, dass sie heute noch als gefährdete Art gelten. Doch 1957 wurde die Annahme, Pottwale seien stumm, endgültig widerlegt. Damals nahmen zwei Wissenschaftler der Woods Oceanographic Institution vor der Küste des US-Bundesstaats North Carolina Geräusche auf, die von einer Schule von Pottwalen stammten.

Sie beschrieben die Laute als Serien von «scharfen Klicks» und vermuteten, dass sie der Echoortung dienten. Dies trifft in der Tat zu – Pottwale verwenden diese Klicks, die von festen und halbfesten Objekten reflektiert werden, zur Orientierung und Nahrungssuche in der Dunkelheit der Tiefsee. Sie generieren bis zu sechs dieser Klicks pro Sekunde mithilfe eines speziellen Organs in ihrem Kopf. Die Sequenz dieser Klicklaute ist individuell, das heisst, sie unterscheidet sich bei verschiedenen Tieren.

Die «Sprache» der Pottwale

Wie sich zeigte, produzieren Pottwale aber auch schnelle, rhythmische Folgen von Klicks, die in bestimmten, oft wiederholten Mustern auftreten und nicht der Echoortung dienen. Diese sogenannten Codas tauschen die Wale untereinander aus, besonders in der Nähe der Wasseroberfläche und auch über grosse Entfernungen – in einer Art, die stark an die Struktur einer Konversation erinnert. Solche «Gespräche» können eine Stunde oder länger dauern, wenn die Wale sich an der Oberfläche befinden.

Das Geräusch dieser Codas ist völlig verschieden von den bekannten, melancholisch anmutenden «Gesängen» der Buckelwale, die schon seit Jahren mit einigem Erfolg kommerziell vertrieben werden. Die scharfen, schnellen Klicks erinnern eher an das Geräusch von brutzelndem Speck oder von platzendem Popcorn.

Die Giganten ernähren sich vorzugsweise von Tintenfisch, den sie auch in extremen Tiefen jenseits der 1000 Meter jagen. Bild: Shutterstock

Pottwal

Pottwale gehören zu den tiefsten Tauchern der Welt; sie halten den Tauchrekord unter den Säugetieren. Sie tauchen regelmässig 600 Meter tief, manchmal bis zu 1600 Metern. Ihre Tauchgänge können bis zu 100 Minuten dauern. Dabei können sie alle Organe «abschalten», die sie während des Tauchgangs nicht benötigen, um Sauerstoff zu sparen. Zudem können sie in ihren Muskeln und im Blut grosse Mengen Sauerstoff speichern.

Pottwale bilden Gruppen von etwa 15 bis 20 Tieren, sogenannte Schulen, die aus Weibchen mit ihren Kälbern bestehen. Männliche Tiere bleiben bis etwa zu ihrem 15. Lebensjahr im von Weibchen geführten Familienverband, danach werden sie verstossen und leben solitär oder bilden eigene Gruppen. Bullen nähern sich einer Gruppe nur noch zu Fortpflanzungszwecken.

Der Bestand der Tiere hat sich nach der starken Bejagung im 19. und 20. Jahrhundert etwas erholt, aber Pottwale gelten immer noch als gefährdete Art. Je nach Schätzung gibt es derzeit zwischen 360'000 und 1 Million Exemplare.

Dokumentierter jährlicher globaler Pottwalfang, 1750–2000. Grafik: Scientific Reports

Die Frage, der sich Wissenschaftler seit Jahren widmen, liegt auf der Hand: Handelt es sich beim Austausch von solchen Codas um eine Sprache? Und wenn ja – können wir Menschen sie entschlüsseln?

Pottwale sind soziale Tiere und leben in Gruppen, die Schulen genannt werden. Bild: Shutterstock

Das CETI-Projekt

Die Speerspitze der Forschung in diesem Bereich bildet das CETI-Projekt (Cetacean Translation Initiative). Das Akronym verdankt sich zum einen der lateinischen Bezeichnung für «Wal» (cetus, Plural ceti), will aber zum anderen bewusst an das bekannte SETI-Projekt erinnern, das sich der Suche nach extraterrestrischer Intelligenz verschrieben hat. Während wir aber bisher nicht wissen, ob es ausserhalb der Erde intelligentes Leben gibt, kennen wir auf unserem Planeten durchaus Lebensformen, die über ein bestimmtes Denkvermögen verfügen. Die Frage ist, wie wir mit ihnen kommunizieren können.

Die 2018 auf Initiative des Biologen David Gruber und der Informatikerin und Kryptographie-Expertin Shavi Goldwasser vom Massachusetts Institute of Technology (MIT) gegründete interdisziplinäre Organisation ist wahrscheinlich das grösste Projekt zur Kommunikation zwischen verschiedenen Spezies in der Geschichte. Es vereint Biologen, Linguisten, Robotiker und Computer-Experten – darunter etwa der kanadischen Biologe Shane Gero, Gründer des Dominica Sperm Whale Project, Michael Bronstein, Professor für maschinelles Lernen in Oxford oder Daniela Rus vom Computer Science and AI Laboratory (CSAIL) des MIT.

Sie setzen, wie es auf der CETI-Homepage heisst, «fortschrittliches maschinelles Lernen und modernste Robotertechnik» ein, um die Kommunikation der Pottwale zu enträtseln. Im April 2021 begann eine auf fünf Jahre angelegte Studie, die diesem Ziel entscheidend näher kommen will. Zu diesem Zweck ging das CETI-Projekt eine Partnerschaft mit der Regierung von Dominica ein.

Lauschangriff vor der Küste Dominicas

Auf dieser Insel in der östlichen Karibik liegt der Forschungsschwerpunkt von CETI. Vor der Küste Dominicas halten sich Pottwale oft auf. Diese leben eigentlich nomadisch und verbringen den grössten Teil ihres Lebens auf der Jagd, vornehmlich auf Tintenfisch. Mehr als 30'000 Kilometer legt ein Pottwal schätzungsweise pro Jahr mindestens zurück. An einigen Orten in den Tropen, darunter die Küstengewässer vor Dominica, verweilen sie jedoch durchaus länger.

Hier, vor der Westküste der Insel, plant das CETI-Team einen umfangreichen Lauschangriff auf die Meeressäuger, wie die Journalistin Elizabeth Kolbert in einem Artikel im «New Yorker» berichtet. Zu diesem Zweck wird ein Netzwerk von Unterwasser-Mikrofonen installiert, das die Codas der in der Nähe schwimmenden Wale aufnehmen soll. Da Pottwale meist nur etwa zehn Minuten pro Stunde in der Nähe der Oberfläche verbringen, sollen auch drei Abhörstationen auf dem Meeresgrund eingerichtet werden, die Laute von bis zu 20 Kilometer weit entfernten Walen auffangen können. Die Klicks können sehr laut sein; sie erreichen bis zu 230 Dezibel, sind also lauter als ein Rock-Konzert oder ein Gewehrschuss. Über der Wasseroberfläche sind sie indes nicht hörbar.

Illustration der verschiedenen Bereiche des CETI-Projekts. Bild: sciencedirect.com

Lautäusserungen der Wale aufzufangen ist ein aufwendiges Unternehmen, da die Tiere oft tief unter die Wasseroberfläche tauchen. Bild: sciencedirect.com

Auch auf den Tieren selber bringen die CETI-Leute Aufnahmegeräte an. Die mit empfindlichen Mikrofonen ausgestatteten Kameras, die grosse Drücke aushalten können, werden mittels langen Stangen oder Drohnen auf dem Rücken der Wale befestigt – was kein einfaches Unterfangen ist, wie Kolbert bei einem Besuch des Teams auf Dominica selber beobachten konnte. Diese Geräte bleiben etwa acht Stunden lang haften, bevor sie abfallen, an die Wasseroberfläche aufsteigen und dort über ein Signal, das sie aussenden, geortet und eingesammelt werden können. Neben den Codas der Wale registrieren sie auch den Herzschlag der Tiere, deren Route und die Lage im Wasser.

Test des Geräts, das auf den Pottwalen angebracht wird: «Researchers test a non-invasive soft device to attach to the back of whales and record their speech, in the hopes of understanding their language and eventually talking back.» Video: YouTube/Harvard John A. Paulson School of Engineering and Applied Sciences

Codas – Klickfolgen als Wörter

Die Codas der Pottwale sind ausgiebig studiert worden. So weiss man etwa über sie, dass sie erlernt werden. Jungtiere lernen sie ähnlich wie Menschen ihre Sprache: Zuerst «brabbeln» sie Klicks, bis sie das Repertoire ihrer Familie übernehmen und es korrekt reproduzieren können. Tatsächlich gibt es unterschiedliche Sets von Codas, die man mit Dialekten vergleichen könnte. Die Klickfolgen der Pottwale im Ostpazifik sind nicht identisch mit jenen der Wale in der östlichen Karibik oder im südlichen Atlantik. Es scheint zudem, dass die Pottwale einander mit Klickmustern identifizieren – das menschliche Pendant dazu wäre ein Name.

Die Codas unterscheiden sich in der Anzahl der Klicks und in ihrem Rhythmus. Bild: sciencedirect.com

Universell bei allen Varianten der Pottwal-Codas scheint ihr Timing zu sein. Zwischen dem Beginn einer Coda und dem Beginn der nächsten verstreichen immer vier Sekunden, wobei etwa die Hälfte dieser Zeit mit Klicks belegt ist. Die Pausen zwischen den Klicks ähneln jenen, die ein menschlicher Sprecher zwischen den Worten oder Wortgruppen einlegt.

Wie Elizabeth Kolbert in ihrer Reportage von Dominica für den «New Yorker» berichtet, verwenden die Pottwale vor Dominica ein Set von rund 25 Codas, die sich untereinander in der Anzahl der Klicks und in ihrem Rhythmus unterscheiden. Als Beispiele nennt sie die Coda 3R («three regular»), 7R («seven regular»), 7I («seven increasing») und 4D («four decreasing»). Während 3R aus drei Klicks besteht, die in gleichen Intervallen geäussert werden, sind es bei 7R sieben ebenfalls gleichmässig verteilte Klicks. Bei 7I nehmen die Intervalle hingegen gegen Ende der Coda zu; bei 4D indes nehmen sie ab. Daneben existieren auch synkopierte Codas, etwa die Coda 1 + 1 + 3, die von einer der Pottwalschulen vor Dominica häufig verwendet wird und eine Art Cha-Cha-Cha-Rhythmus aufweist.

Wenn Codas tatsächlich eine Art Äquivalent zu menschlichen Worten wären, würde ein Repertoire von 25 ein eher limitiertes Vokabular darstellen. Allerdings weiss man bisher schlicht nicht, ob es Nuancen in Tempo oder Tonhöhe gibt, die für die Wale signifikant sind und die der menschlichen Beobachtung bisher entgangen sind.

Daten – viel mehr Daten

Das umfangreichste Archiv an Pottwal-Codas hat der Biologe Shane Gero während mehrerer Jahre aufgebaut: Es umfasst rund hunderttausend Klicks. Das ist beeindruckend – doch um den Algorithmus eines Computer-Modells wie ChatGPT zu trainieren, sind ganz andere Bestände vonnöten. Nach Schätzungen des CETI-Teams würde dafür eine etwa 40'000-mal grössere Sammlung benötigt – also vier Milliarden Klicks. Dieser Bedarf an enormen Datenbeständen zum Training von modernen Deep-Learning-Modellen stellt daher nach Ansicht der CETI-Forscher eine der hauptsächlichsten Herausforderungen bei der Analyse der Pottwal-Kommunikation dar – zumal Pottwale sich oft sehr tief unter Wasser aufhalten und weit wandern.

Vergleich der Datenmenge, die für das Training von KI-Sprachmodellen verwendet werden. Die geplanten vier Milliarden Klicks des CETI-Projekts fallen ins Nichts im Vergleich zur Datenmenge, die zum Training von GPT-3 diente. Grafik: sciencedirect.com

Auch ein Chatbot wie ChatGPT benötigte eine gigantische Datenbank – Millionen von Webseiten –, um schliesslich die englische Sprache und weitere Idiome meistern zu können. Im Grunde sagt dieses KI-Sprachmodell auf dem Kontext der vorhergehenden Wörter jeweils das nächste Wort voraus – ohne den Satz jemals zu «verstehen». Könnte also eine ausreichend grosse Datenbasis an Klicks angelegt werden, könnte ein solches Computer-Modell damit trainiert werden und es wäre dann theoretisch in der Lage, Sequenzen von Codas zu generieren, die ein Pottwal überzeugend finden würde. Das Modell würde nach wie vor nicht «Walisch» verstehen, aber es könnte es «sprechen».

Allerdings wird die maschinelle Übersetzung bei menschlichen Sprachen zum Teil durch den Umstand erleichtert, dass Wortassoziationen in verschiedenen Sprachen analog sind: «Mond» und «Himmel» beziehen sich etwa im Deutschen auf ähnliche Weise aufeinander wie die französischen Wörter «lune» und «ciel». «Bei Walen ist die grosse Frage, ob es so etwas überhaupt gibt», stellt Jacob Andreas, ein Experte für die Verarbeitung natürlicher Sprache am MIT und CETI-Mitglied, gegenüber «National Geographic» fest.

Es braucht Kontext

Um den «Gesprächen» der Wale auf die Schliche zu kommen, braucht es einen weiteren, wesentlichen Faktor: Kontext. Die Vokalisation muss mit dem Verhalten abgeglichen werden: Gibt es etwa eine bestimmte Coda, die immer dann auftaucht, wenn die Pottwale zur Jagd aufbrechen, oder eine, die stets dann geäussert wird, wenn sie sich zur Paarung zusammenfinden? Pottwale kommunizieren oft, bevor sie tauchen. Doch es ist nicht klar, worüber sie «sprechen»: Wie tief sie tauchen wollen, wer auf die Kälber aufpasst? Oder über etwas, zu dem es in der menschlichen Erfahrung gar keine Analogie gibt?

Für die Linguisten stellt sich die Frage, ob die Pottwale wie Menschen die Stufe der sogenannten zweifachen Gliederung (englisch «Duality of patterning») erreicht haben. Jacob Andreas bezeichnet sie als «Heiligen Gral – das Ding, das menschliche Sprache von allen anderen tierischen Kommunikationssystemen trennt».

Der Begriff bezieht sich auf die Eigenschaft der Sprache – oder allgemeiner eines Zeichensystems –, dass darauf basierende Nachrichten zum einen in bedeutungstragende («signifikative») Einheiten gegliedert sind, und diese Einheiten zum anderen wiederum in nicht bedeutungstragende, aber bedeutungsunterscheidende («distinktive») Einheiten. So besteht beispielsweise der Ausdruck «alter Knabe» aus drei kleinsten signifikativen Einheiten:

alt: «eine überdurchschnittliche Zeitspanne existent»

-er: Nominativ Singular Maskulinum

Knabe: «männliches Kind»

Die signifikative Einheit alt besteht aus drei kleinsten distinktiven Einheiten: /a/, /l/, /t/.

Zweifache Gliederung würde im Fall der Pottwale bedeuten, dass die Klicks an sich nicht bedeutungstragend, aber distinktiv wären, die Codas sich aber auf etwas beziehen würden, mithin bedeutungstragend oder signifikativ wären. Sollte sich diese Vermutung bestätigen, wäre dies eine revolutionäre Erkenntnis: Bisher sind nur menschliche Zeichensysteme bekannt, die diese zweifache Gliederung aufweisen. Sie ermöglicht es uns, alles Denk- und Kommunizierbare auszudrücken.

Die Pottwale sind an ihrer Fluke erkennbar – sie ist bei jedem Tier anders. Bild: Shutterstock

Kommunikation mit Tieren

Wale und die zur Ordnung der Wale gehörenden Delfine sind mit ihrer hoch entwickelten akustischen Kommunikation die bevorzugte Spezies für die Anwendung fortgeschrittener KI-Sprachmodelle. Ihr Kodierungssystem ist zudem ganz anders und hat sich eher in einem aquatischen Medium entwickelt. Besonders Pottwale mit ihren hoch entwickelten neuroanatomischen Merkmalen, kognitiven Fähigkeiten, sozialen Strukturen und der klickbasierten Kodierung könnten jene Tierart sein, deren «Sprache» solche KI-Sprachmodelle zuerst entschlüsseln könnten. In Zukunft könnten solche Modelle auch auf andere Tiere angewendet werden.

Die Kommunikationsfähigkeit von Tieren variiert allerdings stark zwischen den einzelnen Arten und auch ihrer Beziehung zum Menschen. Die menschliche Sprache funktioniert überdies in erster Linie über auditive oder schriftliche Kanäle, während die Kommunikation von Tieren beispielsweise auch Gerüche umfassen kann, die für den Menschen nicht wahrnehmbar sind. Und auch bei der auditiven Kommunikation gibt es Bereiche, die für das menschliche Ohr nicht wahrnehmbar sind; etwa Ultraschallgeräusche von Nagetieren. Diese versucht das KI-Projekt DeepSqueak zu entschlüsseln.

Ohnehin stellen neuere Forschungsergebnisse die lange Zeit gängige wissenschaftliche Meinung infrage, Sprache sei grundsätzlich ein menschliches Konzept. Lautäusserungen von Tieren signalisieren gemäss dieser Ansicht zwar eine Absicht oder einen Zustand, sind aber weit von dem entfernt, was wir unter Sprache verstehen. Mit anderen Worten: Tiere kommunizieren, aber sie sprechen nicht. Doch es gibt Anzeichen dafür, dass dies möglicherweise nicht für jede tierische Kommunikation zutrifft. Vögel entwickeln beispielsweise als Reaktion auf eine neue Umgebung neue Rufe, und bestimmte Rufe tragen eine bestimmte Bedeutung. Bei den Vogelstimmen derselben Spezies gibt es – wie bei den Pottwalen – regionale Variationen, die man als «Dialekte» bezeichnen könnte.

Grössenvergleich Pottwal – Mensch: Die Pottwale sind die grössten Predatoren auf dem Planeten. Bild: Shutterstock

Bedürfnisse der Wale besser verstehen

Die Erforschung der Sprache der Pottwale hat zwar das Potenzial, unser Verständnis für diese Tiere – und Tiere im allgemeinen – zu erweitern. Es gibt aber auch mahnende Stimmen – manche Wissenschaftler befürchten, dass die Entschlüsselung tierischer Kommunikation dazu benutzt werden könnte, Tiere noch mehr zu dominieren und auszubeuten. Und die grundsätzliche Frage bleibt bestehen, ob wir ein Tier überhaupt wirklich verstehen können, auch wenn es uns gelingen sollte, mit ihm zu «sprechen». Die Bezugssysteme von Mensch und etwa Pottwal sind so unterschiedlich, dass die Kommunikation zwischen ihnen ziemlich frustrierend verlaufen könnte.

Welche Erkenntnisse und welchen Nutzen Projekte wie CETI dereinst liefern werden, bleibt ohnehin noch abzuwarten. Es ist aber nicht ausgeschlossen, dass diese Forschung – wie es bei der Raumfahrt der Fall war – möglicherweise überraschende «Kollateralnutzen» abwerfen könnte. Zumindest besteht aber die Hoffnung, dass ein besseres Verständnis der Pottwale und ihrer Bedürfnisse dazu beiträgt, das Überleben dieser faszinierenden Giganten zu sichern.