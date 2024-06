Endlich mit Tieren sprechen – dank KI machen wir dabei Fortschritte

Die Vorstellung wirkt verlockend: Wie Dr. Dolittle mit Tieren sprechen zu können. Oder wenigstens in groben Zügen verstehen, was sie mit ihren Lauten mitteilen. Von Ersterem sind wir noch weit entfernt, bei Letzterem wurden in den letzten Jahren aber erstaunliche Fortschritte erzielt. Vor allem dank des Einsatzes von KI.

Die jüngste Studie auf diesem Gebiet stammt von der Universität Michigan. Sie entschlüsselt das Gebell von Hunden. Dafür fütterten die Autoren das für menschliche Sprache entwickelte KI-Modell Wav2Vec2 mit den Lauten von 74 verschiedenen Hunden aus Mexiko. Dabei handelte es sich vor allem um Chihuahuas, Pudel und Schnauzer, die während verschiedener Situationen bellten. Beispielsweise bei energischem Klopfen an der Haustüre, bei einem (vorgetäuschten) Angriff auf die Hundehalterin oder beim Spielen.

Zur Studie kursieren im deutschsprachigen Raum diverse Falschinformationen. So heisst es vielerorts, dass die KI mit 74 Laut-Aufzeichnungen trainiert wurde. Das ist falsch. Die Anzahl der Aufzeichnungen beträgt 16’789 – von 74 verschiedenen Tieren. Auch die kolportierte Genauigkeit von 70 Prozent ist nur in einem Fall korrekt. Hier kann das Paper gelesen werden.

Der trainierten KI gelang es daraufhin, Hundelaute mit einer erstaunlichen Zuverlässigkeit dem korrekten Geschlecht, der korrekten Rasse und dem Gemütszustand des Hundes zuzuordnen. Wer dabei allerdings die Präzision eines olympischen Bogenschützen erwartet, wird enttäuscht.

Das Geschlecht wurde bei 70 Prozent der Versuche erkannt (bei einer 50:50-Chance). Die Bestimmung der Rasse gelang bei 62,28 Prozent der Fälle. Genauso erfolgreich (62,18 Prozent) war das Zuweisen einer von vier Gemütslagen. Die KI unterschied dabei, ob der Hund eine fremde Person aggressiv anbellte, ob er sie normal anbellte, ob der Hund feindselig knurrte oder ängstlich winselte.

Ein aggressives Bellen von einem ängstlichen Winseln zu unterscheiden – noch geht es bei der Erkennung von Tierlauten um rudimentäre Unterscheidungen. Von «Ich möchte lieber einen Knochen als eine Wurst» sind wir noch sehr weit weg.

Der Schlüssel zum besseren Verständnis von Tier-Lauten sind die Datensätze. Mit diesen werden die KI-Modelle trainiert. Von der menschlichen Sprache existieren enorme Datenmengen. Nicht so bei Tieren. Doch dort, wo sie bereits mit einem gewissen Umfang vorhanden sind, bei Meeressäugern wie Orcas und Pottwalen und bei Vögeln, hat die KI-Forschungstätigkeit in den letzten Jahren stark zugenommen.

Shane Gero ist Teil des Teams von Project CETI. Bild: keystone

Sehr weit fortgeschritten ist das Projekt CETI. Die Gruppe vereint Experten auf dem Gebiet der Linguistik, des maschinellen Lernens, der Kryptographie, der Unterwasserakustik und der Robotik. Mit neu entwickelten Roboter-U-Booten belauscht CETI Wale – und filmt sie dabei dank neuster Kameratechnik auch in tiefen Gewässern. Obwohl KIs mit grossen Datensätzen dank sogenannt «neuronaler Netzwerke» auch ohne Anhaltspunkte Lautmuster erkennen können, ist doch jeder Zusammenhang, in den ein Tierlaut gebracht werden kann, Gold wert.

Schema, wie die Kommunikation mit Walen ablaufen könnte – bis es dann eine App gibt. Bild: sciencedirect.com

Einen ersten Erfolg konnte CETI bereits vermelden. Eine von ihnen trainierte KI kann die Stimmen der Wale unterscheiden und einzelne Laute mit einer Präzision von 94 Prozent dem korrekten Wal zuordnen. Ausserdem publizierte das Team kürzlich eine Studie, die darauf hindeutet, dass Wale auf eine Art phonetisches Alphabet zurückgreifen. Dies deute darauf hin, dass die Meeressäuger über eine komplexe und hochentwickelte Kommunikation untereinander verfügen.

Noch sind die Erkenntnisse klein – und doch ist es ein enormer Schritt in Richtung Verständnis der Pottwal-Sprache. Mit den rasanten Fortschritten, welche aktuell mithilfe der Künstlichen Intelligenz erzielt werden, kann man davon ausgehen, dass der Pottwal-Code, sollte er existieren, in überschaubarer Zukunft geknackt werden kann – was wiederum einen gigantischen Strauss an Fragen eröffnet. Vor allem ethische. Wie wird am besten auf die Tiere zugegangen? Wer wird mit den Walen kommunizieren? Und wie? Wale sind Wildtiere. Jede Form von Kommunikation mit ihnen ist ein Eingriff in ihre Lebensweise – mit unvorhersehbaren Folgen.

Eine Pottwalfamilie. Wie lange wird es noch dauern, bis wir ihre Kommunikation nicht nur abhorchen, sondern auch verstehen? Bild: AP GUAM VARIETY NEWS

So wie bei Dr. Dolittle ist es eben nicht. Die Vorstellung von einer lustigen kleinen Plauderstunde mit einem Meeressäuger ist naiv. «Wir sehen einen Pottwal, der mit seiner Brustflosse winkt, und denken, er sagt ‹Hallo›», beschreibt Akustikökologin Michelle Fournet von der Cornell University das Problem gegenüber National Geographic. Dabei sind Pottwale normalerweise einfach nur aggressiv.