Digital
Leben

Spektakuläres Video von KI-Dolmetscher macht die Runde – Experte warnt

Spektakuläres Video von KI-Dolmetscher macht die Runde – Experte warnt

13.09.2023, 08:2313.09.2023, 15:05
Anna Von Stefenelli / watson.de
Mehr «Digital»

In Sachen Digitalisierung folgt derzeit eine Überraschung auf die nächste. Besonders im Bereich der Künstlichen Intelligenzen (KI) gibt es immer neue Errungenschaften und Einsatzbereiche. ChatGPT war offenbar erst der Anfang einer neuen digitalen Ära.

KI eröffnet eine Welt voller neuer Möglichkeiten und Ideen.

Da stellt sich etwa die Frage, ob es möglich ist, einfach und ohne grossen Aufwand eine andere Sprache sprechen zu können? Und das, obwohl man diese nicht einmal beherrscht. Ein Live-Übersetzer auf KI-Basis für Online-Meetings etwa wäre praktisch. Das alles ist offenbar keine Zukunftsmusik mehr. Ein auf Social Media zirkulierendes Video zeigt, was wirklich möglich ist. Ungefährlich ist das aber offenbar nicht.

Video offenbart KI-Dolmetscher: Mann spricht plötzlich Fremdsprache

Würde man nicht wissen, dass hier mit KI getrickst wurde, fällt es kaum auf. Der US-Tech-Influencer und Regisseur Jon Finger hat auf X (ehemals Twitter) und Youtube ein Video geteilt, in dem er eine Videoübersetzung auf KI-Basis ausprobiert. In einem Beitrag auf X schreibt er: «Übersetzung auf Französisch und Deutsch. Ich spreche keine der beiden Sprachen, also lasst mich wissen, ob es natürlich klingt.»

Er erklärt in dem Video zunächst auf Englisch, dass er mindestens 30 Sekunden sprechen müsse, um das Video in das Tool namens HeyGen zu laden und die Video-Übersetzung zu starten. Er habe nicht viel zu sagen, sei jedoch gespannt auf die Übersetzung. Dann sieht man den gleichen Ausschnitt wie in der Frequenz zuvor: Jon Finger, wie er vor der Kamera sitzt. Nur, dass er diesmal die gleichen Worte in Französisch – und schlussendlich auch in Deutsch – spricht.

Heftige Reaktionen auf KI-Video auf Social Media

Einer Meinung ist man sich in den Kommentaren über die Qualität der Übersetzung zwar nicht. Was im Video zu sehen ist, liefert aber offenbar dennoch Gesprächsstoff auf Social Media. Innerhalb eines Tages wurde der Tweet bereits über 2200 Mal repostet, über 1000 Mal zitiert, erntete rund 10'000 «Gefällt mir»-Angaben und über 500 Kommentare.

«Das gibt's nicht!», heisst es in den Kommentaren mehrmals. «Unglaublich gut», finden andere. Zwar betonen einige User:innen, dass die Übersetzung nicht absolut perfekt, wohl aber beeindruckend sei. Mehrere X-User:innen betonen, dass der Ton der Stimme noch zu mechanisch klinge. Beeindruckt zeigen sich die meisten Personen hingegen von den Lippenbewegungen, die bei der Video-Übersetzung automatisch mit angepasst werden. Dazu ist zu sagen, dass Finger für das Video nach eigenen Angaben nur eine gratis Testversion verwendet hat.

KI-Tool liefert Ausblick in nahe digitale Zukunft

Ob perfekt oder nicht – klar ist: Die Video-Übersetzung ist aussergewöhnlich gut und gibt einen Vorgeschmack auf das, was wohl bald möglich ist.

Fest steht nämlich auch: Diese Form der Übersetzung wird vermutlich in rasender Geschwindigkeit noch besser werden. Und: Bald wird diese Form des KI-Einsatzes ausserdem wohl auch live möglich sein. Je etablierter die Funktion, desto zugänglicher wird diese im Laufe der Jahre dann auch für die breite Masse. Was das für das alltägliche Leben bedeutet, kann nur gemutmasst werden.

Experten warnen vor Missbrauch von KI-Tools durch Deepfakes

Einer, der auf das viral gegangene Video nun reagiert hat, ist Lutz Mache. Der arbeitet als Government Relations Senior Analyst bei Google. Er retweetet die KI-Aufnahmen und verweist auf eine potenzielle Gefahr durch den Übersetzer. Dabei verweist er darauf, dass auch der Tech-Gigant Google bereits einen «Universal Translator» vorgestellt habe. Dieser übersetze die Stimme eine:r Sprecher:in und synchronisiere die Lippenbewegungen. Ähnlich wie der vorgestellte Übersetzer von HeyGen.

Dabei spricht er eine Warnung aus: «Das Risiko, diese Technologie missbräuchlich einzusetzen, ist gross. Stichwort Deepfakes.» In einem weiteren Tweet fügt er hinzu: Deswegen wird das Tool derzeit nur ausgewählten Partnern zur Verfügung gestellt. Mittels Watermarking soll auch in Zukunft klar sein, dass dies ein KI-generiertes Video ist."

Und tatsächlich: Deepfakes aller Art machen immer häufiger auch Schlagzeilen in negativem Kontext. So gibt es etwa Betrugsmaschen mit Deepfake-Anrufen, bei denen Betrüger die Stimme von Verwandten ihrer potenziellen Opfer durch KI generieren und so versuchen, an Geld oder sensible Daten zu kommen. Das Bundesamt für Sicherheit in der Informationstechnik (BSI) warnt bereits seit einiger Zeit davor. Demnach ist es auch heute schon möglich, solche Fälschungen in Echtzeit mit einer vergleichsweise hohen Qualität zu erstellen.

Durch Social Media ist es für potenzielle Betrüger zudem zunehmend einfacher, an die entsprechenden Daten für die Erstellung von Deepfakes zu kommen.

    DANKE FÜR DIE ♥
    Würdest du gerne watson und unseren Journalismus unterstützen? Mehr erfahren
    (Du wirst umgeleitet, um die Zahlung abzuschliessen.)
    5 CHF
    15 CHF
    25 CHF
    Anderer
    Oder unterstütze uns per Banküberweisung.
    Das könnte dich auch noch interessieren:
    Hast du technische Probleme?
    Wir sind nur eine E-Mail entfernt. Schreib uns dein Problem einfach auf support@watson.ch und wir melden uns schnellstmöglich bei dir.
    36 Kommentare
    Weil wir die Kommentar-Debatten weiterhin persönlich moderieren möchten, sehen wir uns gezwungen, die Kommentarfunktion 24 Stunden nach Publikation einer Story zu schliessen. Vielen Dank für dein Verständnis!
    Die beliebtesten Kommentare
    avatar
    Müller Lukas
    13.09.2023 10:22registriert August 2020
    "Bald wird diese Form des KI-Einsatzes ausserdem wohl auch live möglich sein."
    Was heisst schon "live"?
    Der Algorithmus MUSS,
    gerade bei den im Deutschen üblichen Satzkonstruktionen, wo das entscheidende Verb oft erst ganz am Schluss steht, und der Hauptsatz unter Umständen erst nach mehreren, womöglich untereinander verschachtelten - und eventuell auch mit zusätzlichen Einschüben versehenen - Nebensätzen folgt, um eine halbwegs sinnvolle Übersetzung zu erreichen, zwingend zuerst den gesamten, möglicherweise sehr langen, im Einzelfall bis zu sechshundert Zeichen umfassenden Satz
    KENNEN. 😉
    1144
    Melden
    Zum Kommentar
    avatar
    Geralt von Riva
    13.09.2023 09:51registriert Mai 2021
    Da gehen wir :D
    241
    Melden
    Zum Kommentar
    avatar
    Rethinking
    13.09.2023 09:01registriert Oktober 2018
    Es ist nur eine Frage der Zeit, bis wir telefonieren können und dies live in die Sprache des anderen übersetzt wird. Wohl sogar mit unserer Stimme…

    Das Problem:

    Der Übersetzungsdienst weiss danach alles, was gesprochen wurde.

    Der Übersetzungsdienst kann auch was ganz anderes übersetzen, als ich sagte und so z.B. einen geschäftlichen oder politischen Deal gefährden…
    221
    Melden
    Zum Kommentar
    36
    Wurde Schoggi in der Schweiz erfunden? Ein Überblick
    Zentralamerika, Spanien, Frankreich, England ... Welchen Platz hat die Schweiz in der langen Kulturgeschichte der Schokolade?

    Trinkschokolade, die Schoggi-Tafel, die Milchschokolade gar – erfunden wurden sie alle ausserhalb der Schweiz. Doch den technischen Innovationen erfinderischer Schweizer im 19. Jahrhundert ist es zu verdanken, dass die Schweizer Schokolade ihren heutigen Ruf geniesst als beste der Welt. Eine kleine Schokoladen-Historie im Schnelldurchlauf:

    Zur Story