¿hablas español? Kein Problem die neuste Videoübersetzungstechnologie regelt das für dich. Im Handumdrehen sprichst du bis zu 14 Sprachen!

In der vergangenen Woche am 11.September machte ein Clip im Social-Media-Netzwerk X (früher bekannt als Twitter) die Runde, in dem Tech-Influencer Jon Finger zunächst Englisch spricht. Eine KI-Software ändert jedoch die Sprache und passt sogar die Lippenbewegungen entsprechend an. Eine wachsende Anzahl von Nutzer*innen hat inzwischen die Technologie ausprobiert und ihre umgewandelten Videos online gestellt. Obwohl sie im Original in einer anderen Sprache sprachen, sind sie nun nahtlos in Deutsch, Italienisch und Spanisch zu hören. Dass künstliche Intelligenz im Spiel ist, ist kaum auszumachen.

Was steckt dahinter?

Das Unternehmen hinter dem viralen Video ist HeyGen, ein Online-Dienst, der auf die Erstellung von KI-gesteuerten Sprechervideos mit exakter Lippensynchronisation spezialisiert ist.
 
Bevor HeyGen letzte Woche durch seinen Video-Übersetzungsdienst in die Schlagzeilen geriet, war das Unternehmen vor allem für seine animierten Avatare bekannt. Diese Avatare konnten einen schriftlich verfassten Text in der gewählten Sprache und Tonlage wiedergeben. Insgesamt spezialisierte sich das Online-Unternehmen auf die Erstellung von Videos, mit Einsatz von Sprache und Stimme. 

Wie funktioniert es?

Es ist ganz leicht: Nimm ein Video von dir auf und lade es hier hoch. Wähle für die Übersetzung zwischen 14 verschiedenen Sprachen aus (Stand: 20. September 2023):

 

  • Input: Englisch, Spanisch, Französisch, Chinesisch, Deutsch, Italienisch, Portugiesisch, Holländisch, Hindi, Japanisch

 

  • Output: Englisch (Amerikanischer Akzent), Englisch (Dein Akzent), Spanisch, Französisch, Hindi, Italienisch, Deutsch, Polnisch, Portugiesisch, Chinesisch, Japanisch, Holländisch, Türkisch, Koreanisch 

Ein Upload ist möglich für Videos von mindestens 30 Sekunden bis zu 5 min und einer max. Dateigrösse von 500 MB. Um eine gute Audio-Qualität gewährleisten zu können, sollte man Hintergrundgeräusche minimieren und idealerweise nur eine einzelne Person reden lassen. Zudem muss die Auflösung des Videos zwischen 360×360 und 4096×4096 liegen.

Was meint die Bildungslandschaft?

Die Videoübersetzungstechnologie von HeyGen löst eine Bandbreite an Reaktionen aus. Auf der einen Seite gibt es ethische Bedenken, vor allem im Hinblick auf das Potential für Deep Fakes. Besonders in Schulen könnten die Risiken schwerwiegender sein, weshalb einige, die Anwendung im Primarbereich kritisch sehen.

Auf der anderen Seite wird die Technologie im Bildungskontext, vor allem im Fremdsprachenunterricht, als äusserst nützlich erachtet. Lehrpersonen sehen grosses Potential darin, Schüler*innen die Möglichkeit zu geben, mehrsprachige Avatare zu kreieren. Dies könnte vor allem für diejenigen Schüler*innen motivierend sein, die normalerweise Schwierigkeiten mit Fremdsprachen haben. Durch die Integration in Canva ist die Technologie zudem leicht zugänglich und bietet vielfältige Einsatzmöglichkeiten im Unterricht.

Die Technologie wirft auch Fragen zur zukünftigen Bildungslandschaft auf. Es entsteht die Diskussion darüber, welche Kompetenzen im Licht der sich schnell entwickelnden KI-Technologien überarbeitet oder als zukunftsweisende Fähigkeiten betrachtet werden sollten.

Diskutiere mit uns mit! Was meinst du zum Einsatz dieser Technologie im Unterricht? Wie kann der Fremdsprachenunterricht davon profitieren und wo siehst du Probleme?

HeyGen (o.J.). AI Video Generator. [20.9.23] 

HeyGen Labs (o.J.). Video Translate. [20.9.23] 

SRF (2023). Was ist dran am Hype um die Übersetzungs-KI HeyGen? [20.9.23]  

Stern (2023). Hype um neue Übersetzer-KI: Das ist das Start-up hinter den viralen Videos. [20.9.23]  

X (2023). K.I. – Sprachtalent. [20.9.23] 

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Adresse

PHBern
Netzwerk Digitale Transformation
Think Tank Medien und Informatik
CH-3012 Bern

Kontakt

ttim@phbern.ch
+41 31 309 28 95