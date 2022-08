Vermutlich hat jeder schon mal auf YouTube eines der Videos angeschaut und bemerkt, dass dort häufig Englisch gesprochen wird. Das trifft auf einen Großteil der 500 Stunden Videomaterial zu, die dort jede Minute veröffentlicht werden. Ist einem dann noch bewusst, dass nur etwa 10 Prozent der Weltbevölkerung die englische Sprache beherrschen, wird klar, welches Potenzial eine Technologie hat, die in der Lage ist, solche Videoinhalte qualitativ hochwertig zu übersetzen. Beispielsweise KI-basierte Übersetzungssoftware, die neben dem Geschlecht auch die Stimmung der sprechenden Person erkennt, ist in Begriff dabei, den Übersetzungsmarkt zu revolutionieren und auf diese Weise wertvolle Informationen für die Nachwelt erhalten.

Übersetzungen – Markt mit großem Potenzial

Unsere Welt ist immer stärker vernetzt und die Globalisierung von Wirtschaft und Gesellschaft schreitet voran. Viele Menschen sind z. B. sehr interessiert daran zu erfahren, was in den zahlreichen Krisengebieten der Welt geschieht, allen voran in der Ukraine. Der ukrainische Präsident Volodymyr Selensky wendet sich immer wieder an seine eigene Nation, lässt sich aber auch bei wichtigen Veranstaltungen und Sitzungen ausländischer Institutionen dazuschalten und hält eindringliche Reden.

Gerade auf dem politischen Spielfeld kommt es aber darauf an, möglichst hochwertige Übersetzungen zu liefern, denn ein falsches Wort kann zu weiteren Verwerfungen führen. Die Lösung kann hier eine KI-basierte hochentwickelte Technologie wie die des Schweizer Startups vidby sein. Das vom gebürtigen Kiewer Alexander Konovalov und Eugen von Rubinberg gegründete Unternehmen hat eine solche Übersetzungssoftware entwickelt und ein Teil des Vidby-Teams arbeitet augenblicklich teilweise noch in der Ukraine, wie ein Artikel von Forbes kürzlich berichtete. Unter anderem übersetzt er Reden des ukrainischen Präsidenten in 20 bis 30 verschiedene Sprachen.

Die Übersetzung von gesprochenen Inhalten bietet eine Vielzahl von Möglichkeiten, etwa in Form von Simultanübersetzungen bei Videokonferenzen. Wo bisher die Sprachkompetenz von Dolmetschern zum Einsatz kommt, ließe sich diese durch den Einsatz von Übersetzungssoftware sinnvoll ergänzen. Es gibt für qualitativ hochwertige Übersetzungen schier endlose Einsatzmöglichkeiten, etwa video-basierte Bedienungsanleitungen, als Video festgehaltene Produktvorstellungen für internationale Geschäftspartner oder in Videos festgehaltene Fachvorträge. Deshalb bezeichnen Experten den Übersetzungsmarkt mit Recht als Milliardenmarkt.

KI reduziert die bisherige Qualitätsschwäche

Als größte Schwäche bisher am Markt zu findender Übersetzungssoftware galt die geringe Qualität hinsichtlich der Übersetzungsgenauigkeit, die bei gerade einmal 50 Prozent lag. Was für den privaten Gebrauch und die Übersetzung einfacher Texte vollkommen ausreichend ist, genügt bei Videosequenzen mit Sach- und Fachtexten nicht mehr. Auch im unternehmerischen Umfeld, also etwa bei Übersetzungen für Institutionen oder Unternehmen, braucht es Lösungen, die eine deutlich höhere Genauigkeit bieten.

KI-gestützte Softwares übersetzen Videos in mehr als 70 Sprachen. Bild: Pexels.com, Nothing Ahead

Bei Übersetzungssoftware, wie sie vidby entwickelt hat und deren Grundlage KI (Künstliche Intelligenz) ist, erreichen Übersetzungen eine Genauigkeit zwischen 80 und 99 Prozent. Dadurch ist sie auch für alle interessant, die eine starke Affinität zum gesprochenen Wort haben, also vor allem Medienunternehmen, Großkonzerne, NGOs oder Museen.

Algorithmen zum Erkennen von Stimmungen und Geschlecht

Damit die Übersetzung eines Sprechteils in Videos nicht einfach nur korrekt wiedergegeben wird, sondern auch „lebendig“ wirkt und zum Bild passt, wird im Rahmen moderner Übersetzungssoftware daran gearbeitet, Algorithmen zu entwickeln, die nicht nur das Geschlecht bestimmen können, sondern durch Analyse der Stimmfarbe in der Lage sind, die jeweilige Stimmung der sprechenden Person zu erkennen. Diese Erkenntnisse werden dann in der Übersetzung verarbeitet, sodass diese noch natürlicher wirkt.

Vorteilhaft ist eine Software im Bereich automatisierter Übersetzung vor allem deshalb, weil sie den Nutzen neben einer hohen Übersetzungsgenauigkeit auch Schnelligkeit und niedrige Kosten bietet. Effiziente Tools benötigen lediglich zwei Minuten, um die Übersetzung einer Minute Originalvideo zu erstellen. Dabei ist es unwichtig, welche der 70 verfügbaren Sprachen der Nutzer wählt. Diese extrem zügige Übersetzung ist nur durch die ausgereifte Technologie, den Einsatz von KI und den hohen Grad an Automation möglich. Sämtliche Schritte, also die Spracherkennung, die Übersetzung bzw. Synchronisation sowie die Tonbearbeitung laufen automatisiert ab.

Erfahrung als Grundlage neuer Technologien

Eugen von Rubinberg (links) und Alexander Konovalov (rechts). Foto: vidby.com



Der Fortschritt bei der Entwicklung softwaregestützter Übersetzungsprogramme ist rasant. Möchte man hier erfolgreich sein, braucht man vor allem hohe Innovationskraft sowie bereits gesammelte Erfahrungen, auf die man zurückgreifen kann. Alexander Konovalov und Eugen von Rubinberg, die Gründer von vidby bringen beides mit. Vor dem Start von vidby hatten die beiden nämlich schon den Messengerdienst DROTR gegründet. Schon bei diesem kamen Technologien zum Einsatz, mit deren Hilfe automatische Übersetzungen möglich waren.

Die Hauptzielgruppe von DROTR waren, wie bei anderen Messengerdiensten auch, private Nutzer. Die jetzt für vidby entwickelte Software richtet ihr Augenmerk hauptsächlich auf den Bereich B2B, zu dem öffentliche Einrichtungen sowie die Berufsgruppe der Influencer gehören. Die große Professionalität der Software ist für Nutzer wichtig, die verstärkt mit Videoinhalten arbeiten, bei denen eine exakte Übersetzung der gesprochenen Worte existenziell ist.

Eine solche Übersetzungssoftware auf Grundlage von KI ist ein gutes Beispiel dafür, wie wichtig die Entwicklung fortschrittlicher Technologien ist und wie groß der Beitrag ist, den sie hinsichtlich der Überwindung von Sprachbarrieren leisten können. Sie helfen dabei, Menschen zusammenzuführen und sorgen dafür, dass kulturelles, wissenschaftliches und technisches Wissen in unserer schnelllebigen Zeit nicht einfach vergessen wird oder verloren geht.