10.09.2020

Maschinensynchronisation

Maschinensynchronisation – Wort des Tages – EVS Translations
Maschinensynchronisation – Wort des Tages – EVS Translations

Manchmal kann es einen richtig ärgern oder frustrieren, einen Film lesen zu müssen. Ja, Sie haben richtig gelesen: Natürlich geht es bei Filmen, Videos etc. in erster Linie nicht ums Lesen, sondern ums Anschauen, doch wer fremdsprachliche Filme ansieht, muss sich oft durch Unmengen an Untertiteln kämpfen – und gibt vielleicht irgendwann entnervt auf. Untertitel sind sicher auch nicht der Weisheit letzter Schluss, hatten im Vergleich zur Synchronisation bisher aber den Vorteil, dass sie kostengünstiger produziert werden können und schneller verfügbar sind. Eine neue Technologie, die Maschinensynchronisation bzw. das maschinelle Dubbing, könnte das allerdings ändern.

Sehen wir uns erst einmal an, wie sich der Begriff „maschinelles Dubbing“ zusammensetzt: Das Wort Maschine kommt aus dem Mittelfranzösischen (machine) bzw. dem Lateinischen (machina) und dem Altgriechischen (μηχανή), bedeutet in etwa Werkzeug, Hilfsmittel oder Maschine und beschreibt ein Gebilde, das als technisches Arbeitsmittel eingesetzt wird. Dubbing, ein heute im Deutschen weithin verbreitetes Synonym für Synchronisation, ist eine Zusammenziehung des englischen Wortes double, hat seinen Ursprung im Altfranzösischen (dobler) und Lateinischen (duplare) und bedeutet „etwas zweimal tun“. In der Bedeutung, die für uns hier interessant ist, wurde „Dubbing“ erstmals in den Anfangszeiten des Tonfilms verwendet – wer hätte es gedacht? – und von Walter B. Pitkin und William Moulton Marston in deren Werk The Art of Sound Pictures als ein Verfahren beschrieben, mit dem eine Tonspur (bzw. Stimmen) über eine Filmspur gelegt werden kann (können).

Das Dubben oder Synchronisieren war im Vergleich mit der Untertitelung schon immer mit einem hohen Aufwand verbunden, und das ganz abgesehen von den Produktions- bzw. technischen Aspekten: Das Gesprochene muss übersetzt werden, dann erfolgt (aus Gründen der Authentizität) eine Anpassung an den jeweiligen Sprachraum und erst wenn dann die Lippensynchronisation steht, bei der ein besonderer Fokus auf verschiedenste Aspekte wie die Artikulation, die Betonung und die Sprachmelodie zu legen ist, geht es los mit den Aufnahmen. Allerdings könnte der Zeit-, Arbeits- und Kostenaufwand in Verbindung mit der Synchronisation durch die Nutzung und Anpassung neuester Technologien in den Bereichen Maschinenübersetzung, maschinelles Lernen, Spracherkennung und Text-to-Speech-Technologie sowie den Einsatz von sogenannten Natural Voice Readers, die eingegebene Texte in natürlich klingender Sprache vorlesen, deutlich reduziert werden. Das Dubben könnte dann den Wettbewerb mit der Untertitelung aufnehmen und würde es den Zuschauern ermöglichen, Filme einfach nur anzuschauen, anstatt sie zusätzlich auch noch lesen zu müssen.

Natürlich muss dieses synergetische Zusammenwirken moderner Technologien aber erst mal perfektioniert werden. Bei der Maschinenübersetzung (und auch der Spracherkennung) besteht die Gefahr, dass feine sprachliche Nuancen verloren gehen oder bei mehrdeutigen Begriffen die falsche Bedeutung ausgewählt wird, und auch die Lippensynchronisation und das Timing haben ihre Tücken: In den meisten Fällen gelingt es zwar, das Gesagte mittels Maschinensynchronisation in enger Anlehnung an die Geschwindigkeit, den Ton und die Betonung im Original in einer anderen Sprache wiederzugeben, doch es bleibt eine Herausforderung, Zeitverzögerungen zwischen der im Bild sprechenden Person und dem darübergelegten Ton zu vermeiden. Gegenüber der zwar einfacheren, aber oft auch arbeitsaufwendigen Erstellung von Untertiteln, die einem als Zuschauer/in oft das Gefühl geben, den Fernseher als Kindle zu nutzen und den Film nur noch im Hintergrund wahrzunehmen, stellt das maschinelle Dubbing allerdings eine deutliche Verbesserung dar.