Bogdan Babych, neuer Technischer Leiter bei der Lingenio GmbH und Professor an der Universität Leeds, trägt bei der diesjährigen Konferenz der European Association for Machine Translation (EAMT) in Alicante über eine neues Verfahren zur Gewinnung von Übersetzungsdaten aus sog. vergleichbaren Corpora mit großem Potenzial für die mehrsprachige Termextraktion vor.

Die EAMT veranstaltet jährlich eine Konferenz zu neuesten Entwicklungen in der Maschinellen Übersetzung. Dieses Jahr fand die Veranstaltung in Alicante statt. (The 21st Annual Conference of the European Association for Machine Translation). Ein wichtiges aktuelles Thema ist die Gewinnung von Übersetzungsdaten aus sog. ‚vergleichbaren Corpora‘ (Comparable Corpora), d.h. von Texten unterschiedlicher Sprache die nicht Übersetzungen voneinander sind, sondern nur in der Thematik ähnlich.

Das ist gerade für Übersetzungen von und in sog. ‚kleinere Sprachen‘ wichtig. Das sind solche, für die es vergleichsweise wenig elektronisch verfügbare Texte gibt und – vor allem – wenig Übersetzungen in ‚große Sprachen‘ wie Englisch oder Französisch. Um Übersetzungssysteme trainieren zu können, muss dann auf andere, nur vergleichbare, Korpora ausgewichen werden. Für diese ist es von großer Bedeutung, sog. Cognates zu finden, d.h. Wörter in den Texten die mit großer Sicherheit als Übersetzung voneinander erkannt werden können. Bei Vorliegen von nur bescheidenen Wörterbüchern, wie oft z.B. zwischen asiatischen und europäischen Sprachen der Fall, ist das ein großes Problem.

Prof. Babych hat nach detaillierten Studien zu diesem Thema nun eine vielversprechende Arbeit vorgelegt die zur Bestimmung von Cognates zusätzliche, standardisierte und automatisch abfragbare Kriterien aus der Phonologie mit einbezieht. Die Arbeit ist auf großes Interesse bei Kollegen gestoßen, u.a. von der School of Computing der University of Dublin und der Universitat d’Alicant, beides bekannte Zentren innovativer Forschung zur automatischen Übersetzung.

Lingenio wird das Verfahren in seine Term-Extraktions-Systeme zur Unterstützung von diversen Übersetzungsprozessen integrieren.

Mehr zu der Arbeit zu ‚Development and evaluaton of phonological models for cognate identification‘ findet sich in den Proceedings der Konferenz.

 

Firmenkontakt und Herausgeber der Meldung:

Lingenio GmbH
Karlsruher Str. 10
69126 Heidelberg
Telefon: +49 (1805) 5464-36
Telefax: +49 (6221) 9146755
https://lingenio.de/

Ansprechpartner:
Kurt Eberle
Geschäftsführer
Telefon: +49 (6221) 6552706
Fax: +49 (6221) 619766
E-Mail: k.eberle@lingenio.de
Für die oben stehende Pressemitteilung ist allein der jeweils angegebene Herausgeber (siehe Firmenkontakt oben) verantwortlich. Dieser ist in der Regel auch Urheber des Pressetextes, sowie der angehängten Bild-, Ton-, Video-, Medien- und Informationsmaterialien. Die United News Network GmbH übernimmt keine Haftung für die Korrektheit oder Vollständigkeit der dargestellten Meldung. Auch bei Übertragungsfehlern oder anderen Störungen haftet sie nur im Fall von Vorsatz oder grober Fahrlässigkeit. Die Nutzung von hier archivierten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die United News Network GmbH gestattet.