next up previous contents index
Nächste Seite: Ein Ansatz zur Nutzung Aufwärts: Magisterarbeit Joachim Wagner Vorherige Seite: Ausblick   Inhalt   Index

Bilinguale Korpora in CAT-Systemen - eine Anwendungsperspektive

Die Anwendung eines Translation Memorys stößt an ihre Grenzen, wenn nur Subsegment-Matches oder Fuzzy-Matches mit geringer inhaltlicher Ähnlichkeit gefunden werden. Werkzeuge, mit denen ein CAT-System den Übersetzer auch in diesen Situationen unterstützen kann, wurden im Abschnitt [*] vorgestellt. Sowohl datengestützt als auch automatisch erstellt neben einem Translation Memory nur die EBMT (Example-Based Machine Translation) Übersetzungsvorschläge.

EBMT-Ansätze unterscheiden sich sehr in der Art des linguistischen Wissens, das sie einsetzen. Ein Teil der Ansätze extrahiert Transferregeln aus den Daten, die dann in einem klassischen MT-System verwendet werden. () bildet in einer Vorverarbeitungsphase flache Strukturen, die Variablen enthalten, um sie in der Übersetzungsphase auf die zu übersetzenden Sätze anzuwenden. Die Extraktion der Strukturen, die er Translation Patterns nennt, erfolgt mit einem machinellen Lernverfahren. Linguistisches Wissen in Form von POS-Tags oder Grundformannotationen wird nicht eingesetzt. Einführungen und Übersichten zu EBMT bieten () und ().

In Nachfolgendem wird eine Anwendungsperspektive gezeigt, die keinen dieser Ansätze verfolgt, sondern sich im wesentlichen auf Alignment und Ähnlichkeitsmaße stützt.



Unterabschnitte
next up previous contents index
Nächste Seite: Ein Ansatz zur Nutzung Aufwärts: Magisterarbeit Joachim Wagner Vorherige Seite: Ausblick   Inhalt   Index
JWaGnER@CoMpUtING.Dcu.Ie