next up previous contents index
Nächste Seite: Granularität Aufwärts: Translation Memory in CAT Vorherige Seite: Austauschbarkeit mittels TMX   Inhalt   Index

Segmentierung eines Bitexts in TUs

Ein Translation Memory wird eingesetzt, um Textstücke, die bereits einmal übersetzt wurden, nicht von neuem übersetzen zu müssen, sondern die Übersetzung vom Computer automatisch einfügen zu lassen. Wichtig für ein TM ist es, dass es die Übersetzung der vorgegebenen Einheit im zweisprachigen Textmaterial zuverlässig identifizieren kann. Der Ausgangs- und Zieltext des Referenzmaterials werden dazu so segmentiert, dass das $ i$-te Segment des Zieltextes die Übersetzung des $ i$-ten Segments der Ausgangstextes ist. Innerhalb der Segmentpaare können andere Zuordnungen als $ 1:1$ Zuordnung vorliegen, wie in diesem Abschnitt noch erläutert wird. Insbesondere ist es möglich, dass ein Segment mehrere Einheiten umfasst oder leer ist. Sind die Einheiten Sätze, dann wird häufig genau eine Einheit der Ausgangssprache einer Einheit der Zielsprache zugeordnet. Ein Segmentpaar, dessen zielsprachlicher Teil Übersetzung des ausgangssprachlichen Teils ist, wird als Translation Unit (TU) bezeichnet. Segmentpaare von verschiedenen Segmenten mit gleichem Index sind also nach Wahl der Segmentierung immer TUs.

Die Zuordnung der Einheiten, die z.B. durch die im vorangegangenen Absatz beschriebene Segmentierung vorgegeben werden kann, wird Alignment genannt. Am Ende dieses Abschnitts wird in Grundzügen auf die verschiedenen Arten von Alignments ein eingegangen, die zum Teil flexibler als die beschriebene Segmentierung sind. Zunächst jedoch wird ein kurzer Überblick gegeben, welche Einheiten in Frage kommen und welche Probleme sich mit ihnen verbinden. Dann werden speziell Sätze als Einheiten betrachtet. Es wird mit Material aus dem in dieser Arbeit verwendeteten Korpus verdeutlicht, dass selbst bei Sätzen das Auftreten von nicht trivialen Übersetzungsentsprechungen nicht ungewöhnlich ist.

Konkrete Verfahren, mit denen ein Alignment hergestellt werden kann, werden in diesem Abschnitt nicht beschrieben. Hier soll nur ein grundlegendes Verständnis geschaffen werden. Ein Beispiel für ein Verfahren kann im Abschnitt [*] gefunden werden, in dem der für diese Arbeit verwendete maschinelle Satzaligner vorgestellt wurd. Eine Übersicht über Alignmentverfahren bietet (). Viele CAT-Programme alignen jedoch nicht automatisch, sondern unterstützen den Benutzer lediglich bei der Herstellung eines Alignments.



Unterabschnitte
next up previous contents index
Nächste Seite: Granularität Aufwärts: Translation Memory in CAT Vorherige Seite: Austauschbarkeit mittels TMX   Inhalt   Index
JWaGnER@CoMpUtING.Dcu.Ie