next up previous contents index
Nächste Seite: Studienprojekt KoKS Aufwärts: Magisterarbeit Joachim Wagner Vorherige Seite: Zusammenfassung   Inhalt   Index

Korpusaufbereitung für CAT-Systeme

In dieser Arbeit wird ein bilinguales Korpus verwendet, um Fallbeispiele für die Betrachtung einzelner Probleme der datengestützten Übersetzung untersuchen zu können. Das verwendete Korpus besteht aus einer Sammlung von deutschen und englischen Texten zusammen mit ihren jeweiligen englischen und deutschen Übersetzungen. Ein Teilkorpus kann auch Paare von deutschen und englischen Texten enthalten, die aus einer dritten Sprache übersetzt wurden.

In diesem Kapitel wird das Korpus vorgestellt. Zuerst werden die Quellen genannt. Dann werden die Schritte der Vorverarbeitung beschrieben, die das Korpus in eine Form bringen, in der es leichter genutzt werden kann. Anschließend werden kurz einige quantitativen Abgaben zum Korpus gemacht. Schließlich wird eine Stichprobe aus dem Korpus vorgestellt, die zeigen soll, welche Arten von Fuzzy-Matches erwartet werden können und wie häufig sie auftreten. Die Stichprobe wird Grundlage für die Betrachtungen im Kapitel [*] sein.



Unterabschnitte
next up previous contents index
Nächste Seite: Studienprojekt KoKS Aufwärts: Magisterarbeit Joachim Wagner Vorherige Seite: Zusammenfassung   Inhalt   Index
JWaGnER@CoMpUtING.Dcu.Ie