next up previous contents index
Nächste Seite: Segmentierung eines Bitexts in Aufwärts: Integration in den Übersetzungsprozess Vorherige Seite: Einsatz für mehrere Übersetzungsaufträge   Inhalt   Index

Austauschbarkeit mittels TMX

Ein Translation Memory speichert die Zuordnung der Sätze (oder anderer Einheiten) von Ausgangs- und Zieltext dauerhaft zusammen mit den Texten. Die einmal geleistete Arbeit, diese Zuordnung herzustellen, kann somit in beliebig vielen Übersetzungsprojekten genutzt werden. Allerdings ist die Art, wie diese Daten gespeichert werden, nicht einheitlich. Jeder Hersteller löst auf eigene Weise das Problem, die Daten so zu speichern, dass die gewünschten Zugriffsarten ausreichend schnell erfolgen können. Auch ist unterschiedlich, welche zusätzlichen Informationen über das Referenzmaterial abgelegt werden. Die Daten eines TMs können daher nicht direkt in einer TM-Software eines anderen Herstellers benutzt werden.

Bis vor kurzem gab es auch keine Möglichkeit, die Daten in einem von mehreren Herstellern unterstützten Austauschformat zu exportieren oder zu importieren. Wenn Referenzmaterial in einem anderen TM genutzt werden sollte, musste das Textmaterial erneut sämtliche Vorverarbeitungsschritte einschließlich der aufwendigen Zuordnung der Übersetzungsentsprechungen durchlaufen. Dies bedeutete zum einem, dass dem einzelnen Übersetzer eine Hürde gestellt wurde, das Produkt zu wechseln. Zum anderen musste der Übersetzer verschiedene TM-Software besitzen oder zumindest mit ihnen umgehen können, um vorhandene Translation Memorys nutzen zu können, die der vorausschauende Auftraggeber bereits zusammen mit den bisher erstellten Übersetzungen erworben hat. Des Weiteren werden die Verwendungsmöglichkeiten des vorhandenen Referenzmaterials eingeschränkt, wie () darlegt. betrachtet die Formate, in denen die zu übersetzenden Texte und das Referenzmaterial verarbeitet werden können. Er behauptet, dass das Übersetzungswissen des Translation Memorys kaum genutzt werden könne, wenn das zu übersetzende Textmaterial in einem anderen Format vorliegt als das, in dem die Dokumente kodiert waren, die dem vorhandenen Referenzmaterial zus Grunde liegen. Diese Aussage macht nach der bisherigen Beschreibung von TM in dieser Arbeit keinen Sinn. Ein Übersetzungsvorschlag wird von TM immer dann unterbreitet, wenn ein zu übersetzender Satz im Referenzmaterial gefunden wird. Man würde annehmen, dass nur die Wörter oder Zeichen des Satzes aber nicht das Format für die Suche eine Rolle spielen. Eine Erklärung der Behauptung könnte sein, dass TM-Produkte verwendet, die formatspezifische Informationen mit im TM speichern und bei der Suche diese auch berücksichtigen. Wie dem auch sein, zu der Schlussfolgerung, dass Barrieren bei der Nutzung des in einem TM gespeicherten Übersetzungswissens bestehen, gelangt man auch einfacher. Kein TM unterstützt alle denkbaren Formate. Liegen in einem Übersetzungsauftrag inhaltsähnliche Dokumente in verschiedenen Formaten vor, dann kann es passieren, dass dem Übersetzer kein TM-Produkte zur Verfügung steht, dass beide Formate unterstützt. Es müssen zwei verschiedene TM-Produkte eingesetzt werden. Die zu den Dokumenten im einen Format gemachten Übersetzungen können so nicht bei der Übersetzung der Dokumente im anderen Format genutzt werden. Die drei Formatgebiete, die man in der Softwarelokalisierung antrifft -- nämlich Benutzerschnittstellen, Hilfesysteme und Handbücher.2.2 --, bilden laut solche Inseln, die nicht überbrückt werden können. Er nennt dies Fragmentierung.

Zur Lösung dieser Probleme hat die Localization Industry Standards Association (LISA) im September 1997 ein standardisiertes Format für den Austausch von Translation Memorys vorgestellt. Es gehört zu einer Gruppe von Standards (OSCAR, Open Standards for Container/Content Allowing Re-use) und heißt Translation Memory eXchange (TMX). Es gehört zu einer Gruppe von Standards, die unter der Bezeichnung OpenTag zusammengefasst werden. Weitere OpenTag Standards sind TBX für den Terminologieaustausch und OLIF für Wörterbücher. Drei Hersteller durchlaufen zur Zeit den Zertifizierungsprozess für die Konformität zu diesem offenen, herstellerübergreifenden Austauschformat.

Laut () (Artikel zu einem ELAN Korpus) wird in () TMX vorgestellt. TMX beschäftige sich vor allem damit, Markup-Informationen der Ausgangsdokumente möglichst gut zu erhalten. Andererseits sagt , dass das TMX-Format Strukturinformation (er nennt das DIV-Tag) nicht repräsentiert würde. Des Weiteren erwähnt er dort das Text Encoding and Interschange Format TEI P3 als Alternative. TEI erhalte die ursprünglichen Dokumente und speichere die Zuordnung in einer getrennten Datei.

Ein weiteres offenes Format, das für den Austausch von TMs adaptiert werden könnte, ist CES (Corpus Encoding Standard).



Fußnoten

... Handbücher.2.2
Genannt werden die Begriffe ,,Software``, ,,Help`` und ,,Publications``. Die Übersetzung trifft vermutlich das gemeinte, da später von ,,WinHelp`` und ,,software resource files`` die Rede ist.

next up previous contents index
Nächste Seite: Segmentierung eines Bitexts in Aufwärts: Integration in den Übersetzungsprozess Vorherige Seite: Einsatz für mehrere Übersetzungsaufträge   Inhalt   Index
JWaGnER@CoMpUtING.Dcu.Ie