Hinweise zum Mogeln

      Name                    Zuletzt verändert  Größe  Beschreibung

[DIR] Parent Directory 31-Jan-2002 18:37 - Inhalt der CD [DIR] 20010827/ 31-Jan-2002 21:17 - Beispieldateien für die Datenbank neu17 [DIR] 20011028/ 31-Jan-2002 21:18 - unklar und evtl. unvollständig

Anmerkungen

Zum Mogeln sind folgende Schritte notwendig:

  1. ggf. einen kleinen Korpus eintragen, der die gewünschten Korpusbelege enthält. Details zu den einzelnen Schritten können dem Abschlussbericht entnommen werden.
    1. mogel-de.txt und mogel-en.txt schreiben
    2. index.xml anlegen
    3. bin/preproc.py ausführen
  2. Die als erkannt einzutragenden Phrasen werden in der Datei phrases zusammengestellt. Sie enthält je Phrase die deutschen und englischen Tag-Zeilen und die Liste der Segment-IDs der Korpusbelege. Die Segment-IDs können mit dem Skript align/demo-qdb.py ermittelt werden. Siehe Dokumentation.
  3. Das Skript bin/mogel.py trägt die Phrasen in die Datenbank ein. Aufruf:
          mogel.py phrases
          

Die Dateien vom 28. Oktober 2001 dienen anscheint zum Eintragen des Beispielkorpus für die Folien der Abschlusspräsentation. Es ist aber nicht mehr bekannt, warum das Skript phrase.py geschrieben wurde.


Joachim Wagner, 31. Januar 2002