Die nachfolgenden Tabellen zeigen Daten zu den Sätzen (genauer: Segmenten) der Stichprobe geordnet nach der durchschnittlichen Ähnlichkeit der besten vier Fuzzy-Matches. Angegeben sind zusätzlich die Längen der Sätze in Token sowie die Güte der Belegsituation, die aus der Klassifikation der Fuzzy-Matches berechnet wird. Fehlt letzterer Wert, dann wurden die Fuzzy-Matches zu dem betroffenen Satz (noch) nicht klassifiziert.