Von dem im KoKS Projekt zusammengestellten Korpus wurden nur die zwei Teilkorpora ,,DE-News`` und ,,EU`` übernommen. Die übrigen Teilkorpora wurden entweder bereits im KoKS Projekt aus verschiedenen Gründen (siehe Abschlussbericht) nicht weiter verwendet oder ihre Berücksichtigung erschien wegen ihres geringen Umfangs nicht lohnenswert. Im KoKS-Abschlussbericht werden als Quelle der übernommenen Teilkorpora ,,De-News`` und ,,EU`` die Webseiten http://www.isi.edu/~koehn/publications/de-news/und http://europa.eu.int/rapid/start/welcome.htmgenannt.
() haben für ihre Untersuchung zusätzlich die ersten vier Harry Potter Bücher von Joanne K. Rowling als literarischen Teilkorpus erschlossen, da sie hofften, dort eine höhere Dichte von Kollokationen vorzufinden. Die Werke wurden im Juni 2002 über das Internet aus nicht notierten Quellen bezogen. Es ist davon auszugehen, dass Unbekannte die Bücher eingescannt und mit einer OCR Software in Text oder PDF umgewandelt haben. Die englischen und deutschen Fassungen konnten innerhalb zweier Tage zusammengestellt werden. Probleme bereiteten ein Teil der PDF-Dokumente. Wenn die Extraktion des Textes nicht gelang, musste eine weitere Quelle gefunden werden.