In dieser Arbeit wird ein bilinguales Korpus verwendet, um Fallbeispiele für die Betrachtung einzelner Probleme der datengestützten Übersetzung untersuchen zu können. Das verwendete Korpus besteht aus einer Sammlung von deutschen und englischen Texten zusammen mit ihren jeweiligen englischen und deutschen Übersetzungen. Ein Teilkorpus kann auch Paare von deutschen und englischen Texten enthalten, die aus einer dritten Sprache übersetzt wurden.
In diesem Kapitel wird das Korpus vorgestellt.
Zuerst werden die Quellen genannt.
Dann werden die Schritte der Vorverarbeitung
beschrieben, die das Korpus in eine Form bringen,
in der es leichter genutzt werden kann.
Anschließend werden kurz einige quantitativen
Abgaben zum Korpus gemacht.
Schließlich wird eine Stichprobe aus dem Korpus
vorgestellt, die zeigen soll, welche Arten von
Fuzzy-Matches erwartet werden können und wie
häufig sie auftreten.
Die Stichprobe wird Grundlage für die Betrachtungen
im Kapitel
sein.