[Trennmuster] patgen-Kram
Stephan Hennig
mailing_list at arcor.de
Fr Aug 2 00:17:11 CEST 2013
Am 01.08.2013 22:34, schrieb Georg Pfeiffer:
> Am Do 01 Aug 2013 20:43:53 schrieb Stephan Hennig:
>> Hast du mal den Google-Books-Korpus mit den Lua-Skripten aus meiner
>> anderen E-Mail bearbeitet?
>
> Ein bis vier Gigabyte, wo ich noch nicht einmal mit meinen fuffzig Einträgen
> zurandekomme. Das habe ich mir für später vorgemerkt.
Das sind die rohen Korpus-Dateien, die man bei Google herunterladen
kann. Wenn man keine Filter einsetzt, ist die Ergebnisliste des 2009er
Korpus (ger-all) um die 60 MB groß, je nach Ausgabeformat.
>> Alte Frage, worauf stützt sich die Trennung, wenn es gar keine
>> Konventionen zur Rechtschreibung gab?
>
> Eigentlich auf die traditionalen Kriterien, Sprechsilben und Etymologie. Ich
> will ja gar nicht etwaige historische Regeln rekonstruieren, sondern nur alte
> Texte so trennen, daß es heutigen Lesern nicht aufstößt und sie vom Inhalt
> ablenkt.
Klar. Meine Frage rührt daher, dass ich mich frage, ob es sinnvoll
wäre, die Wörter in die Wortliste aufzunehmen. Entweder als Teil der
traditionellen Rechtschreibung oder als neue Varietät. Sind sich die
Sprachgelehrten über die historischen Trennungen einig oder gibt es da
vielerlei Varianten?
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster