[Trennmuster] Grundwortschatz
Werner LEMBERG
wl at gnu.org
So Aug 11 06:36:06 CEST 2013
> Persönlich würde ich streng formale Aufnahmekriterien für die
> Wortliste bevorzugen. Also die Zugehörigkeit zu konsensfähig
> relevanten Korpora, seien es nach Häufigkeit(sklassen) sortierte
> Korpora, thematische Korpora (z. B. Bücher) oder auch Wörter mit
> gewissen sprachlichen Besonderheiten (vgl.
> <URL:http://projekte.dante.de/Trennmuster/WortdatenbankAufgaben>)
Ich habe nichts dagegen, wenn eine größere Zahl an Wörtern auf diese
Weise eingepflegt werden. Es muß halt jemand *tun*.
> Werner findet aber eher alle Wörter relevant. In dem Falle gibt die
> Liste von wenig effektiven Mustern einen Anhaltspunkt, welche Wörter
> bzw. Flexionsformen zunächst ergänzt werden sollten.
Nun, ich schätze, daß mehr als 95 Prozent der Wörter den (bereinigten)
Häufigkeitsklassen 1-19 der Mannheimer Liste folgen. Die wenigen
Wörter, die manuell ergänzt wurden, fallen da eigentlich nicht ins
Gewicht. Wer also Häufigkeitsklasse 20 ergänzen will: Nur zu!
> Ich versuche demnächst mal, eine aktuelle Liste wenig effektiver
> Muster bzw. der betroffenen Wörter zu erstellen.
Klingt interessant.
Werner
Mehr Informationen über die Mailingliste Trennmuster