[Trennmuster] Grundwortschatz

Werner LEMBERG wl at gnu.org
So Aug 11 06:36:06 CEST 2013


> Persönlich würde ich streng formale Aufnahmekriterien für die
> Wortliste bevorzugen.  Also die Zugehörigkeit zu konsensfähig
> relevanten Korpora, seien es nach Häufigkeit(sklassen) sortierte
> Korpora, thematische Korpora (z. B. Bücher) oder auch Wörter mit
> gewissen sprachlichen Besonderheiten (vgl.
> <URL:http://projekte.dante.de/Trennmuster/WortdatenbankAufgaben>)

Ich habe nichts dagegen, wenn eine größere Zahl an Wörtern auf diese
Weise eingepflegt werden.  Es muß halt jemand *tun*.

> Werner findet aber eher alle Wörter relevant.  In dem Falle gibt die
> Liste von wenig effektiven Mustern einen Anhaltspunkt, welche Wörter
> bzw. Flexionsformen zunächst ergänzt werden sollten.

Nun, ich schätze, daß mehr als 95 Prozent der Wörter den (bereinigten)
Häufigkeitsklassen 1-19 der Mannheimer Liste folgen.  Die wenigen
Wörter, die manuell ergänzt wurden, fallen da eigentlich nicht ins
Gewicht.  Wer also Häufigkeitsklasse 20 ergänzen will: Nur zu!

> Ich versuche demnächst mal, eine aktuelle Liste wenig effektiver
> Muster bzw. der betroffenen Wörter zu erstellen.

Klingt interessant.


    Werner


Mehr Informationen über die Mailingliste Trennmuster