[Trennmuster] Grundwortschatz
Stephan Hennig
mailing_list at arcor.de
Mo Aug 12 00:27:02 CEST 2013
Am 11.08.2013 06:36, schrieb Werner LEMBERG:
>> Persönlich würde ich streng formale Aufnahmekriterien für die
>> Wortliste bevorzugen. Also die Zugehörigkeit zu konsensfähig
>> relevanten Korpora, seien es nach Häufigkeit(sklassen) sortierte
>> Korpora, thematische Korpora (z. B. Bücher) oder auch Wörter mit
>> gewissen sprachlichen Besonderheiten (vgl.
>> <URL:http://projekte.dante.de/Trennmuster/WortdatenbankAufgaben>)
>
> Ich habe nichts dagegen, wenn eine größere Zahl an Wörtern auf diese
> Weise eingepflegt werden. Es muß halt jemand *tun*.
Ich weiß. Eine streng formale Wortliste lässt sich aus entsprechenden
Quellen mit Hilfe von Skripten ja auch jederzeit automatisiert
nachträglich erstellen. Daher ist es kein Problem, wenn die Liste im
Repositorium mehr Wörter enthält.
>> Ich versuche demnächst mal, eine aktuelle Liste wenig effektiver
>> Muster bzw. der betroffenen Wörter zu erstellen.
>
> Klingt interessant.
Ich hatte Skripten dafür schon vor einigen Jahren in den Dateibereich
der alten Liste hochgeladen (patternstat-v0.2.zip). Ziel war die
Identifikation von Fehlern in der Wortliste durch eben solche wenig
effektiven Muster. Die Ausbeute war aber gering, mehr als ein oder zwei
falsch geschriebene Wörter hatte ich so nicht aufspüren können. Ein
weiteres Wort habe ich jetzt aber doch noch gefunden:
Delegiertenversamllung.
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster