[Trennmuster] german.dic-Abgleich

Tobias Wendorff tobias.wendorff at tu-dortmund.de
Mo Apr 27 17:35:46 CEST 2015


Am Mo, 27.04.2015, 07:15 schrieb Werner LEMBERG:
>
> Hier eine neue Version der Fehleinträge der Anfangsbuchstaben b-z,
> welche mit Günters Helferlein (und privaten Skripten von mir)
> aufbereitet wurde.

Werner: danke! Ich gucke nachher mal über die Liste.

Günter, ich habe ja ein ähnliches Script damals geschrieben und habe
zuerst nach eigenständigen Wörtern gesucht. Könntest du das in dein
Script übernehmen? Dann würden solche Problemchen nicht auftreten:
"Bierg-locken".

Ich frage mich auch, welches Pattern für "Bierg" verantwortlich ist.
Es gibt in der kompletten Wortliste kein Morphem (oder sonstwas) mit
"bierg", dafür aber über 100 Einträge mit "Bier=" und über 40 Einträge
mit "Glocken".

Irgendwie vermute ich immer noch, dass zu viele Einträge in der
Wortliste die Qualität der Trennmuster herunterreißen.




Mehr Informationen über die Mailingliste Trennmuster