[Trennmuster] Vergleich alte und neue patgen-Parameter
Werner LEMBERG
wl at gnu.org
Di Apr 7 11:19:34 CEST 2020
Hallo Keno!
> Spannend wäre jetzt die Untersuchung der Auswirkung der
> vorgeschlagenen Parameter auf die Trennqualität ...
Hier sind 100000 zufällig ausgewählte Wörter (alles einfache
Komposita), getrennt mit den derzeitigen Mustern (»old«) und Mustern,
die Deine vorgeschlagenen Parameter verwenden (»new«).
(hyphenate_neueintraege.py + Entfernung aller Einträge mit »·«)
https://we.tl/t-zoQygDXbXv
Und hier eine Diff-Datei, wo alle Wörter in »german.dic« mit den
derzeitigen und den Keno-Parameter-Mustern getrennt und verglichen
werden.
(hyphenate.py)
https://we.tl/t-4cJX02Xc88
Mein Résumé: Die Qualität ist ziemlich gleich. Ich sehe keine echte
Verbesserung oder Verschlechterung.
Ich denke daher, wir sollten in Zukunft Deine neuen Parameter verwenden.
Werner
Mehr Informationen über die Mailingliste Trennmuster