[Trennmuster] Vergleich alte und neue patgen-Parameter

Werner LEMBERG wl at gnu.org
Di Apr 7 11:19:34 CEST 2020


Hallo Keno!


> Spannend wäre jetzt die Untersuchung der Auswirkung der
> vorgeschlagenen Parameter auf die Trennqualität ...

Hier sind 100000 zufällig ausgewählte Wörter (alles einfache
Komposita), getrennt mit den derzeitigen Mustern (»old«) und Mustern,
die Deine vorgeschlagenen Parameter verwenden (»new«).

  (hyphenate_neueintraege.py + Entfernung aller Einträge mit »·«)

    https://we.tl/t-zoQygDXbXv

Und hier eine Diff-Datei, wo alle Wörter in »german.dic« mit den
derzeitigen und den Keno-Parameter-Mustern getrennt und verglichen
werden.

  (hyphenate.py)

    https://we.tl/t-4cJX02Xc88

Mein Résumé: Die Qualität ist ziemlich gleich.  Ich sehe keine echte
Verbesserung oder Verschlechterung.

Ich denke daher, wir sollten in Zukunft Deine neuen Parameter verwenden.


    Werner




Mehr Informationen über die Mailingliste Trennmuster