[Trennmuster] Arbeitslisten

Guenter Milde milde at users.sf.net
Mi Dez 2 13:29:53 CET 2020


Liebe Trennfreunde,

On 28.11.20, Keno Wehr wrote:
> Am 06.08.20 um 11:39 schrieb Werner LEMBERG:
> > > Ich werde Dir neue Dateien zuschicken, damit die Anzahl von
> > > Doubletten kleiner ist.

> Lieber Werner,
> von den 100 Dateien habe ich mittlerweile 24 eingepflegt. Mittlerweile
> häufen sich wieder die schon vorhandenen Einträge. Schick mir gern eine
> aktuelle Version, wenn es deine Zeit erlaubt.

Vorhandene Einträge auszusortieren sollte mit "filter_wortliste" einfach sein
(problematisch ist es mit ggf. vorhandenen auskommentierten Alternativen).

Ich habe aber noch einen anderen Vorschlag:

Neben den Neueinträgen hat auch die Berücksichtigung von Wörtern in
Umschrift in einer nicht unerheblichen Zahl von Fällen zu Regressionenen
geführt.
  Vor der nächsten Veröffentlichung von dehyph-exptl würde ich gern gezielt
Wörter korrigieren, die mit v0.6 korrekt getrennt werden (ohne explizit in
der wortliste zu sein) aber mit "master" nicht mehr.

Im September hatte ich 15599 solche Einträge mit Abweichung der
Standard-Trennstellen ermittelt. Nach Aussortieren von Ableitungen
(`filter_wortliste -a`), blieben 8011 Abweichung der
Standard-Trennstellen.  Ich denke, die Zahl dürfte aktuell in der
gleichen Größenordnung liegen.

Mein Vorschlag wäre, diese "Regressionsfälle" bevorzugt zu bearbeiten.
Ich kann dazu entweder die Liste neu generieren und verteilen oder
ein Rezept zum Nachbau zu Hause erstellen.

Eine schöne Adventszeit wünscht

Günter




Mehr Informationen über die Mailingliste Trennmuster