[Trennmuster] Arbeitslisten
Guenter Milde
milde at users.sf.net
Do Dez 3 00:51:19 CET 2020
On 2.12.20, Keno Wehr wrote:
> Am 02.12.20 um 13:29 schrieb Guenter Milde:
> > Ich habe aber noch einen anderen Vorschlag:
> >
> > Neben den Neueinträgen hat auch die Berücksichtigung von Wörtern in
> > Umschrift in einer nicht unerheblichen Zahl von Fällen zu Regressionenen
> > geführt.
> > Vor der nächsten Veröffentlichung von dehyph-exptl würde ich gern gezielt
> > Wörter korrigieren, die mit v0.6 korrekt getrennt werden (ohne explizit in
> > der wortliste zu sein) aber mit "master" nicht mehr.
> >
> > Im September hatte ich 15599 solche Einträge mit Abweichung der
> > Standard-Trennstellen ermittelt. Nach Aussortieren von Ableitungen
> > (`filter_wortliste -a`), blieben 8011 Abweichung der
> > Standard-Trennstellen. Ich denke, die Zahl dürfte aktuell in der
> > gleichen Größenordnung liegen.
> >
> > Mein Vorschlag wäre, diese "Regressionsfälle" bevorzugt zu bearbeiten.
> > Ich kann dazu entweder die Liste neu generieren und verteilen oder
> > ein Rezept zum Nachbau zu Hause erstellen.
> Sehr gern.
> Zum konkreten Vorgehen hätte ich folgenden Vorschlag:
> Es wird eine Liste noch zu bearbeitender Einträge (zunächst die von dir
> genannten 8000) im Repositorium abgelegt (zum Beispiel im Verzeichnis
> „zusatzlisten“).
Ich würde große temporäre Daten gern aus dem Repositorium fernhalten -
die brauchen wirklich nicht für alle Zeiten wiederauffindbar zu sein. Ich
hatte eher an eine Verteilung über private E-Mail oder Selbstbau gedacht.
Rezept folgt.
Zur Arbeitsaufteilung schlage ich eine Verteilung nach Anfangsbuchstaben vor.
Nach einiger Zeit ist dann sowieso eine Neuerstellung und -aufteilung dran.
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster