[Trennmuster] Fehler in »abgleich_neueintraege.py«?
Guenter Milde
milde at users.sf.net
Mi Apr 11 16:08:10 CEST 2018
On 31.03.18, Werner LEMBERG wrote:
> [Trennmuster erzeugt von 8b9a428c, aber »wortliste« ist aktuell.]
> Wenn ich den Eintrag
> Aalmolchs;Aal=molchs
> in eine Datei »test« gebe und
> ./abgleich_neueintraege.py < test > test.out
> ausführe, erhalte ich
> ## eindeutig abgeleitet
> Aalmolchs;-2-;Aal=;Aal=molchs
> #Aalmolchs;Aal=molchs
> in »test.out«. Das schaut verdächtig nach einem Bug aus...
Ist ein nicht berücksichtigter Spezialfall:
Die einzige Fundstelle des Teilworts "Molchs" ist der des "Kamm-Molchs"
mit den Einträgen
Kammmolchs;-2-;-3-;Kamm=molchs
Kammolchs;-2-;Ka{mm/mm=m}olchs;-4-
Auf das Parsen der Zwei-von-Drei-Konsonanten-Wörter habe ich verzichtet
(ist zu komplex und kommt zu selten vor).
Nach dem Eintrag von
Molches;Mol-ches
Molchs;Molchs
klappt es wie gewünscht.
Kommit folgt.
Günter
Mehr Informationen über die Mailingliste Trennmuster