[Trennmuster] Fehler in »abgleich_neueintraege.py«?

Guenter Milde milde at users.sf.net
Mi Apr 11 16:08:10 CEST 2018


On 31.03.18, Werner LEMBERG wrote:

> [Trennmuster erzeugt von 8b9a428c, aber »wortliste« ist aktuell.]

> Wenn ich den Eintrag

>   Aalmolchs;Aal=molchs

> in eine Datei »test« gebe und

>   ./abgleich_neueintraege.py < test > test.out

> ausführe, erhalte ich

>   ## eindeutig abgeleitet
>    Aalmolchs;-2-;Aal=;Aal=molchs
>   #Aalmolchs;Aal=molchs

> in »test.out«.  Das schaut verdächtig nach einem Bug aus...

Ist ein nicht berücksichtigter Spezialfall:

Die einzige Fundstelle des Teilworts "Molchs" ist der des "Kamm-Molchs"
mit den Einträgen

 Kammmolchs;-2-;-3-;Kamm=molchs

 Kammolchs;-2-;Ka{mm/mm=m}olchs;-4-

Auf das Parsen der Zwei-von-Drei-Konsonanten-Wörter habe ich verzichtet
(ist zu komplex und kommt zu selten vor).

Nach dem Eintrag von 

 Molches;Mol-ches
 Molchs;Molchs

klappt es wie gewünscht.

Kommit folgt.

Günter




Mehr Informationen über die Mailingliste Trennmuster