[Trennmuster] Probleme mit »abgleich_neueintraege.py«
Werner LEMBERG
wl at gnu.org
Sa Apr 21 07:40:15 CEST 2018
Folgende Testeingabe
Aareal
abwracken
ergibt mit
./abgleich_neueintraege.py < test > test.out
folgende Ausgabe:
## identisch rekonstruiert:
## eindeutig abgeleitet
Aareal;Aa=re-al
abwracken;-2-;ab<wra{ck/k-k}en;ab<wra-cken
## eindeutig abgeleitet (andere Großschreibung)
## mehrdeutig abgeleitet
## Rest
Was genau bedeutet »eindeutig abgeleitet«? Ich hätte erwartet, daß
das Skript das Wort »abwracken« als »bereits vorhanden« (o.ä.)
klassifiziert und gar nicht erst weiter behandelt – zumindest sollte
das Wort nicht in der gleichen Kategorie wie das neue (und falsche)
Wort »Aareal« stehen.
Werner
Mehr Informationen über die Mailingliste Trennmuster