[Trennmuster] Probleme mit »abgleich_neueintraege.py«

Werner LEMBERG wl at gnu.org
Sa Apr 21 07:40:15 CEST 2018


Folgende Testeingabe

  Aareal
  abwracken

ergibt mit

  ./abgleich_neueintraege.py < test > test.out

folgende Ausgabe:

  ## identisch rekonstruiert:

  ## eindeutig abgeleitet
  Aareal;Aa=re-al
  abwracken;-2-;ab<wra{ck/k-k}en;ab<wra-cken

  ## eindeutig abgeleitet (andere Großschreibung)

  ## mehrdeutig abgeleitet

  ## Rest

Was genau bedeutet »eindeutig abgeleitet«?  Ich hätte erwartet, daß
das Skript das Wort »abwracken« als »bereits vorhanden« (o.ä.)
klassifiziert und gar nicht erst weiter behandelt – zumindest sollte
das Wort nicht in der gleichen Kategorie wie das neue (und falsche)
Wort »Aareal« stehen.


    Werner




Mehr Informationen über die Mailingliste Trennmuster