[Trennmuster] Seltsames Verhalten von `abgleich-neueintraege.py`

Guenter Milde milde at users.sf.net
Do Apr 9 11:32:52 CEST 2020


Liebe Trennfreunde,

On  8.04.20, Keno Wehr wrote:
> Hier noch ein anderes Problem mit dem Skript:

> Die Eingabe „Erosionsereignis“ ergibt:

> ## eindeutig abgeleitet
> Erosionsereignis;-2-;E·ro-si.ons=er<eig>nis;-4-

> ## Rest

> Die Trennung ist zwar korrekt, nicht aber die Feldbelegung.

Das könnte evt. (ebenso wie Werners Problem mit "Docking") an der mit
"expand_teilwoerter.py" erstellten "Teilwortliste" liegen.

Da gab es noch einen Fehler mit Wortteilen die in allen Sprachen gleich
sind, aber aus Wörtern mit Unterschieden extrahiert, z.B.

  bäuer;bäu-er

aus:

  grossbäuerlich;-2-;-3-;-4-;gross=bäu-er=>lich
  großbäuerlich;groß=bäu-er=>lich


Das ist in 629b2f31bf0131033a korrigiert.

Aber weiterhin ist die ganze Sache immer noch eine Heuristik...


Frohe Ostern

Günter



Mehr Informationen über die Mailingliste Trennmuster