[Trennmuster] Seltsames Verhalten von `abgleich-neueintraege.py`
Guenter Milde
milde at users.sf.net
Do Apr 9 11:32:52 CEST 2020
Liebe Trennfreunde,
On 8.04.20, Keno Wehr wrote:
> Hier noch ein anderes Problem mit dem Skript:
> Die Eingabe „Erosionsereignis“ ergibt:
> ## eindeutig abgeleitet
> Erosionsereignis;-2-;E·ro-si.ons=er<eig>nis;-4-
> ## Rest
> Die Trennung ist zwar korrekt, nicht aber die Feldbelegung.
Das könnte evt. (ebenso wie Werners Problem mit "Docking") an der mit
"expand_teilwoerter.py" erstellten "Teilwortliste" liegen.
Da gab es noch einen Fehler mit Wortteilen die in allen Sprachen gleich
sind, aber aus Wörtern mit Unterschieden extrahiert, z.B.
bäuer;bäu-er
aus:
grossbäuerlich;-2-;-3-;-4-;gross=bäu-er=>lich
großbäuerlich;groß=bäu-er=>lich
Das ist in 629b2f31bf0131033a korrigiert.
Aber weiterhin ist die ganze Sache immer noch eine Heuristik...
Frohe Ostern
Günter
Mehr Informationen über die Mailingliste Trennmuster