[Trennmuster] Mehr vom gleichen

Guenter Milde milde at users.sf.net
Do Apr 9 23:40:59 CEST 2020


On  9.04.20, Werner LEMBERG wrote:

> Lieber Günter!


> Hier eine weitere Besonderheit von »abgleich_neueintraege.py«, die ich
> gerade entdeckt habe (commit 206589):

>   echo Einheitsaktien \
>   | .../wortliste/skripte/python/edit_tools/abgleich_neueintraege.py

>   ## eindeutig abgeleitet
>   Einheitsaktien;Ein>heits=ak-tien

> Siehe die fehlende Trennung bei »ti-en«.

# Problem:
#   mehr Endungspaare lösen mehr Fälle aber führen auch zu mehr Fehldeutungen.

-            ('e', 'en'),
+            # ('e', 'en'),     # !! Ak-ti.en, A·ri-en, A·ka-zi-en, O·bo-en

sollte helfen.


Perspektivisch könnten die Endungspaare in einer Konfigurationsdatei
angegeben und somit einfacher vom Endanwender geändert werden.
Nachteil: Wenn dann etwas falsch wird ist eine zusätzliche Fehlerquelle eine
vom Endanwender geänderte Liste. 
Vorteil: Wenn dann etwas falsch getrennt wird bin ich nicht mehr schuld.

Günter



Mehr Informationen über die Mailingliste Trennmuster