[Trennmuster] Mehr vom gleichen
Guenter Milde
milde at users.sf.net
Do Apr 9 23:40:59 CEST 2020
On 9.04.20, Werner LEMBERG wrote:
> Lieber Günter!
> Hier eine weitere Besonderheit von »abgleich_neueintraege.py«, die ich
> gerade entdeckt habe (commit 206589):
> echo Einheitsaktien \
> | .../wortliste/skripte/python/edit_tools/abgleich_neueintraege.py
> ## eindeutig abgeleitet
> Einheitsaktien;Ein>heits=ak-tien
> Siehe die fehlende Trennung bei »ti-en«.
# Problem:
# mehr Endungspaare lösen mehr Fälle aber führen auch zu mehr Fehldeutungen.
- ('e', 'en'),
+ # ('e', 'en'), # !! Ak-ti.en, A·ri-en, A·ka-zi-en, O·bo-en
sollte helfen.
Perspektivisch könnten die Endungspaare in einer Konfigurationsdatei
angegeben und somit einfacher vom Endanwender geändert werden.
Nachteil: Wenn dann etwas falsch wird ist eine zusätzliche Fehlerquelle eine
vom Endanwender geänderte Liste.
Vorteil: Wenn dann etwas falsch getrennt wird bin ich nicht mehr schuld.
Günter
Mehr Informationen über die Mailingliste Trennmuster