[Trennmuster] Entfernen von deklinierten Wörtern
Werner LEMBERG
wl at gnu.org
Di Aug 18 20:10:58 CEST 2020
Liebe Kollegen!
Gerade habe ich folgende Änderung gesehen:
-Binnendreher;Bin-nen=dre-her
-Binnendrehern;Bin-nen=dre-hern
-Binnendrehers;Bin-nen=dre-hers
+Binnendreher;Bin-nen=dre-her # techn. (bei Holländerwindmühlen)
Ich bitte vielmals, diese deklinierten Formen *nicht* zu entfernen; es
gibt einen guten Grund, daß ich sie ergänze.
Unsere Muster erfassen Trennstellen bis zu einer Entfernung von acht
Buchstaben (bzw. sieben derzeit), deshalb ist es meiner Meinung nach
notwendig, alle möglichen Wortformen nach der aufgetretenen
Fehlerstelle zu inkludieren, falls sie innerhalb dieser acht
Buchstaben abweichen. Normalerweise ist die Fehlstelle genau das
»=«-Zeichen; mit acht Buchstaben danach sind wir also auf der sicheren
Seite.
Meiner Erkenntnis nach ist `patgen` da recht empfindlich. Immer
wieder tauchen in `german.dic` Wörter auf, wo die Grundform bereits in
unserer Liste ist, die deklinierte Form allerdings falsch getrennt
wird. Es nützt übrigens gar nichts, wenn beispielsweise das Wort
»Dreher« mit allen Deklinationsformen inkludiert ist. Es kommt
explizit darauf an, daß »Binnendreher« mit Deklinationsformen in der
Liste aufscheint.
Sobald es einen Übergang zu automatisch generierten Deklinationsformen
gibt, brauchen wir das nicht mehr, und vieles kann aufgeräumt und
entfernt werden. Aber bis dahin ersuche ich, meine Arbeit nicht
unnötigerweise rückgängig zu machen.
Werner
Mehr Informationen über die Mailingliste Trennmuster