[Trennmuster] Sinnentstellende Trennungen?

Werner LEMBERG wl at gnu.org
Sa Mai 24 00:20:17 CEST 2014


> ich plädiere dafür, bei Komposita die Unterdrückung
> sinnentstellender Trennungen über die Wichtung zu markieren, nicht
> über zusätzliche Punkte.  [...]
> 
> Anstelle von über 32000 neuen Punkten hätte ich da lieber eine
> Extraktionsregel.

Mir soll's recht sein:

  1. Bildet das Teilwort + 2 Buchstaben + Trennstelle ein eigenes
     Wort, sollte ein Skript automatisch die Trennstelle unterdrücken.
     Ditto für 3 Buchstaben und mehr, falls die Trennstelle keine
     Komposit-Trennstelle ist.

  2. Anderenfalls sollte die Trennstelle als »ungünstig« markiert
     werden.

Bei noch weiter in der Wortliste vorhandene »Punkten« kann man dann
separat schauen, ob's noch mehr Regeln gibt.


    Werner




Mehr Informationen über die Mailingliste Trennmuster