[Trennmuster] Gla-cischaus-see
Tobias Wendorff
tobias.wendorff at tu-dortmund.de
Di Sep 20 11:24:53 CEST 2016
Am Di, 20.09.2016, 11:17 schrieb Guenter Milde:
>
> Darum ist die Aufnahme seltener und "exotischer" Begriffe eben nicht
> "ungefährlich" solange nicht alle häufigeren Wörter explizit in der Liste
> sind.
Sollte der Algorithmus dann nicht um ein "100%-Match" ergänzt werden?
Also eine Liste mit Wörtern, welche total atypisch wären. Diese würden
nach dem Patgen-Verfahren an die erzeugten Muster angefügt und trennten
dann aber nur die betroffenen Wörter. (Konjunktivierung kann gerne
gefixt werden).
Auch wenn es nicht auf Wahrscheinlichkeiten basiert:
Momentan versuchen wir ja, durch die Häufigkeit von Ausnahmen eine
Regel zu erzeugen. Wenn jetzt etwas atypisches dazu kommt, könnten
wir die Regel brechen oder abschwächen.
Oder versteht ich alles falsch?
Mehr Informationen über die Mailingliste Trennmuster