[Trennmuster] Gla-cischaus-see
Stephan Hennig
sh-list at posteo.net
Di Sep 20 23:12:04 CEST 2016
Am 20.09.2016 um 11:24 schrieb Tobias Wendorff:
> Am Di, 20.09.2016, 11:17 schrieb Guenter Milde:
>>
>> Darum ist die Aufnahme seltener und "exotischer" Begriffe eben nicht
>> "ungefährlich" solange nicht alle häufigeren Wörter explizit in der Liste
>> sind.
>
> Sollte der Algorithmus dann nicht um ein "100%-Match" ergänzt werden?
> Also eine Liste mit Wörtern, welche total atypisch wären. Diese würden
> nach dem Patgen-Verfahren an die erzeugten Muster angefügt und trennten
> dann aber nur die betroffenen Wörter. (Konjunktivierung kann gerne
> gefixt werden).
>
> Auch wenn es nicht auf Wahrscheinlichkeiten basiert:
> Momentan versuchen wir ja, durch die Häufigkeit von Ausnahmen eine
> Regel zu erzeugen. Wenn jetzt etwas atypisches dazu kommt, könnten
> wir die Regel brechen oder abschwächen.
>
> Oder versteht ich alles falsch?
Ich denke, nicht. Aber welches Problem möchtest du mit einer Liste
"total atypischer" Wörter lösen? Falls du "total atypische" Wörter
kennst, pack die doch mal in die Wortliste, berechne neue Muster und
sieh dann mal nach, welche Level die entsprechenden Muster haben.
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster