[Trennmuster] Datenstruktur

Werner LEMBERG wl at gnu.org
So Apr 13 06:32:08 CEST 2014


> Ich überlege, ob wir die Muster ggf. optimieren können, wenn wir in
> einem Vor-Lauf zunächst nur Grundwörter (bzw. nur an
> Haupttrennstellen) trennen und im zweiten Lauf patgen mit den so
> generierten Mustern "anfüttern".

Ich glaube, das hat keinen Sinn, weil damit genau patgens
musterbasierender Algorithmus unterlaufen wird.  Besser ist es,
getrennte Muster zu erzeugen – oder eben nicht patgen verwenden.


    Werner




Mehr Informationen über die Mailingliste Trennmuster