[Trennmuster] Warum nicht sisisi
Werner LEMBERG
wl at gnu.org
Sa Nov 30 09:31:42 CET 2013
> Wäre es vielleicht sinnvoll, die Trennung nach Prä- und Suffixen
> sowie Grundwörtern durch einen Algorithmus durchführen zu lassen und
> nur die fehlerhaften Ausnahmen in die Liste zu packen?
Nun ja, wenn man alle Möglichkeiten permutiert, entstehen *sehr viele*
Wörter, die nicht existieren. Wenn wir all diese »Ausnahmen«
registrieren, haben eine Liste, die um ein vielfaches länger ist, als
was wir jetzt sammeln.
Die Trennung nach Präfix, Suffix und Grundwort hat Sinn, wenn man aus
der Liste eine kompakte Darstellung der Worttrennung für Algorithmen
wie SiSiSi generieren will – da spielt es dann keine Rolle (bzw. es
ist sogar wünschenswert), wenn andere Kombinationen erfaßt werden.
Werner
Mehr Informationen über die Mailingliste Trennmuster