[Trennmuster] Fundstueck: wordaxe : Hyphenation by decomposition of compound words

Tobias Wendorff tobias.wendorff at tu-dortmund.de
Mo Jul 21 16:32:04 CEST 2014


Am So, 20.07.2014, 12:29 schrieb Stephan Hennig:
>
> bevor es mir wieder abhanden kommt, mir ist unlängst das Python-Programm
> wordaxe (Apache-Lizenz) über den Weg gelaufen,
> <URL:http://deco-cow.sourceforge.net/>.  Vielleicht kann jemand damit
> etwas anfangen.

Netter Ansatz, so habe ich mir das ursprünglich auch mal vorgestellt:
fälisch
fall
fäll,NEED_SUFFIX
falsch
fälsch,NEED_SUFFIX
falt
fält,NEED_SUFFIX
familie
fand
fang
farb
färb,NEED_SUFFIX

Dann müssen nur ebenjene Grundwörter, Suffixe und Ausnahmen getrennt werden.
Ob es das jeweilige Wort dann gibt ist eigentlich Wurst (bei uns ja nicht).
Eine Kategorisierung zu guter und nicht so guter Trennung fällt allerdings
weg, so wie ich das sehe.

Das Ganze basiert übrigens wieder auf den TeX-Trennmustern, unsere
Arbeit wäre also nicht umsonst :D

LG
Tobias




Mehr Informationen über die Mailingliste Trennmuster