[Trennmuster] Fundstueck: wordaxe : Hyphenation by decomposition of compound words
Tobias Wendorff
tobias.wendorff at tu-dortmund.de
Mo Jul 21 16:32:04 CEST 2014
Am So, 20.07.2014, 12:29 schrieb Stephan Hennig:
>
> bevor es mir wieder abhanden kommt, mir ist unlängst das Python-Programm
> wordaxe (Apache-Lizenz) über den Weg gelaufen,
> <URL:http://deco-cow.sourceforge.net/>. Vielleicht kann jemand damit
> etwas anfangen.
Netter Ansatz, so habe ich mir das ursprünglich auch mal vorgestellt:
fälisch
fall
fäll,NEED_SUFFIX
falsch
fälsch,NEED_SUFFIX
falt
fält,NEED_SUFFIX
familie
fand
fang
farb
färb,NEED_SUFFIX
Dann müssen nur ebenjene Grundwörter, Suffixe und Ausnahmen getrennt werden.
Ob es das jeweilige Wort dann gibt ist eigentlich Wurst (bei uns ja nicht).
Eine Kategorisierung zu guter und nicht so guter Trennung fällt allerdings
weg, so wie ich das sehe.
Das Ganze basiert übrigens wieder auf den TeX-Trennmustern, unsere
Arbeit wäre also nicht umsonst :D
LG
Tobias
Mehr Informationen über die Mailingliste Trennmuster