[Trennmuster] Trennmuster mit Wortliste
Werner LEMBERG
wl at gnu.org
So Jun 2 12:26:38 CEST 2013
> Wie wäre es denn, wenn wir es nach dem Vorbild von GermaNet machen
> würden? [...]
Das gibt's alles schon. Schau beispielsweise, wie Hunspell
funktioniert; das wird in OpenOffice verwendet. Die deutschen Daten
gibt's hier:
http://extensions.services.openoffice.org/project/dict-de_DE_frami
insbesondere schau Dir die Dateien im Verzeichnis »de_DE_frami« an,
nachdem Du das Paket runtergeladen hast.
Vielleicht findest Du eine Lösung, wie man gewichtete und
kategorisierende Trennstellen da einarbeiten kann.
Die Liste der GermaNet-Komposita könnte man übrigens mit den
Hunspell-Dateien sowie mit unserer Liste abgleichen.
Werner
Mehr Informationen über die Mailingliste Trennmuster