[Trennmuster] Trennmuster mit Wortliste

Werner LEMBERG wl at gnu.org
So Jun 2 12:26:38 CEST 2013


> Wie wäre es denn, wenn wir es nach dem Vorbild von GermaNet machen
> würden?  [...]

Das gibt's alles schon.  Schau beispielsweise, wie Hunspell
funktioniert; das wird in OpenOffice verwendet.  Die deutschen Daten
gibt's hier:

  http://extensions.services.openoffice.org/project/dict-de_DE_frami

insbesondere schau Dir die Dateien im Verzeichnis »de_DE_frami« an,
nachdem Du das Paket runtergeladen hast.

Vielleicht findest Du eine Lösung, wie man gewichtete und
kategorisierende Trennstellen da einarbeiten kann.

Die Liste der GermaNet-Komposita könnte man übrigens mit den
Hunspell-Dateien sowie mit unserer Liste abgleichen.


    Werner


Mehr Informationen über die Mailingliste Trennmuster