[Trennmuster] Projekt Gutenberg Korpus
Stephan Hennig
mailing_list at arcor.de
Do Jan 10 18:34:18 CET 2013
Am 10.01.2013 18:23, schrieb Herbert Voss:
> Am 10.01.2013 18:17, schrieb Werner LEMBERG:
>
>> ... Das Wörtersammeln bringt uns aber nur dann etwas, wenn auch gleich
>> Trennstellen eingearbeitet werden.
>
> Das geht doch jetzt eh exponentiell: Immer mehr Wörter
> führen zu immer weniger Änderungen in den Trennmustern.
Ja, es wäre aber sinnvoll, wenn die Wortliste nicht nur Häufigkeiten
berücksichtigt, sondern auch verschiedene Themenbereiche abdeckt, auch
wenn dort verwendete Wörter im allgemeinen Sprachgebrauch nur selten zu
finden sind. Ich denke da zum Beispiel an die Mathematik o.ä.
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster