[Trennmuster] Projekt Gutenberg Korpus

Stephan Hennig mailing_list at arcor.de
Do Jan 10 18:34:18 CET 2013


Am 10.01.2013 18:23, schrieb Herbert Voss:
> Am 10.01.2013 18:17, schrieb Werner LEMBERG:
> 
>> ... Das Wörtersammeln bringt uns aber nur dann etwas, wenn auch gleich
>> Trennstellen eingearbeitet werden.
> 
> Das geht doch jetzt eh exponentiell: Immer mehr Wörter
> führen zu immer weniger Änderungen in den Trennmustern.

Ja, es wäre aber sinnvoll, wenn die Wortliste nicht nur Häufigkeiten
berücksichtigt, sondern auch verschiedene Themenbereiche abdeckt, auch
wenn dort verwendete Wörter im allgemeinen Sprachgebrauch nur selten zu
finden sind.  Ich denke da zum Beispiel an die Mathematik o.ä.

Viele Grüße,
Stephan Hennig




Mehr Informationen über die Mailingliste Trennmuster