[Trennmuster] Projekt Gutenberg Korpus
Herbert Voss
Herbert.Voss at FU-Berlin.DE
Do Jan 10 18:41:31 CET 2013
Am 10.01.2013 18:34, schrieb Stephan Hennig:
> Am 10.01.2013 18:23, schrieb Herbert Voss:
>> Am 10.01.2013 18:17, schrieb Werner LEMBERG:
>>
>>> ... Das Wörtersammeln bringt uns aber nur dann etwas, wenn auch gleich
>>> Trennstellen eingearbeitet werden.
>>
>> Das geht doch jetzt eh exponentiell: Immer mehr Wörter
>> führen zu immer weniger Änderungen in den Trennmustern.
>
> Ja, es wäre aber sinnvoll, wenn die Wortliste nicht nur Häufigkeiten
> berücksichtigt, sondern auch verschiedene Themenbereiche abdeckt, auch
> wenn dort verwendete Wörter im allgemeinen Sprachgebrauch nur selten zu
> finden sind. Ich denke da zum Beispiel an die Mathematik o.ä.
Das Wort an sich ist ja uninteressant, nur die
Buchstabenanordnung interessiert und da ist die
Mathematik eigentlich _nicht_ interessant, da sie
wenig Kunstwörter kennt. Ganz im Gegensatz zur Chemie.
Insofern sind auch Romane aus gutenberg.org nicht
spannend, da sie nicht sonderlich viel ungewöhnliche
Buchstabenanordnungen aufweisen.
Herbert
Mehr Informationen über die Mailingliste Trennmuster