[Trennmuster] Projekt Gutenberg Korpus

Stephan Hennig mailing_list at arcor.de
Do Jan 10 18:05:41 CET 2013


Am 10.01.2013 16:21, schrieb Werner LEMBERG:
> 
>> wieso taucht eigentlich der Korpus des "Projekt Gutenberg" nicht
>> auf der Liste auf?

Ich vermute, weil es noch niemand eingetragen hat.


> Welche Liste meinst Du?

Vielleicht <URL:http://projekte.dante.de/Trennmuster/Korpora>?


>> Sehr viele Bücher sind bereits durchkorrigiert:
>> http://www.gutenberg.org/browse/languages/de
> 
> Aber was hat das mit Trennmustern zu tun?

Wenn die Bücher durchgesehen und korrigiert sind, würde das Erweitern
unserer Liste um Wörter aus dem einen oder anderen Buch in der Tat etwas
weniger Arbeit bereiten.

Ein erster Schritt wäre, jedes interessante Buch in eine Liste von
Wörtern zu wandeln, die nicht in unserer Liste enthalten sind und die
dann mit aktuellen Mustern zu trennen.  Dann könnte man weitersehen.
Ich vermisse ja immer noch den "Wackerstein".  Gibt es die Grimmschen
Märchen dort?  Ich lande seltsamerweise entweder bei englischer
Literatur oder bei Hörbüchern ...  Hat irgend jemand Zeit und Interesse?

Viele Grüße,
Stephan Hennig




Mehr Informationen über die Mailingliste Trennmuster