[Trennmuster] Projekt Gutenberg Korpus
Stephan Hennig
mailing_list at arcor.de
Do Jan 10 18:25:44 CET 2013
Am 10.01.2013 18:15, schrieb Herbert Voss:
> Am 10.01.2013 18:05, schrieb Stephan Hennig:
>
>> Ein erster Schritt wäre, jedes interessante Buch in eine Liste von
>> Wörtern zu wandeln, die nicht in unserer Liste enthalten sind und die
>> dann mit aktuellen Mustern zu trennen. Dann könnte man weitersehen.
>> Ich vermisse ja immer noch den "Wackerstein". Gibt es die Grimmschen
>> Märchen dort? Ich lande seltsamerweise entweder bei englischer
>> Literatur oder bei Hörbüchern ... Hat irgend jemand Zeit und Interesse?
>
> http://de.wikisource.org/wiki/Index:Kinder-_und_Haus-M%C3%A4rchen_Band_2_%281815%29
>
> Da gibt es doch alle oder suchst du was anderes?
Gibt es dort auch Text? Ich sehe erst einmal nur PNG-Dateien.
Herbert und alle anderen, wenn Euch vielversprechende Textquellen oder
thematische Korpora bekannt sind, könnt Ihr die bitte unter
<URL:http://projekte.dante.de/Trennmuster/Korpora> eintragen? Wie man
Schreibrechte für das Wiki bekommt, steht hier:
<URL:http://projekte.dante.de/Trennmuster/TWikiTipps>
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster