[Trennmuster] Projekt Gutenberg Korpus

Stephan Hennig mailing_list at arcor.de
Do Jan 10 18:25:44 CET 2013


Am 10.01.2013 18:15, schrieb Herbert Voss:
> Am 10.01.2013 18:05, schrieb Stephan Hennig:
> 
>> Ein erster Schritt wäre, jedes interessante Buch in eine Liste von
>> Wörtern zu wandeln, die nicht in unserer Liste enthalten sind und die
>> dann mit aktuellen Mustern zu trennen.  Dann könnte man weitersehen.
>> Ich vermisse ja immer noch den "Wackerstein".  Gibt es die Grimmschen
>> Märchen dort?  Ich lande seltsamerweise entweder bei englischer
>> Literatur oder bei Hörbüchern ...  Hat irgend jemand Zeit und Interesse?
> 
> http://de.wikisource.org/wiki/Index:Kinder-_und_Haus-M%C3%A4rchen_Band_2_%281815%29
> 
> Da gibt es doch alle oder suchst du was anderes?

Gibt es dort auch Text?  Ich sehe erst einmal nur PNG-Dateien.

Herbert und alle anderen, wenn Euch vielversprechende Textquellen oder
thematische Korpora bekannt sind, könnt Ihr die bitte unter
<URL:http://projekte.dante.de/Trennmuster/Korpora> eintragen?  Wie man
Schreibrechte für das Wiki bekommt, steht hier:
<URL:http://projekte.dante.de/Trennmuster/TWikiTipps>

Viele Grüße,
Stephan Hennig




Mehr Informationen über die Mailingliste Trennmuster