[Trennmuster] Endungen finden

Tobias Wendorff tobias.wendorff at tu-dortmund.de
Fr Mai 22 17:37:17 CEST 2015


Am Fr, 22.05.2015, 17:26 schrieb Guenter Milde:
>
> Was ist das Ziel der Übung? Statistik, Fehlersuche, ...?
> (Davon hängt auch ab, welches Vorgehen effektiv ist.)

Ich will meine Liste mit Eigen- und Gattungsnamen von Straßennamen
ein wenig auf Vordermann bringen (Auszug):

acker, allee, bach, bahn, bank, baum, beck, becke, berg, blick,
bogen, born, brücke, brügge, brand, bredde, breite, brink,
bruch, busch, delle, diek, feld, forst, gabel, garten, gasse,
gatter, graben, grenze, gut, höhe, höhle, hagen, hain, pfad,
plätzchen, platz, poth, promenade, ring, steige, stieg, stiege,
straße, tangente, umgehung, weg, winkel

> Die umgedrehte Liste könnte man einfach sortieren, dann liegen ähnliche
> "end"-strings nebeneinander.

Yop, das mache ich schon. War jetzt nur zu faul, diese im Beispiel
zu sortieren :)

> Wenn Teilwörter ausgefiltert werden sollen, kannst Du gleich mit der von
> "analyse.py" angelegten "Teilwortdatei" anfangen. Da steht auch drin, wie
> oft jedes "Teilwort" allein bzw. an erster, mittlerer, oder letzter Stelle
> in Verbindungen vorkommt.

Aha, muss ich mir mal anschauen.

Danke
Tobias




Mehr Informationen über die Mailingliste Trennmuster