[Trennmuster] Namen

Tobias Wendorff tobias.wendorff at tu-dortmund.de
Fr Feb 22 18:51:42 CET 2013


Am 22.02.2013 18:39, schrieb Stephan Hennig:
> Nur Personennamen oder auch geographische, biologische etc.?

Zunächst nur Personennamen, denn das ist, was ich momentan benötige.
Für mich wäre es auch "sicherer", diese auf einer eigenen Liste zu
haben, u.a. aus den von dir gleich genannten gründen.

> Ich finde eigene Muster für alle Arten von Namen höchst sinnvoll. Allerdings
> halte ich eine solche Liste für ein schwieriges Unterfangen, weil Namen
> aus etlichen Sprachen importiert wurden, die über die Jahrhunderte stark
> durchgerüttelt wurden und heute häufig schlecht erkennbar ist, wie sie
> nun "richtig" getrennt werden.

Das meinte ich ja gestern mit "Krasowski": Kra|sows|ki vs. Kra|sow|ski.
Die sind Endung -ski, -cki und -wic sind, aufgrund des polnischen
Ursprungs, eigentlich zusammenhängend, aber ich spreche eher
Kra|sows|ki.

> Hier sind zwei kommerzielle, aber meiner Erinnerung nach erschwingliche
> Listen mit Namen.  Eventuell kann man die auch über den Dante e.V. erwerben:
> <URL:http://projekte.dante.de/Trennmuster/Korpora#beliebteste_Vornamen>
> <URL:http://projekte.dante.de/Trennmuster/Korpora#Named_Entity_Recognition_NER>

Ich habe schon ein größeres Verzeichnis selbst gesammelt, ansonsten
fehlen auf der Liste IMHO noch die Telefonbuchverlage :p

LG
Tobias



Mehr Informationen über die Mailingliste Trennmuster