[Trennmuster] Alfred

Guenter Milde milde at users.sf.net
Sa Jan 25 23:23:35 CET 2014


On 25.01.14, Georg Pfeiffer wrote:
> Am Sa 25 Jan 2014 08:10:24 schrieb Werner LEMBERG:
> > Wo setzen wir die Grenze, was noch reinkommt?

> Ich entscheide das pragmatisch. Wenn mir ein Name bekannt vorkommt, ich 
> ihn also irgendwo schon mal gelesen habe und er mir jetzt wieder in die 
> Quere kommt, dann muß es ihn in Texten öfter geben, also rein damit. 
> Wenn ich ihn noch nie gehört habe, dann nicht. Subjektiv, aber schnell.

> Günther hat mal vorgeschlagen, es von Häufigkeitsklassen (ich nehme an, 
> vom Google-Korpus oder so) abhängig zu machen. Da weiß ich im Moment 
> noch nicht genau, wie man die bestimmt.

canoo.net?

Z.B. http://wortschatz.uni-leipzig.de/cgi-bin/wort_www.exe?site=1&Wort=genug
liefert schnell und bündig:

  Wort: genug
  Anzahl: 53459
  Häufigkeitsklasse: 8 (d.h. der ist ca. 2^8 mal häufiger als das gesuchte Wort)
  Morphologie: 	ge|nug
  Grammatikangaben: 	Wortart: Adverb
  [...]
  
Wie die Häufigkeitsklasse in dieser Quelle bestimmt wurde weiß ich jetzt
nicht, sollte sich aber sicherlich finden lassen.

Ein schneller Check auf der Webseite ist gerade in Zweifelsfällen zwar
langsamer als eine Bauchentscheidung, aber deutlich schneller als eine
der Bauchentscheidung folgende E-Mail-Diskussion.

Günter (ohne h)



Mehr Informationen über die Mailingliste Trennmuster