[Trennmuster] Auswertungen Net vs. unsere
Werner LEMBERG
wl at gnu.org
Mi Jun 5 19:48:32 CEST 2013
> Mit einem Trennstrich getrennte Wörter haben wir gar nicht?!
Nein, warum auch? TeX trennt an *jedem* Trennstrich, außer man
verbietet es explizit (mit dem »"~«-Befehl aus german.sty).
> Beim Vergleich habe ich bemerkt, dass Wörter unter drei
> Buchstaben kaum einen Sinn ergeben und sie daher rausgeworfen,
> z.B. pin, pkw, off, oh, ob, ofb.
Ganz genau. Deutsche Trennungen bedingen mindestens zwei Buchstaben
vor und nach einer Trennung (von der Geschmacksverirrung der
allerersten Version der Rechtschreibreform von 2006 abgesehen), das
sind also vier Buchstaben.
> Rund 16.500 Wörter fehlen uns aus der Net-Liste. Das macht also
> etwa 35% aus.
Gar nicht einmal so übel. Unsere Wortliste basiert zu einem großen
Teil auf Häufigkeiten der »Mannheimer Liste«; ich habe alles
eingearbeitet bis Häufigkeitsklasse 19. Mit anderen Worten, was noch
übrig ist, ist relativ selten (oder neu).
> Uns fehlen schrecklicher Weise gängige Wörter, wie: Adresszeile,
> Zugticket oder Adventsgottesdienst!
Alle fehlenden Wörter könnte jemand mit Zeit und Lust ohne
Gewissensbisse einarbeiten. Niemand hat ein Privileg auf eine Liste
von deutschen Wörtern :-)
> Außerdem haben "die" nur den Singular. Ich finde, wir sollten die
> Information führen, in welchem Casus und in welchem Numerus das Wort
> ist. So könnte man die Liste noch für andere Projekte nutzen.
Wieder einmal: Freiwillige vor!
> Wir sollten denen Wörter anbieten, die bei denen fehlen und
> sie gegen Wörter, die bei uns fehlen, eintauschen.
Da brauchen wir nix anbieten; unsere Liste ist frei verfügbar.
Lizensiert ist ja bei der Net-Liste höchstens die grammatikalischen
Zusatzinformationen bzw. die Zusammenstellung der Liste als solches.
Vergleiche das beispielsweise mit der deutschen Übersetzung von »Harry
Potter«: Nimm alle Wörter, sortiere sie und entferne Doubletten und
nicht-deutsche Ausdrücke. So eine Wortliste hat natürlich keinerlei
Copyright mehr; man kann ja das Originalwerk nicht mehr erkennen oder
gar rekonstruieren.
> ps: "Herkulestempel", was ist mit "Herkulestempels" oder
> "Herkulestempeln"?
Könnte man ergänzen, ja.
> Das Gleiche für "Herkunftsbezeichnung" und hunderte andere Wörter,
> die auch im Plural existieren.
So ist es.
Werner
Mehr Informationen über die Mailingliste Trennmuster