[Trennmuster] Auswertungen Net vs. unsere

Werner LEMBERG wl at gnu.org
Mi Jun 5 19:48:32 CEST 2013


> Mit einem Trennstrich getrennte Wörter haben wir gar nicht?!

Nein, warum auch?  TeX trennt an *jedem* Trennstrich, außer man
verbietet es explizit (mit dem »"~«-Befehl aus german.sty).

> Beim Vergleich habe ich bemerkt, dass Wörter unter drei
> Buchstaben kaum einen Sinn ergeben und sie daher rausgeworfen,
> z.B. pin, pkw, off, oh, ob, ofb.

Ganz genau.  Deutsche Trennungen bedingen mindestens zwei Buchstaben
vor und nach einer Trennung (von der Geschmacksverirrung der
allerersten Version der Rechtschreibreform von 2006 abgesehen), das
sind also vier Buchstaben.

> Rund 16.500 Wörter fehlen uns aus der Net-Liste.  Das macht also
> etwa 35% aus.

Gar nicht einmal so übel.  Unsere Wortliste basiert zu einem großen
Teil auf Häufigkeiten der »Mannheimer Liste«; ich habe alles
eingearbeitet bis Häufigkeitsklasse 19.  Mit anderen Worten, was noch
übrig ist, ist relativ selten (oder neu).

> Uns fehlen schrecklicher Weise gängige Wörter, wie: Adresszeile,
> Zugticket oder Adventsgottesdienst!

Alle fehlenden Wörter könnte jemand mit Zeit und Lust ohne
Gewissensbisse einarbeiten.  Niemand hat ein Privileg auf eine Liste
von deutschen Wörtern :-)

> Außerdem haben "die" nur den Singular.  Ich finde, wir sollten die
> Information führen, in welchem Casus und in welchem Numerus das Wort
> ist.  So könnte man die Liste noch für andere Projekte nutzen.

Wieder einmal: Freiwillige vor!

> Wir sollten denen Wörter anbieten, die bei denen fehlen und
> sie gegen Wörter, die bei uns fehlen, eintauschen.

Da brauchen wir nix anbieten; unsere Liste ist frei verfügbar.
Lizensiert ist ja bei der Net-Liste höchstens die grammatikalischen
Zusatzinformationen bzw. die Zusammenstellung der Liste als solches.

Vergleiche das beispielsweise mit der deutschen Übersetzung von »Harry
Potter«: Nimm alle Wörter, sortiere sie und entferne Doubletten und
nicht-deutsche Ausdrücke.  So eine Wortliste hat natürlich keinerlei
Copyright mehr; man kann ja das Originalwerk nicht mehr erkennen oder
gar rekonstruieren.

> ps: "Herkulestempel", was ist mit "Herkulestempels" oder
>     "Herkulestempeln"?

Könnte man ergänzen, ja.

> Das Gleiche für "Herkunftsbezeichnung" und hunderte andere Wörter,
> die auch im Plural existieren.

So ist es.


    Werner


Mehr Informationen über die Mailingliste Trennmuster