[Trennmuster] Auswertungen Net vs. unsere
Tobias Wendorff
tobias.wendorff at tu-dortmund.de
Mi Jun 5 21:19:38 CEST 2013
Am 05.06.2013 19:48, schrieb Werner LEMBERG:
> Alle fehlenden Wörter könnte jemand mit Zeit und Lust ohne
> Gewissensbisse einarbeiten. Niemand hat ein Privileg auf eine Liste
> von deutschen Wörtern :-)
Bin ich nicht von überzeugt, siehe unten.
>> Außerdem haben "die" nur den Singular. Ich finde, wir sollten die
>> Information führen, in welchem Casus und in welchem Numerus das Wort
>> ist. So könnte man die Liste noch für andere Projekte nutzen.
>
> Wieder einmal: Freiwillige vor!
Das kann man relativ einfach automatisieren (siehe unten).
Auf Basis dieser Liste könnte man sogar die Fugenlaute und
Wortbestände identifizieren und so unsere Trennungen "korrekt"
einpflegen.
>> Wir sollten denen Wörter anbieten, die bei denen fehlen und
>> sie gegen Wörter, die bei uns fehlen, eintauschen.
>
> Da brauchen wir nix anbieten; unsere Liste ist frei verfügbar.
Bedingt stimmt das. Die Diskussion hatten wir ja schon einmal.
> Lizensiert ist ja bei der Net-Liste höchstens die grammatikalischen
> Zusatzinformationen bzw. die Zusammenstellung der Liste als solches.
Schutz als Datenbank, das hatten wir aber schon einmal. Eben zum
Schutz solcher Sammlungen wurde die Regelung ja eingeführt
(natürlich auf "Drängen" durch die EU).
> Vergleiche das beispielsweise mit der deutschen Übersetzung von »Harry
> Potter«: Nimm alle Wörter, sortiere sie und entferne Doubletten und
> nicht-deutsche Ausdrücke. So eine Wortliste hat natürlich keinerlei
> Copyright mehr; man kann ja das Originalwerk nicht mehr erkennen oder
> gar rekonstruieren.
Wenn Du eine Wortliste nimmst, nur die erste Spalte nimmst und diese
1:1 in eine andere Liste überträgt, hast Du einen bedeutenden Teil
der Datenbank entnommen und etwas hergestellt, was dem alten Original
noch sehr, sehr ähnlich ist. Da wird die Quelle angeben (sollten),
kann man sie sogar noch einzeln identifizieren. Beim Harry Potter
wäre auch nur die Sortierung betroffen.
Ich bin dafür: einfach mal fragen, ob wir sie nutzen dürfen.
Wenn sie "ja" sagen, ist doch spitze. Wenn nicht, kann man immer
noch darüber diskutieren.
>> Das Gleiche für "Herkunftsbezeichnung" und hunderte andere Wörter,
>> die auch im Plural existieren.
>
> So ist es.
Ich muss mal mit dem Wiktionary arbeiten, laut dem Server arbeitet
die ja auch bedingt damit.
LG
Tobias
Mehr Informationen über die Mailingliste Trennmuster