[Trennmuster] Überkategorisierung?

Tobias Wendorff tobias.wendorff at tu-dortmund.de
Fr Jul 18 20:50:16 CEST 2014


Am Fr, 18.07.2014, 19:09 schrieb Guenter Milde:
>
> Bereits jetzt finde ich die Lesbarkeit der Trennmusterliste gegenüber
> dem Stand vor dem Beginn der Kategorisierung deutlich vermindert.
> Und die Skripte zur Verarbeitung der Informationen werden notwendigermaßen
> ebebfalls komplexer, i.e. schwerer zu durchschauen, zu dokumentieren und
> zu warten.

Das ist jetzt aber Klagen auf hohem Niveau. In den letzten Jahren im
Bereich FOSS habe ich bei ähnlichen Problemen häufig folgende Aussage
vor den Kopf geknallt bekommen: Dann sind die Tools halt zu schlecht;
warte ein paar Jahre, bis jemand bessere schreibt und finde Dich erstmal
damit ab. Sowas führt auch bei OpenStreetMap immer wieder zu Streit.

Jetzt mal ehrlich: Die Trennmunstermannschaft ist doch überhaupt nicht
organisiert. Jeder macht ein wenig Qualitätssicherung für sich und es
gibt keine Strategie, einmal den Bestand vernünftig zu bereinigen.

Aber mal ehrlich: Du kennst die Komplexität von Sprache. Wieso sollen
ein paar Hobbyisten plötzlich eine "Komplettlösung" auf die Beine
stellen, an der Computerlinguisten seit Jahren bei Duden & Co. arbeiten?

> Überspitzt gefragt: wo hilft "En<er-gie"?
> (z.B. Beim Erkennen des Zusammenhangs mit "Syn<er-gie" - wieviel
> Komlexität
> in der Wortliste wollen wir dafür in Kauf nehmen?)

Vielleicht sollten wir endlich mal aus unserem "Mein Schatz"-Denken
herauskommen und mit anderen Projekten kooperieren, die ebenfalls
mit der deutschen Sprache arbeiten - Hunspell & Co. - die können uns
dann vielleicht etwas Arbeit abnehmen und haben selbst noch was davon.
Auch in der Wikipedia gibt es fanatische Working-Groups für die deutsche
Rechtschreibung; ich bezweifle, dass die unsere Trennmusterlist kennen.

LG
Tobias




Mehr Informationen über die Mailingliste Trennmuster