[Trennmuster] Datenstruktur

Guenter Milde milde at users.sf.net
Fr Apr 11 10:12:35 CEST 2014


On  9.04.14, Tobias Wendorff wrote:
> Am 09.04.2014 00:21, schrieb Werner LEMBERG:

> >Es gibt aber keinen Birnenbaum, sondern bloß einen Birnbaum.

Oder der Birnenbaum ist eine lokale Variante, so wie der Wissenschafter,
welcher hier völlig unbekannt ist.

   Ju, ja, grün ist der Kirschenbaum,
   ju, ja, grün ist der Baum.
   
   -- http://www.paganino.de/pdf/products/10600.pdf

> Das Problem, was ich darin sehe, ist unsere wertende, redaktionelle
> Arbeit. Ein gutes Beispiel sind "Birnenbaum" und "Ackerklee". Beide
> Wörter gibt es nicht, 

Ackerklee gibt es, auch wenn er nicht ein offizieller Pflanzenname ist.
(Wie ist es mit der Pusteblume?)

   wissenschaftlicher Name: Trifolium arvense L.
   englischer Name: 	    Hare's foot, Rabbit Foot, Clover
   volkstümlicher Name:     Acker-Klee, Hasen-Klee, Hasenfuß, Hasenpfötlein,
   		  	    Katzen-Klee, Mäuse-Klee, Stopfarsch

   -- http://www.heilkraeuter.de/lexikon/hasen-klee.htm
   
Und der Pons Verlag hat ihn auch im Wörterbuch:
http://de.pons.com/%C3%BCbersetzung/deutsch-spanisch/Ackerklee

Doch nun zum Grundsätzlichen

> ... also würden sie nie Einzug in unsere Liste finden. 
> Wenn xy jedoch einen Text mit diesen Wörtern schreibt, würde
> er sich kaputt ärgern.

+ Ich habe auch "Bauchschmerzen" bei jedem Nicht-Wort in der Liste.

+ Den hohen Aufwand der in die Aussortierung solcher Wörter
  gesteckt wurde sollten wir nicht leichtfertig verscherzen.

- Wenn xy einen Text mit diesen Wörtern schreibt, wird TeX sie völlig
  korrekt als Bir-nen=baum und Acker=klee (und Stopf=arsch) trennen,
  auch wenn sie nicht in der Liste sind.
  
- xy wird gemeinhin nicht auf die Idee kommen, für seine Rechtschreibprüfung
  unsere "Trennliste" zu konsultieren.

Der "Reinigungsaufwand" wird also nur dann einen Sinn auch für
Normalnutzer haben, wenn wir nicht erkannte Fehlwörter an die
Rechtschreib-Wörterbuchautoren (Björn Jacke) melden oder ein eigenes
Rechtschreibwörterbuchprojekt starten. (Übrigens steht in igerman98
Werner schon als Contributor drin.)

> Vielleicht könnte man *zusätzlich* eine aus Hunspell oder ispell
> automatisch generierte Haupttrennstellendatei anbieten, die aber
> nicht der redaktionellen Bearbeitung unterliegt.

Ich bin dabei, die Differenzen zu untersuchen. Aus diesen kann dann eine
Liste von bei uns fehlenden/falschen und bei ispell-de-98 fehlenden/falschen
erstellt werden.

Günter



Mehr Informationen über die Mailingliste Trennmuster