[Trennmuster] Weiterentwicklung des Kurzformats

Keno Wehr keno.wehr at abgol.de
Fr Mär 16 16:13:33 CET 2018


Im Moment dreht sich die Diskussion wohl vor allem darum, auf welchem 
Wege das
Langformat der Liste in das neue Kurzformat konvertiert werden soll. Da 
will ich
mich gar nicht weiter einmischen.

Doch bin ich der Meinung, dass das Ergebnis einer solchen Konvertierung noch
nicht den wünschenswerten Endzustand der Kurzliste darstellen kann und 
möchte
einige Ideen zur weiteren Optimierung zur Diskussion stellen. Allerdings 
würden
die hierfür nötigen Änderungen vermutlich erhebliche manuelle Eingriffe
erfordern.


1. Nach Möglichkeit erhält jedes Wort nur einen Eintrag.

Anfangs habe ich mich in der Wortliste – ich meine die bisherige Langform –
immer gewundert, dass sich Formen wie „Beschluss“ und „Beschluß“ nicht in
derselben Zeile befinden, obwohl es sich um das gleiche Wort handelt.
Für die meisten Wörter mit ss/ß wird diese Merkwürdigkeit mit der neuen
Kurzform nun beseitigt. Allerdings finden sich beispielsweise noch

     -1-;auf<ge<rauht
     auf<ge<raut;-2-
     de<plat-ziert;-2-
     -1-;de<pla-ziert
     Ur<laubs=tip
     Ur<laubs=tipp;-2-
     -1-;Zie-rat
     Zier=rat;-2-

Warum nicht vereinfachen zu

     auf<ge<raut;auf<ge<rauht
     de<plat-ziert;de<pla-ziert
     Ur<laubs=tipp;Ur<laubs=tip
     Zier=rat;Zie-rat ?


2. Jedes Wort existiert in jeder Rechtschreibung.

Die Reform von 1996 war keine Sprachreform, sondern eine 
Rechtschreibreform. Es
wurden weder Wörter abgeschafft noch neu eingeführt. Lediglich die 
Schreibung
hat sich in vielen Fällen verändert. Felder auszukreuzen ist daher generell
nicht nötig.
In den meisten Fällen entfallen die Auskreuzungen bereits durch das in 
Regel 1
vorgeschlagene Vorgehen. In einigen Fällen müssten Wörter mit drei 
Buchstaben
ergänzt werden. Aus

     Bass;-2-;Bass;Bass;Bass
     -1-;rauh

mache

     Bass;Baß
     rau;rauh .

Falls dreibuchstabige Wörter für die Trennmustererzeugung mit Patgen ein
Problemdarstellen sollten, könnte das vorbereitende Skript diese einfach
aussortieren.


3. Unterschiedliche Wörter erhalten unterschiedliche Einträge, auch wenn 
sie in
einer oder mehreren Rechtschreibungen gleich geschrieben werden.

Die gemeinsame Behandlung unterschiedlicher, aber gleich geschriebener 
Wörter
in einer Zeile ist unübersichtlich und steht außerdem der in Aussicht
genommenen Möglichkeit der automatischen Erzeugung von Beugungsformen im 
Wege.

Statt

     Bett=tuch;Be[t=t/{tt/tt=t}]uch
     Bet=tuch;-2-
     Bus=sys-tem;Bus=sy-.stem;Bus=sys-tem;Bus=sy-.stem;-5-
  Buß=sys-tem;Buß=sy-stem;Buss=sys-tem;Buss=sy-stem;Bu[s=s/{ss/ss=s}]y-.stem
     schoss;Schoß;schoss;schoss;schoss # schoß und Schoß
     Schoß;-2-;-3- # schoß und Schoß

verwende

     Bet=tuch
     Bett=tuch
     Bus=sys-tem;Bus=sy-.stem
     Buß=sys-tem
     schoss
     Schoß

Alle bisher in eckigen Klammern verzeichneten Unterscheidungen möglicher
Trennvarianten könnten dadurch entfallen.
Das Skript, das die Patgen-Eingabe erzeugt, müsste dann natürlich 
unvereinbare
Trennstellen in gleich geschriebenen Wörtern vorab entfernen; das dürfte 
aber
kein wesentliches Problem darstellen, ebensowenig wie die Tilgung so
entstehender Dubletten.


4. Wenn mehrere Schreibweisen existieren, werden mehrere Einträge für 
das Wort
angelegt.

Aus

     auf<wän-dig;-2-
     auf<wen-dig
     Busi-ness;Busi-ness
     -1-;Busi-neß;-3-;-4-;-5-
     Ge<schoss
     Ge<schoß;-2-;-3- # österr. auch in Reformschreibung
     -1-;Zwi-schen=stop
     Zwi-schen=stopp

wird dann unter Anwendung der Regeln 1 und 2

     auf<wän-dig;auf<wen-dig
     auf<wen-dig
     Busi-ness # eingedeutschte Schreibung, ß in AR
     Busi-ness;Busi-ness # englische Schreibung
     Ge<schoss
     Ge<schoß # österr. Nebenform mit langem o .
     Zwi-schen=stopp
     Zwi-schen=stopp;Zwi-schen=stop

Diese Regel ist so noch nicht ganz befriedigend, da sie viele Wörter
verdoppelt, die in einer Rechtschreibvariante zwei Schreibungen haben. Evtl.
könnte man eine neue Kurzschreibweise einführen, die es erlaubt, zwei
Schreibungen in einem Eintrag unterzubringen, oder man erlaubt in diesen 
Fällen
das Auskreuzen doch wieder.


5. Es genügen zwei Felder(?).

Wenn ich nichts übersehen habe, sind die Schreibungen der bisher 
vorgesehenen
Felder 3 bis 5 durch Regeln aus den Feldern 1 und 2 herleitbar. Zumindest
könnten die Felder 3 bis 5 in den allermeisten Fällen wegfallen.
Für die automatische Erzeugung von Beugungsformen wird auf Dauer ein 
weiteres
Feld nötig, das Auskunft über die Art der Beugung gibt.


Vermutlich gibt es noch einige Fälle, die mit den genannten Regeln nicht
angemessen zu behandeln sind. Insgesamt glaube ich aber, dass die 
Wortliste auf
die beschriebene Weise einfacher les- und erweiterbar wäre.


Gruß
Keno



Mehr Informationen über die Mailingliste Trennmuster