[Trennmuster] Weiterentwicklung des Kurzformats
Keno Wehr
keno.wehr at abgol.de
Fr Mär 16 16:13:33 CET 2018
Im Moment dreht sich die Diskussion wohl vor allem darum, auf welchem
Wege das
Langformat der Liste in das neue Kurzformat konvertiert werden soll. Da
will ich
mich gar nicht weiter einmischen.
Doch bin ich der Meinung, dass das Ergebnis einer solchen Konvertierung noch
nicht den wünschenswerten Endzustand der Kurzliste darstellen kann und
möchte
einige Ideen zur weiteren Optimierung zur Diskussion stellen. Allerdings
würden
die hierfür nötigen Änderungen vermutlich erhebliche manuelle Eingriffe
erfordern.
1. Nach Möglichkeit erhält jedes Wort nur einen Eintrag.
Anfangs habe ich mich in der Wortliste – ich meine die bisherige Langform –
immer gewundert, dass sich Formen wie „Beschluss“ und „Beschluß“ nicht in
derselben Zeile befinden, obwohl es sich um das gleiche Wort handelt.
Für die meisten Wörter mit ss/ß wird diese Merkwürdigkeit mit der neuen
Kurzform nun beseitigt. Allerdings finden sich beispielsweise noch
-1-;auf<ge<rauht
auf<ge<raut;-2-
de<plat-ziert;-2-
-1-;de<pla-ziert
Ur<laubs=tip
Ur<laubs=tipp;-2-
-1-;Zie-rat
Zier=rat;-2-
Warum nicht vereinfachen zu
auf<ge<raut;auf<ge<rauht
de<plat-ziert;de<pla-ziert
Ur<laubs=tipp;Ur<laubs=tip
Zier=rat;Zie-rat ?
2. Jedes Wort existiert in jeder Rechtschreibung.
Die Reform von 1996 war keine Sprachreform, sondern eine
Rechtschreibreform. Es
wurden weder Wörter abgeschafft noch neu eingeführt. Lediglich die
Schreibung
hat sich in vielen Fällen verändert. Felder auszukreuzen ist daher generell
nicht nötig.
In den meisten Fällen entfallen die Auskreuzungen bereits durch das in
Regel 1
vorgeschlagene Vorgehen. In einigen Fällen müssten Wörter mit drei
Buchstaben
ergänzt werden. Aus
Bass;-2-;Bass;Bass;Bass
-1-;rauh
mache
Bass;Baß
rau;rauh .
Falls dreibuchstabige Wörter für die Trennmustererzeugung mit Patgen ein
Problemdarstellen sollten, könnte das vorbereitende Skript diese einfach
aussortieren.
3. Unterschiedliche Wörter erhalten unterschiedliche Einträge, auch wenn
sie in
einer oder mehreren Rechtschreibungen gleich geschrieben werden.
Die gemeinsame Behandlung unterschiedlicher, aber gleich geschriebener
Wörter
in einer Zeile ist unübersichtlich und steht außerdem der in Aussicht
genommenen Möglichkeit der automatischen Erzeugung von Beugungsformen im
Wege.
Statt
Bett=tuch;Be[t=t/{tt/tt=t}]uch
Bet=tuch;-2-
Bus=sys-tem;Bus=sy-.stem;Bus=sys-tem;Bus=sy-.stem;-5-
Buß=sys-tem;Buß=sy-stem;Buss=sys-tem;Buss=sy-stem;Bu[s=s/{ss/ss=s}]y-.stem
schoss;Schoß;schoss;schoss;schoss # schoß und Schoß
Schoß;-2-;-3- # schoß und Schoß
verwende
Bet=tuch
Bett=tuch
Bus=sys-tem;Bus=sy-.stem
Buß=sys-tem
schoss
Schoß
Alle bisher in eckigen Klammern verzeichneten Unterscheidungen möglicher
Trennvarianten könnten dadurch entfallen.
Das Skript, das die Patgen-Eingabe erzeugt, müsste dann natürlich
unvereinbare
Trennstellen in gleich geschriebenen Wörtern vorab entfernen; das dürfte
aber
kein wesentliches Problem darstellen, ebensowenig wie die Tilgung so
entstehender Dubletten.
4. Wenn mehrere Schreibweisen existieren, werden mehrere Einträge für
das Wort
angelegt.
Aus
auf<wän-dig;-2-
auf<wen-dig
Busi-ness;Busi-ness
-1-;Busi-neß;-3-;-4-;-5-
Ge<schoss
Ge<schoß;-2-;-3- # österr. auch in Reformschreibung
-1-;Zwi-schen=stop
Zwi-schen=stopp
wird dann unter Anwendung der Regeln 1 und 2
auf<wän-dig;auf<wen-dig
auf<wen-dig
Busi-ness # eingedeutschte Schreibung, ß in AR
Busi-ness;Busi-ness # englische Schreibung
Ge<schoss
Ge<schoß # österr. Nebenform mit langem o .
Zwi-schen=stopp
Zwi-schen=stopp;Zwi-schen=stop
Diese Regel ist so noch nicht ganz befriedigend, da sie viele Wörter
verdoppelt, die in einer Rechtschreibvariante zwei Schreibungen haben. Evtl.
könnte man eine neue Kurzschreibweise einführen, die es erlaubt, zwei
Schreibungen in einem Eintrag unterzubringen, oder man erlaubt in diesen
Fällen
das Auskreuzen doch wieder.
5. Es genügen zwei Felder(?).
Wenn ich nichts übersehen habe, sind die Schreibungen der bisher
vorgesehenen
Felder 3 bis 5 durch Regeln aus den Feldern 1 und 2 herleitbar. Zumindest
könnten die Felder 3 bis 5 in den allermeisten Fällen wegfallen.
Für die automatische Erzeugung von Beugungsformen wird auf Dauer ein
weiteres
Feld nötig, das Auskunft über die Art der Beugung gibt.
Vermutlich gibt es noch einige Fälle, die mit den genannten Regeln nicht
angemessen zu behandeln sind. Insgesamt glaube ich aber, dass die
Wortliste auf
die beschriebene Weise einfacher les- und erweiterbar wäre.
Gruß
Keno
Mehr Informationen über die Mailingliste Trennmuster