[Trennmuster] neuer Arbeitsansatz
Guenter Milde
milde at users.sf.net
Mo Nov 7 10:49:36 CET 2016
On 6.11.16, Stephan Hennig wrote:
> Am 06.11.2016 um 18:40 schrieb Guenter Milde:
> > On 6.11.16, Stephan Hennig wrote:
> >> Am 05.11.2016 um 22:27 schrieb Werner LEMBERG:
...
> >> > süß=sau-.er;süß=sau-.er;süss=sau-.er;süss=sau-.er;sü{ss/ss=s}au-er
> >
> >> Finde ich eigentlich gut, sofern es sich nur um ß-Ersatzschreibungen
> >> handelt. Dagegen fände ich
> >
> >> Stän-gel;Sten-gel
> >
> >> schlecht.
...
> > Welchen Vorteil hätte die Variante
> >
> > Stän-gel;-2-
> > -1-;Sten-gel
> >
> > ?
> Einfachheit. Bisher ist klar, dass zwischen verschiedenen Schreibungen
> (Zeilen) kein expliziter Bezug hergestellt wird.
Mit der Kurzform
Fass=bier
für bisher
Fassbier;-2-;-3-;Fass=bier;Fass=bier
Faßbier;-2-;Faß=bier;-4-
haben wir doch schon genau diesen Fall: beide Zeilen werden in eine gesteckt.
> Wenn wir damit
> anfangen, könnte man zwar Stängel/Stengel mit einer Zeile abhandeln,
> gräulich/greulich dagegen nicht.
Das Problem gibt es mit ß auch:
Lössboden;-2-;-3-;Löss=bo-den;Löss=bo-den
Lößboden;Löß=bo-den
braucht auch in der Kurzform 2 Zeilen und wir müssen überlegen, ob wir
eine davon mit einer "Sperre" ergänzen um Doppeleinträge nach
automatischer Konversion zu verhindern:
a) Löss=bo-den
Löß=bo-den
+1 einfach
-1 zwei Einträge, die in de-1901 das gleiche Wort erbgeben
b) Löss=bo-den
Löß=bo-den;-2-
oder
Löss=bo-den;-2-
Löß=bo-den
+1 eindeutige Ableitung: nur ein Lößboden in der Liste wenn
de-1901 extrahiert wird.
-1 was soll Regelfall und was Ableitung sein?
Bei gräulich/greulich¹
gräulich;gräu>lich # < grau oder < Gräuel < grauen
greulich;-2-;greu>lich;-4- # < Greuel < grauen
ist die Kurzform wegen der zwei Herleitungen
gräu>lich # < grau oder < Gräuel < grauen
-1-;greu>lich # < Greuel < grauen
egal, ob Stängel/Stengel eine oder zwei Zeilen belegt.
Ähnliches gilt für neuzugelassene Alternativschreibungen²:
es-sen-ti-ell
es-sen-zi-ell;-2-
> Ich halte das für wenig intuitiv (für Menschen) und für Hinderlich bei
> (weiteren) Automatisierungen.
Ich finde die Regelung
Ist in jeder Rechtschreibvariante die Schreibweise eindeutig, reicht
im Kurzeintrag eine Zeile.
intuitiver und simpler als:
Ist in jeder Rechtschreibvariante die Schreibweise eindeutig, reicht
im Kurzeintrag eine Zeile, wenn diese abgeleitet werden kann. Bei
Ausnahmen müssen verschiedene Schreibweisen in separate Zeilen.
Der Algorithmus zur Auswahl von Wörtern einer Rechtschreibvariante
wird durch Stän-gel;Sten-gel in einer Zeile nicht geändert:
de-1996:
nimm immer das erste Feld, -1- bedeutet "gibts nicht".
de-1901:
Ist ein ';' drin?
nein -> über Regeln ableiten
ja -> nimm Feld zwei, -2- bedeutet "gibts nicht"
de-x-ohne-ß:
Mehr als 2 Felder?
nein -> über ß-Ersatz-Regeln ableiten
ja -> nimm das "richtige" Feld
Viele Grüße,
Günter Milde
¹ in der wortliste gegenwärtig noch (sic!)
gräulich;gräu>lich
greulich;greu>lich
² gegenwärtig inkorrekt:
essentiell;es-sen-ti-ell
essenziell;es-sen-zi-ell
Mehr Informationen über die Mailingliste Trennmuster