[Trennmuster] neuer Arbeitsansatz

Guenter Milde milde at users.sf.net
Mo Nov 7 10:49:36 CET 2016


On  6.11.16, Stephan Hennig wrote:
> Am 06.11.2016 um 18:40 schrieb Guenter Milde:
> > On  6.11.16, Stephan Hennig wrote:
> >> Am 05.11.2016 um 22:27 schrieb Werner LEMBERG:

...

> >> >   süß=sau-.er;süß=sau-.er;süss=sau-.er;süss=sau-.er;sü{ss/ss=s}au-er
> >
> >> Finde ich eigentlich gut, sofern es sich nur um ß-Ersatzschreibungen
> >> handelt.  Dagegen fände ich
> >
> >>   Stän-gel;Sten-gel
> >
> >> schlecht.
...

> > Welchen Vorteil hätte die Variante
> >
> >    Stän-gel;-2-
> >    -1-;Sten-gel
> >
> > ?

> Einfachheit.  Bisher ist klar, dass zwischen verschiedenen Schreibungen
> (Zeilen) kein expliziter Bezug hergestellt wird.

Mit der Kurzform

  Fass=bier

für bisher

  Fassbier;-2-;-3-;Fass=bier;Fass=bier
  Faßbier;-2-;Faß=bier;-4-

haben wir doch schon genau diesen Fall: beide Zeilen werden in eine gesteckt.

> Wenn wir damit
> anfangen, könnte man zwar Stängel/Stengel mit einer Zeile abhandeln,
> gräulich/greulich dagegen nicht.

Das Problem gibt es mit ß auch:

  Lössboden;-2-;-3-;Löss=bo-den;Löss=bo-den
  Lößboden;Löß=bo-den

braucht auch in der Kurzform 2 Zeilen und wir müssen überlegen, ob wir
eine davon mit einer "Sperre" ergänzen um Doppeleinträge nach
automatischer Konversion zu verhindern:

a)  Löss=bo-den
    Löß=bo-den

    +1 einfach
    -1 zwei Einträge, die in de-1901 das gleiche Wort erbgeben

b)  Löss=bo-den
    Löß=bo-den;-2-

    oder

    Löss=bo-den;-2-
    Löß=bo-den

    +1 eindeutige Ableitung: nur ein Lößboden in der Liste wenn
       de-1901 extrahiert wird.
    -1 was soll Regelfall und was Ableitung sein?


Bei gräulich/greulich¹

  gräulich;gräu>lich  # < grau oder < Gräuel < grauen
  greulich;-2-;greu>lich;-4- # < Greuel < grauen

ist die Kurzform wegen der zwei Herleitungen

  gräu>lich # < grau oder < Gräuel < grauen
  -1-;greu>lich # < Greuel < grauen

egal, ob Stängel/Stengel eine oder zwei Zeilen belegt.

Ähnliches gilt für neuzugelassene Alternativschreibungen²:

  es-sen-ti-ell
  es-sen-zi-ell;-2-


> Ich halte das für wenig intuitiv (für Menschen) und für Hinderlich bei
> (weiteren) Automatisierungen.

Ich finde die Regelung

  Ist in jeder Rechtschreibvariante die Schreibweise eindeutig, reicht
  im Kurzeintrag eine Zeile.

intuitiver und simpler als:

  Ist in jeder Rechtschreibvariante die Schreibweise eindeutig, reicht
  im Kurzeintrag eine Zeile, wenn diese abgeleitet werden kann. Bei
  Ausnahmen müssen verschiedene Schreibweisen in separate Zeilen.


Der Algorithmus zur Auswahl von Wörtern einer Rechtschreibvariante
wird durch Stän-gel;Sten-gel in einer Zeile nicht geändert:

de-1996:

  nimm immer das erste Feld, -1- bedeutet "gibts nicht".

de-1901:

  Ist ein ';' drin?

    nein -> über Regeln ableiten

    ja -> nimm Feld zwei, -2- bedeutet "gibts nicht"

de-x-ohne-ß:

  Mehr als 2 Felder?

    nein -> über ß-Ersatz-Regeln ableiten

    ja   -> nimm das "richtige" Feld


Viele Grüße,

Günter Milde


¹ in der wortliste gegenwärtig noch (sic!)
    gräulich;gräu>lich
    greulich;greu>lich

² gegenwärtig inkorrekt:
    essentiell;es-sen-ti-ell
    essenziell;es-sen-zi-ell



Mehr Informationen über die Mailingliste Trennmuster