[Trennmuster] neuer Arbeitsansatz
Guenter Milde
milde at users.sf.net
Sa Okt 29 00:10:30 CEST 2016
On 28.10.16, Werner LEMBERG wrote:
> > Wenn wir "Format a)" nehmen (ohne Schlüssel), können wir -1- auch ganz
> > weglassen. Ein ";" gibt ja zuverlässig an, dass eine Ausnahme vorliegt.
> >
> > Die restlichen Spalten können entweder einfach nachrücken, oder
> > neu definiert werden.
> >
> > * Mit erster Spalte == de-1996 wäre die Extraktion der Trennmuster
> > für die aktuelle Rechtschreibung trivial und die Bedeutung der
> > 1. Spalte einheitlich für Regeleinträge und Ausnahmen.
> >
> > * Mit herkömmlicher Spaltendefinition wäre die Umwandlung von
> > Ausnahmen ins alte Format einfacher und die Verwirrung für "alte
> > Hasen" bei "Handkorrekturen" der Ausnahmen geringer.
> Meinst Du folgendes?
> * Nur eine Spalte.
> AR, versal AR, versal NR und schweiz AR sind von NR
> algorithmisch ableitbar.
> Beispiel:
> Dach=de-cker=meis-ter
> * Mehr als eine Spalte.
> AR;NR[;versAR=versNR=schweizAR[;versAR[;versNR[;schweizAR]]]]
> Beispiel:
> An<äs-the-sie=creme;An<äs-the-sie=creme
> Mit diesem Schema kämen wir auf höchstens sechs Felder. Ich glaube,
> kompakter geht's nicht mehr, ohne die Lesbarkeit zu verlieren.
Ja, so in der Art. Z.B.
Bedeutung der Felder
====================
1 Wort mit Trennungen, falls für alle Varianten rekonstruierbar,
anderenfalls Trennung nach de-1996
2 Trennung nach de-1901
3 Trennung für Wortform, die entweder in der
Schweiz oder mit Großbuchstaben oder Kapitälchen benutzt wird und
für traditionelle und reformierte Rechtschreibung identisch ist
4 falls Feld 3 leer, Trennung für Wortform, die entweder in der
Schweiz oder mit Großbuchstaben oder Kapitälchen benutzt wird,
traditionelle Rechtschreibung
5 falls Feld 4 leer, Trennung für Wortform, die entweder in der
Schweiz oder mit Großbuchstaben oder Kapitälchen benutzt wird,
reformierte Rechtschreibung (2006)
6 falls Feld 3 leer und nicht identisch mit Feld 4, Trennung nach
(deutsch)schweizerischer, traditioneller Rechtschreibung;
insbesondere Wörter mit „sss“ gefolgt von einem Vokal, die wie
andere Dreifachkonsonanten gehandhabt wurden (also anders, als der
Duden früher vorgeschrieben hat), z.B. „süssauer“
Leere Felder sind mit „-x-“ markiert („x“ ist die Feldnummer).
Alle in der aktuellen Rechtschreibung gültigen Wörter (de-DE, de-AT)
stehen in Feld 1.
Ist der Eintrag in Feld 1 nur in reformierter Rechtschreibung (de-1996)
gültig, so steht in Feld 2 "-2-". Ein Eintrag der nur in traditioneller
Rechtschreibung gilt folgt in Feld 2 auf "-1-".
Felder 4, 5 und 6 treten immer simultan auf, um die Lesbarkeit zu
erhöhen.
...
(ich bin mir nicht sicher, ob ich das jemals ganz verstanden und jetzt
richtig umgesetzt habe).
Günter
Mehr Informationen über die Mailingliste Trennmuster