[Trennmuster] Wortlisten-Formate

Guenter Milde milde at users.sf.net
Do Sep 23 09:59:19 CEST 2021


Liebe Trennfreunde,

> > 1. Umwandlung der Wortliste ins grammatische Kurzformat (über das
> >    Kurzformat)

> Langfristig wäre es gut, wenn wir auf dieses Format wechseln, ...

Ich sehe einen deutlichen Vorteil, wenn wir weiter ein explizites Format
für die Versionsverwaltung nutzen. Die Ersatzregeln des Kurzformats
haben zu viele freie Parameter (zu viel "Magie") und Raum für Verbesserungen.
Wenn wir das Kurzformat zur "Urliste" machen würden, wäre jede Änderung des
Konversionsskripts mit einem riesen Patch für die Wortliste verbunden und
die Prüfung auf korrekte Expansion von Neueinträgen ist auch schwerer.


Was ich mir gut vorstellen kann, ist ein aktualisiertes explizites Format
mit 6 Spalten:

6-Felder-Format
---------------

* Ein vollständiger Eintrag enthält sechs, durch Semikolon getrennte, Felder:

    ungetrennt; de; de-1901; de-CH; de-1901-x-versal; de-CH-1901
  
  Spalte 0 vereinfacht die Suche, Sortierung und Kontrolle von Einträgen
  in der Liste. (Die Zählung beginnt bei 0, dann ist die Spaltennummer
  der Sprachvarianten gleich dem Kurzformat.)

* Für unterschiedlich geschriebene Wörter werden eigene Einträge verwendet.

  I.e. durch Weglassen der Trennzeichen entsteht das Wort in Spalte 0.

* Felder können weggelassen werden, wenn der Inhalt gleich der
  "Elternspalte" ist.
  
  Vererbungsfolge:
  
     de -> de-1901 -> de-1901-x-versal -> de-CH-1901
     de ->            de-CH   

  Die Mehrzahl der Einträge bleibt damit wie bisher auf 2 Spalten
  beschränkt.
  
    laufen;lau-fen
    
  Bei Trennänderungen reichen 3 Spalten
  
    hasten;has-ten;ha-sten
    faustdicke;faust=di-cke;faust=di{ck/k-k}e

* Wenn eine Schreibweise in einer Sprachvariante unzulässig ist, wird das
  Feld ausgekreuzt.

     Stängel;Stän-gel;-2-
     Stengel;-1-;Sten-gel
     faustgross;-1-;-2-;faust=gross

  Optional:
    Bei Wörtern mit ß wird die Spalten 3 nicht extra ausgekreuzt, i.e
  
       faustgroß;faust=groß
  
    statt

       faustgroß;faust=groß;faust=groß;-3-


Vorteile:

* weniger Spalten
* einfache Zuordnung Spalte -- Sprachvariante
* ähnlicher zum Kurzformat
* einfachere Dokumentation

Nachteile:

* Arbeitsaufwand zur Anpassung der Skripte
* Massiver "commit" bei Formatwandlung, "Historienverlust"



Bei allgemeiner Zustimmung würde ich ein Wandelskript erstellen und meine
Helferchen anpassen.

Günter



Mehr Informationen über die Mailingliste Trennmuster