[Trennmuster] Wortlisten-Formate
Guenter Milde
milde at users.sf.net
Do Sep 23 09:59:19 CEST 2021
Liebe Trennfreunde,
> > 1. Umwandlung der Wortliste ins grammatische Kurzformat (über das
> > Kurzformat)
> Langfristig wäre es gut, wenn wir auf dieses Format wechseln, ...
Ich sehe einen deutlichen Vorteil, wenn wir weiter ein explizites Format
für die Versionsverwaltung nutzen. Die Ersatzregeln des Kurzformats
haben zu viele freie Parameter (zu viel "Magie") und Raum für Verbesserungen.
Wenn wir das Kurzformat zur "Urliste" machen würden, wäre jede Änderung des
Konversionsskripts mit einem riesen Patch für die Wortliste verbunden und
die Prüfung auf korrekte Expansion von Neueinträgen ist auch schwerer.
Was ich mir gut vorstellen kann, ist ein aktualisiertes explizites Format
mit 6 Spalten:
6-Felder-Format
---------------
* Ein vollständiger Eintrag enthält sechs, durch Semikolon getrennte, Felder:
ungetrennt; de; de-1901; de-CH; de-1901-x-versal; de-CH-1901
Spalte 0 vereinfacht die Suche, Sortierung und Kontrolle von Einträgen
in der Liste. (Die Zählung beginnt bei 0, dann ist die Spaltennummer
der Sprachvarianten gleich dem Kurzformat.)
* Für unterschiedlich geschriebene Wörter werden eigene Einträge verwendet.
I.e. durch Weglassen der Trennzeichen entsteht das Wort in Spalte 0.
* Felder können weggelassen werden, wenn der Inhalt gleich der
"Elternspalte" ist.
Vererbungsfolge:
de -> de-1901 -> de-1901-x-versal -> de-CH-1901
de -> de-CH
Die Mehrzahl der Einträge bleibt damit wie bisher auf 2 Spalten
beschränkt.
laufen;lau-fen
Bei Trennänderungen reichen 3 Spalten
hasten;has-ten;ha-sten
faustdicke;faust=di-cke;faust=di{ck/k-k}e
* Wenn eine Schreibweise in einer Sprachvariante unzulässig ist, wird das
Feld ausgekreuzt.
Stängel;Stän-gel;-2-
Stengel;-1-;Sten-gel
faustgross;-1-;-2-;faust=gross
Optional:
Bei Wörtern mit ß wird die Spalten 3 nicht extra ausgekreuzt, i.e
faustgroß;faust=groß
statt
faustgroß;faust=groß;faust=groß;-3-
Vorteile:
* weniger Spalten
* einfache Zuordnung Spalte -- Sprachvariante
* ähnlicher zum Kurzformat
* einfachere Dokumentation
Nachteile:
* Arbeitsaufwand zur Anpassung der Skripte
* Massiver "commit" bei Formatwandlung, "Historienverlust"
Bei allgemeiner Zustimmung würde ich ein Wandelskript erstellen und meine
Helferchen anpassen.
Günter
Mehr Informationen über die Mailingliste Trennmuster