[Trennmuster] Dokumentation 5-Felder-Format

Werner LEMBERG wl at gnu.org
Fr Mär 16 21:23:37 CET 2018


> der nächste Versuch einer verständlichen Beschreibung des neuen
> Formats: [...]

Danke.  Keno hat einige sehr sinnvolle Beobachtungen gemacht; hier die
nächste Iteration der Beschreibung.


    Werner


----------------------------------------------------------------------


5-Felder-Format
---------------

Ein vollständiger Eintrag enthält fünf Felder für die Sprachvarianten
`de`, `de-1901`, `de-CH`, `de-1901-x-versal` und `de-CH-1901` (Tags
nach [BCP47]_).

Die Felder sind durch Semikolons getrennt. 

Felder können weggelassen werden, wenn sich der jeweilige Inhalt aus
einem allgemeineren Feld gewinnen lässt (siehe `Ersatzregeln`_).

Feldinhalte sind Wörter mit Kennzeichnung der Trennstellen nach den
Regeln der `Wortliste der deutschsprachigen Trennmustermannschaft`_,
z.B. ``Pro<zent=zah-len``.

Ein Feld wird als leer markiert (durch den Eintrag ``---``, wenn ein
Wort in dieser Sprachvariante nicht ausgegeben werden soll,
z.B. ``---;Ba-bies``.


Feldbelegung
~~~~~~~~~~~~

Die Felder beschreiben die Schreibung und Trennung eines Wortes gemäß
der Sprachvarianten:

1. `de`: `aktuelle Rechtschreibung`_, wie sie in Deutschland und
   Österreich angewendet wird.

   Beispiele: ``Diens-te``, ``ba-cken``, ``Grü-ße``, ``Schluss=satz``.

2. `de-1901`: `traditionelle Rechtschreibung`_, wie sie in Deutschland
   und Österreich von 1901 bis 1996 gültig war.
  
   Beispiele: ``Dien-ste``, ``ba{ck/k-k}en``, ``Grü-ße``,
   ``Schluß=satz``.

3. `de-CH` oder `de-x-versal`: aktuelle Rechtschreibung, wie sie in
   der Schweiz und bei ß-Ersatzschreibung angewendet wird.
   
   Beispiele: ``ba-cken``, ``Grüs-se``, ``Schluss=satz``.

4. `de-1901-x-versal`: traditionelle Rechtschreibung mit
   ß-Ersatzschreibung, wie sie in Deutschland und Österreich
   angewendet wurde (keine Trennung von „ss“ als Ersatz für „ß“).

   Beispiele: ``ba{ck/k-k}en``, ``Grü-sse``, ``Schluss=satz``.

5. `de-CH-1901`: traditionelle Rechtschreibung, wie sie in der Schweiz
   angewendet wurde (Trennung von „ss“, auch wenn es für „ß“ steht).

   Beispiele: ``ba{ck/k-k}en``, ``Grüs-se``, ``Schlu{ss/ss=s}atz``.


Ersatzregeln
~~~~~~~~~~~~

Feld 1 (`de`) ist ein Pflichtfeld, die anderen Felder können
weggelassen werden, wenn sich der Inhalt über regelmäßige
Transformationen_ aus einem generischeren Feld gewinnen lässt:

2. `de-1901`          aus `de`      mit `ableitung1901()`_ 
3. `de-CH`            aus `de`      mit `versalschreibung()`_
4. `de-1901-x-versal` aus `de-1901` mit `versalschreibung()`_
5. `de-CH-1901`       aus `de-1901` mit `versalschreibung()`_

Die Ersetzung erfolgt rekursiv (siehe `getitem()`_). 


    Werner




Mehr Informationen über die Mailingliste Trennmuster