[Trennmuster] Kommentare zu »umformatierung.py«

Werner LEMBERG wl at gnu.org
Sa Mär 10 18:04:12 CET 2018


Bei der Durchsicht der Konvertierungsergebnisse »lang« zu »kurz« ist
mir folgendes aufgefallen.

(1) Es gibt den Eintrag

      Ar-til-le-rie=ge<schoß;-2-;-3- # österr. auch in Reformschreibung

    und die Mehrzahl dazu:

      Ar-til-le-rie=ge<scho-ße;Ar-til-le-rie=ge<scho-ße;-3-;-4-;-5- # österr.

    Ich frage mich jetzt aber, warum letzterer Eintrag Felder 4 und 5
    explizit erwähnt.  Sollte nicht

      Ar-til-le-rie=ge<scho-ße;Ar-til-le-rie=ge<scho-ße;-3- # österr.

    ausreichend sein?

(2) Man könnte es auch genau umgekehrt sehen: Weil alle Versalformen
    von »Artilleriegeschoß« durch den Eintrag »Artilleriegeschoss«
    abgedeckt werden, sollte der Eintrag

      Ar-til-le-rie=ge<schoß;-2-;-3-;-4-;-5-

    heißen.

(3) Sollte das Feld

      Ästhet;Äs-thet # Trennung von s-th auch in de-1901, aber langes S (Äſ-thet)

    im Langformat nicht zu

      Äs-thet;Äs-thet # Trennung von s-th auch in de-1901, aber langes S (Äſ-thet)

    im Kurzformat konvertiert werden?  Derzeit findet sich in der
    generiert Kurzliste

      Äs-thet # Trennung von s-th auch in de-1901, aber langes S (Äſ-thet)

(4) Der Eintrag

      Biss;-2-;Biss;Biss;Biss

    könnte, wenn man (1) folgt, zu

      Biss;-2-;Biss

    verkürzt werden.

(5) Warum hat der Eintrag

      Es-ther;Esther # Name < hebr.

    zwei Felder?  Sollte nicht

      Es-ther # Name < hebr.

    ausreichend sein?

Sonst schaut alles sehr gut aus!


    Werner




Mehr Informationen über die Mailingliste Trennmuster