[Trennmuster] Problem mit Ein-Buchstaben-Trennungen

Werner LEMBERG wl at gnu.org
Di Jan 19 16:32:12 CET 2021


>> Derzeit ist die Markierung für »Ärzteinitiative«
>> für die NR
>>
>>   Ärz-te=i·n<.i-ti.a-ti-ve
>>                ^

Ich finde, wir sollten dieses Wort in die Dokumentation aufnehmen und
*ganz genau* erklären, wie das funktioniert!  Wenn selbst ich
Schwierigkeiten habe, der ich doch im Team bin, wie sollen das
Außenstehende erst begreifen :-)

> Ja, mit
>
>   "<x-" als Kurzschreibung für {<x/x-} (morphemisch/syllabisch)

OK.

> Wenn Wahlmöglichkeit nach § 113 und randständiger Vokal
> zusammentreffen, bleibt im morphemischen eine Gesangstrennung:
>
>   "<i-" als Kurzschreibung für {<i·/i-}.

Aah, ich habe übersehen, daß hier von »Vokalen« die Rede ist!

> Die Auflösung der Wahlmöglichkeit nach § 113 erfolgt *vor* der
> Entfernung von mit "." markierten ungünstigen Stellen.  (Wir wollen
> doch keine etymologisch falschen Trennungen, nur weil die
> benachbarte Trennung ungünstig ist.)  Das ist anders als bei der
> Auflösung von Flattervokalen!

Laß mich den Algorithmus zusammenfassen.


======================================================================

(1) Auflösung von Wahlmöglichkeiten zwischen morphemischem und
    syllabischem Trennstil, falls verlangt.  Ungünstigkeitsmarker
    werden in diesem Schritt nicht berücksichtigt (wohl aber entfernt,
    wenn die entsprechende Trennstelle entfällt).

    (a) Die Bezeichnungen

          <x-  und  -x<

        sind Kurzschreibungen für

          {<x/x-}  und  {x</-x}  (morphemisch/syllabisch)   ,

        wobei »x« ein Konsonant oder »ch« ist.  Diese Regel gilt
        *nicht* für »>x-« und »-x>«.  Beachte weiters, daß es die
        Bezeichnung »=x-« nicht gibt.

        Ein Beispiel ist die Markierung

          Re<s-tau-rant   ,

        die sich zu

          Re<stau-rant  (morphemisch)

        bzw. zu

          Res-tau-rant  (syllabisch)

        auflöst.  Ein anderes Beispiel ist

          Ge-r<i.a-trie   ,

        mit den Auflösungen

          Ger<i.a-trie  (morphemisch)

        und

          Ge-ri.a-trie  (syllabisch)   .

    (b) Die Bezeichnungen

          <i-  und  -i<

        sind Kurzschreibungen für

          {<i·/i-}  und  {·i</-i}  (morphemisch/syllabisch)   ,

        wobei »i« ein Vokal ist.  Diese Regel gilt *nicht* für »>i-«
        und »-i>«.  Beachte weiters, daß es die Bezeichnung »=i-«
        nicht gibt.

        Zwei Beispiele.

        * Die Markierung

            al-ge-bra>i-sche

          bleibt in diesem Schritt unverändert; wegen »>« gibt es
          keine Wahlmöglichkeit.

        * Der Eintrag

            Ärz-te=i·n<.i-ti.a-ti-ve

          löst sich zu

            Ärz-te=i·n<.i·ti.a-ti-ve

          im morphemischen Trennstil auf, im syllabischen Trennstil
          dagegen wird es zu

            Ärz-te=i·ni-ti.a-ti-ve   .

    (c) Die Bezeichner werden repetitiv von links nach rechts
        abgearbeitet.

        Das Beispiel

          Di-a<s-po-ra

        wird im morphemischen Trennstil zuerst zu

          Di·a<s-po-ra

        (Regel 1b) und dann zu

          Di·a<spo-ra

        (Regel 1a) umgeformt.  Im syllabischen Trennstil dagegen wird
        es in einem Schritt zu

          Di-as-po-ra

        konvertiert.

(2) Behandle ».«-Marker, falls ungünstige Trennstellen unterdrückt
    werden sollen.  Bei den vorigen Beispielen ergibt das nach
    Ausführung von (1)

      Ärz-te=i·ni·tia-ti-ve (morphemisch)

    und

      Ärz-te=i·ni-tia-ti-ve (syllabisch)

    bzw.

      Ger<ia-trie  (morphemisch)

    und

      Ge-ria-trie  (syllabisch)   .

(3) Entferne Gesangstrennstellen, falls verlangt.  Für das Beispiel
    aus (2) haben wir dann

      Ärz-te=initia-ti-ve (morphemisch)

    bzw.

      Ärz-te=ini-tia-ti-ve (syllabisch)

(4) Entferne Flattervokale (also Einbuchstaben-Trennstellen), falls
    verlangt.  Ist keine der betroffenen Trennstellen speziell
    markiert, wird die »stärkere« Trennstelle genommen (z.B. ist »>«
    stärker als »-«).  Sind die Trennstellen gleich stark, wird die
    rechte Trennstelle genommen.

    Für das Beispiel aus (1) bekommen wir also

      al-ge-bra>ische   ,

    für den Eintrag

      Ru-i-ne

    ergibt sich

      Rui-ne   .

======================================================================


Stimmt das so?  Hab' ich was übersehen?


   Werner




Mehr Informationen über die Mailingliste Trennmuster