[Trennmuster] Problem mit Ein-Buchstaben-Trennungen

Guenter Milde milde at users.sf.net
Mi Jan 20 13:26:05 CET 2021


On 19.01.21, Werner LEMBERG wrote:

> >> Derzeit ist die Markierung für »Ärzteinitiative«
> >> für die NR
> >>
> >>   Ärz-te=i·n<.i-ti.a-ti-ve
> >>                ^

> Ich finde, wir sollten dieses Wort in die Dokumentation aufnehmen und
> *ganz genau* erklären, wie das funktioniert!  Wenn selbst ich
> Schwierigkeiten habe, der ich doch im Team bin, wie sollen das
> Außenstehende erst begreifen :-)

Na ohne die Betriebsblindheit von uns alten Hasen...

...

> Laß mich den Algorithmus zusammenfassen.


> ======================================================================

> (1) Auflösung von Wahlmöglichkeiten zwischen morphemischem und
>     syllabischem Trennstil, falls verlangt.

Alle Filter werden nur genutzt, falls verlangt.
Alle unsere Trennstile verlangen die Wahl zwischen morphemisch oder
syllabisch (Muster für He-li-k-o-p-ter etc. bauen wir nicht und planen wir
auch nicht zu bauen).

>     Ungünstigkeitsmarker
>     werden in diesem Schritt nicht berücksichtigt (wohl aber entfernt,
>     wenn die entsprechende Trennstelle entfällt).

Logo, Ungünstigkeitsmarker ohne Trennstelle gibt es nicht.

>     (a) Die Bezeichnungen

>           <x-  und  -x<

>         sind Kurzschreibungen für

>           {<x/x-}  und  {x</-x}  (morphemisch/syllabisch)   ,

>         wobei »x« ein Konsonant oder »ch« ist.

-         Diese Regel gilt *nicht* für »>x-« und »-x>«.
+         Diese Regel gilt *nicht* für Suffixe (»>x-« und »-x>«).

>         Beachte weiters, daß es die Bezeichnung »=x-« nicht gibt.

Theoretisch schon, praktisch nutzen wir sie nicht.

>         Ein Beispiel ist die Markierung

>           Re<s-tau-rant   ,

>         die sich zu

>           Re<stau-rant  (morphemisch)

>         bzw. zu

>           Res-tau-rant  (syllabisch)

>         auflöst.  Ein anderes Beispiel ist

>           Ge-r<i.a-trie   ,

>         mit den Auflösungen

>           Ger<i.a-trie  (morphemisch)

>         und

>           Ge-ri.a-trie  (syllabisch)   .

>     (b) Die Bezeichnungen

>           <i-  und  -i<

>         sind Kurzschreibungen für

>           {<i·/i-}  und  {·i</-i}  (morphemisch/syllabisch)   ,

>         wobei »i« ein Vokal ist.

>         Zwei Beispiele.

>         * Die Markierung

>             al-ge-bra>i-sche

>           bleibt in diesem Schritt unverändert; wegen »>« gibt es
>           keine Wahlmöglichkeit.

>         * Der Eintrag

>             Ärz-te=i·n<.i-ti.a-ti-ve

>           löst sich zu

>             Ärz-te=i·n<.i·ti.a-ti-ve

>           im morphemischen Trennstil auf, im syllabischen Trennstil
>           dagegen wird es zu

>             Ärz-te=i·ni-ti.a-ti-ve   .

>     (c) Die Bezeichner werden repetitiv von links nach rechts
>         abgearbeitet.

>         Das Beispiel

>           Di-a<s-po-ra

>         wird im morphemischen Trennstil zuerst zu

>           Di·a<s-po-ra

>         (Regel 1b) und dann zu

>           Di·a<spo-ra

>         (Regel 1a) umgeformt.  Im syllabischen Trennstil dagegen wird
>         es in einem Schritt zu

>           Di-as-po-ra

>         konvertiert.

Die Reihenfolge ist hier unerheblich. Punkt (c) kann damit entfallen.


> (2) Behandle ».«-Marker, falls ungünstige Trennstellen unterdrückt
>     werden sollen.  Bei den vorigen Beispielen ergibt das nach
>     Ausführung von (1)

>       Ärz-te=i·ni·tia-ti-ve (morphemisch)

>     und

>       Ärz-te=i·ni-tia-ti-ve (syllabisch)

>     bzw.

>       Ger<ia-trie  (morphemisch)

>     und

>       Ge-ria-trie  (syllabisch)   .

> (3) Entferne Gesangstrennstellen, falls verlangt.  Für das Beispiel
>     aus (2) haben wir dann

>       Ärz-te=initia-ti-ve (morphemisch)

>     bzw.

>       Ärz-te=ini-tia-ti-ve (syllabisch)

Die Schritte (2) und (3) können auch vertauscht werden, das ist für die
Wirkung egal.


> (4) Entferne Flattervokale (also Einbuchstaben-Trennstellen), falls
>     verlangt.  Ist keine der betroffenen Trennstellen speziell
>     markiert, wird die »stärkere« Trennstelle genommen (z.B. ist »>«
>     stärker als »-«).  Sind die Trennstellen gleich stark, wird die
>     rechte Trennstelle genommen.

>     Für das Beispiel aus (1) bekommen wir also

>       al-ge-bra>ische   ,

>     für den Eintrag

>       Ru-i-ne

>     ergibt sich

>       Rui-ne   .

- (4) Entferne Flattervokale (also Einbuchstaben-Trennstellen), falls
+ (4) Entferne Flattervokale (Einbuchstaben-Silben), falls

> Stimmt das so?  Hab' ich was übersehen?

In der Dokumentation sollte klar werden:

Wir haben 3 Fälle von Trennstellen im Abstand 1:

  Flattervokale: 
    reguläre Sprechsilben im Wortinneren,
    erlaubt (§109 (de-1996) und K81 (Duden 72)) aber nicht empfohlen.
   
  Gesangstrennungen:   
    Einzelvokale am Wortrand und vor/nach Wortfugen [<=],
    Nur im Notentext erlaubt (§107 E1 und K79)
 
  verblasste Wortfugen:
    Einzelbuchstaben vor/nach Wortfugen, die nicht erkannt/empfunden werden.
    Nur in de-1996 (§113).
   
Außerdem hilft die beste Dokumentation nichts, wenn sie nicht gefunden wird,
es ist also zu überlegen, wohin damit.

Günter



Mehr Informationen über die Mailingliste Trennmuster