[Trennmuster] Problem mit Ein-Buchstaben-Trennungen
Werner LEMBERG
wl at gnu.org
Di Jan 19 16:32:12 CET 2021
>> Derzeit ist die Markierung für »Ärzteinitiative«
>> für die NR
>>
>> Ärz-te=i·n<.i-ti.a-ti-ve
>> ^
Ich finde, wir sollten dieses Wort in die Dokumentation aufnehmen und
*ganz genau* erklären, wie das funktioniert! Wenn selbst ich
Schwierigkeiten habe, der ich doch im Team bin, wie sollen das
Außenstehende erst begreifen :-)
> Ja, mit
>
> "<x-" als Kurzschreibung für {<x/x-} (morphemisch/syllabisch)
OK.
> Wenn Wahlmöglichkeit nach § 113 und randständiger Vokal
> zusammentreffen, bleibt im morphemischen eine Gesangstrennung:
>
> "<i-" als Kurzschreibung für {<i·/i-}.
Aah, ich habe übersehen, daß hier von »Vokalen« die Rede ist!
> Die Auflösung der Wahlmöglichkeit nach § 113 erfolgt *vor* der
> Entfernung von mit "." markierten ungünstigen Stellen. (Wir wollen
> doch keine etymologisch falschen Trennungen, nur weil die
> benachbarte Trennung ungünstig ist.) Das ist anders als bei der
> Auflösung von Flattervokalen!
Laß mich den Algorithmus zusammenfassen.
======================================================================
(1) Auflösung von Wahlmöglichkeiten zwischen morphemischem und
syllabischem Trennstil, falls verlangt. Ungünstigkeitsmarker
werden in diesem Schritt nicht berücksichtigt (wohl aber entfernt,
wenn die entsprechende Trennstelle entfällt).
(a) Die Bezeichnungen
<x- und -x<
sind Kurzschreibungen für
{<x/x-} und {x</-x} (morphemisch/syllabisch) ,
wobei »x« ein Konsonant oder »ch« ist. Diese Regel gilt
*nicht* für »>x-« und »-x>«. Beachte weiters, daß es die
Bezeichnung »=x-« nicht gibt.
Ein Beispiel ist die Markierung
Re<s-tau-rant ,
die sich zu
Re<stau-rant (morphemisch)
bzw. zu
Res-tau-rant (syllabisch)
auflöst. Ein anderes Beispiel ist
Ge-r<i.a-trie ,
mit den Auflösungen
Ger<i.a-trie (morphemisch)
und
Ge-ri.a-trie (syllabisch) .
(b) Die Bezeichnungen
<i- und -i<
sind Kurzschreibungen für
{<i·/i-} und {·i</-i} (morphemisch/syllabisch) ,
wobei »i« ein Vokal ist. Diese Regel gilt *nicht* für »>i-«
und »-i>«. Beachte weiters, daß es die Bezeichnung »=i-«
nicht gibt.
Zwei Beispiele.
* Die Markierung
al-ge-bra>i-sche
bleibt in diesem Schritt unverändert; wegen »>« gibt es
keine Wahlmöglichkeit.
* Der Eintrag
Ärz-te=i·n<.i-ti.a-ti-ve
löst sich zu
Ärz-te=i·n<.i·ti.a-ti-ve
im morphemischen Trennstil auf, im syllabischen Trennstil
dagegen wird es zu
Ärz-te=i·ni-ti.a-ti-ve .
(c) Die Bezeichner werden repetitiv von links nach rechts
abgearbeitet.
Das Beispiel
Di-a<s-po-ra
wird im morphemischen Trennstil zuerst zu
Di·a<s-po-ra
(Regel 1b) und dann zu
Di·a<spo-ra
(Regel 1a) umgeformt. Im syllabischen Trennstil dagegen wird
es in einem Schritt zu
Di-as-po-ra
konvertiert.
(2) Behandle ».«-Marker, falls ungünstige Trennstellen unterdrückt
werden sollen. Bei den vorigen Beispielen ergibt das nach
Ausführung von (1)
Ärz-te=i·ni·tia-ti-ve (morphemisch)
und
Ärz-te=i·ni-tia-ti-ve (syllabisch)
bzw.
Ger<ia-trie (morphemisch)
und
Ge-ria-trie (syllabisch) .
(3) Entferne Gesangstrennstellen, falls verlangt. Für das Beispiel
aus (2) haben wir dann
Ärz-te=initia-ti-ve (morphemisch)
bzw.
Ärz-te=ini-tia-ti-ve (syllabisch)
(4) Entferne Flattervokale (also Einbuchstaben-Trennstellen), falls
verlangt. Ist keine der betroffenen Trennstellen speziell
markiert, wird die »stärkere« Trennstelle genommen (z.B. ist »>«
stärker als »-«). Sind die Trennstellen gleich stark, wird die
rechte Trennstelle genommen.
Für das Beispiel aus (1) bekommen wir also
al-ge-bra>ische ,
für den Eintrag
Ru-i-ne
ergibt sich
Rui-ne .
======================================================================
Stimmt das so? Hab' ich was übersehen?
Werner
Mehr Informationen über die Mailingliste Trennmuster