[Trennmuster] Problem mit Ein-Buchstaben-Trennungen
Guenter Milde
milde at users.sf.net
Mi Jan 20 13:26:05 CET 2021
On 19.01.21, Werner LEMBERG wrote:
> >> Derzeit ist die Markierung für »Ärzteinitiative«
> >> für die NR
> >>
> >> Ärz-te=i·n<.i-ti.a-ti-ve
> >> ^
> Ich finde, wir sollten dieses Wort in die Dokumentation aufnehmen und
> *ganz genau* erklären, wie das funktioniert! Wenn selbst ich
> Schwierigkeiten habe, der ich doch im Team bin, wie sollen das
> Außenstehende erst begreifen :-)
Na ohne die Betriebsblindheit von uns alten Hasen...
...
> Laß mich den Algorithmus zusammenfassen.
> ======================================================================
> (1) Auflösung von Wahlmöglichkeiten zwischen morphemischem und
> syllabischem Trennstil, falls verlangt.
Alle Filter werden nur genutzt, falls verlangt.
Alle unsere Trennstile verlangen die Wahl zwischen morphemisch oder
syllabisch (Muster für He-li-k-o-p-ter etc. bauen wir nicht und planen wir
auch nicht zu bauen).
> Ungünstigkeitsmarker
> werden in diesem Schritt nicht berücksichtigt (wohl aber entfernt,
> wenn die entsprechende Trennstelle entfällt).
Logo, Ungünstigkeitsmarker ohne Trennstelle gibt es nicht.
> (a) Die Bezeichnungen
> <x- und -x<
> sind Kurzschreibungen für
> {<x/x-} und {x</-x} (morphemisch/syllabisch) ,
> wobei »x« ein Konsonant oder »ch« ist.
- Diese Regel gilt *nicht* für »>x-« und »-x>«.
+ Diese Regel gilt *nicht* für Suffixe (»>x-« und »-x>«).
> Beachte weiters, daß es die Bezeichnung »=x-« nicht gibt.
Theoretisch schon, praktisch nutzen wir sie nicht.
> Ein Beispiel ist die Markierung
> Re<s-tau-rant ,
> die sich zu
> Re<stau-rant (morphemisch)
> bzw. zu
> Res-tau-rant (syllabisch)
> auflöst. Ein anderes Beispiel ist
> Ge-r<i.a-trie ,
> mit den Auflösungen
> Ger<i.a-trie (morphemisch)
> und
> Ge-ri.a-trie (syllabisch) .
> (b) Die Bezeichnungen
> <i- und -i<
> sind Kurzschreibungen für
> {<i·/i-} und {·i</-i} (morphemisch/syllabisch) ,
> wobei »i« ein Vokal ist.
> Zwei Beispiele.
> * Die Markierung
> al-ge-bra>i-sche
> bleibt in diesem Schritt unverändert; wegen »>« gibt es
> keine Wahlmöglichkeit.
> * Der Eintrag
> Ärz-te=i·n<.i-ti.a-ti-ve
> löst sich zu
> Ärz-te=i·n<.i·ti.a-ti-ve
> im morphemischen Trennstil auf, im syllabischen Trennstil
> dagegen wird es zu
> Ärz-te=i·ni-ti.a-ti-ve .
> (c) Die Bezeichner werden repetitiv von links nach rechts
> abgearbeitet.
> Das Beispiel
> Di-a<s-po-ra
> wird im morphemischen Trennstil zuerst zu
> Di·a<s-po-ra
> (Regel 1b) und dann zu
> Di·a<spo-ra
> (Regel 1a) umgeformt. Im syllabischen Trennstil dagegen wird
> es in einem Schritt zu
> Di-as-po-ra
> konvertiert.
Die Reihenfolge ist hier unerheblich. Punkt (c) kann damit entfallen.
> (2) Behandle ».«-Marker, falls ungünstige Trennstellen unterdrückt
> werden sollen. Bei den vorigen Beispielen ergibt das nach
> Ausführung von (1)
> Ärz-te=i·ni·tia-ti-ve (morphemisch)
> und
> Ärz-te=i·ni-tia-ti-ve (syllabisch)
> bzw.
> Ger<ia-trie (morphemisch)
> und
> Ge-ria-trie (syllabisch) .
> (3) Entferne Gesangstrennstellen, falls verlangt. Für das Beispiel
> aus (2) haben wir dann
> Ärz-te=initia-ti-ve (morphemisch)
> bzw.
> Ärz-te=ini-tia-ti-ve (syllabisch)
Die Schritte (2) und (3) können auch vertauscht werden, das ist für die
Wirkung egal.
> (4) Entferne Flattervokale (also Einbuchstaben-Trennstellen), falls
> verlangt. Ist keine der betroffenen Trennstellen speziell
> markiert, wird die »stärkere« Trennstelle genommen (z.B. ist »>«
> stärker als »-«). Sind die Trennstellen gleich stark, wird die
> rechte Trennstelle genommen.
> Für das Beispiel aus (1) bekommen wir also
> al-ge-bra>ische ,
> für den Eintrag
> Ru-i-ne
> ergibt sich
> Rui-ne .
- (4) Entferne Flattervokale (also Einbuchstaben-Trennstellen), falls
+ (4) Entferne Flattervokale (Einbuchstaben-Silben), falls
> Stimmt das so? Hab' ich was übersehen?
In der Dokumentation sollte klar werden:
Wir haben 3 Fälle von Trennstellen im Abstand 1:
Flattervokale:
reguläre Sprechsilben im Wortinneren,
erlaubt (§109 (de-1996) und K81 (Duden 72)) aber nicht empfohlen.
Gesangstrennungen:
Einzelvokale am Wortrand und vor/nach Wortfugen [<=],
Nur im Notentext erlaubt (§107 E1 und K79)
verblasste Wortfugen:
Einzelbuchstaben vor/nach Wortfugen, die nicht erkannt/empfunden werden.
Nur in de-1996 (§113).
Außerdem hilft die beste Dokumentation nichts, wenn sie nicht gefunden wird,
es ist also zu überlegen, wohin damit.
Günter
Mehr Informationen über die Mailingliste Trennmuster