[Trennmuster] Problem mit Ein-Buchstaben-Trennungen
Werner LEMBERG
wl at gnu.org
Sa Jan 23 08:08:06 CET 2021
> Ich bin gerade dabei, mein »extract-tex.pl«-Skript zu aktualisieren,
> da geb' ich die Beschreibung einmal hinein. Später kann man das
> woanders unterbringen.
Mein Skript liefert jetzt wieder identische Resultate zu Günters
Implementierung :-) Während der Implementation haben sich noch
kleinere Korrekturen in der Beschreibung ergeben; hier ist jetzt die
aktualisierte Version.
(1) Auflösung von Wahlmöglichkeiten zwischen morphemischem und
syllabischem Trennstil (einer der beiden Stile muß gewählt
werden). Ungünstigkeitsmarker und Gesangstrennstellen
werden in diesem Schritt nicht berücksichtigt (wohl aber
entfernt, wenn die entsprechende Trennstelle entfällt).
(a) Die Bezeichnungen
<x- und -x<
sind Kurzschreibungen für
{<x/x-} und {x</-x} (morphemisch/syllabisch) ,
wobei »x« ein Konsonant oder »ch« ist. Diese Regel gilt
weder für die Suffixe »>x-« und »-x>« noch für die
Zusammensetzungen »=x-« und »-x=«.
(b) Die Bezeichnungen
<i- und -i<
sind Kurzschreibungen für
{<i·/i-} und {·i</-i} (morphemisch/syllabisch) ,
wobei »i« ein Vokal ist (einschließlich »y«). Diese
Regel gilt weder für die Suffixe »>i-« und »-i>« noch
für die Zusammensetzungen »=i-« und »-i=«.
Beispielsweise bleibt die Markierung
al-ge-bra>i-sche
in diesem Schritt unverändert; wegen »>« gibt es keine
Wahlmöglichkeit.
(2) Behandle (angehängte) ».«-Marker, falls ungünstige
Trennstellen unterdrückt werden sollen.
(3) Entferne Flattervokale (also Einbuchstaben-Silben), falls
verlangt. Beachte, daß »ch« wie ein Buchstabe behandelt
wird und auch Schwankungsfälle berücksichtigt werden.
Gesangstrennstellen dagegen werden ignoriert (aber
gegebenenfalls entfernt).
(a) Ist eine Trennstelle »stärker« als die andere, wird die
stärkere Trennstelle genommen (z.B. ist »>« stärker als
»-«, »-« stärker als ».«).
(b) Sind die Trennstellen gleich stark, wird die rechte
Trennstelle genommen.
(4) Entferne Gesangstrennstellen, falls verlangt. Beachte, daß
die Markierung für Gesangstrennstellen, ähnlich zu
Ungünstigkeitsmarkern, auch zu anderen Markern treten kann
(die dann ebenfalls entfernt werden).
(5) Entferne restliche Schwankungsfälle, falls verlangt.
(6) Alle verbliebenen Markierungen werden zu »-« aufgelöst.
Beispiele:
Re<s-tau-rant
Re<stau-rant (1a, morphemisch)
Re-stau-rant (6)
Re<s-tau-rant
Res-tau-rant (1a, syllabisch)
Ge-r<i.a-trie
Ger<i.a-trie (1a, morphemisch)
Ger<ia-trie (3)
Ger-ia-trie (6)
Ge-r<i.a-trie
Ge-ri.a-trie (1a, syllabisch)
Ge-ria-trie (3)
Ärz-te=i·n<.i-ti.a-ti-ve
Ärz-te=i·n<.i·ti.a-ti-ve (1b, morphemisch)
Ärz-te=i·ni·ti.a-ti-ve (2)
Ärz-te=i·ni·tia-ti-ve (3a)
Ärz-te=initia-ti-ve (4)
Ärz-te-initia-ti-ve (6)
Ärz-te=i·n<.i-ti.a-ti-ve
Ärz-te=i·ni-ti.a-ti-ve (1b, syllabisch)
Ärz-te=i·ni-tia-ti-ve (3a)
Ärz-te=ini-tia-ti-ve (4)
Ärz-te-ini-tia-ti-ve (6)
Di-a<s-po-ra
Di·a<s-po-ra (1b, morphemisch)
Di·a<spo-ra (1a)
Dia<spo-ra (4)
Dia-spo-ra (6)
Di-a<s-po-ra
Di-as-po-ra (1b, syllabisch)
Kaf-ka=ken-.ner
Kaf-ka=kenner (2)
Kaf-ka-kenner (6)
al-ge-bra>i-sche
al-ge-bra>ische (3a)
al-ge-bra-ische (6)
Ru-i-ne
Rui-ne (3b)
A<·s-phalt
A<·sphalt (1a, morphemisch)
Asphalt (4)
A<·s-phalt
As-phalt (1b, syllabisch)
ge-ni.al
ge-nial (5)
Werner
Mehr Informationen über die Mailingliste Trennmuster