[Trennmuster] Problem mit Ein-Buchstaben-Trennungen
Guenter Milde
milde at users.sf.net
Do Jan 14 11:31:43 CET 2021
On 13.01.21, Werner LEMBERG wrote:
> > > Unterschiedliche Regeln für »>« und »<«? Ich halte das für eine
> > > nicht so gute Idee, ehrlich gesagt.
> >
> > Ist aber "schon immer" so: [...]
> Das habe ich nicht gemeint. Ich bezog mich auf die Funktion von ».«
> als Suffix (»<.«, »=.«, »>.«, »-.«) – meiner Meinung nach sollte die
> Bedeutung *immer* gleich sein, nämlich eine Ungünstigkeitsmarkierung,
> die in weiterer Folge zur Unterdrückung *genau dieser* Trennstelle
> führt.
> > Nach der Anwendung von "morphemisch" sind die beiden Bsp. also
> >
> > aar=gau=>.i-schen Ärz-te=in<.i·ti.a-ti-ve
> Da stimmt was nicht.
Ich glaube, das Problem ist die Unterscheidung von Wahltrennung nach §113
und Flattervokalen...
> Derzeit ist die Markierung für »Ärzteinitiative«
> für die NR
> Ärz-te=i·n<.i-ti.a-ti-ve
> ^
Ja, mit
"<x-" als Kurzschreibung für {<x/x-} (morphemisch/syllabisch)
Wenn Wahlmöglichkeit nach § 113 und randständiger Vokal zusammentreffen,
bleibt im morphemischen eine Gesangstrennung:
"<i-" als Kurzschreibung für {<i·/i-}.
Die Auflösung der Wahlmöglichkeit nach § 113 erfolgt *vor* der Entfernung
von mit "." markierten ungünstigen Stellen. (Wir wollen doch keine
etymologisch falschen Trennungen, nur weil die benachbarte Trennung
ungünstig ist.) Das ist anders als bei der Auflösung von Flattervokalen!
Für die Ärz-te=in<.i·ti.a-ti-ve wird also die Wahl:
Ärz-te=in<.i·ti.a-ti-ve / Ärz-te=i·ni-ti.a-ti-ve
(morphemisch/syllabisch).
> Der »morphemische« Eintrag ist also
> n<.i-t
Das ist nicht morphemisch sondern weiterhin zweideutig. Wenn ich den
"morphemischen" Trennstil wähle kenne ich die Zusammensetzung
in- + itiative und darf eins nach der Vorsilbe nur noch im Notentext
trennen (§ 107 E1).
> und normalerweise bedeutet ».«, daß die andere Trennstelle zu nehmen
> ist:
> Ärz-te=i·ni-ti.a-ti-ve
Das ist bei Flattervokalen so, wo zwei reguläre Sprechsilbentrennungen
("-" oder ">") zusammenfallen (also entweder im Wortinneren oder bei
suffigierten (Teil-) Wörtern).
> Und genau das wollen wir ja nicht.
Genau.
> Ich sehe meine Argumentation bis jetzt nicht entkräftet. Dein Skript
> macht da irgendwas, das nicht dokumentiert ist, soweit ich das überblicke.
Mein Skript unterscheidet Wahltrennungen von Flattervokalen an der Kategorie
der Trennstellen (regexp: "[<=].-" vs. "-.-") genauer::
def morphemisch(wort):
"""Bei Alternativen, Trennung nach Morphologie (hin<auf, Päd<ago-ge).
Entferne Alternativtrennungen nach §113 (verblasste Morphologie).
"""
# nach (mit Selbstlaut):
wort = re.sub('([<=]+[.·]*[aeiouyäöü])[-.]+', '\\1·', wort)
# nach
wort = re.sub('([<=]+[.·]*([^>]|ch))[-.]+', '\\1', wort)
# vor (mit Selbstlaut):
wort = re.sub('[-.]+([aeiouyäöü][<=]+)', '·\\1', wort)
# vor:
wort = re.sub('[-.]+((.|ch)[<=]+)', '\\1', wort)
# vor (mit Randtrennung: E·x<a-men, Di·a<g-no-se)
wort = re.sub('·(([^aeiouyäöü]|ch)[<=]+)', '\\1', wort)
return wort
vs. ::
def keine_flattervokale(wort):
"""Entferne Trennmarker vor Einzevokalsilben (Thea-ter)."""
wort = re.sub('>([aeiouyäöü])[-]\.?', '>\\1', wort)
wort = re.sub('(?<![<>=])[-.]+([aeiouyäöüëï])(?=[->][^.])', '\\1', wort)
return wort
In lib/py_wortliste/stilfilter.py sind diese Funktionen auch samt Beispielen
dokumentiert.
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster