[Trennmuster] Trennstellenunterdrückung

Guenter Milde milde at users.sf.net
Di Mai 15 02:46:26 CEST 2018


On 14.05.18, Werner LEMBERG wrote:
> >> Zur Fehlersuche wäre es praktisch, gezielt die Muster
> >>
> >>   Athe-isten
> >>   Ego-isten
> >>
> >> oder
> >>
> >>   Athei-sten
> >>   Egoi-sten
> >>
> >> aktivieren zu können.  Es sind also genau die einbuchstabigen
> >> Trennstellen, zwischen denen ich wechseln möchte.
> >
> > Also statt der "normalen" Variante von keine_einzelvokale(), die bei
> > "Unentschieden" die erste Trennung unterdrückt:
> >
> >   re.sub(u'-[.]*([aeiouyäöü]-[^.])', u'\\1', wort)
> >
> > eine, die gezielt (und auch bei "punktierten" Trennungen) die erste oder
> > zweite weglässt:
> >
> >   re.sub(u'(-[.]*[aeiouyäöü]-[.]*)', u'-\\1', wort)
> >
> > bzw.
> >
> >   re.sub(u'(-[.]*[aeiouyäöü]-[.]*)', u'\\1-', wort)

> Das ist nicht notwendig.  Was ich haben will, ist einfach die
> Aktivierung der »anderen« einbuchstabigen Trennstelle.

Für "Flatterbuchstaben" oder für alle vier Fälle von Trennstellen mit
Abstand eins? (vgl. Trennstile.txt)

Wenn "für alle", was ist dann die "andere" Stelle bei z.B.
ger<i-a-t-ri-sche, Bi-n<o-kel, o·pi-o-i-.de oder Di-a<g-no-se?



> >> Um das zu realisieren, sollte in Fällen, wo ein regulärer Ausdruck
> >> nicht ausreicht, ein eigener Marker verwendet werden:
> >>
> >>   An<woh-ner=in<.i·ti-a-ti-ve
> >
> > Achtung: Hier haben wir es nicht mit einem selbstdefinierten
> > Trennstil zu tun, der aus ästhetischen Gründen nur eine von zwei
> > gleichberechtigt zulässigen Trennstellen auswählt.  [...]

> Spielt keine Rolle, weil für Muster unerheblich.

Wenn wir ein neues Trennstellensymbol einführen, ist es sehr erheblich,
zu definieren wo es stehen darf, was es bedeuten soll und wie es in den
verschiedenen Anwendungsfällen zu verarbeiten ist.

Welchen Unterschied zu An<woh-ner=in<.i-ti-a-ti-ve soll denn das «·»
kennzeichnen?


> Ich will »Schalter« haben:

> Schalter 1: Semantische Trennungen ein/aus.

Ich vermute, Du meinst "semantisch irreführende" Trennstellen:

>   An<woh-ner=in-i-ti-a-ti-ve  <-->  An<woh-ner=ini-ti-a-ti-ve
>   Ur<in<stinkt                <-->  Ur<instinkt

Schalter 1 gilt also auch für Trennstellen *ohne* Nachbar im Abstand 1,
richtig?

Soll/darf Schalter 1 auch "phonetisch irreführende" Trennstellen schalten?

  Ab<fra-ge=in-.ter<vall:  Ab<fra-ge=in-ter<vall / Ab<fra-ge=inter<vall
  Ju-da-i-.stik:	    Ju-da>i-stik 	  / Ju-da>istik

Soll/darf Schalter 1 "Nottrennstellen" schalten?

  Tel-tow-.er:  Tel-tow-er / Tel-tower
  Ko-.a-la: 	Ko-a-la    / Koa-la



> Schalter 2: Keine einbuchstabigen Trennungen mit
>             bevorzugter/alternativer Unterdrückung.

>   An<woh-ner=ini-tia-ti-ve  <-->  An<woh-ner=in-iti-ati-ve
>   aar=gaui-schen            <-->  aar=gau-ischen

Was bedeutet hier bevorzugt/alternativ?

Mit Stand 2018-05-09 gibt es vier Anlässe für die Auszeichnung von
Trennstellen mit Abstand eins mit unterschiedlichen "Vorzugsregelungen"
und damit die zusätzlichen Trenn-Varianten:

  An<woh-ner=ini-ti-ati-ve # modern + Flatterbuchstabe nach hinten

  An<woh-ner=in<itia-ti-ve # etymologisch + Flatterbuchstabe nach vorn


> Schalter 3: Nur Haupttrennstellen ein/aus.

> Schalter 4: Nur Suffixe ein/aus.

> ...

> Und diese Schalter sollten möglichst unabhängig sein, also
> z.B. semantische Trennung ein und alternative Trennung ein:

>   An<woh-ner=in<.i·ti-a-ti-ve  ->  An<woh-ner=initi-ati-ve

bzw. An<woh-ner=ini-ti-ati-ve, wenn sich "alternative Trennung" auch auf
"modernen" Trennstil anstelle des bisher bevorzugten "etymologischen"
Trennstils bezieht.

...

Die "An<woh-ner=in<.i-ti-a-ti-ve" ist ein komplexer Fall, mit

* Wahltrennungen an "verblassten" Wortfugen nach § 113:

    …in<.i-ti…      ->  …ini-ti… (etymologisch) vs. …ini-ti… (sprechsilben)

  Die Alternativauswahl erfolgt hier auch, wenn eine der Alternativen als
  explizit ungünstig markiert ist, um einen dokumentweit einheitlichen
  Trennstil zu gewähren. (Wir wollen keine einzelne "neumodische"
  Sprechsilbentrennung zulassen die im Konflikt mit der Morphologie steht,
  nur weil Trennung an der Wortfuge zu semantischen Missverständnissen
  führen könnte.)

* Silbisch ausgesprochenem Vokal

    …ti-a-ti…

  Hier sind beide Trennungen (in AR und NR) zulässig, wenn eine silbische
  Aussprache des -a- angenommen wird (nach AR zwischen "ia" in
  Fremdwörtern nur Nottrennung).

  Die Auswahl einer Trennstelle erfolgt hier nur zur Vermeidung von
  Flatterbuchstaben. Dieser "ästhetische Filter" ist nicht nötig, wenn
  eine der Trennstellen aus semantischen oder phonetischen Gründen
  unterdrückt, oder als Nottrennstelle gekennzeichnet ist.





> >> Wir haben derzeit eine Handvoll solcher Fälle; der Aufwand wäre
> >> also sehr überschaubar – wahrscheinlicher werden's ein paar mehr
> >> werden.
> >
> > Die Kosten sind weniger im Editieraufwand als im "Verbraten" eines
> > separaten Trennzeichens

> Also ich denke, wir können uns ein neues Zeichen leisten :-)

Ein extra Zeichen für seltene Ausnahmen ist eine schlechte Idee -- die
Bedeutung wird schnell vergessen und verwirrt dann nur. Für Einzelfälle
fände ich z.B. einen "formalisierten Kommentar" deutlich günstiger.


> > Also weiterhin der nachgestellte Punkt für "semantische"
> >
> >   Ab<dampf=en<.er-gie
> >   Ju-gend=buch=au-to-.rin
> >   Ra-che=ter-.zett

> Ja.

> > *und* "phonetische"
> >
> >   Ab<fra-ge=in-.ter<vall
> >   Ju-da>i-.stik
> >   Ra-e-.li
> >
> > Ungünstikeit?

> Ja, weil in diesen Beispielen semantisch problematische Trennstellen
> nicht mit Einbuchstaben-Trennstellen zusammenfallen.  Problematisch
> wären phonetische Zweibuchstaben-Trennstellen – gibt's sowas?

Eine aus phonetischen Gründen als ungünstig markierte Trennstelle im Abstand
zwei? Ja, z.B.

Abfrageinterface;Ab<fra-ge=in-.ter<face
Abfrageintervall;Ab<fra-ge=in-.ter<vall


> >> Mein Vorschlag ist »·«, das wir auch für den Fall (d) verwenden
> >> könnten – wir brauchen ja keine semantisch irreführenden Trennungen
> >> für Gesangstexte markieren, daher gäbe es keinen Konflikt.
> >
> > Ich sehe hier einen großen Konflikt: in engen Spalten können
> > "irreführende" und Nottrennungen erlaubt werden, Notentexttrenner
> > aber nicht.

> Das wären auch »Schalter« in obigem Sinne.

Das Problem ist, dass in bei normalem Text im "modernem" Trennstil die
Trennung "Anwohnerini-tiative" zulässig ist, die Trennung "gea-delt" aber
nicht. Wie soll das bei einer Auszeichnung mit

  An<woh-ner=in<.i·ti-a-ti-ve  und ge<a·delt

erkannt werden?


Viele Grüße

Günter



Mehr Informationen über die Mailingliste Trennmuster