[Trennmuster] Ein-Buchstaben-Silben

Guenter Milde milde at users.sf.net
Mi Mai 2 16:56:57 CEST 2018


Liebe Trennfreunde,

On 30.04.18, Keno Wehr wrote:
> Am 30.04.2018 um 14:44 schrieb Guenter Milde:
> > 
> > > Ich gebe Dir völlig recht.  Aber trotz Gleichwertigkeit der
> > > Trennstellen vor und nach Einvokalsilben sollte meiner Meinung nach
> > > standardmäßig nicht beides gleichzeitig im Text auftauchen
> > Warum? Was ist daran schlimmer, als gleichzeitiges Auftauchen anderer
> > legaler Trennalternativen (Schauspiele-rin aund Schauspie-lerin)?

...

> Wie Werner empfinde ich „The-ater“ und „Thea-ter“ in einem Text als
> ungünstig.
> „Schauspiele-rin“ und „Schauspie-lerin“ wären auch nicht besonders günstig,
> aber weniger ungünstig, da der Abstand der beiden Trennstellen etwas größer
> ist.

Ja, etwas ungünstig schon, aber nicht schlimmer als solche Sachen wie
Parkeisen-bahn, Atomeis-
brecher oder bebil-
derte Geschichten.


> Ich plädiere dafür, die Einteilung der Trennstile in „Trennstile.txt“ etwas
> zu überarbeiten, beispielsweise:
> – alle: wie bisher, doch nur der Vollständigkeit halber, ohne konkreten
> Anwendungszweck

Welche der möglichen Trennstile wir wirklich implementieren wollen ist
sowieso noch offen.

> – sehr schmalspaltig: Unterdrückung sehr ungünstiger Trennstellen
> – schmalspaltig: Unterdrückung ungünstiger Trennstellen

> – lesefreundlich: Unterdrückung ungünstiger Trennstellen, Unterdrückung von
> Trennstellen im Abstand von nur einem Buchstaben; dies als Standard für die
> TeX-Trennmuster

Ich finde das nicht lesefreundlich (siehe oben). Evt. könnte man es als
"ästhetisch" bezeichnen.

> – sehr lesefreundlich: zusätzlich Unterdrückung von Trennstellen in der Nähe
> von besseren Trennstellen (was noch zu spezifizieren ist)

Bezüglich der "Güte" von Trennstellen haben wir in README.wortliste schon
Gedanken gesammelt, aber es sind noch Feinarbeit und Tests nötig, um dies in
einen sinnvollen Algorithmus umzusetzen:

Ziel:
  geringe Störung des Leseflusses bei Zeilenumbruch an dieser Stelle


Im Allgemeinen ist die Bindungsstärke umgekehrt proportional zur „Güte“
(oder dem „Gewicht“) einer Trennstelle:¹

  Bindungsstärke  Güte/Gewicht       Beispiel
  --------------  -----------------  -----------
  schwach         Vorzugstrennungen  Auswahl-
                                     liste

  mittel          mittel             Aus-
                                     wahlliste

  stark           weniger gut        Auswahllis-
                                     te

  ¹ In eine genauere „Gütebestimmung“ geht auch der Abstand zu anderen
    Trennstellen und die Position im Wort ein.


Das mindeste wäre, Trennstellen im abstand von bis zu 2 (oder 3) Buchstaben
zu einer Trennstelle mit geringerer Bindungsstärke zu unterdrücken, also z.B.

 Be<för-de-rungs=be<din-gun-gen  -> Be-förde-rungs-bedingun-gen

Evt. müssen bei größeren Bindungsstärke- oder Kategorieunterschieden auch
größere Abstände berücksichtigt werden um z.B. die Trennung "Be-
gleitfahrzeug" zu vermeiden.

> – dazu Haupttrennstellen, Primärtrennstellen und Notentext wie bisher

> Das hieße allerdings, dass man eine neue Syntax für die Markierung der
> einbuchstabigen Silben braucht, um festzulegen, welche Trennmöglichkeit als
> lesefreundlicher gelten soll. Mit der bisherigen Markierungspraxis wären die
> Stile „schmalspaltig“ und „lesefreundlich“ wie oben vorgeschlagen nicht
> unterscheidbar. Evtl. würde auch schon eine mutigere Suffixauszeichnung
> helfen (s. u.).

Für "schmalspaltig" vs. "gegenwärtiger Stil" wäre die Implementierung der
schon dokumentierten Stufen der "Ungünstigkeit" nötig:

  Besonders ungünstige Trennstellen können mit mehreren Punkten gekennzeichnet
  sein.
  
    Symbol  Qualität           Beispiele
    ------  -----------------  ------------------------------------
      .     ungünstig          An<den-.ken, Ost=en-.de, Re<im<.port
      ..    sehr ungünstig     Ge<winn=er<..war-tung
      ...   äußerst ungünstig  An<=al-...pha=bet

Vielleicht reicht das auch für die einvokalischen Silben ohne das wir noch
zusätzliche Syntax brauchen.


> > 
> > Bei der Wichtung der einvokalischen Silben (fcc63ae286) hab ich an vielen
> > Stellen abweichende Vorstellungen:
> > 
> >    jetzt		    		  Vorschlag
> >    ======================          =============================
> >    adri-.a-tisch                   gleichwertig: adri-atisch adria-tisch

> Hier bin ich unentschlossen. Aufgrund einer möglichen Fehlinterpretation
> Adria-Tisch evtl. eher das erste.

Andererseits ist "adria-ti-sche" sowieso schon möglich und die
Verwechslungsgefahr beim Teil auf der neuen Zeile eher gering.


> >    ga-li-lä-i-.sche		  galiläi-sche

> Ich bin aus zwei Gründen für „galilä-ische“:
> 1. „isch“ ist ein Suffix: „galilä>ische“
> 2. Die Grundform „galiläisch“ wird auch nach dem ä getrennt, nicht nach dem
>    i. Somit wird für ein einheitliches Textbild gesorgt.

Andererseits ist "Ische" eher abwertend.

> > In der Wortliste sind jetzt ein ganzes Bündel Trennungen wie thei-
> > stisch (the-i-stisch), die bisher durch ableitung1901 (fälschlich)
> > herausgefiltert wurden. Da ist sicher teilweise auch noch eine
> > explizite Unterdrückung ungünstiger Trennstellen angesagt.

> Mein Vorschlag: AR nur the-istisch, NR the-is-tisch
> (Die Wortstruktur ist the>ist>isch. Das zweite Suffix wird für die Trennung
> ignoriert, also the>istisch.)

So ungefähr war es (atheistisch;-2-;athe-istisch;athe-is-tisch, etc.) aber
das entspricht nicht dem Sachstand, athei-stisch ist in de 1901 legal,
sollte also auch in der "wortliste" stehen. (Und in einem Liedtext muss auch
a-the-i-stisch getrennt werden.)

Viele Grüße

Günter



Mehr Informationen über die Mailingliste Trennmuster