[Trennmuster] Worttrennung versus Ligaturen-Aufbruch

Guenter Milde milde at users.sf.net
Mo Dez 10 21:50:44 CET 2018


Liebe Trennfreunde, lieber Mico,

On  1.12.18, Mico Loretan wrote:

> Meiner Ansicht sollte eine Verquickung von Trennstellen-Regeln und
> Ligaturaufbruchs-Regeln strikt vermieden werden. 

> Trennstellen-Regeln sollten gültig sein unabhängig davon ob eine
> Schrift gewisse Ligaturen anbietet oder nicht. Das heisst, z.B., dass
> Offizier wie Of-fi-zier getrennt werden sollte, unabhängig davon ob die
> verwendete Schrift die Ligaturen fi, ff, und/oder ffi anbietet. 

Dies ist unstrittig: Ligaturen haben keinen Einfluss auf die
Worttrennung.

> Und umgekehrt sollten Ligaturen an (gewissen, aber nicht allen)
> Morphemgrenzen unterdrückt werden, egal ob die betroffene Morphemgrenze
> auch eine Wort-Trennstelle ist -- oder eben vielleicht auch nicht.
> Morpheme und Silben sind zwei verschiedene Dinge. Sie miteinander zu
> vermischen ist keine gute Idee.

Allerdings weist der Aufbruch von Ligaturen eine Reihe von
Gemeinsamkeiten mit der Worttrennung und der Unterscheidung von Lang- und
Rund-s in gebrochenen Schriften auf:

Ziel
 ist einfache Rezeption geschriebener Texte durch ein der Wortstruktur
 adäquates Layout. 
 
Aus den entsprechenden Konventionen entstanden mehr oder weniger
verbindliche Regeln.
  
* Zusammenhalten der Morpheme

  - Worttrennung nur zwischen (formalen) „Sprechsilben“, die i.Allg. mit
    Zäsuren beim Vorlesen übereinstimmen.
  fi Verwendung von Ligaturen um optische Lücken zu vermeiden.
  ſ Verwendung des Lang-S im Inneren der Morpheme.

* Wortfugen in Komposita und nach Präfixen werden hervorgehoben:

  - Worttrennung auch entgegen den formalen Sprechsilbenregeln
    (Plan-spiel, ab-arbeiten),
  fi Aufbruch von Ligaturen (Stoff|igel, auf|fällig),
  ſ Verwendung des Schluss-s (Achslaſt, Ausſage).

* Die Grenze vor Suffixen ist weniger geschützt

  - Worttrennung und Morphemgrenze sind entkoppelt (hal-ten ↔ halt + -en),
    Trennung im Abstand 1 erlaubt (Opi-oid, Steroi-de)
  fi einige Ligaturen sind erlaubt (häu{fi}g, aber höf|lich)
  ſ Lang-s möglich (er raſte, ein Sechſtel)

  Einige Suffixe werden analog zu Komposita und Präfixen behandelt:

  - Worttrennung möglich (Sprechsilbenregel) (ess-bar, acht-fach, Frei-heit)
  fi Ligaturaufbruch (begreif|lich, fünf|fach, acht|los)
  ſ Schluss-s (wachſen ↔ Wachstum, Biſchof ↔ Bistum, Häuſel  ↔ Häusler
    	       Müsli, Fiesling, Riesling)
  
Daher erscheint es sinnvoll, die eingeführten Kategorien der Trennstellen
auch für Lang-s-Schreibung und Ligaturaufbruch zu nutzen.

Für die Behandlung von Suffixen gibt es unterschiedliche Ansätze. 
Ggf. müssen wir analog zu den Trennstilen mehrere unterschiedliche
"Ligaturaufbruchstile" anbieten.


> Das selnolig Paket ist ganz in diesem Sinne konzipiert und
> eingerichtet: Die Algorithmen zur selektiven Unterdrückung gewisser
> Ligaturen interagieren bewusst auf gar keine Weise mit dem
> Zeilenumbruchsalgorithmus von LuaTeX.

Eine simple Übertragung/Fremdnutzung des Zeilenumbruchalgorithmus' für den
Ligaturaufbruch ist nicht möglich, soweit bin ich ganz Deiner Meinung.
Dennoch gibt es Potential zur Nutzung der Analogien der beiden
Strukturierungsaufgaben:

Implementierung:
  In beiden Fällen geht es darum, "Sollbruchstellen" in Strings zu finden.
  Der Liangsche Algorithmus und die Datenstruktur "trie" sind dabei
  besonders effizient.
  
  Anstelle einer handgebauten Liste von \nolig und \keeplig Makros können
  Regeln in der Form von "patgen"-Pattern ebenfalls "händisch" oder aus
  einer entsprechenden Vorgabeliste mit `patgen` erstellt werden.
  
  Der Algorithmus zum Anwenden dieser Pattern um Sollbruchstellen in
  Strings einzufügen ist generisch und effizient. selnolig kann entweder
  eine eigene Lua-Implementierung verwenden oder evt. (mit geeigneter Vor-
  und Nachbereitung und Patternliste) die in LuaTeX eingebaute
  Implementierung nutzen.

Tests/Beispiele:
  An allen Stellen, die in der "Wortliste" mit "=" oder "<"
  gekennzeichnet sind müssen Ligaturen unterdrückt werden.
  
Ligaturalternativen (Zweifelsfälle):
  Treffen drei Buchstaben zusammen, von denen je zwei eine Ligatur
  bilden können, entscheidet die Silbengrenze.
  
  Diese Regel ist nachrangig und gilt nur für den Fall, dass die
  Dreifachligatur nicht vorhanden ist:

    ohne ffl: Souf{fl}eur, nicht Sou{ff}ler
    ohne ffi: Of{fi}zier, nicht O{ff}izier; af{fi}g, nicht a{ff}ig
    
  Eine Erweiterung von selnolig könnte, wenn in einem Wort verbleibende
  Ligaturalternativen erkannt werden die Silbentrennung abfragen und
  die grenzüberschreitende Ligatur unterdrücken.

Lösung ungeklärter Fälle:
  Die Betrachtung der Analogien zur Worttrennung und Schluss-s-Schreibung
  kann auch beim Entscheid von in den "offiziellen" Regeln und Beispielen
  nicht (oder widersprüchlich) behandelter Fälle helfen.
  
In diesem Sinne hoffe ich auf ein fruchtbare Zusammenarbeit.

Viele Grüße

Günter



Mehr Informationen über die Mailingliste Trennmuster