[Trennmuster] Worttrennung versus Ligaturen-Aufbruch
Guenter Milde
milde at users.sf.net
Mo Dez 10 21:50:44 CET 2018
Liebe Trennfreunde, lieber Mico,
On 1.12.18, Mico Loretan wrote:
> Meiner Ansicht sollte eine Verquickung von Trennstellen-Regeln und
> Ligaturaufbruchs-Regeln strikt vermieden werden.
> Trennstellen-Regeln sollten gültig sein unabhängig davon ob eine
> Schrift gewisse Ligaturen anbietet oder nicht. Das heisst, z.B., dass
> Offizier wie Of-fi-zier getrennt werden sollte, unabhängig davon ob die
> verwendete Schrift die Ligaturen fi, ff, und/oder ffi anbietet.
Dies ist unstrittig: Ligaturen haben keinen Einfluss auf die
Worttrennung.
> Und umgekehrt sollten Ligaturen an (gewissen, aber nicht allen)
> Morphemgrenzen unterdrückt werden, egal ob die betroffene Morphemgrenze
> auch eine Wort-Trennstelle ist -- oder eben vielleicht auch nicht.
> Morpheme und Silben sind zwei verschiedene Dinge. Sie miteinander zu
> vermischen ist keine gute Idee.
Allerdings weist der Aufbruch von Ligaturen eine Reihe von
Gemeinsamkeiten mit der Worttrennung und der Unterscheidung von Lang- und
Rund-s in gebrochenen Schriften auf:
Ziel
ist einfache Rezeption geschriebener Texte durch ein der Wortstruktur
adäquates Layout.
Aus den entsprechenden Konventionen entstanden mehr oder weniger
verbindliche Regeln.
* Zusammenhalten der Morpheme
- Worttrennung nur zwischen (formalen) „Sprechsilben“, die i.Allg. mit
Zäsuren beim Vorlesen übereinstimmen.
fi Verwendung von Ligaturen um optische Lücken zu vermeiden.
ſ Verwendung des Lang-S im Inneren der Morpheme.
* Wortfugen in Komposita und nach Präfixen werden hervorgehoben:
- Worttrennung auch entgegen den formalen Sprechsilbenregeln
(Plan-spiel, ab-arbeiten),
fi Aufbruch von Ligaturen (Stoff|igel, auf|fällig),
ſ Verwendung des Schluss-s (Achslaſt, Ausſage).
* Die Grenze vor Suffixen ist weniger geschützt
- Worttrennung und Morphemgrenze sind entkoppelt (hal-ten ↔ halt + -en),
Trennung im Abstand 1 erlaubt (Opi-oid, Steroi-de)
fi einige Ligaturen sind erlaubt (häu{fi}g, aber höf|lich)
ſ Lang-s möglich (er raſte, ein Sechſtel)
Einige Suffixe werden analog zu Komposita und Präfixen behandelt:
- Worttrennung möglich (Sprechsilbenregel) (ess-bar, acht-fach, Frei-heit)
fi Ligaturaufbruch (begreif|lich, fünf|fach, acht|los)
ſ Schluss-s (wachſen ↔ Wachstum, Biſchof ↔ Bistum, Häuſel ↔ Häusler
Müsli, Fiesling, Riesling)
Daher erscheint es sinnvoll, die eingeführten Kategorien der Trennstellen
auch für Lang-s-Schreibung und Ligaturaufbruch zu nutzen.
Für die Behandlung von Suffixen gibt es unterschiedliche Ansätze.
Ggf. müssen wir analog zu den Trennstilen mehrere unterschiedliche
"Ligaturaufbruchstile" anbieten.
> Das selnolig Paket ist ganz in diesem Sinne konzipiert und
> eingerichtet: Die Algorithmen zur selektiven Unterdrückung gewisser
> Ligaturen interagieren bewusst auf gar keine Weise mit dem
> Zeilenumbruchsalgorithmus von LuaTeX.
Eine simple Übertragung/Fremdnutzung des Zeilenumbruchalgorithmus' für den
Ligaturaufbruch ist nicht möglich, soweit bin ich ganz Deiner Meinung.
Dennoch gibt es Potential zur Nutzung der Analogien der beiden
Strukturierungsaufgaben:
Implementierung:
In beiden Fällen geht es darum, "Sollbruchstellen" in Strings zu finden.
Der Liangsche Algorithmus und die Datenstruktur "trie" sind dabei
besonders effizient.
Anstelle einer handgebauten Liste von \nolig und \keeplig Makros können
Regeln in der Form von "patgen"-Pattern ebenfalls "händisch" oder aus
einer entsprechenden Vorgabeliste mit `patgen` erstellt werden.
Der Algorithmus zum Anwenden dieser Pattern um Sollbruchstellen in
Strings einzufügen ist generisch und effizient. selnolig kann entweder
eine eigene Lua-Implementierung verwenden oder evt. (mit geeigneter Vor-
und Nachbereitung und Patternliste) die in LuaTeX eingebaute
Implementierung nutzen.
Tests/Beispiele:
An allen Stellen, die in der "Wortliste" mit "=" oder "<"
gekennzeichnet sind müssen Ligaturen unterdrückt werden.
Ligaturalternativen (Zweifelsfälle):
Treffen drei Buchstaben zusammen, von denen je zwei eine Ligatur
bilden können, entscheidet die Silbengrenze.
Diese Regel ist nachrangig und gilt nur für den Fall, dass die
Dreifachligatur nicht vorhanden ist:
ohne ffl: Souf{fl}eur, nicht Sou{ff}ler
ohne ffi: Of{fi}zier, nicht O{ff}izier; af{fi}g, nicht a{ff}ig
Eine Erweiterung von selnolig könnte, wenn in einem Wort verbleibende
Ligaturalternativen erkannt werden die Silbentrennung abfragen und
die grenzüberschreitende Ligatur unterdrücken.
Lösung ungeklärter Fälle:
Die Betrachtung der Analogien zur Worttrennung und Schluss-s-Schreibung
kann auch beim Entscheid von in den "offiziellen" Regeln und Beispielen
nicht (oder widersprüchlich) behandelter Fälle helfen.
In diesem Sinne hoffe ich auf ein fruchtbare Zusammenarbeit.
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster