[Trennmuster] selektive Ligaturwahl
Stephan Hennig
sh-list at posteo.net
Di Dez 2 00:31:19 CET 2014
Hallo Mico,
hier in aller Kürze unser Vorschlag:
Das Problem der selektiven Ligaturwahl ist praktisch identisch mit dem
Problem der Worttrennung. Was liegt also näher als spezielle Muster
anzufertigen, die nicht Trennstellen, sondern (nicht) zu setzende
Ligaturen anzeigen?
Wir haben folgende Bausteine:
1.
Im Rahmen der Trennmustererarbeitung haben wir eine Wortliste erstellt,
die nicht nur einfach Trennstellen enthält, sondern angereichert ist mit
Informationen zur morphologischen Klassifikation (fast) aller
Trennstellen. Das Format der Auszeichnung ist in der Datei
dokumente/README.wortliste beschrieben (im Wortliste-Repositorium).
Da Ligaturen nicht über Wortfugen sowie Vor- und Nachsilben reichen
sollten, können mit Hilfe der morphologischen Klassifikation spezielle
Muster erstellt werden, die eben Wortfugen, Vor- und
Nachsilbentrennungen anzeigen, jedoch keine Stammtrennungen. Solche
Liang-Muster bieten die bekannten Vorteile:
+ Sie lassen sich automatisch mit patgen erzeugen.
+ Sie sind kompakt.
+ Liang-Muster funktionieren in vielen Sprachen.
+ Vielleicht das beste: Die oben beschriebenen Muster enthalten
Informationen, die nicht auf einzelne Ligaturen zugeschnitten
sind. Das heißt, mit solchen Mustern lassen sich grundsätzlich
beliebige Ligaturen behandeln.
2.
Unter <URL:https://github.com/sh2d/padrinoma> ist eine
Lua-Implementierung von Liangs Musteranpassung (Musterzerlegung) zu
finden. Das Verzeichnis examples/ enthält einige Beispielanwendungen,
insbesondere im Verzeichnis examples/luatex/break-ligatures/ eines,
welches die selektive Ligaturwahl in LuaTeX mit Hilfe der oben
beschriebenen Methode zeigt. Die verwendeten Muster sind in der Datei
examples/patterns/hyph-de-1901-joint.pat.txt zu finden. Wie die
Beispiele lokal ausgeführt werden können, ist in der Datei
examples/README beschrieben.
Kompiliert man die Datei break-ligatures.tex mit lualatex, kann man
sehen, dass das Verfahren grundsätzlich funktioniert. Mico, hast du
Interesse, diesen Ansatz für das Paket selnolig zu übernehmen?
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster