[Trennmuster] 99% Kategorisiert, wie weiter
G. Milde
milde at users.sf.net
Fr Mai 9 21:21:07 CEST 2014
Liebe Trennmustler,
die Kategorisierung der Trennstellen ist fast geschafft (noch < 3000 unkategorisierte Einträge). Nun müssen wir überlegen, wie wir diese Zusatzinformation möglichst sinnvoll nutzen.
Vorschläge:
1 Trennmuster für Flattersatz
Im Gegensatz zum Englischen kann bei deutschen Texen wegen der vielen Zusammensetzungen auch im Flattersatz nicht wirklich auf Trennungen verzichtet werden. Andererseits sind die akzeptablen Zeilenlängenunterschiede deutlich größer als im Blocksatz. Für linksbündigen Text in normalbreiten Spalten ist daher ein Trennmustersatz mit nur guten° Trennstellen wünschenswert.
° als Gütekriterium gelte die Bindungskraft unter Berücksichtigung der Länge der ungetrennten Wortteile (d.h. in der Mitte wirklich langer Wörter wird auch Trennung nach Sprechsilbe zugelassen).
Ich schlage vor, daß das TeX-Paket dehyph-exptl zukünftig einen solchen "Haupttrennstellmustersatz" bereitstellt.
Wenn gewünscht, kann ich ein Python-Skript erstellen, welches aus der "wortliste" eine Eingabedatei für patgen generiert. Die Details können dann anhand einer Vorversion besprochen werden.
2 Lang-S
Das Lang-S-Skript kann die Wörter der Wortliste konvertieren. Für die Nutzung des Resultats sind verschiedene Wege möglich, einer ist ein aspell/hunspell Wörterbuch de-x-lang-s. Dazu fehlen noch ca. Wörter aus den *spell Wortlisten.
Alternativ kann ich mir eine LuaTeX Lösung vorstellen.
3 Ligaturauflösung
Kommt noch.
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster