[Trennmuster] Eigene Wortliste (1904) als Ergänzung zu pre1901
Werner LEMBERG
wl at gnu.org
Mi Jun 11 12:50:31 CEST 2014
> Meinst du nicht, dass mit den Mustern irgendwann auch Strawinſky
> korrekt getrennt werden können soll?
Mit welchen Mustern?
> Lang-s-Muster übernehmen nur die Konvertierung von Rund-s in Lang-s.
Konvertierung? Wir reden aber von Trennmustern; da wird nix
konvertiert...
> Momentan erscheint mir der Gedanke sympathischer, die
> Lang-s-Ersetzung (bzw. ganz allgemein Glyphersetzungen) vor der
> Worttrennung vorzunehmen. Die /Trenn/muster müssen dann mit ſ
> umgehen können. Und das sind genau unsere. Also, warum nicht heute
> schon ſ in den Trennmustern unterstützen?
Es gibt zwei Ansätze:
1. »ſ« wird als Glyphvariante angesehen, die am Ende einer Silbe
auftaucht.
2. »ſ« ist ein eigenständiger Buchstabe, der auch als solcher
einzugeben ist.
Ich tendiere zu letzterem, vor allem weil es einen Schwung von
Ausnahmen gibt, die nicht vollautomatisch behandelt werden können.
Wir können aufgrund der Wichtungen in der Wortliste (zusammen mit
einer kleinen Ausnahmsliste, falls notwendig) eine mechanische
Konversion »s« -> »ſ« durchführen und damit neue, spezielle
Trennmuster erstellen, wo »s« und »ſ« als separate Buchstaben
behandelt werden. Eine automatische Konversion von »s« nach »ſ« bei
der Benutzereingabe ist dann nicht gewünscht und auch nicht sinnvoll!
Mit anderen Worten, ein \lccode-Mapping von »ſ« zu »s« wäre völlig
falsch.
Ansatz 1 ist übrigens mit Trennmustern allein keinesfalls zu lösen.
> Hm, mir fällt gerade auf, dass ſ nicht in der T1-Kodierung enthalten
> ist. Das heißt, die Änderung betrifft sowieso nur LuaTeX/XeTeX und
> das Paket hyph-utf8. Oder?
Es betrifft nur LuaTeX/XeTeX – für klassisches LaTeX müßten wir eine
neue Fontkodierung erstellen, die auch »ſ« enthält, und sowas will
heutzutage wirklich niemand...
Werner
Mehr Informationen über die Mailingliste Trennmuster