[Trennmuster] "exotische" Buchstaben
Werner LEMBERG
wl at gnu.org
Mi Jun 18 20:40:20 CEST 2014
> Wir können uns entscheiden, Lang-S-Schreibungen als Varianten
> aufzunehmen (analog zu Oevre/Œvre).
Was genau meinst Du mit »Varianten«?
> Mir geht es darum, ob der Trennalgorithmus überhaupt auf explizite
> Lang-S-Muster angewiesen ist um Lang-S-Wörter zu trennen,
> schließlich
>
> * sind die Trennstellen der entsprechenden Rund-S-Wörter exakt gleich,
> * ist die Wandlung ſ->s trivial,
> * haben wir auch keine Großschreibung bei den Mustern.
Es ist nicht ganz das gleiche: Die *Anzahl* der Rund-S-Wörter ist
größer, also eine Obermenge. Während das bei den in der Wortliste
enthaltenen Wörtern egal ist, könnte es durchaus sein, daß patgen für
»ſ« bessere Trennstellen liefert, weil »präziser« – also »Adelung«
vs. »Heise«.
> Für 8-bit TeX brauchen wir keine Lang-S-Muster. LuaTeX kann man
> nebenwirkungsfrei "hinbiegen". Lohnt der Aufwand für die paar
> XeTeX-Nutzer, die mit Unicode-Fonts Fraktur schreiben?
Ich meine ja, vor allem, da der Aufwand gering ist. Zugegebenerweise
läuft patgen langsamer, weil viel mehr Wörter, aber man braucht ja die
Wörter mit »ſ« nicht immer inkludieren.
Werner
Mehr Informationen über die Mailingliste Trennmuster