[Trennmuster] langes s (was: "exotische" Buchstaben)

Stephan Hennig mailing_list at arcor.de
Sa Jun 21 15:39:06 CEST 2014


Am 18.06.2014 10:49, schrieb Guenter Milde:
> On 14.06.14, Werner LEMBERG wrote:
>
>> Also wenn ich einen deutschen Text mit »ſ« schreibe und dann XeTeX
>> oder luatex drüberlaufen lassen will, sollte das schon korrekt
>> getrennt werden, oder?
>
> Ja.
>
>> Ich habe das Gefühl, daß ihr nur an den komplizierten Fall denkt, wo
>> Frakturschriften den Glyphen »ſ« auf dem Code von »s« legen, was ich
>> für eine sehr schlechte Lösung halte.[*]
>
> Mir geht es darum, ob der Trennalgorithmus überhaupt auf explizite
> Lang-S-Muster angewiesen ist um Lang-S-Wörter zu trennen,

Der Trennalgorithmus ist auf Muster mit explizitem ſ angewiesen, da
Muster mit rundem s nicht auf Wörter mit langem s passen, sofern man
nicht den \lccode von ſ hackt.  Das ist aber, wie du selbst richtig
anmerkst, nicht nebenwirkungsfrei möglich.  In der Wortliste selbst muss
das ſ nicht enthalten sein, dank deines Skripts s2long-s.py.

Die kniffligen Fälle Wach[s=/=ſ]tube würde ich aus der Diskussion
zunächst einmal komplett herausnehmen.  Um die können wir uns später
kümmern.


> schließlich
>
> * sind die Trennstellen der entsprechenden Rund-S-Wörter exakt gleich,

Ohne \lccode-Hack sind s und ſ für TeX komplett unterschiedliche Buchstaben.


> * ist die Wandlung ſ->s trivial,

Innerhalb LuaTeXs sollte man sich ein paar Gedanken machen, /wann/
dieser Prozess stattfinden soll (vor/nach Ligierung bzw. Trennung).


> LuaTeX kann man nebenwirkungsfrei "hinbiegen".

Ehe wir aneinander vorbeireden, welche Art von "hinbiegen" meinst du?

Ich denke, auch mit dem Padrinoma-Paket und Eingabe ohne ſ in LuaTeX
benötigten wir den Buchstaben in den Trennmustern.  In unserem Fall muss
die Glyphersetzungen aus naheliegendem Grund vor der Ligierung erfolgen.
 Das bedeutet auch, dass die Glyphersetzung vor der Trennung
stattfindet, was wiederum bedeutet, dass der Trennalgorithmus ſ-Muster
benötigt.  Fände die Glyphersetzung nach der Trennung statt, müssten wir
uns auch noch um die ſ-Ligaturen kümmern.  Der einzig richtige Weg ist
daher, ſ in die Trennmuster aufzunehmen, um den Preis einer etwas
längeren Patgen-Laufzeit.  Andernfalls handeln wir uns aber nur Probleme
ein.


> Lohnt der Aufwand für die paar
> XeTeX-Nutzer, die mit Unicode-Fonts Fraktur schreiben?

Dazu kommen auch die /LuaTeX/-Nutzer, die Unicode-Schriften verwenden.

Viele Grüße,
Stephan Hennig



Mehr Informationen über die Mailingliste Trennmuster