[Trennmuster] langes s (was: "exotische" Buchstaben)

Guenter Milde milde at users.sf.net
So Jun 22 21:19:15 CEST 2014


Liebe Trennmuſtler,

On 21.06.14, Stephan Hennig wrote:
> Am 18.06.2014 10:49, schrieb Guenter Milde:
> > On 14.06.14, Werner LEMBERG wrote:

> > Mir geht es darum, ob der Trennalgorithmus überhaupt auf explizite
> > Lang-S-Muster angewiesen ist um Lang-S-Wörter zu trennen,

> Der Trennalgorithmus ist auf Muster mit explizitem ſ angewiesen, da
> Muster mit rundem s nicht auf Wörter mit langem s passen, sofern man
> nicht den \lccode von ſ hackt.  Das ist aber, wie du selbst richtig
> anmerkst, nicht nebenwirkungsfrei möglich.

Das gilt für den TeX algorithmust in Original-Form. 

...

> > * ist die Wandlung ſ->s trivial,

> Innerhalb LuaTeXs sollte man sich ein paar Gedanken machen, /wann/
> dieser Prozess stattfinden soll (vor/nach Ligierung bzw. Trennung).

Achtung: ich spreche über die Lang-S-nach-Rund-S-Wandlung um
lang-s-Wörter nach Trennstellen in rund-S-Mustern zu suchen!

> > LuaTeX kann man nebenwirkungsfrei "hinbiegen".

> Ehe wir aneinander vorbeireden, welche Art von "hinbiegen" meinst du?

Ich meine, daß es möglich ist, in LuaTeX-hooks einen alternativen
Trennalgorithmus zu werdenden oder vor/nach der Bestimmung der
Trennstellen Transformationen so vorzunehmen, daß ohne schädliche
Nebenwirkungen über rund-s-Muster auch für lang-s-Worte Trennstellen
bestimmt werden können.

> Ich denke, auch mit dem Padrinoma-Paket und Eingabe ohne ſ in LuaTeX
> benötigten wir den Buchstaben in den Trennmustern. 

> In unserem Fall muss die Glyphersetzungen aus naheliegendem Grund vor
> der Ligierung erfolgen. Das bedeutet auch, dass die Glyphersetzung vor
> der Trennung stattfindet, 

Das sollte auch darum passieren, weil lang-S und rund-S unterschiedlich weit
laufen und damit die Wortbreite/Zeilenlänge durch eine Transformation
erhebliche beeinflußt wird.

Kurz und gut: die automatische rund-lang Konvertierung über
"Lang-S-Konvertierungsmuster" und die Worttrennung zum Zeilenumbruch sind
in jedem Fall separat zu behandelnde/betrachtende Dinge.

> was wiederum bedeutet, dass der Trennalgorithmus ſ-Muster benötigt.  

Nicht unbedingt: 

Für die obige Betrachtung ist es unerheblich, ob die langen-eSSe
automatisch oder von Hand in die Lang-S-Wörter eingefügt sind.
Entscheiden ist, ob wir sie zum Zwecke der Suche in den Mustern
(rück-)wandeln können. Ob das dann über eine Lua-Ersetzungsfunktion oder
ein temporäres lc-ucvalue-Paar geht ist auch zweitrangig.

Aber ich vermute, daß der insgesamt geringere Aufwand bei "incluſiven"
Trennmustern den Ausschlag gibt.

Günter




Mehr Informationen über die Mailingliste Trennmuster