[Trennmuster] langes s (was: "exotische" Buchstaben)

Mo Jun 23 18:21:20 CEST 2014

Am 22.06.2014 21:19, schrieb Guenter Milde:
> On 21.06.14, Stephan Hennig wrote:
>> Am 18.06.2014 10:49, schrieb Guenter Milde:
> 
>> > * ist die Wandlung ſ->s trivial,
> 
>> Innerhalb LuaTeXs sollte man sich ein paar Gedanken machen, /wann/
>> dieser Prozess stattfinden soll (vor/nach Ligierung bzw. Trennung).
> 
> Achtung: ich spreche über die Lang-S-nach-Rund-S-Wandlung um
> lang-s-Wörter nach Trennstellen in rund-S-Mustern zu suchen!

Oh, das hatte ich übersehen.

>> > LuaTeX kann man nebenwirkungsfrei "hinbiegen".
> 
>> Ehe wir aneinander vorbeireden, welche Art von "hinbiegen" meinst du?
> 
> Ich meine, daß es möglich ist, in LuaTeX-hooks einen alternativen
> Trennalgorithmus zu werdenden oder vor/nach der Bestimmung der
> Trennstellen Transformationen so vorzunehmen, daß ohne schädliche
> Nebenwirkungen über rund-s-Muster auch für lang-s-Worte Trennstellen
> bestimmt werden können.

OK.  Beachte aber, dass das Padrinoma-Paket zwar in eine ähnliche
Richtung geht -- eine Knotenmanipulation kann durchaus darin bestehen,
Discretionarys einzufügen -- aber nicht zum Ziel hat, den
Trennalgorithmus zu ersetzen.  Während TeX zum Beispiel ein Wort,
welches unmittelbar an eine Box angrenzt, nicht trennt, wäre es falsch,
ein solches Wort allgemein von Glyphersetzungen auszunehmen.  Das
Padrinoma-Paket hat daher einen etwas anderen Begriff von einem "Wort"
als TeX bei der Trennung.  Wenn man mit dem Padrinoma-Paket einfach so
Discretionarys einfügt, kann man daher Trennungen erhalten, die
untypisch für TeX sind.

Außerdem wäre es sinnvoll, vor dem Trennalgorithmus zunächst den
Absatzumbruch aufzubohren, damit der mit verschiedenen Trenngewichten
umgehen kann.  Mir sind leider keine Bestrebungen in Richtung einer
Lua-Implementierung des Umbruch- oder Trennalgorithmus bekannt, die man
dann als Spielwiese nutzen könnte.

>> In unserem Fall muss die Glyphersetzungen aus naheliegendem Grund vor
>> der Ligierung erfolgen. Das bedeutet auch, dass die Glyphersetzung vor
>> der Trennung stattfindet, 
> 
> Das sollte auch darum passieren, weil lang-S und rund-S unterschiedlich weit
> laufen und damit die Wortbreite/Zeilenlänge durch eine Transformation
> erhebliche beeinflußt wird.

Auch richtig.

> Kurz und gut: die automatische rund-lang Konvertierung über
> "Lang-S-Konvertierungsmuster" und die Worttrennung zum Zeilenumbruch sind
> in jedem Fall separat zu behandelnde/betrachtende Dinge.
> 
>> was wiederum bedeutet, dass der Trennalgorithmus ſ-Muster benötigt.  
> 
> Nicht unbedingt: 
> 
> Für die obige Betrachtung ist es unerheblich, ob die langen-eSSe
> automatisch oder von Hand in die Lang-S-Wörter eingefügt sind.
> Entscheiden ist, ob wir sie zum Zwecke der Suche in den Mustern
> (rück-)wandeln können.  Ob das dann über eine Lua-Ersetzungsfunktion oder
> ein temporäres lc-ucvalue-Paar geht ist auch zweitrangig.

Genau das wird heute ja schon mit \lccode gemacht.  Nur dass TeX dafür
nicht \lccode verwenden sollte, sondern so etwas wie \hyphcode o. ä.
Soweit ich es sehe, ist Babel auf diese Unterscheidung schon vorbereitet
(siehe \SetHyphenMap).  Eigentlich sollte es nicht schwierig sein, eine
solche neue Abbildung für die Worttrennung einzuführen.  Wer Lust hat,
Wünsche kann man unter <URL:http://tracker.luatex.org/> äußern.

> Aber ich vermute, daß der insgesamt geringere Aufwand bei "incluſiven"
> Trennmustern den Ausschlag gibt.

Insgesamt wäre der einmalige Aufwand, \hyphcode in LuaTeX einzuführen,
schon geringer ... ;-)

Viele Grüße,
Stephan Hennig