[Trennmuster] Überarbeitung Dokumentation Ligatursatz

Lukas Sommer sommerluk at gmail.com
Di Feb 28 20:32:25 CET 2017


In der Tat enthält die aktuelle Wortliste keine solchen Trennungen,
insofern macht’s auch keine Unterschied. Aber ich sehe halt (anders
als bei der Worttrennung) auch keinen Grund, es durch die
patgen-Einstellungen systematisch zu verbieten.

Zum langen S: Da habe ich wohl etwas missverständlich dokumentiert. Es
ging mir gar nicht um Regeln für das lange ſ. Mit dem Abschnitt wollte
ich eigentlich auf die Frage antworten: Was sollte ein Programmierer
mit einem Wort tun, bevor er das Ligaturmuster darauf anwendet – er
will ja schließlich, dass der Algorithmus die passenden Muster auch
tatsächlich findet. Antwort:

* Er sollte alle Großbuchstaben werden in Kleinbuchstaben umwandeln.

* Das schließt ein, dass das große ẞ in das kleine ß umgewandelt wird,
was viele Programmbibliotheken jedoch nicht tun und deshalb eventuell
per Hand erledigt werden muss.

* Er sollte das lange ſ in das kleine runde s umwandeln (wenn er denn
damit rechnet, dass seine Nutzer das lange ſ verwenden)

* Wenn er dann noch Zeit und Nerven hat, kann er sich ein paar
Gedanken über Unicode-Normalisierung machen: „ü“ kann als ein
einzelnes Zeichen U+00FC aber auch als Zeichenkette U+0075 U+0308
kodiert sein. Letzteres ist zwar selten, aber mögich. Besonders
hinderlich ist hier, dass sich mit der Normalisierung die Anzahl der
Zeichen ändern kann. Die Wortliste liegt, so wie ich das sehe, in der
Normalform NFC vor, das resultierende Muster hat also ebenfalls die
Normalform NFC, und jedes Wort, auf das das Muster angewendet wird,
sollte auch NFC haben.

Ich werde mir mal ein paar Gedanken über eine bessere Formulierung machen …


Am 28.02.17 schrieb Guenter Milde <milde at users.sf.net>:
> On 27.02.17, Lukas Sommer wrote:
>> Hallo.
>
>> Anbei eine überarbeitete Fassung der Dokumentation für den
>> Ligatursatz. Änderungen:
>
>> * Aufruf von der Kommandozeile: Neuformulierung. Empfehlung, german.tr
>> mit „ 1 1“ statt „ 2 2“ als erster Zeile zu verwenden. Das erscheint
>> mir beim Ligatursatz – anders als bei der Worttrennung – als korrekt.
>
> Warum? Die Trennmuster enthalten keine Wörter mit Trennstellen nach dem
> ersten oder vor dem letzten Buchstaben.
>
> Zum:
>
>   Hinweis: Die Wortliste des Trennmuster-Projekts enthält kein
>   langes S (ſ). Das sollte bei der späteren Verwendung des Musters
>   bedacht werden.
>
> Bedenke: nach dem langem S kommt nie eine Haupttrennstelle, denn am Schluß
> eines (Teil)worts wird stets das runde s geschrieben.
>
> Es wären also nur eventuelle Ligaturen mit langem S an der letzten Stelle
> aufzubrechen, da gibt es, soweit ich weiß, nur ſſ aber zwei ſ stehen
> hinwiederum wegen Satz eins nie an den beiden Seiten einer Haupttrennstelle.
>
> Fazit: kein problem mit langem ſ.
>
>
> Günter
> _______________________________________________
> Trennmuster mailing list
> Trennmuster at dante.de
> https://lists.dante.de/mailman/listinfo/trennmuster
>


-- 
Lukas Sommer




Mehr Informationen über die Mailingliste Trennmuster