[Trennmuster] Kombinierende Zeichen in der TeX Eingabe

Werner LEMBERG wl at gnu.org
Di Okt 31 06:56:58 CET 2023


> [...] Daher werden ca. 17 000 Wörter (3.4%) der Wortliste werden
> falsch oder nicht vollständig getrennt wenn sie mit kombinierenden
> Zeichen anstelle der vorgefertigten äöü... geschrieben werden.

Aah, daran hab' ich überhaupt nicht gedacht.  Sehr guter Einwand!

> * Sollte der Zeilenumbruch auch bei Quellen in NFD funktionieren
>   oder wird irgendwo beschrieben, dass die LaTeX Eingabe in NFC zu
>   erfolgen hat?

Sobald man NFD verwendet, wird LaTeX bei Akzenten komplett übergangen,
und die Verantwortung zur korrekten Darstellung liegt ausschließlich
in der Fähigkeit von Fonts, die Kombination Basisbuchstabe–Akzent
(also genau andersrum als bei LaTeX) korrekt darzustellen.

* XeTeX kann auf Wunsch NFD zu NFC konvertieren (mittels
  \XeTeXinputnormalization).
* Auch für LuaTeX gibt's das »uninormalize«-Paket, um das gleiche zu
  tun, auf Wunsch vor oder nach der Anwendung von Trennmustern.
* pdfTeX hat nichts dergleichen.

XeTeX und LuaTeX verwenden die HarfBuzz-Bibliothek; bei LuaTeX ist sie
optional.  Wenn diese Bibliothek aktiv ist, wird intern nocheinmal von
NFD zu NFC konvertiert, bevor ein Glyph aus einem Font ausgewählt
wird.

Uns betrifft natürlich nur den Fall, daß Trennmuster auf NFD angewandt
wird, und das kann bei jeder TeX-Variante auftreten.

Zusammenfassend kommt von mir ein klares ja zur automatischen
Ergänzung von NFD-Formen, und ich sehe auch keinerlei technische
Probleme.


    Werner




Mehr Informationen über die Mailingliste Trennmuster