[Trennmuster] Kodierung fuer Patgen
Stephan Hennig
mailing_list at arcor.de
Fr Jun 6 20:29:02 CEST 2014
Am 06.06.2014 20:10, schrieb Guenter Milde:
> Soviel ich weiß, müssen die erzeugten Muster in einer TeX-Fontkodierung
> vorliegen - für Deutsch mit 8-bit TeX also T1. D.h. wir können nur solche
> Muster erzeugen, die in T1 enthalten sind (vgl. `texdoc fntguide.pdf`,
> `texdoc encguide.pdf`)
Auch in T1 sind die Buchstaben Œ und Š enthalten. Aaaber ... das ist
ganz egal, denn seit einigen Jahren liegen (fast) alle Muster in
UTF-8-Kodierung vor,
<URL:http://www.tug.org/TUGboat/tb29-3/tb93miklavec.pdf>. Für 8-Bit-TeX
werden die beim Laden in eine geeignete Kodierung gewandelt.
> Wie das jetzt mit der Eingabekodierung zusammenhängt und ob evt. auch da
> schon T1 gefordert ist oder ob wir das konfigurieren können ist mir nicht
> gegenwärtig.
Spielt keine Rolle, die Wortliste liegt in UTF-8 vor und die Muster am
Ende auch. Nur im Zwischenschritt Patgen muss eine 8-Bit-Kodierung
verwendet werden. Das kann auch eine selbsterstellte Kodierung sein
(wenn wir zum Beispiel weitere Buchstaben abdecken möchten, die in der
Gesamtheit in keiner bekannten 8-Bit-Kodierung enthalten sind). Nach
außen ist aber nicht erkennbar, dass die Kodierung zweimal geändert
werden musste.
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster