[Trennmuster] Kodierung fuer Patgen

Guenter Milde milde at users.sf.net
Fr Jun 6 20:10:18 CEST 2014


On  6.06.14, Stephan Hennig wrote:
> Hi,

> bekanntermaßen kann Patgen nur mit 8-Bit-kodierten Alphabeten umgehen.
> Soweit ich es erkennen kann, nutzen wir derzeit die Kodierung ISO-8859-1
> (latin1) für die Mustererzeugung.  In dieser Kodierung können einige
> durchaus gebräuchliche Zeichen nicht dargestellt werden, etwa Œ und Š
> aus Œuvre und Škoda (siehe auch dehyph-exptl/CHANGES, Abschnitt
> "Bekannte Probleme").  Ich würde diese Wörter gern als Teil der
> Wortliste sehen.  Die fraglichen Zeichen sind in den Kodierungen
> ISO-8859-15 und Windows-1252 enthalten, die ansonsten weitgehend mit
> latin1 übereinstimmen,
> <URL:http://de.wikipedia.org/wiki/Latin1#ISO_8859-1_vs._ISO_8859-15_vs._Windows-1252_vs._Unicode>.

> Kann bitte jemand den Prozess der Mustererstellung so ändern, dass die
> Eingabe für Patgen eine der genannten Kodierungen nutzt?

Soviel ich weiß, müssen die erzeugten Muster in einer TeX-Fontkodierung
vorliegen - für Deutsch mit 8-bit TeX also T1. D.h. wir können nur solche
Muster erzeugen, die in T1 enthalten sind (vgl. `texdoc fntguide.pdf`,
`texdoc encguide.pdf`)

Wie das jetzt mit der Eingabekodierung zusammenhängt und ob evt. auch da
schon T1 gefordert ist oder ob wir das konfigurieren können ist mir nicht
gegenwärtig.

Günter



Mehr Informationen über die Mailingliste Trennmuster