[Trennmuster] Kodierung fuer Patgen

Werner LEMBERG wl at gnu.org
So Jun 8 07:37:16 CEST 2014


> Leider versteht iconv 1.14, welches in Git for Windows enthalten ist,
> die Kodierung latin9 nicht sondern nur
> 
>   $ iconv -l |grep -i latin.*9
>   ISO-8859-15 ISO-IR-203 ISO8859-15 ISO_8859-15 ISO_8859-15:1998 LATIN-9
> 
> (und Kleinschreibung).

OK.  Obiger grep-Ausdruck paßt aber nicht zur angezeigten Ausgabe :-)

> Könntest du das Makefile nochmal anpassen?

Erledigt.

> Zwar werden momentan nicht alle Buchstaben aus german.tr in der
> Wortliste verwendet.  Für eine vollständige Aufzählung aller
> zulässigen Buchstaben aus Latin-9/-1 fehlen jedoch noch die
> Buchstaben Ï (0xCF) und Ý (0xBE).  Daneben noch Ð (0xD0), allerdings
> scheint es für diesen Buchstaben zwei Kleinbuchstaben zu geben
> (0xDE, 0xFE).  Da müsste dann im (unwahrscheinlichen) konkreten Fall
> entschieden werden, welcher benötigt wird.  (Fiel mir nur beim
> Anpassen des Skripts zur Konsistenzprüfung auf.)

Wenn solche Buchstaben einmal kommen sollten, dann ergänze ich sie.
Derzeit bin ich zu faul dazu...


    Werner




Mehr Informationen über die Mailingliste Trennmuster