[Trennmuster] Kodierung fuer Patgen

Stephan Hennig mailing_list at arcor.de
Sa Jun 7 22:21:10 CEST 2014


Am 07.06.2014 13:58, schrieb Werner LEMBERG:
> 
>> Kann bitte jemand den Prozess der Mustererstellung so ändern, dass
>> die Eingabe für Patgen eine der genannten Kodierungen nutzt?
> 
> Erledigt.

Danke!

Leider versteht iconv 1.14, welches in Git for Windows enthalten ist,
die Kodierung latin9 nicht sondern nur

  $ iconv -l |grep -i latin.*9
  ISO-8859-15 ISO-IR-203 ISO8859-15 ISO_8859-15 ISO_8859-15:1998 LATIN-9

(und Kleinschreibung).  Könntest du das Makefile nochmal anpassen?

Zwar werden momentan nicht alle Buchstaben aus german.tr in der
Wortliste verwendet.  Für eine vollständige Aufzählung aller zulässigen
Buchstaben aus Latin-9/-1 fehlen jedoch noch die Buchstaben Ï (0xCF) und
Ý (0xBE).  Daneben noch Ð (0xD0), allerdings scheint es für diesen
Buchstaben zwei Kleinbuchstaben zu geben (0xDE, 0xFE).  Da müsste dann
im (unwahrscheinlichen) konkreten Fall entschieden werden, welcher
benötigt wird.  (Fiel mir nur beim Anpassen des Skripts zur
Konsistenzprüfung auf.)

Viele Grüße,
Stephan Hennig




Mehr Informationen über die Mailingliste Trennmuster