[Trennmuster] Kodierung fuer Patgen
Guenter Milde
milde at users.sf.net
Di Jun 10 12:39:43 CEST 2014
On 9.06.14, Stephan Hennig wrote:
> Am 09.06.2014 09:44, schrieb G. Milde:
> >> Am 06.06.2014 18:34, schrieb Stephan Hennig:
> >
> >> Uttendorf
> >> Œuvre
> >> Uwes
> >>
> >> Ist das zu erwarten?
> >
> > Daß aus OE ein U überrascht allerdings schon.
> Der Buchstabe Œ scheint ignoriert und das Wort wie 'uvre' einsortiert zu
> werden.
Exakt. Buchstaben die nicht aus Akzent (Combining diacritical marks) +
ASCII-Character bestehen fallen bei der "Deakzentuierung" raus.
Ich habe jetzt eine explizite Wandlugn für die AE- und OE-Ligaturen sowie
das Lang-S vor der Deakzentuierung eingeführt.
Zumindest Oevre sollte jetzt schreibungsunabhängig sortiert werden.
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster