[Trennmuster] Kodierung fuer Patgen

Guenter Milde milde at users.sf.net
Di Jun 10 12:39:43 CEST 2014


On  9.06.14, Stephan Hennig wrote:
> Am 09.06.2014 09:44, schrieb G. Milde:
> >> Am 06.06.2014 18:34, schrieb Stephan Hennig:
> > 
> >>  Uttendorf
> >>  Œuvre
> >>  Uwes
> >>
> >> Ist das zu erwarten?
> > 
> > Daß aus OE ein U überrascht allerdings schon.

> Der Buchstabe Œ scheint ignoriert und das Wort wie 'uvre' einsortiert zu
> werden.

Exakt. Buchstaben die nicht aus Akzent (Combining diacritical marks) +
ASCII-Character bestehen fallen bei der "Deakzentuierung" raus.

Ich habe jetzt eine explizite Wandlugn für die AE- und OE-Ligaturen sowie
das Lang-S vor der Deakzentuierung eingeführt.

Zumindest Oevre sollte jetzt schreibungsunabhängig sortiert werden.


Viele Grüße

Günter



Mehr Informationen über die Mailingliste Trennmuster