[Trennmuster] Flatterbuchstabe

Werner LEMBERG wl at gnu.org
Mi Nov 2 06:43:57 CET 2016


> Ich hänge eine Zusammenfassung meiner Vorschläge an.

Danke.

> Bsp.: 
>    genau-e-re, 
> 
> Vorschlag:
>    Beide Stellen markieren. Wenn wie bisher die Unterdrückung der ersten
>    Trennstelle gewünscht ist, kann dies im Extraktionsskript mit
>    
>      -([aeiouäöü])-  ==>  \1-
>      
>    erfolgen.

Das muß

  -([aeiouyäöü])-  ==>  \1-

sein, um Wörter wie »lo-y-al« ebenfalls zu erfassen.

> Die Unterdrückung ungünstiger Trennungen muss vor der obigen Ersetzung
> erfolgen:
> 
>   # Entferne die ungünstigere von 2 benachbarten Trennstellen:
>   "-\.+([aeiouäöü])-([^.])" -> "\1-\2"
>   "-([^.])([aeiouäöü])-\."  -> "-\1\2"
>   
>   "-([aeiouäöü])-"          -> "\1-"

Ditto.


    Werner




Mehr Informationen über die Mailingliste Trennmuster