[Trennmuster] Zaïre

Guenter Milde milde at users.sf.net
Fr Nov 2 12:59:07 CET 2018


Lieber Werner,

danke für den Hinweis.

On  1.11.18, Werner LEMBERG wrote:

> ich glaube, daß »sprachauszug.py« das Wort »Zaïre« falsch behandelt:

>   echo "Zaïre;Za.ï-re" | sprachauszug.py -l de-1996-x-versal,de-1996
>     -> Za-ï-re

In den Filterfunktionen die "sprachauszug" nutzt ist das ï im regulären
Ausdruck zum Entfernen von Flattervokalen zu Zeit nicht drin.

Das Ergebnis ist falsch, aber es liegt auch an der Auszeichnung: Das
Trema zeigt ja eine silbische Aussprache, somit ist "aï" kein
Schwankungsfall und "a.ï" falsch.

> Das Wort ist ja analog zu »Alëuten«:

>   echo "Alëuten;Alë.u-ten" | sprachauszug.py -l de-1996-x-versal,de-1996
>     -> Alëu-ten

Hier "flattert" das u ohne Trema.

> Mein aktualisiertes Skript »extract-tex.pl« erzeugt »Zaï-re«.

Das wäre eine Möglichkeit. Aber wir müssen überlegen, ob (analog zu
"-isten") bei zweisilbiger Aussprache von Zwielaut-Verbindungen (eu, ai,
au, ei) nicht auch die erste Trennstelle Vorrang vor der zweiten haben
sollte, also

  Alë-u-.ten  wie Ale-u-.ten
  Za-ï-.re    wie Za-i-.re¹

¹gerade im Rahmen der durch dieses Problem angestoßenen Durchsicht der
Wörter mit "fremdländischen" Akzenten analog zu Ale-u-.ten geändert.


Gruß und Dank,

Günter



Mehr Informationen über die Mailingliste Trennmuster