[Trennmuster] einbuchstabige Trennungen
Guenter Milde
milde at users.sf.net
Sa Mai 19 01:14:55 CEST 2018
Liebe Trennfreunde,
jetzt haben wir 8750 "flatterhafte" Trennungen in der Wortliste (Danke
Keno!).
Das könnte schon ausreichen, nun wieder einmal über die optimale
Auszeichnung nachzudenken bevor die nächste Charge kommt.
* Nottrennungen markieren (Vorschlag: "." als Kurzschreibweise für "-.").
* Vorzugstrennungen markieren (ggf. via Suffix?)
* Grenzfälle:
· Französische Wörter mit oi oder oy und Aussprachevariation
/to-a-le-te/ vs. /to-i-le-te/ vs. /to-le-te/
/re-gi-on/ vs. /re-gjon/
· Viele Fremdwörter mit ay, ey, ea, ia, ie, io, ... sind auch in AR
schon trennbar (Nottrennung)
· Abstrakt, Abszess, ... (siehe README.wortliste)
· Auspizien als Au<spizien?
Wahrscheinlich vom Duden so gedeutet, sonst wäre in NR nur
Au-spi-zi-en erlaubt.
Wörter mit Flatterbuchstaben mit lassen sich mit "sprachauszug" jetzt
auch extrahieren, wenn kein Filter gesetzt wird und auf 1er-Abstände
zwischen Trennstellen getestet:
./sprachauszug.py --test-1er --stil='' ../../../wortliste > flatterhafte.txt
Mit
./sprachauszug.py ../../../wortliste
lassen sich die Flatterbuchstaben auflösen und mit
./sprachauszug.py --test-1er ../../../wortliste
prüfen ob alles "erwischt" wird. Zur Zeit gibt es nur 2 Problemfälle:
Au-s-pi-zi-en
Au-s-pi-zi-um # < lat. auspex < avis (Vogel) + specere (schauen)
denn der Ab-s-trakt ist noch nicht vollständig markiert.
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster