[Trennmuster] Notentext-Endspurt
Guenter Milde
milde at users.sf.net
Mo Okt 29 16:57:39 CET 2018
Liebe Trennfreunde,
ich habe den Eindruck, wir haben die Zielgerade im Projekt
Notentext-Trennungen und den damit verbundenen Erweiterungen erreicht.
Zum Test habe ich die erzeugte patgen-Eingabe des aktuellen Standes
skripte/python/edit_tools/sprachauszug.py -l de-1901,de-1901-x-versal wortliste > words-de-1901.2018-10-30
mit der von der letzten Version vor der Markierung von Flattervokalen am
30.04.2018
perl skripte/extract-tex.pl -t wortliste-2018-04-29 > words-de-1901.2018-04-29
verglichen:
skripte/python/edit_tools/compare_word_files.py words-de-2018-04-29 words-de-2018-10-30
Unter den ca. 500 Trennstellen-Ändererungen sind einige hoffentlich
unstrittig:
* Fehlerkorrekturen (Epi-sko-pat, Fahr-rad-ta-chos, sy-sto-lisch)
* neu als ungünstig markierte Trennstellen (Elek-tronik-markt)
* keine Trennung in Fremdword-Diphthongen:
Fi-nan-cial, Fon-taine-bleau, Hyde-park, ok-troyie-ren, Ta-bloid
* syllabische Trennung in assimilierten Wörtern mit ſ am Präfixende.
So schon im Duden 34, vgl. auch Regelteil Wahrig (80).
Rhap-so-die, Pro-so-di-en
* Trennung vor Suffix -id:
As-te-ro-iden, fa-schis-to-ide, ...
In anderen Fällen sollten wir einen Konsens finden:
a) um die Änderungen gering zu halten und nicht allzu viele existierende
Dokumente bei Neuübersetzungen zu "zerschießen" habe ich
"Schwankungsfälle" im Standard-Trennstil zugelassen, wenn sie keine
Flattervokale erzeugen (so auch im Wahrig und Einheitsduden):
ge-ni-al, Na-ti-on (wie sau-er) aber ge-nia-le, Na-tio-nen, Saue-rei
b) Keine Trennung bei entfallenem "e" (i-.en, e-.en):
Fett-embo-lien, ideell, Aus-seer (< Aus=see)
Im Duden (71) als "zu vermeidend" beschrieben.
Regelteil Duden 91:
Nicht trennbar sind die Wörter:
Feen, knien, (auf) Knien, Seen
TODO:
* Entscheidung: schri-en, ge-schri-en vs. schrien, ge-schrien
Ist hier ein Schluss-"e" entfallen?
Kommt das von "schrie + en" oder von "schr(e)i + en"?
* Auszeichnung entfallenes e im Schwankungsfall:
Ak-ti*en, Bat-te-ri*en, Di<op-tri*en, En<er-gi*en, Ga-la-xi*en
Im Notentext getrennt oder verbunden
(zu fer-nen Ga-la-xien / zu fer-nen Ge-la-xi-en)?
Wenn verbunden, wie auszeichnen?
Vorschlag: ".." (Ak-ti..en) oder doch ein neues Zeichen für
Schwankungsfälle (Na-ti'on, ge-ni'al, Ak-ti'.en,
c) Trennung vor/nach y als ungünstig markiert:
Fayence, Foyer, Lai-en-plä-doyer
TODO: im Standard-Trennstil zulassen?
d) Wahltrennungen in AR (A<·s-phalt)
z.B bei "neu" zulässiger syllabischer Trennung (Duden 91 vs. Duden 72)
Asbest, Aspekt, Asphalt
TODO:
* im Standard-Trennstil wie Duden 91 oder morphemisch?
(Wie wird Aspekt in Duden 91 getrennt)
Wenn syllabisch,
Wahltrennung auszeichnen und im Standard-Trennstil syllabisch filtern
oder
in der Quelle gemäß Duden (91) auszeichnen?
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster