[Trennmuster] Sprechsilben vs. Wortherkunft
G. Milde
g.milde at quantentunnel.de
Fr Feb 21 18:45:53 CET 2014
Liebe Trennmustler,
----- Ursprüngliche Mitteilung -----
> Am 21.02.2014 09:03, schrieb G. Milde:
> > Während also an der Auszeichnung ethymologischer Trennstellen "nicht zu rütteln
> > ist", wäre eine Kennzeichnung der neuen Zusatztrennmöglichkeiten in de-1996
> > wünschenswert. Das könnte Nutzern helfen, denen sonst von Verlagen oder
> > Professoren die nicht ihrer Hausorthogaphie entsprechenden Trennungen
> > angekreidet werden.
>
> Lässt sich ein Muster ausmachen, mit dem man gezielt nach Unterschieden
> zwischen Morphem- und Sprechtrennung suchen kann? Also "wenn vor einem
> Vokal ein Konsonant kommt und es sich dabei um die letzte Silbe handelt"
> oder so?
Selbstverständlich. Besonders einfach ist es, wenn (wie geplant) die Trennstellen an Morphemgrenzen entsprechend markiert sind. Bsp.:
da-r|um
hi-n|aus
su|s-pekt
He-li-ko|p-ter
Wenn | (auch = ?) und - mit nur einen Buchstaben dazwischen vorkommen, muß je nach Hausorthographie entweder - oder | unterdrückt werden. Als regexp-replace Regeln also für "ethymologisch":
-(.)\| -> \1|
|(.)\- -> \1|
Wenn diese Regeln zu den existerenden (aber für mich (weil in perl, sed, etc.) kryptischen Vorverarbeitungsschritten für den "patgen" Lauf hinzugefügt würden, könnten wir in einfacher und gut lesbarer Form die seit 1996 erlaubten "Sprechsilbentrennungen" sukzessive ohne Einfluß auf die TeX-Trennmuster in die Datenbank ("wortliste") aufnehmen.
Achtung: natürlich nur für de-1996, nicht
für de-1901, d.h. in den meisten Fällen bedeutet
dies eine neue Fallunterscheidung.
Etwas komlizierter ist das Auffinden der "Kandidaten", d.h. Trennungen welche der Sprechsilbenregel widersprechen. Ich würde mit regexp
[-|][aeiouyäöü]
oder
[-|][^aeiouyäöü]
anfangen. Bei der zweiten Regel noch sch, ch und ck ausfiltern und dann nach Verfeinerungsbedarf sehen. (Ich habe das schon einmal im Texteditor gemacht, um Fälle für die Präfixmarkierung aufzuspüren.)
Dann müßte man "nur noch" herausbekommen, in welchen der tausenden gefundenen Wörter die Rechtschreibkommision die Herkunft für verblasst gehalten und Sprechsilbentrennung als Alternative eingeführt hat. Da ist es vielleich einfacher, eine Liste der geänderten Wörter nach "Trennzeichen-Buchstabe-Trennzeiche" zu durchforsten.
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster