[Trennmuster] Sprechsilben vs. Wortherkunft

G. Milde g.milde at quantentunnel.de
Fr Feb 21 18:45:53 CET 2014


Liebe Trennmustler,

----- Ursprüngliche Mitteilung -----
> Am 21.02.2014 09:03, schrieb G. Milde:
> > Während also an der Auszeichnung ethymologischer Trennstellen "nicht zu rütteln
> > ist", wäre eine Kennzeichnung der neuen Zusatztrennmöglichkeiten in de-1996
> > wünschenswert. Das könnte Nutzern helfen, denen sonst von Verlagen oder
> > Professoren die nicht ihrer Hausorthogaphie entsprechenden Trennungen
> > angekreidet werden.
>
> Lässt sich ein Muster ausmachen, mit dem man gezielt nach Unterschieden
> zwischen Morphem- und Sprechtrennung suchen kann? Also "wenn vor einem
> Vokal ein Konsonant kommt und es sich dabei um die letzte Silbe handelt"
> oder so?

Selbstverständlich. Besonders einfach ist es, wenn (wie geplant) die Trennstellen an Morphemgrenzen entsprechend markiert sind. Bsp.:

  da-r|um
  hi-n|aus
  su|s-pekt
  He-li-ko|p-ter

Wenn | (auch = ?) und - mit nur einen Buchstaben dazwischen vorkommen, muß je nach Hausorthographie entweder - oder | unterdrückt werden. Als regexp-replace Regeln also für "ethymologisch":

  -(.)\|   ->  \1|
  |(.)\-   ->  \1|  

Wenn diese Regeln zu den existerenden (aber für mich (weil in perl, sed, etc.) kryptischen Vorverarbeitungsschritten für den "patgen" Lauf hinzugefügt würden, könnten wir in einfacher und gut lesbarer Form die seit 1996 erlaubten "Sprechsilbentrennungen" sukzessive ohne Einfluß auf die TeX-Trennmuster in die Datenbank ("wortliste") aufnehmen. 

  Achtung: natürlich nur für de-1996, nicht 
  für de-1901, d.h. in den meisten Fällen bedeutet
  dies eine neue Fallunterscheidung.

Etwas komlizierter ist das Auffinden der "Kandidaten", d.h. Trennungen welche der Sprechsilbenregel widersprechen. Ich würde mit regexp

   [-|][aeiouyäöü]

oder

   [-|][^aeiouyäöü]

anfangen. Bei der zweiten Regel noch sch, ch und ck ausfiltern und dann nach Verfeinerungsbedarf sehen. (Ich habe das schon einmal im Texteditor gemacht, um Fälle für die Präfixmarkierung aufzuspüren.)

Dann müßte man "nur noch" herausbekommen, in welchen der tausenden gefundenen Wörter die Rechtschreibkommision die Herkunft für verblasst gehalten und Sprechsilbentrennung als Alternative eingeführt hat. Da ist es vielleich einfacher, eine Liste der geänderten Wörter nach "Trennzeichen-Buchstabe-Trennzeiche" zu durchforsten.

Viele Grüße

Günter





Mehr Informationen über die Mailingliste Trennmuster