[Trennmuster] genaueste Trennung

Guenter Milde milde at users.sf.net
Fr Okt 28 14:58:50 CEST 2016


On 20.10.16, Werner LEMBERG wrote:

> > [...] bei einbuchstabigen Sprechsilben bin ich dafür, alle
> > regelkonformen Trennungen zuzulassen.  [...] auch einmal "genau-
> > este" und anderswo "genaue-
> > ste" in einem Text sind keine größere Inkonsistenz als
> > unterschiedliche Trennstellen in größerem Abstand.

> Das finde ich nicht, aber...

> > Was sind denn die typographischen Gründe und wo ist diese Regel
> > dokumentiert?

> ... ich habe keine Referenz dafür.

> > Wenn schon nur eine Trennung, dann halte ich [...] die Trennungen
> >
> >   Ale-uten
> >   oze-anisch
> >
> > für deutlich günstiger, da sie der Sprechweise näher kommen
> > (zumindest meiner).

> Hmm.

> > Bei den Aleuten ich würde sogar
> >
> >   Aleuten;Ale-u..-ten
> >   Alëuten;Alë-u-ten
> >
> > vorschlagen, da die Trennung nach "eu" ohne Diaeresis (phonetisch)
> > irreführend ist.

> Hmm hmm hmm.  Klingt leider vernünftig :-)

Und was machen wir da?

> >> [1] Vielleicht ist ein separater Marker gar nicht vonnöten?  Man
> >>     könnte eine entsprechende Regel in die Skripten einbauen, damit
> >>     man unsere derzeitigen »typographischen« Wortformen erzeugen
> >>     kann.
> >
> > Eine solche Regel würde es einfacher machen, alle zulässigen
> > Trennstellen in de-1996 einzubauen, also He-li-ko<p-ter in Spalte 4
> > und He-li-ko-pter in der patgen-Eingabedatei.

> Bist Du jetzt für oder gegen einen separaten Marker?  

Ich bin gegen einen separaten Marker.

> Die grundsätzliche Frage ist nämlich, ob wir im letzteren Fall
> zuverlässig die Ein-Buchstaben-Trennstellen für die
> Trennmustererstellung eliminieren können.

Die nichtethymologischen Trennungen welche in de-1901 verboten sind lassen
sich einfach finden: ein "-" im Abstand 1 zu "<" oder "=". Die lassen sich
dann für "traditionelle Muster" sowie für "traditionelle Reformmuster"
eliminieren.

Die Trennungen in Vokalclustern lassen sich filtern, wenn eine allgemeine
Regel zugrundegelegt wird, z.B. bei gleichberechtigten Trennungen im Abstand
1, nimm die zweite:  "-(.)-" -> "\1-"

Wenn wir die jeweils günstigere behalten wollen, müßte dies markiert werden,
z.B. "Ale-u..-ten" oder "oze-a-.nisch" und die Ersatzregel angepaßt:
Nach der Ersetzung von sehr ungünstigen Trennstellen 
  "[=<>-]+\.\.+" -> ""
die ungünstigere von 2 naheliegenden
  "-(.)-([^.])" -> "\1-\2" 
gefolgt von den Regelfällen
  "-(.)-" -> "-\1"
  
> Ich könnte mir vorstellen, mit einem separaten Marker zu beginnen und,
> sobald wir genügend Erfahrung gesammelt haben, vielleicht auf ihn zu
> verzichten, falls Skripte eine Konsistenzprüfung vornehmen können.

Ich würde ohne separaten Marker anfangen und bei Bedarf einen einführen

Günter



Mehr Informationen über die Mailingliste Trennmuster