[Trennmuster] Ein-Buchstaben-Silben

Guenter Milde milde at users.sf.net
Mo Apr 30 14:44:41 CEST 2018


Lieber Werner,

On 27.04.18, Werner LEMBERG wrote:

> >> Da hast Du im Prinzip recht.  Allerdings sollte trotzdem eine
> >> dieser Trennungen stärker gewichtet werden, damit innerhalb eines
> >> Dokuments die zweite Trennung seltener (oder gar nicht) vorkommt
> >> (falls man zukünftige, gewichtete Trennmuster anwendet).  Hat
> >> jemand Ideen dazu?
> > 
> > Ich denke, wir müssen hier unterscheiden zwischen den einvokalischen
> > Silben (die echte Sprechsilben sind und "schon immer" abtrennbar)
> > und den Alternativtrennungen (die es in großem Maße erst seit 1996
> > gibt wärend früher bei Eindeutschung von Fremdwörtern eher eine
> > Trennvorschriftsänderung erfolgte):
> > 
> > Alternativtrennungen
> >   sollten in einem Dokument einheitlich gehandhabt
> >   werden, also nicht Kon-trolle und Kont-rolle in einem Text.
> >   
> > Einvokalsilben
> >   sind "normale" Silben und Texte mit "Thea-ter" und "The-ater"
> >   nicht schlechter als solche mit "af-figer" und "affi-ger".

> Ich gebe Dir völlig recht.  Aber trotz Gleichwertigkeit der
> Trennstellen vor und nach Einvokalsilben sollte meiner Meinung nach
> standardmäßig nicht beides gleichzeitig im Text auftauchen

Warum? Was ist daran schlimmer, als gleichzeitiges Auftauchen anderer
legaler Trennalternativen (Schauspiele-rin aund Schauspie-lerin)?

> – ich hab' ja normalerweise die beiden Vokale zusammengelassen und also
> nur die Nachher-Trennstelle in die Wortliste aufgenommen.

Das weiß ich. Ein Argument könnte also sein, dass wir einerseits erkannt
haben, dass es weitere legale Trennstellen gibt und andererseits nicht zu
viel ändern wollen...

> Vorschlag: Alternativtrennungen bekommen ».« als Ungünstigkeitsmarker.

Da läuft ja jetzt die Variante mit Alternativselektion via Regexp.


> Einvokalsilben bekommen keinen solchen Marker, werden aber
> standardmäßig nicht an patgen weitergeleitet (also vorher mit einem
> regulären Ausdruck ausgefiltert), wobei das konfigurierbar sein wird.

Also so etwas wie ein Trennstil "dehyphen"? 


Bei der Wichtung der einvokalischen Silben (fcc63ae286) hab ich an vielen
Stellen abweichende Vorstellungen:

  jetzt		    		  Vorschlag
  ======================          =============================
  adri-.a-tisch                   gleichwertig: adri-atisch adria-tisch
  ga-li-lä-i-.sche		  galiläi-sche
  Wor-k=.a-ho-lic 		  etymologisch: Work-aholic

  
In der Wortliste sind jetzt ein ganzes Bündel Trennungen wie thei-
stisch (the-i-stisch), die bisher durch ableitung1901 (fälschlich)
herausgefiltert wurden. Da ist sicher teilweise auch noch eine 
explizite Unterdrückung ungünstiger Trennstellen angesagt.

  
Viele Grüße

Günter  

----- End forwarded message -----



Mehr Informationen über die Mailingliste Trennmuster