[Trennmuster] Sind < und > wirklich gleichmächtig?

Guenter Milde milde at users.sf.net
Mi Apr 2 16:41:12 CEST 2014


On  2.04.14, Werner LEMBERG wrote:

Liebe Trennmustler!

> Wenn ich mir ein Wort wie

>   Ab<hän-gig>keit

> anschaue, finde ich die Trennung

>   Abhängig-
>   keit

> besser als

>   Ab-
>   hängigkeit   .

Da stimme ich voll zu.

> Für mich fühlt sich also dieses Suffix »stärker« an als das Präfix.

> Bin ich mit dieser Meinung alleine?  

Das weiß ich nicht, aber ich würde das nicht an diesem Suffix/Präfix
festmachen, sondern darauf zurückführen, daß

    Güte = 1/Bindungsstärke
    
bestenfalls eine erste Näherung ist.

Meine Zielvorstellung ist eine "Güteformel" oder ein Algorithmus, wo die
Bindungsstärke nur eine der betrachteten Abhängigkeiten ist. 

In der zweiten Näherung sollte z.B. die Zahl der Zeichen (oder Laute,
dann wäre N("sch") = 1) vor/nach einer Trennstelle beachtet werden.

> Meine Frage hat nämlich einen konkreten Hintergrund: Ich habe
> »extract-tex.pl« erweitert, sodaß Option »-g n« nur die n besten
> Trennungen zurückliefert.

Ich denke, daß dies ein wenig praktikabler Ansatz ist. Für Fälle wie
Trennungen in Webbrowsern (oder generell bei linksbündigem Text) ist
meines Erachtens eher ein "die besten Trennstellen mit höchstens N
Zeichen Abstand" wichtig, denn sonst hätten wir 

   Hu-
   mus 
   
neben 

   Altersteilzeit-
   regelung

und schlimmeren...

> Derzeit liefert es beispielsweise bei »-g 1«

>   Ab<hängig>keit

> zurück, weil »>« und »<« als gleichmächtig betrachtet werden.  Ich
> glaube aber, es sollte stattdessen

>   Abhängig>keit

> retournieren...

> Andere Beispiele:

>   Un<ab<hän-gig>keit           ->   Unabhängig>keit
>   Mit<ver<ant-wort>lich>keit   ->   Mitverantwortlich>keit
>   Un<an<ge<passt>heit          ->   Unangepasst>heit

Das ginge mit z.B dem Regelsatz:

  * mindestens 3 (oder 4?) Zeichen vor der ersten Trennstelle
  
  * mindestens 4 Zeichen Abstand zu einer schwächer bindenden Trennstelle,
    selbst wenn diese aus anderen Gründen (z.B. zu weit vorn) entfällt
    (Damit fällt Mitver + antwortlichkeit raus, weil Präfix
    rechtsbindend ist.)
    



> Andererseits haben wir

>   un<wirt>schaft>lich          ->   un<wirtschaftlich

Hier könnte evt. un<<wirt>schaft>lich hin oder un<=wirt... hin.

> Schwierig, schwierig.

Komplex. Daher wird es sicher noch lange dauern, bis wir eine allgemein
akzeptierte Lösung für "sparsames" Trennen haben. Möglicherweise wird es
auch auf eine reiche Auswahl suboptimaler Varianten hinauslaufen...


Günter



Mehr Informationen über die Mailingliste Trennmuster