[Trennmuster] Kombitrennzeichen

Guenter Milde milde at users.sf.net
Mi Mär 19 18:35:43 CET 2014


On 19.03.14, Stephan Hennig wrote:
> Am 16.03.2014 15:03, schrieb Guenter Milde:

...

> >    Die Mischung
> > 
> >      acht=ein=halb=>fach 
> >      
> >    stellt die Trennstelle vor -fach auf die gleiche Stufe wie die
> >    Wortfugen,

> Weshalb ist das wünschenswert?

> Mögliche Erklärung: Suffixtrennstellen sind häufig gut, weil an ihnen
> für den Leser schon viel Information vorliegt, aus der häufig das ganze
> Wort abgeleitet werden kann, zumindest aber auf den Kontext des Wortes
> geschlossen werden kann.  

Das ist nur ein Teil der Wahrheit:

  Die Trennung an sinnbildenden Einheiten fördert den Lesefluss und ist
  daher zu bevorzugen.

  -- G. Milde in README.wortliste
  
Vergleiche

  unabding-
  lich
  
  Weltmeiste-
  rin
  
> Dieser Unterschied zwischen Präfix- und Suffixtrennstellen wird durch
> die symmetrische Auszeichnung <= und => leider kaschiert.

Das verstehe ich nicht:

* Die Stellung im Wort ist (wieviel Zeichen/Silben gehen voraus, wie
  viele folgen) ist unabhängig vom Trennzeichen stets erkennbar.

* Die Zeichen < und > können von Mensch und Maschine leicht unterschieden
  werden, auch wenn sie mit = kombiniert sind.


> Sofern diese Erklärung richtig ist, könnten wir diese Aufwertung von
> Suffixtrennstellen nicht auch den Endprogrammen überlassen?  In der
> einfachsten Form werden gleichwertige Trennstellen geringfügig
> aufgewertet, je weiter rechts sie liegen.  Ist das zu einfach gedacht?

Das ist in die richtige Richtung gedacht: ein Endprogramm oder ein
Zwischenprogramm (zur Generierung von Eingangsdaten für ein Endprogramm)
kann/soll die Information der "wortliste" in geeigneter Weise in eine
Wichtung der Trennstellen nach ihrer "Güte" umsetzen.

Da das Endprogramm TeX keine Wichtung von Trennstellen erlaubt, ist im
Makefile eine "Binärwichtung" implementiert: problematische Trennstellen
werden nicht in die Eingangsdate für patgen übernommen.

Die "geeignete Weise" für schlauere (wichtende) Trennalgorithmen ist zur
Zeit nicht bekannt und sicher auch umstritten. Wir konzentrieren uns
daher in der Wortliste auf die Auszeichnung nach objektiven Kriterien,
die dann Grundlage einer Vielzahl verfeinerter gewichteter
Trennalgorithmen sein können.

Ziel der Trennstellensyntax sollte es daher sein, in einfacher, eleganter
und für Mensch und Maschine verständlicher Form die Zerlegungshierarchie¹
von Wörtern korrekt darzustellen, wenn die Grenzen sinntragender
Einheiten mit den legalen Trennstellen zusammenfallen. 

¹ Also z.B. den Zusammenhang
     
       
          Hochsicherheitsgefängnis
       
       Hochsicherheits  +  gefängnis
       
    (Hoch + sicher + heits) + (ge + fäng + nis)

Warum?

  Holz-
  eisenbahn
  
ist eine bessere Trennung als

  Holzeisen-
  bahn
  
und das soll ein "schlaues Trennsystem" aus den Daten der "wortliste"
erkennen können.

Günter

    



Mehr Informationen über die Mailingliste Trennmuster