[Trennmuster] Trennzeichen: Analyse und Wichtung Frakturschriften

Guenter Milde milde at users.sf.net
Do Feb 2 12:58:07 CET 2012


On  2.02.12, Werner LEMBERG wrote
(in Reaktion auf einen Briefwechsel, der irrtümlicherweise nicht über die
Liste ging):

> > Schwieriger wird es, wenn der Trennalgorithmus nach "guten" und
> > "weniger guten" Trennstellen unterscheidet, weil diese
> > Unterscheidung deutlich weniger mit den Regeln zur S-Schreibung
> > korreliert.

> Touché.  Ich denke, das läßt sich unter einen Hut bringen, wenn sich
> ein Freiwilliger findet, der das pflegt.  Wenn wir Deinem Vorschlag
> folgen, brauchen wir ja nur »-« und »=« (und vielleicht »+«, wo ich
> noch um eine Erklärung bitte).

Der Vorschlag war:

> > Da die Bildung zusammengesetzter Wörter rekursiv möglich ist, ist
> > keine Begrenzung der "Gewichtsstufen" von Haupttrennstellen vorhanden.
> > Wie wäre es mit einer rekursiven (und somit ebenso unbegrenzten)
> > Auszeichung durch Verdoppelung anstelle der Wahl neuer Symbole:
> >
> >   Holz++eisen+bahn
> >   Tank+stellen++besitzer
> >   Donau++dampf+schifffahrts+++gesellschaft
> >   ab==ge=half-tert

In meinem Beispiel ging ich von 3 Klassen von Trennstellen aus:

  + zwischen Teilwörtern,
  = zwischen Vorsilbe und (Teil-) Wort,
  - innerhalb eines Wortes (Nebentrennstelle)

Die Unterscheidung der Haupttrennstellen in '+' und '-' war gedacht, um
eine stärkere Wichtung der Trennung nach Teilwörtern zu ermöglichen, die
gegenwärtig durch die Markierung der "Vorsilbentrennung" als
Nebentrennstellen gelöst ist.

Für die ſ-Schreibung ist die Unterscheidung der Haupttrennstellen nicht
relevant, und könnte auch durch eine Wichtung ersetzt werden.
Andererseits erleichtert diese Unterscheidung eine automatische
Trennstellenwichtung. Es könnte also sinnvoll sein, dieses Ergebnis der
Wortbildungsanalyse nicht einfach "wegzuschmeißen" sondern in die
Datenbank aufzunehmen.

Beispiele:

  Aus-bau=ar-bei-ten     # ist

  Aus=bau+ar-bei-ten     # 3 Klassen

  Aus=bau==ar-bei-ten    # 2 Klassen + Wichtung


  Ab-än-de-rungs=vor-schlä-ge  # ist

  Ab=än-de-rungs+vor=schlä-ge  # 3 Klassen

  Ab=än-de-rungs==vor=schlä-ge  # 2 Klassen


  Ab-fall=ent-sor-gungs=ver-band   # ist

  Ab=fall+ent=sor-gungs++ver-band  # 3 Kl.

  Ab=fall==ent=sor-gungs===ver=band # 2 Kl.

Die Variante mit 3 Klassen erscheint mir besser lesbar und eindeutiger in
Fällen wie:
  
  Hoch=schul=re-form=ge-setz=ge-bung
  
  Hoch+schul++re-form+++ge=setz++ge-bung
  
  Hoch==schul===re-form====ge=setz===ge-bung
  

  Ab-ge-ord-ne-ten=ge-bäu-de   # ist

  Ab==ge=ord-ne-ten+ge=bäu-de  # 3

  Ab==ge=ord-ne-ten==ge=bäu-de   # 2
  
  
> Dann hätten wir beispielsweise »|« zur
> Verfügung, das ästhetische Trennstellen markieren könnte.  Genauso
> könnten wir Digraphen wie ».=« verwenden, damit eine zu unterdrückende
> Trennstelle immer noch als Haupttrennstelle für »ſ« erkenntlich ist.

Eine Aufwertung einer Trennstelle kann auch manuell über Verdoppelung
erfolgen. Damit wären noch zwei/drei Zeichen für manuell
herabgestufte/unterdrückte Trennstellen, z.B.

  normal  unerwünscht

  + 	  ±	       zwischen Teilwörtern,
  = 	  :	       zwischen Vorsilbe und (Teil-) Wort,
  - 	  _	       innerhalb eines Wortes (Nebentrennstelle)

oder ein (vor oder) nachgestelltes Zeichen für "unerwünscht":

 Al-pin+gen_darm   oder Al-pin+gen-.darm
 Spar+gel_der	   	Spar+gel-.der

nötig. Bei der zweiten Variante könnte bei Bedarf auch noch ein zweites
Zeichen für auf jeden Fall zu unterdrückende Trennstellen vereinbart werden.


Günter



Mehr Informationen über die Mailingliste Trennmuster