[Trennmuster] patgen und Haupttrennstellen

Werner LEMBERG wl at gnu.org
Mo Sep 23 10:48:44 CEST 2013


Hallo Günter!


> Gibt es eine Dokumentation was - und . bedeuten?

».« ist eine falsche Trennstelle, »-« ist eine, die nicht erkannt
wurde.  Mehr Hilfe gibt's, wenn Du

  texdoc -s patgen

eingibst und Dir die entsprechende Dokumentation in TeXLive anschaust.

> In diesem Fall scheint die Ursache darin zu liegen, daß Teilwörter
> mit Vorsilben in einigen Zusammensetzungen mit "|" und in anderen
> noch mit "-" markiert sind.

Ganz genau.

> Diese Inkonsistenz kann meine Skriptsammlung erkennen und ich werde
> sie zum Ende der Arbeitseinheit bereinigen.

Danke!

> Als ich es das letzte Mal probiert habe, gab es Fehlermeldungen.
> Wenn es so einfach ist wie:
>
>   cd patgen-directory
>   make major pattern-refo
>
> kann ich es ja erneut probieren.

Es ist so einfach, vorausgesetzt, Du hast die benötigten Werkzeuge
(ich habe da keine extra Tests eingebaut).

> Ein großer Teil der Problemfälle entfiele aber auch, wenn die Regel
>
>   Mindestabstand(«|», «=») = 3
>
> für "major" implementiert würde.

Das geht leider nicht.  So ist beispielsweise die Trennung

  un-
  benachteiligt

die Beste.

> Es geht mir natürlich nicht darum, Inkonsistenzen in der
> Auszeichnung zu behalten, aber ich zumindest wäre stark enttäuscht,
> wenn mir ein Trennalgorithmus für *Haupttrennstellen* die Trennung
>
>   Abrüstungsbe-
>   reich
>
> in ein Dokument einarbeitet.

Nun ja, die »oberste« Stufe könnten beispielsweise Muster sein, die
nur »=« berücksichtigen.  Die nächste dann verarbeitet auch »|«, etc.
Derzeit wird das gleichgestellt und bloß »-« unterdrückt.  Allerdings
sind manche Präfix meiner Meinung so stark (z.B. »un-«), daß sie
eigentlich auf oberster Ebene zu berücksichtigen wären.

> Vieleicht müssen wir generell über die Einstufung der Präfixfugen
> nachdenken (und gegebenenfalls die Kategorisierung anpassen),

Ja, doch ist das wohl ein nächster Schritt, der noch etwas weiter in
der Zukunft liegt.


    Werner


Mehr Informationen über die Mailingliste Trennmuster