[Trennmuster] patgen und Haupttrennstellen
Werner LEMBERG
wl at gnu.org
Mo Sep 23 10:48:44 CEST 2013
Hallo Günter!
> Gibt es eine Dokumentation was - und . bedeuten?
».« ist eine falsche Trennstelle, »-« ist eine, die nicht erkannt
wurde. Mehr Hilfe gibt's, wenn Du
texdoc -s patgen
eingibst und Dir die entsprechende Dokumentation in TeXLive anschaust.
> In diesem Fall scheint die Ursache darin zu liegen, daß Teilwörter
> mit Vorsilben in einigen Zusammensetzungen mit "|" und in anderen
> noch mit "-" markiert sind.
Ganz genau.
> Diese Inkonsistenz kann meine Skriptsammlung erkennen und ich werde
> sie zum Ende der Arbeitseinheit bereinigen.
Danke!
> Als ich es das letzte Mal probiert habe, gab es Fehlermeldungen.
> Wenn es so einfach ist wie:
>
> cd patgen-directory
> make major pattern-refo
>
> kann ich es ja erneut probieren.
Es ist so einfach, vorausgesetzt, Du hast die benötigten Werkzeuge
(ich habe da keine extra Tests eingebaut).
> Ein großer Teil der Problemfälle entfiele aber auch, wenn die Regel
>
> Mindestabstand(«|», «=») = 3
>
> für "major" implementiert würde.
Das geht leider nicht. So ist beispielsweise die Trennung
un-
benachteiligt
die Beste.
> Es geht mir natürlich nicht darum, Inkonsistenzen in der
> Auszeichnung zu behalten, aber ich zumindest wäre stark enttäuscht,
> wenn mir ein Trennalgorithmus für *Haupttrennstellen* die Trennung
>
> Abrüstungsbe-
> reich
>
> in ein Dokument einarbeitet.
Nun ja, die »oberste« Stufe könnten beispielsweise Muster sein, die
nur »=« berücksichtigen. Die nächste dann verarbeitet auch »|«, etc.
Derzeit wird das gleichgestellt und bloß »-« unterdrückt. Allerdings
sind manche Präfix meiner Meinung so stark (z.B. »un-«), daß sie
eigentlich auf oberster Ebene zu berücksichtigen wären.
> Vieleicht müssen wir generell über die Einstufung der Präfixfugen
> nachdenken (und gegebenenfalls die Kategorisierung anpassen),
Ja, doch ist das wohl ein nächster Schritt, der noch etwas weiter in
der Zukunft liegt.
Werner
Mehr Informationen über die Mailingliste Trennmuster