[Trennmuster] patgen-Kram
Stephan Hennig
mailing_list at arcor.de
Do Aug 1 18:18:37 CEST 2013
Am 01.08.2013 11:31, schrieb Georg Pfeiffer:
> ich habe mal versucht, aus einer kleinen Wortliste mit patgen Suchmuster zu
> erzeugen. Nachdem ich patgen dazu gebracht habe, überhaupt mit mir zu reden,
> stellt es mir so komische Frage, die ich nicht verstehe,
In Kopka, LaTeX: Erweiterungen, Bd. 3 gibt es eine kurze Einführung in
Patgen. Keine tiefergehenden Erklärungen, eher eine Beispielsitzung.
> Wer hat einen Link für mich, wo mir weiter hilft?
>
> Gruß
> Georg
>
> $ patgen pre-1903 dehypht-x-2012-05-30.pat tmp.pat ../daten/german.tr
Auf den traditionellen Mustern aufzubauen, wird so nicht klappen.
Erstens solltest du die Datei pattern.8 verwenden, die patgen nach
make pattern-trad
angelegt hat und die in derselben Kodierung wie german.tr vorliegt
(latin-1?). Aber auch dann wird es nicht klappen, da patgen lediglich
mit 8 Leveln umgehen kann und jene in den Mustern schon ausgereizt sind.
Praktikabler erscheint mir, deine Liste mit der für die traditionelle
Rechtschreibung vorher zu verschmelzen und dann patgen darauf
loszulassen. Die Eingabeliste für patgen für die traditionelle
Rechtschreibung findest du nach
make pattern-trad
unter dehypht-x/words.hyphenated.trad. Zum Testen kannst du die Datei
mal ändern, das skripte/make-full-pattern.sh in jenes Verzeichnis
kopieren, dort ausführen (Dokumentation im Kopf des Skripts) und hier
berichten. (Ich habe das alles nicht getestet.)
> This is PATGEN, Version 2.4 (TeX Live 2012/Debian)
> left_hyphen_min = 2, right_hyphen_min = 2, 50 letters
> 14429 patterns read in
> pattern trie has 21027 nodes, trie_max = 34318, 373 outputs
> hyph_start, hyph_finish: 1 34318
> Specify 1<=hyph_start,hyph_finish<=9 !
> hyph_start, hyph_finish: 2 8
> Largest hyphenation value 8 in patterns should be less than hyph_start
Hier beschwert sich patgen, dass die Eingabemuster schon 8 Level verwenden.
> pat_start, pat_finish: 1 9
> good weight, bad weight, threshold: 1 2 3
> processing dictionary with pat_len = 1, pat_dot = 0
> Bed�nken;Be-d�n-ken
>
> Bad character
Und hier über Zeichen, die in german.tr nicht definiert wurden.
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster