[Trennmuster] Fehlersuche
Werner LEMBERG
wl at gnu.org
Do Mai 24 14:06:15 CEST 2012
> Bei mir ergibt dieser Aufruf (und auch `make major pattern-trad`) zur
> Zeit eine Endlosschleife:
Interessant.
> pattern.2.log sagt:
>
> This is PATGEN, Version 2.4 (TeX Live 2012/dev/Debian)
> left_hyphen_min = 2, right_hyphen_min = 2, 50 letters
> 5962 patterns read in
> pattern trie has 9102 nodes, trie_max = 16524, 11 outputs
> hyph_start, hyph_finish: Specify 1<=hyph_start,hyph_finish<=9 !
> hyph_start, hyph_finish: Specify 1<=hyph_start,hyph_finish<=9 !
> hyph_start, hyph_finish: Specify 1<=hyph_start,hyph_finish<=9 !
Vielleicht ein Zeilenendenproblem, also Unix vs. Windows? Im Skript
»make-full-pattern.sh« werden die Eingabedaten an das (eigentlich
interaktive) patgen weitergereicht. Verwendest Du bash? Ich glaube,
daß meine Skripten nicht mit anderen Shells funktionieren (ich muß das
Shebang korrigieren)...
> MAJOR = -major
> # A single `-' gets removed; all other combinations of `-', `=', and `|'
> # are converted to a hyphen.
>
> Was ist mit den unterdrückten Trennstellen '-.', '|.' und '=.'? Sind
> die schon vorher ausgefiltert?
Ja. Siehe z.B. Zeilen 61-64 in »extract-tex-trad.pl«.
>> aufruft und nach ».« sucht, findet man u.a. folgendes in der Datei
>> »pattmp.2«
>
> Wenn ich das richtig deute, sind "Fehler" in pattmp.[1-7] hinweise auf
> Inkonsistenzen, die auf nicht vollständige Kategorisierung hinweisen
> oder durchaus begründet sein können:
Genau.
>> ab*bau-er.scheinungen # Fehler
>
>> abend*land.schaft # »-schaft« noch nicht behandelt
>
> "Schaft" ist sowohl ein Grundwort (Speer=schaft, ...) als auch ein
> Suffix (Land-schaft, Knecht-schaft, ...). Ist das mit dem Kommentar
> gemeint oder ist eine Markierung des Suffixes in der wortliste
> erwartet/erwünscht?
Ich meine damit, daß Du mit Deinen Änderungen noch nicht bei Buchstabe
»S« angekommen bist und daher »-schaft« noch nicht erfaßt ist.
> Da die Auszeichnung ein langwieriger Prozess ist, werde ich sie nicht in
> absehbarer Zeit vollständig abschließen können.
Wem sagst Du das! Ich bin sehr froh, daß Du derzeit so fleißig an der
Liste bastelst.
> Vor der Veröffentlichung einer neuen dehyph Version oder der
> Optimierung von patgen lassen sich erkannte Inkonsistenzen aber
> minimieren.
Soweit ich das überblicken kann, betreffen die Probleme *nicht* einen
normalen patgen-Lauf; es ist also keinerlei Eile geboten.
Der Einfachheit halber habe ich Dir die pattmp.2-Datei privat
geschickt.
Werner
Mehr Informationen über die Mailingliste Trennmuster