[Trennmuster] Fehlersuche

Werner LEMBERG wl at gnu.org
Do Mai 24 14:06:15 CEST 2012


> Bei mir ergibt dieser Aufruf (und auch `make major pattern-trad`) zur
> Zeit eine Endlosschleife:

Interessant.

> pattern.2.log sagt:
> 
>   This is PATGEN, Version 2.4 (TeX Live 2012/dev/Debian)
>   left_hyphen_min = 2, right_hyphen_min = 2, 50 letters
>   5962 patterns read in
>   pattern trie has 9102 nodes, trie_max = 16524, 11 outputs
>   hyph_start, hyph_finish: Specify 1<=hyph_start,hyph_finish<=9 !
>   hyph_start, hyph_finish: Specify 1<=hyph_start,hyph_finish<=9 !
>   hyph_start, hyph_finish: Specify 1<=hyph_start,hyph_finish<=9 !

Vielleicht ein Zeilenendenproblem, also Unix vs. Windows?  Im Skript
»make-full-pattern.sh« werden die Eingabedaten an das (eigentlich
interaktive) patgen weitergereicht.  Verwendest Du bash?  Ich glaube,
daß meine Skripten nicht mit anderen Shells funktionieren (ich muß das
Shebang korrigieren)...

>   MAJOR = -major
>   # A single `-' gets removed; all other combinations of `-', `=', and `|'
>   # are converted to a hyphen.
> 
> Was ist mit den unterdrückten Trennstellen '-.', '|.' und '=.'? Sind
> die schon vorher ausgefiltert?

Ja.  Siehe z.B. Zeilen 61-64 in »extract-tex-trad.pl«.

>> aufruft und nach ».« sucht, findet man u.a. folgendes in der Datei
>> »pattmp.2«
> 
> Wenn ich das richtig deute, sind "Fehler" in pattmp.[1-7] hinweise auf
> Inkonsistenzen, die auf nicht vollständige Kategorisierung hinweisen
> oder durchaus begründet sein können:

Genau.

>>   ab*bau-er.scheinungen         # Fehler
> 
>>   abend*land.schaft             # »-schaft« noch nicht behandelt
> 
> "Schaft" ist sowohl ein Grundwort (Speer=schaft, ...) als auch ein
> Suffix (Land-schaft, Knecht-schaft, ...). Ist das mit dem Kommentar
> gemeint oder ist eine Markierung des Suffixes in der wortliste
> erwartet/erwünscht?

Ich meine damit, daß Du mit Deinen Änderungen noch nicht bei Buchstabe
»S« angekommen bist und daher »-schaft« noch nicht erfaßt ist.

> Da die Auszeichnung ein langwieriger Prozess ist, werde ich sie nicht in
> absehbarer Zeit vollständig abschließen können.

Wem sagst Du das!  Ich bin sehr froh, daß Du derzeit so fleißig an der
Liste bastelst.

> Vor der Veröffentlichung einer neuen dehyph Version oder der
> Optimierung von patgen lassen sich erkannte Inkonsistenzen aber
> minimieren.

Soweit ich das überblicken kann, betreffen die Probleme *nicht* einen
normalen patgen-Lauf; es ist also keinerlei Eile geboten.

Der Einfachheit halber habe ich Dir die pattmp.2-Datei privat
geschickt.


   Werner



Mehr Informationen über die Mailingliste Trennmuster