[Trennmuster] Fehlersuche
Guenter Milde
milde at users.sf.net
Do Mai 24 18:00:34 CEST 2012
On 24.05.12, Werner LEMBERG wrote:
> > Bei mir ergibt dieser Aufruf (und auch `make major pattern-trad`) zur
> > Zeit eine Endlosschleife:
> Vielleicht ein Zeilenendenproblem, also Unix vs. Windows? Im Skript
> »make-full-pattern.sh« werden die Eingabedaten an das (eigentlich
> interaktive) patgen weitergereicht. Verwendest Du bash? Ich glaube,
> daß meine Skripten nicht mit anderen Shells funktionieren (ich muß das
> Shebang korrigieren)...
Ich verwende GNU bash, Version 4.2.20(1)-release (x86_64-pc-linux-gnu)
perl v5.14.2 built for x86_64-linux-gnu-thread-multi
GNU Make 3.81
und was sonst noch so auf Debian/testing aktuell ist.
> > MAJOR = -major
> > # A single `-' gets removed; all other combinations of `-', `=', and `|'
> > # are converted to a hyphen.
> >
> > Was ist mit den unterdrückten Trennstellen '-.', '|.' und '=.'? Sind
> > die schon vorher ausgefiltert?
> Ja. Siehe z.B. Zeilen 61-64 in »extract-tex-trad.pl«.
Das wird nur eben im Makefile nicht deutlich.
> >> aufruft und nach ».« sucht, findet man u.a. folgendes in der Datei
> >> »pattmp.2«
> >
> > Wenn ich das richtig deute, sind "Fehler" in pattmp.[1-7] hinweise auf
> > Inkonsistenzen, die auf nicht vollständige Kategorisierung hinweisen
> > oder durchaus begründet sein können:
> Genau.
> >> ab*bau-er.scheinungen # Fehler
> >
> >> abend*land.schaft # »-schaft« noch nicht behandelt
> >
> > "Schaft" ist sowohl ein Grundwort (Speer=schaft, ...) als auch ein
> > Suffix (Land-schaft, Knecht-schaft, ...). Ist das mit dem Kommentar
> > gemeint oder ist eine Markierung des Suffixes in der wortliste
> > erwartet/erwünscht?
> Ich meine damit, daß Du mit Deinen Änderungen noch nicht bei Buchstabe
> »S« angekommen bist und daher »-schaft« noch nicht erfaßt ist.
Da liegt also doch noch (mindestens) ein Mißverständnis vor.
Suffixe werden nicht extra markiert, denn bei Suffixen erfolgt die
Trennung über die Morphemgrenzen hinweg nach den Regeln für "normale"
Trennungen (Weih=nach-ten, nicht Weih=nacht-en). Das ist auch in
"dateikopf" so dokumentiert:
# = Trennstelle an Wortfugen (Wort=fu-ge)
# | Trennstelle nach Präfix (Vor|sil-be)
# - Trennstelle in einfachem oder suffigiertem Wort (ne-ben)
Die Endsilbe "schaft" ist daher meines Erachtens ein Fall einer "begründeten
Ambivalenz"
(Außerdem gehe ich nicht nach Alphabet vor, sondern starte mit den
einfacheren oder wichtigeren Fällen (Präfixe welche die ſ-Schreibung oder
die Ligaturtrennung beeinflussen wie "auf" und "aus").
> > Da die Auszeichnung ein langwieriger Prozess ist, werde ich sie nicht in
> > absehbarer Zeit vollständig abschließen können.
> Wem sagst Du das! Ich bin sehr froh, daß Du derzeit so fleißig an der
> Liste bastelst.
> > Vor der Veröffentlichung einer neuen dehyph Version oder der
> > Optimierung von patgen lassen sich erkannte Inkonsistenzen aber
> > minimieren.
> Soweit ich das überblicken kann, betreffen die Probleme *nicht* einen
> normalen patgen-Lauf; es ist also keinerlei Eile geboten.
> Der Einfachheit halber habe ich Dir die pattmp.2-Datei privat
> geschickt.
Danke.
Günter
Mehr Informationen über die Mailingliste Trennmuster