[Trennmuster] Dokumentation
Guenter Milde
milde at users.sf.net
Do Aug 29 14:08:41 CEST 2013
On 29.08.13, Stephan Hennig wrote:
> Am 27.08.2013 16:28, schrieb Guenter Milde:
> > aus aktuellem Anlaß habe ich mir Gedanken über die Dokumentation der
> > Wortliste gemacht. Neben der angehängten Aktualisierung/Änderung schlage ich
> > vor, die sicherlich ursprünglich als einführenden Kommentar zur "wortliste"
> > gedachte Datei "dateikopf"
> >
> > * separat zu halten,
> > * ihrer Kommentarzeichen zu berauben, und
> Ich schlage Markdown-Syntax vor, wie auch schon bei dehyph-exptl/CHANGES
> und dehyph-exptl/README. Die Anpassungen würde ich übernehmen.
OK (wenn ich persölich auch reST bevorzuge).
> > * mit einem aussagekräftigeren Namen zu versehen
> > (leider fällt mir kein wirklich überzeugender Vorschlag ein).
> wortliste.README
> README.wortliste
Ich bin für wortliste.README
...
> diff --git a/dokumente/dateikopf b/dokumente/dateikopf
...
> +# Fehlleitende Trennungen werden durch einen oder mehrere Punkte ??.?? markiert.
> +# Die Punkte k??nnen alleinstehen oder sie folgen den Zeichen zur
> +# morphologischen Kategorisierung:
> +# Ge??winn??er.war??tung
> +# be||in|.hal-ten
Sollen wirklich nur "fehlleitende" Trennungen, oder allgemein alle
ungünstigen (oder bei der Trennmustermanschaft unbeliebten) Trennungen
durch Punkte markiert werden?
Wie würdest Du Nottrennungen wie Telto-wer markieren/bezeichnen?
> +# Durch die Zahl der Punkte kann die Schwere der Beeintr??chtigung der
> +# Leserlichkeit bei Trennung an dieser Stelle bewertet werden. Bei
> +# irref??hrenden Trennungen (Gewinner-wartung) bleibt auch bei falscher Lesart
> +# der Wortstamm eines Teilworts erhalten. Bei sinnentstellenden Trennungen
> +# (bein-halten) muss dagegen w??hrend des Lesens eine kontextfremde Deutung
> +# ??berwunden werden. Das Ablenkungspotential sinnentstellender Trennungen ist
> +# daher h??her als bei irref??hrenden Trennungen.
Gibt es für diese Aussage auch Belege/Untersuchungen?
Meine These ist genau entgegengesetzt:
Eine kontextfremde Deutung stört den Lesefluß weniger als eine
wortstammerhaltende, da sie sich viel einfacher falsifizieren läßt bzw.
nach dem Schema: "wir sehen nur, was wir erwarten" gar nicht erst
wahrgenommen wird.
Einen weit wichtigeren Unterschied macht es meines Erachtens, ob die
falsche Deutung nach dem Lesen des zweiten Wortteils noch Bestand hat:
Anden=ken
ist nach dem Lesen der nächsten Zeile eindeutig falsch, denn "ken" gibt
es nicht. Die Fehldeutung kann also bereits auf syntaktischer Ebene
falsifiziert werden, was eine geringere Verarbeitungstiefe erfordert.
Im Gegensatz dazu ist für die "Auflösung" von
Altbauer=haltung
semantisches Wissen und Verarbeiten erforderlich und
bein=halten
könnte in einem Bericht über die Tanzausbildung an der Palucca-Schule
durchaus Sinn ergeben. Im Extremfall kann ohne Kontext gar nicht auf die
richtige Wortfuge geschlossen werden, z.B.
Abend=brot==zeit vs. Abend==brot=zeit
...
> -# Besonders ung??nstige Trennstellen k??nnen mit mehreren Punkten
> -# gekennzeichnet sein.
> +# . fehlleitend, ohne n??here Bewertung
> +# .. irref??hrend (Ost=en..de, Elek-tro-..nik=rie-se)
> +# ... sinnentstellend (Tal=ent|...w??s-se-rung)
> +# .... anst????ig (An|al-....pha-bet)
Wie schon im anderen Post erwähnt: ich finde diese Zuordnung
problematisch, da sie der Logik: »Anzahl der Zeichen entspricht "Stärke"«
widerspricht. Nur Eingeweihte werden nach dem Lesen von
"Berg===fünf=fin-ger==kraut" richtig interpretieren, daß
"Alt=bau==er..hal-tung" weniger schlimm als "An·al.ge·ti·ka" ist.
> # Spezielle Trennungen
> # ====================
> #
> -# Folgende Notation wird verwendet, um spezielle Trennungen (f??r die
> -# traditionelle Rechtschreibung) zu kennzeichnen:
> +# Trennungen, deren Wahl mehr als das blo??e Einf??gen eines Trennstrichs
> +# erfordern (ck-Trennung, Dreikonsonantenregel), werden durch Aufz??hlung aller
> +# alternativer Erscheinungsformen in einem Paar geschweifter Klammern ??{}??
> +# gekennzeichnet. Die Alternativen werden durch einen Schr??gstrich ??/??
> +# voneinander abgegrenzt:
> #
> -# Ab-fa{ll/ll-l}a-ger
> +# Dru{ck/k??k}er
> +# Bre{nn/nn=n}es-sel
Gut.
> +# Die auf eine Trennstelle mit Dreikonsonantenregel folgende Trennstelle
> +# wird grunds??tzlich als fehlleitend markiert, wenn sie nur einen Laut
> +# entfernt liegt:
> #
> -# Dru{ck/k??k}er
> +# Ab|fa{ll/ll=l}a-.ger
Das ist eine Regel, welche zum Verständnis der "wortliste" nicht nötig
ist und daher besser zu den Regeln der Auswahl und Trennung an anderer
Stelle der Gesamtdokumentation paßt.
BTW: Ist die explizite Auszeichnung überhaupt nötig? Jeder
Trennmustergenerator oder Trennalgorithmus kann solche Fälle doch
einfach, z.B. mit dem regulären Ausdruck "{../..=.}.[-|]", erkennen.
Günter
Mehr Informationen über die Mailingliste Trennmuster