[Trennmuster] Dokumentation

Guenter Milde milde at users.sf.net
Do Aug 29 14:08:41 CEST 2013


On 29.08.13, Stephan Hennig wrote:
> Am 27.08.2013 16:28, schrieb Guenter Milde:

> > aus aktuellem Anlaß habe ich mir Gedanken über die Dokumentation der
> > Wortliste gemacht. Neben der angehängten Aktualisierung/Änderung schlage ich
> > vor, die sicherlich ursprünglich als einführenden Kommentar zur "wortliste"
> > gedachte Datei "dateikopf"
> >
> > * separat zu halten,
> > * ihrer Kommentarzeichen zu berauben, und

> Ich schlage Markdown-Syntax vor, wie auch schon bei dehyph-exptl/CHANGES
> und dehyph-exptl/README.  Die Anpassungen würde ich übernehmen.

OK (wenn ich persölich auch reST bevorzuge).

> > * mit einem aussagekräftigeren Namen zu versehen
> >   (leider fällt mir kein wirklich überzeugender Vorschlag ein).

> wortliste.README
> README.wortliste

Ich bin für wortliste.README


...


> diff --git a/dokumente/dateikopf b/dokumente/dateikopf
...
> +# Fehlleitende Trennungen werden durch einen oder mehrere Punkte ??.?? markiert.
> +# Die Punkte k??nnen alleinstehen oder sie folgen den Zeichen zur
> +# morphologischen Kategorisierung:
> +#   Ge??winn??er.war??tung
> +#   be||in|.hal-ten

Sollen wirklich nur "fehlleitende" Trennungen, oder allgemein alle
ungünstigen (oder bei der Trennmustermanschaft unbeliebten) Trennungen
durch Punkte markiert werden?

Wie würdest Du Nottrennungen wie Telto-wer markieren/bezeichnen?

> +# Durch die Zahl der Punkte kann die Schwere der Beeintr??chtigung der
> +# Leserlichkeit bei Trennung an dieser Stelle bewertet werden.  Bei
> +# irref??hrenden Trennungen (Gewinner-wartung) bleibt auch bei falscher Lesart
> +# der Wortstamm eines Teilworts erhalten.  Bei sinnentstellenden Trennungen
> +# (bein-halten) muss dagegen w??hrend des Lesens eine kontextfremde Deutung
> +# ??berwunden werden.  Das Ablenkungspotential sinnentstellender Trennungen ist
> +# daher h??her als bei irref??hrenden Trennungen.

Gibt es für diese Aussage auch Belege/Untersuchungen?

Meine These ist genau entgegengesetzt:

  Eine kontextfremde Deutung stört den Lesefluß weniger als eine
  wortstammerhaltende, da sie sich viel einfacher falsifizieren läßt bzw.
  nach dem Schema: "wir sehen nur, was wir erwarten" gar nicht erst
  wahrgenommen wird.

Einen weit wichtigeren Unterschied macht es meines Erachtens, ob die
falsche Deutung nach dem Lesen des zweiten Wortteils noch Bestand hat:

  Anden=ken

ist nach dem Lesen der nächsten Zeile eindeutig falsch, denn "ken" gibt
es nicht. Die Fehldeutung kann also bereits auf syntaktischer Ebene
falsifiziert werden, was eine geringere Verarbeitungstiefe erfordert.

Im Gegensatz dazu ist für die "Auflösung" von 

  Altbauer=haltung

semantisches Wissen und Verarbeiten erforderlich und

  bein=halten

könnte in einem Bericht über die Tanzausbildung an der Palucca-Schule
durchaus Sinn ergeben. Im Extremfall kann ohne Kontext gar nicht auf die
richtige Wortfuge geschlossen werden, z.B.

  Abend=brot==zeit  vs. Abend==brot=zeit

...

> -# Besonders ung??nstige Trennstellen k??nnen mit mehreren Punkten
> -# gekennzeichnet sein.
> +#   .     fehlleitend, ohne n??here Bewertung
> +#   ..    irref??hrend (Ost=en..de, Elek-tro-..nik=rie-se)
> +#   ...   sinnentstellend (Tal=ent|...w??s-se-rung)
> +#   ....  anst????ig (An|al-....pha-bet)

Wie schon im anderen Post erwähnt: ich finde diese Zuordnung
problematisch, da sie der Logik: »Anzahl der Zeichen entspricht "Stärke"«
widerspricht. Nur Eingeweihte werden nach dem Lesen von
"Berg===fünf=fin-ger==kraut" richtig interpretieren, daß
"Alt=bau==er..hal-tung" weniger schlimm als "An·al.ge·ti·ka" ist.  

>  # Spezielle Trennungen
>  # ====================
>  #
> -# Folgende Notation wird verwendet, um spezielle Trennungen (f??r die
> -# traditionelle Rechtschreibung) zu kennzeichnen:
> +# Trennungen, deren Wahl mehr als das blo??e Einf??gen eines Trennstrichs
> +# erfordern (ck-Trennung, Dreikonsonantenregel), werden durch Aufz??hlung aller
> +# alternativer Erscheinungsformen in einem Paar geschweifter Klammern ??{}??
> +# gekennzeichnet.  Die Alternativen werden durch einen Schr??gstrich ??/??
> +# voneinander abgegrenzt:
>  #
> -#   Ab-fa{ll/ll-l}a-ger
> +#   Dru{ck/k??k}er
> +#   Bre{nn/nn=n}es-sel

Gut.

> +# Die auf eine Trennstelle mit Dreikonsonantenregel folgende Trennstelle
> +# wird grunds??tzlich als fehlleitend markiert, wenn sie nur einen Laut
> +# entfernt liegt:
>  #
> -#   Dru{ck/k??k}er
> +#   Ab|fa{ll/ll=l}a-.ger

Das ist eine Regel, welche zum Verständnis der "wortliste" nicht nötig
ist und daher besser zu den Regeln der Auswahl und Trennung an anderer
Stelle der Gesamtdokumentation paßt.

BTW: Ist die explizite Auszeichnung überhaupt nötig? Jeder
Trennmustergenerator oder Trennalgorithmus kann solche Fälle doch
einfach, z.B. mit dem regulären Ausdruck "{../..=.}.[-|]", erkennen.


Günter



Mehr Informationen über die Mailingliste Trennmuster