[Trennmuster] Sinnentstellende Trennungen?

Guenter Milde milde at users.sf.net
Sa Mai 24 09:27:25 CEST 2014


Lieber Tobias,

On 23.05.14, Tobias Wendorff wrote:
> Am 23.05.2014 09:47, schrieb Guenter Milde:

> >>Ich möchte einfach kein "Spriter" in meinen Texten und da hilft derzeit
> >>nur ein "Sprit=er<.spar>nis".
> >
> >Auch Spriter ist kein "echtes" Wort.

> Ich finde die Unterscheidung in sinnentstellend (und was wir noch haben)
> ja generell nicht so toll. "Unschöne Trennung" würde mir genügen.

Ich finde dies Unterscheidung wichtig: sinnentstellende Trennungen will
ich normalerweise unterdrücken, leicht irritierende will ich
normalerweise zulassen.

> Das Problem ist aber, dass man beim Lesen des Texts daran hängenbleibt
> und eine nicht geübte Person dann Probleme beim Entziffern des korrekten
> Wortes hat.

Ich denke, daß die Mehrzahl der Leser von Spriter nicht im Lesefluß
behindert wird und daher die "normalen" TeX Trennmuster in diesem Fall
keine Unterdrückung machen sollen.

> Informatiker und Fast-Food-Junkies kennen das Wort "Sprite", wenn man
> nun "Spriter-" liest, könnte man da in Bedrängnis kommen.

Ist dass dann einer, der Sprite herstellt, oder der Endkonsument?


> Durch Veröffentlichungen im Bildungssektor weiß ich, dass viele Kinder
> Probleme mit den Wortendungen "el", "en" und "er" haben; "Wecker/Wecka",
> "Bilder/Bilda". 

Das betrifft aber hauptsächlich das Schreiben und Sprechen und ist ein
Problem des SchriftspachERWERBS. Es ist also bei der Mehrzahl der
Normalleser kein Problem.

> Wenn unsere Trennmuster in Kinder- und Jugendliteratur verwendet
> werden, kann es negativen Ergebnissen kommen. Es wird ein "a" gelesen,
> weil das nächste Wort aufgrund des Umbruchs nicht gesehen wird.

Sorgfältig gesetzte Kinderliteratur (und Ausgaben für leichtes Lesen)
sind ein Sonderanwendungsgebiet, die außer einer guten Wahl der
Schriftart auch eine spezielle Wahl der Trennmuster/des Trennalgorithmus
und die entsprechenden Nacharbeiten rechtfertigen.

> >>Wie willst du dem Programm den sonst sagen, dass er beim ersten Präfix
> >>diesen Wortes explizit nicht trennen soll, beim anderen schon?
> >
> >Mit regexp-replace: "=(..)[-<]"  -> "=\1" bei der Pattern-Extraktion vor dem
> >patgen-Lauf.
> >
> >Oder nur für "er": "=er[-<]"  -> "=er"

> Gut, wenn es dort keine Aufnahmen gibt..?

Eine Trennung im Abstand <=2 von Wortfugen ist immer ungünstig. 
Ich würde sie einer Trennung am Wortanfang oder -ende gleichstellen, d.h.
wenn die Mindestlänge von Wortanfängen/-enden bei 3 ist (TeX-Default), dann
sollte dies auch für den Mindestabstand von Wortfugen gelten.

Eine Trennung nach Wortfuge+"er" ist noch ungünstiger, da "-er" eine
geläufige Ableitungssilbe ist. Wie in Deinem Beispiel ist auch in Fällen
nicht belegter Ableitungen die Gefahr von Fehldeutungen gegeben .

Das gilt für alle 2654 Fälle von Aben-teu-er=er<zäh-lung bis
Zwi-schen=er<zeug>nis-ses, wenn auch in unterschiedlichem Maße
(stärker bei "Wohler-gehen" als bei "Abbuchungser-mächtigung").

> >Nein, wir sollten den Algorithmus verbessern.

> Meinst du libhyphen oder "unsere" Scripte?

*Wir* können nur unsere Skripte verbessern. Weder libhyphen noch patgen
nutzen die "Rohdaten" - im Gegensatz zum Original-TeX könnte libhyphen aber
vielleicht ebenfalls verbessert werden. Bis dahin können wir nur die
"normalen" Muster für den "Normalfall" optimieren und für spezielle
Anwendungsfälle spezielle Mustersätze anbieten.

viele Grüße
Günter



Mehr Informationen über die Mailingliste Trennmuster