[Trennmuster] Ein-Buchstaben-Silben
Guenter Milde
milde at users.sf.net
Mi Mai 2 16:56:57 CEST 2018
Liebe Trennfreunde,
On 30.04.18, Keno Wehr wrote:
> Am 30.04.2018 um 14:44 schrieb Guenter Milde:
> >
> > > Ich gebe Dir völlig recht. Aber trotz Gleichwertigkeit der
> > > Trennstellen vor und nach Einvokalsilben sollte meiner Meinung nach
> > > standardmäßig nicht beides gleichzeitig im Text auftauchen
> > Warum? Was ist daran schlimmer, als gleichzeitiges Auftauchen anderer
> > legaler Trennalternativen (Schauspiele-rin aund Schauspie-lerin)?
...
> Wie Werner empfinde ich „The-ater“ und „Thea-ter“ in einem Text als
> ungünstig.
> „Schauspiele-rin“ und „Schauspie-lerin“ wären auch nicht besonders günstig,
> aber weniger ungünstig, da der Abstand der beiden Trennstellen etwas größer
> ist.
Ja, etwas ungünstig schon, aber nicht schlimmer als solche Sachen wie
Parkeisen-bahn, Atomeis-
brecher oder bebil-
derte Geschichten.
> Ich plädiere dafür, die Einteilung der Trennstile in „Trennstile.txt“ etwas
> zu überarbeiten, beispielsweise:
> – alle: wie bisher, doch nur der Vollständigkeit halber, ohne konkreten
> Anwendungszweck
Welche der möglichen Trennstile wir wirklich implementieren wollen ist
sowieso noch offen.
> – sehr schmalspaltig: Unterdrückung sehr ungünstiger Trennstellen
> – schmalspaltig: Unterdrückung ungünstiger Trennstellen
> – lesefreundlich: Unterdrückung ungünstiger Trennstellen, Unterdrückung von
> Trennstellen im Abstand von nur einem Buchstaben; dies als Standard für die
> TeX-Trennmuster
Ich finde das nicht lesefreundlich (siehe oben). Evt. könnte man es als
"ästhetisch" bezeichnen.
> – sehr lesefreundlich: zusätzlich Unterdrückung von Trennstellen in der Nähe
> von besseren Trennstellen (was noch zu spezifizieren ist)
Bezüglich der "Güte" von Trennstellen haben wir in README.wortliste schon
Gedanken gesammelt, aber es sind noch Feinarbeit und Tests nötig, um dies in
einen sinnvollen Algorithmus umzusetzen:
Ziel:
geringe Störung des Leseflusses bei Zeilenumbruch an dieser Stelle
Im Allgemeinen ist die Bindungsstärke umgekehrt proportional zur „Güte“
(oder dem „Gewicht“) einer Trennstelle:¹
Bindungsstärke Güte/Gewicht Beispiel
-------------- ----------------- -----------
schwach Vorzugstrennungen Auswahl-
liste
mittel mittel Aus-
wahlliste
stark weniger gut Auswahllis-
te
¹ In eine genauere „Gütebestimmung“ geht auch der Abstand zu anderen
Trennstellen und die Position im Wort ein.
Das mindeste wäre, Trennstellen im abstand von bis zu 2 (oder 3) Buchstaben
zu einer Trennstelle mit geringerer Bindungsstärke zu unterdrücken, also z.B.
Be<för-de-rungs=be<din-gun-gen -> Be-förde-rungs-bedingun-gen
Evt. müssen bei größeren Bindungsstärke- oder Kategorieunterschieden auch
größere Abstände berücksichtigt werden um z.B. die Trennung "Be-
gleitfahrzeug" zu vermeiden.
> – dazu Haupttrennstellen, Primärtrennstellen und Notentext wie bisher
> Das hieße allerdings, dass man eine neue Syntax für die Markierung der
> einbuchstabigen Silben braucht, um festzulegen, welche Trennmöglichkeit als
> lesefreundlicher gelten soll. Mit der bisherigen Markierungspraxis wären die
> Stile „schmalspaltig“ und „lesefreundlich“ wie oben vorgeschlagen nicht
> unterscheidbar. Evtl. würde auch schon eine mutigere Suffixauszeichnung
> helfen (s. u.).
Für "schmalspaltig" vs. "gegenwärtiger Stil" wäre die Implementierung der
schon dokumentierten Stufen der "Ungünstigkeit" nötig:
Besonders ungünstige Trennstellen können mit mehreren Punkten gekennzeichnet
sein.
Symbol Qualität Beispiele
------ ----------------- ------------------------------------
. ungünstig An<den-.ken, Ost=en-.de, Re<im<.port
.. sehr ungünstig Ge<winn=er<..war-tung
... äußerst ungünstig An<=al-...pha=bet
Vielleicht reicht das auch für die einvokalischen Silben ohne das wir noch
zusätzliche Syntax brauchen.
> >
> > Bei der Wichtung der einvokalischen Silben (fcc63ae286) hab ich an vielen
> > Stellen abweichende Vorstellungen:
> >
> > jetzt Vorschlag
> > ====================== =============================
> > adri-.a-tisch gleichwertig: adri-atisch adria-tisch
> Hier bin ich unentschlossen. Aufgrund einer möglichen Fehlinterpretation
> Adria-Tisch evtl. eher das erste.
Andererseits ist "adria-ti-sche" sowieso schon möglich und die
Verwechslungsgefahr beim Teil auf der neuen Zeile eher gering.
> > ga-li-lä-i-.sche galiläi-sche
> Ich bin aus zwei Gründen für „galilä-ische“:
> 1. „isch“ ist ein Suffix: „galilä>ische“
> 2. Die Grundform „galiläisch“ wird auch nach dem ä getrennt, nicht nach dem
> i. Somit wird für ein einheitliches Textbild gesorgt.
Andererseits ist "Ische" eher abwertend.
> > In der Wortliste sind jetzt ein ganzes Bündel Trennungen wie thei-
> > stisch (the-i-stisch), die bisher durch ableitung1901 (fälschlich)
> > herausgefiltert wurden. Da ist sicher teilweise auch noch eine
> > explizite Unterdrückung ungünstiger Trennstellen angesagt.
> Mein Vorschlag: AR nur the-istisch, NR the-is-tisch
> (Die Wortstruktur ist the>ist>isch. Das zweite Suffix wird für die Trennung
> ignoriert, also the>istisch.)
So ungefähr war es (atheistisch;-2-;athe-istisch;athe-is-tisch, etc.) aber
das entspricht nicht dem Sachstand, athei-stisch ist in de 1901 legal,
sollte also auch in der "wortliste" stehen. (Und in einem Liedtext muss auch
a-the-i-stisch getrennt werden.)
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster