[Trennmuster] Trennzeichen: Analyse und Wichtung Frakturschriften
Stephan Hennig
mailing_list at arcor.de
Do Feb 9 20:01:38 CET 2012
Am 02.02.2012 12:58, schrieb Guenter Milde:
> On 2.02.12, Werner LEMBERG wrote
>
> Der Vorschlag war:
>
>> > Da die Bildung zusammengesetzter Wörter rekursiv möglich ist, ist
>> > keine Begrenzung der "Gewichtsstufen" von Haupttrennstellen vorhanden.
>> > Wie wäre es mit einer rekursiven (und somit ebenso unbegrenzten)
>> > Auszeichung durch Verdoppelung anstelle der Wahl neuer Symbole:
>> >
>> > Holz++eisen+bahn
>> > Tank+stellen++besitzer
>> > Donau++dampf+schifffahrts+++gesellschaft
>> > ab==ge=half-tert
>
> In meinem Beispiel ging ich von 3 Klassen von Trennstellen aus:
>
> + zwischen Teilwörtern,
> = zwischen Vorsilbe und (Teil-) Wort,
> - innerhalb eines Wortes (Nebentrennstelle)
Ich schlage vor, wir beschränken uns zunächst auf diese drei Klassen
ohne strenge Wichtung gleicher Klassen. Für die Trennung zwischen
Teilwörtern schlage ich übrigens ^ vor. Das Zeichen hebt sich besser
von Kleinbuchstaben ab als + und |. Also:
Ab=än-de-rungs^vor=schlä-ge
Tank^stel-len^be=sit-zer
Nu-kle-ar^müll^wie-der=auf=be-rei-tungs^an-lage
Die 'wiederaufbereitung' schreit zwar nach einer genaueren Wichtung der
Vorsilbentrennungen. Allerdings sollten wir nicht versuchen, alles auf
einmal zu erledigen. Die Wörter mit mehreren (womöglich
aufeinanderfolgenden) = und ^ können in einem späteren Arbeitsschritt ja
einfach identifiziert werden. Was haltet ihr davon?
>> Genauso könnten wir Digraphen wie ».=« verwenden, damit eine zu
>> unterdrückende Trennstelle immer noch als Haupttrennstelle für »ſ«
>> erkenntlich ist.
Dem stimme ich zu. Da Unterdrückungen immer nur ästhetisch motiviert
sind, sollte die morphologische Klassifikation an solchen Stellen nicht
verloren gehen.
Außerdem wären verschiedene Grade an Unerwünschtheit wünschenswert.
Beispielsweise werden sinnentstellende und irreführende Trennungen
derzeit beide mit einem Punkt markiert. In Drucksachen mit schmalen
Kolumnen kann es jedoch durchaus nötig sein, nur sinnentstellende
Trennungen zu unterdrücken, irreführende Trennungen oder Trennstellen
sehr nahe einer höherwertigen Trennstelle aber weiterhin zu erlauben.
Urin-stinkt sinnentstellend
Elektro-nikriese irreführend
zukunftsge-richtet nahe einer sinnfälligen Trennung
Wobei ich denke, dass der letzte Fall in der Wortliste überhaupt nicht
markiert werden muss, sondern die Unterdrückung jeweils per Skript vor
Patgen oder gegebenenfalls in LuaTeX selbst erledigt werden kann.
(Hm, irgendwo meine ich _ schon einmal für den letzten Fall gesehen zu
haben. Die Wortliste scheint den Unterstrich derzeit aber gar nicht zu
enthalten. Dann ist das Beispiel 'zukunftsgerichtet' ohne Belang.)
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster