[Trennmuster] Sind < und > wirklich gleichmächtig?
Werner LEMBERG
wl at gnu.org
Mi Apr 2 17:18:35 CEST 2014
> In der zweiten Näherung sollte z.B. die Zahl der Zeichen (oder
> Laute, dann wäre N("sch") = 1) vor/nach einer Trennstelle beachtet
> werden.
Das macht meine »-g n«-Option nicht.
>> Meine Frage hat nämlich einen konkreten Hintergrund: Ich habe
>> »extract-tex.pl« erweitert, sodaß Option »-g n« nur die n besten
>> Trennungen zurückliefert.
>
> Ich denke, daß dies ein wenig praktikabler Ansatz ist. Für Fälle wie
> Trennungen in Webbrowsern (oder generell bei linksbündigem Text) ist
> meines Erachtens eher ein "die besten Trennstellen mit höchstens N
> Zeichen Abstand" wichtig, denn sonst hätten wir
>
> Hu-
> mus
>
> neben
>
> Altersteilzeit-
> regelung
>
> und schlimmeren...
Das ist nicht die Richtung, die mir vorschwebt. Meine Idee ist es,
Haupttrennstellmuster verschiedener Qualität zu erzeugen. Ein erster
Durchgang verwendet »optimale« Trennungen, der zweite Durchgang »gute«
Trennungen, und ein dritter Durchgang dann alle möglichen Trennungen.
Es werden also Penalties (oder Demerits) für Trennstellen vergeben.
Auf diese Weise kann sicher gestellt werden, daß »Hu-mus« (mit einer
gewöhnlichen Trennstelle) nicht »so gerne« getrennt wird wie
»Altersteilzeit-regelung«, wo eine optimale Trennstelle auftritt.
> * mindestens 3 (oder 4?) Zeichen vor der ersten Trennstelle
Kein guter Ansatz im allgemeinen:
un-
gewöhnlich
ist eine hervorragende Trennung.
> * mindestens 4 Zeichen Abstand zu einer schwächer bindenden
> Trennstelle, selbst wenn diese aus anderen Gründen (z.B. zu weit
> vorn) entfällt (Damit fällt Mitver + antwortlichkeit raus, weil
> Präfix rechtsbindend ist.)
Ja, ich denke aber, daß das ein weiterer Verarbeitungsschritt ist
*nach* der Erstellung von Trennmustern, denn er hängt sehr von der
Umgebung ab – für schmale Spalten braucht man beispielsweise auch
nahestehende Trennungen. Mein Motto: Lieber eine suboptimale Trennung
als ein übergroßer Abstand zweier Wörter, was typographisch extrem
schlecht ausschaut.
>> Andererseits haben wir
>
>> un<wirt>schaft>lich -> un<wirtschaftlich
>
> Hier könnte evt. un<<wirt>schaft>lich hin oder un<=wirt... hin.
Genau. »<<« finde ich ganz gut.
Werner
Mehr Informationen über die Mailingliste Trennmuster