[Trennmuster] [padrinoma] Beispiel zum langen s in LuaTeX
Stephan Hennig
sh-list at posteo.net
Do Dez 25 17:27:16 CET 2014
Am 25.12.2014 um 12:53 schrieb Guenter Milde:
>> make de-1901-Latf
>
>> erstellt und anschließend in 'gsub-long-s-de-1901.pat.txt' umbenannt
>> (gsub für glyph substitution).
>
> Aber warum "long-s" statt des standardmäßigen Sprachvariantenbezeichners
> Latf (latin script, fractur variant)?
Weil mir nicht klar war (und noch nicht ist), dass es sich dabei um
Standardbezeichner handelt. Ich habe deine vergangenen E-Mails
diesbezüglich offensichtlich nicht aufmerksam genug gelesen und werde
das alsbald nachholen. Kannst du trotzdem nochmal einen konkreten
Namensvorschlag machen (der 'gsub' analog zu 'hyph' enthält)?
>> 1. Doppel-s
>
>> Die Lang-s-Muster scheinen momentan besser zu funktionieren als die
>> Rund-s-Muster. Mit letzteren treten alle Varianten von Doppel-s vor
>> einer Morphemgrenze auf:
>
> In de-1901 (d.h. der bis 1996 gültigen Rechtschreibung kommt Doppel-S am
> (Teil-) Wortende nur in österreichischer Schreibung englischer Fremdwörter
> wie Boß und Miß vor. Sonst natürlich mit ß
>
>> ss - Schiessbude Schießbude (auch de-1996)
>> sſ - ausſer außer (auch de-1996)
>> ſſ - miſſverſtanden mißver...
>> ſs - Miſsgeſchick Mißge..
>
>> Die Muster scheinen noch etwas fehlerhaft zu sein.
>
> Sie decken de-1996 und de-CH einfach nicht mit ab.
Ich dachte an den "Krüppelsatz" ohne ß nach de-1901. Anwendungsfälle
wären der buchstabengetreue Satz vorhandener Texte, die ß -- aus welchen
Gründen auch immer -- nicht verwenden oder die Verwendung einer Schrift
oder Tastatur ohne ß. Soll ich die "Versalschreibungen" aus den
Beispielen herausnehmen oder kannst du die berücksichtigen?
>> 2. Musterausrichtung
>
>> Wenn ich mich recht erinnere, hatte Günter erwähnt, dass Patgen keine
>> Trennstellen am Wortende zulässt. Aus diesem Grund wird bei Verwendung
>> von Rund-s-Mustern (Datei pdnm_round-s-patterns.lua) nach dem letzten
>> Buchstaben eines Wortes stets eine künstliche Trennstelle eingefügt und
>> das runde s bleibt dort so erhalten.
>
>> Wenn ein auf Doppel-s (ſſ) folgender Vokal ausfällt, bleibt -- so weit
>> ich weiß -- die ſ-Schreibung davon unberührt (laſſ wie laſſe, eigentlich
>> mit Apostroph).
>
> Nur, wenn ein Apostroph folgt, also "ich lass' es", aber "Laß das!"
> Das gilt auch für einzel-s ("Ich les' aus Deinen Zeilen...")
Selbstverständlich! Zu der Wiedererkenntnis bin ich inzwischen auch
gekommen. :-)
Selbst der reformierten ß-Schreibung folgend, sah ich den Wald vor
lauter Bäumen nicht mehr. Hinzu kommt, dass das Apostroph, so meine
ich, in später traditioneller Rechtschreibung zum Teil optional wurde.
Dass es nicht generell optional wurde, hatte ich nicht mehr parat. Aber
klar, "lass" ist nach traditioneller Rechtschreibung nur mit Apostroph
möglich.
>> Das Problem ließe sich für beide Muster umgehen, indem die Position
>> /vor/ statt hinter rundem/langem s markiert würde. Spricht irgend etwas
>> dagegen?
>
> Einen Versuch mag dies wert sein. Aber wir müssen also den Sonderfall s'
> in jedem Falle extra bedenken. Für die Trennmuster ist im Deutschen der
> Apostroph nicht als Teil des Worts definiert (im Englischen schon). Wir
> müssen entscheiden, ob ' Teil der Muster werden soll, oder eine
> Zusatzregel/Nachbehandlung einfacher ist.
Da das Apostroph zwingend ist, könnte man sich bei der Glyphersetzung
tatsächlich daran orientieren.
Im Sinne der Wartbarkeit würde ich es aber vorziehen, wenn die
Regelkunde möglichst vollständig auf die Ebene der Mustererstellung
verlegt und möglichst wenig oder gar nicht mit der Musteranwendung
verquickt wird. Das Ideal sind stur anzuwendende Muster. Eine
Arbeitsteilung zwischen Musteranwendung (in LuaTeX) und Mustererstellung
(außerhalb) halte ich für einen großen Vorteil. Mein Votum geht daher
pro Apostroph-Letter.
>> 3. Mehrdeutige Wörter
>
>> Mehrdeutige Wörter werden vor der Mustergenerierung augenscheinlich
>> aussortiert (Option --drop-homonyms). Die Schreibung von Wörtern wie
>> Wachstube wird dadurch aus Anwendersicht unvorhersagbar. Ich denke, wir
>> sollten uns in solchen Fällen für eine formale Regel entscheiden,
>> entweder vorzugsweise mit 's' oder mit 'ſ'. Eine Betrachtung des
>> Einzelfalls halte ich nicht für sinnvoll. Gibt es Gründe, die eine oder
>> die andere Variante generell zu bevorzugen?
>
> Ich kenne nur Gründe, *keine* Variante generell zu bevorzugen.
Weder bei defensiver noch bei progressiver Ersetzung erwarte ich mehr
oder schlimmere Fehler als bei unspezifiziertem Verhalten. Dennoch
halte ich letztere Variante aus Anwendersicht für die schlechteste, weil
sie schlecht zu dokumentieren ist. Mir fällt zum Beispiel keine
positive Beschreibung dieses Verhaltens ein (ohne Verneinung). Das ist
zwar hinnehmbar, bleibt aber eine Falle mit Ankündigung.
Ich denke auch, dass stringentes Verhalten den Schreiber entlastet. Er
kann sich in bestimmten Fällen darauf verlassen, dass das Wort ohne
weiteres Zutun richtig geschrieben wird.
Fröhliche Weihnachten!
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster