[Trennmuster] Entscheidungsmuster für Binnen- und Schluss-S in Frakturschriften

Stephan Hennig mailing_list at arcor.de
Di Feb 7 19:52:39 CET 2012


Am 07.02.2012 15:01, schrieb Guenter Milde:
> On  7.02.12, Stephan Hennig wrote:
> 
>> Ich hoffe wie gesagt, LuaTeX stellt für alle oben aufgezählte
>> Transformationen des Eingabestromes irgendwann entsprechende
>> Schnittstellen bereit, so dass die Ersetzungen nicht von Hand in irgend
>> welchen Hooks vorgenommen werden müssen.
> 
> Ich meinte mit Hook genau so eine Schnittstelle im Informationsfluß,
> die von Paketen für Spezialanwendungen (wie die s-ſ-Ersetzung) genutzt
> werden kann ohne daß die Spezifika im Kern von LuaTeX stecken müssen.

Welche Nachteile siehst du bei der Integration eines gewissen Kanons an
Textstromersetzungen in LuaTeX?  Die Pflege von sprachunterstützenden
Paketen würde das jedenfalls erleichtern.


>> Man könnte ein Kommando \longs definieren, welches analog zu
>> \hyphenation korrigierend auf s/ſ-Muster wirkt (ohne jegliche
>> Trennstellen zu enthalten).
> 
> Genau diese Doppelung (oder Tripelung, wenn dann auch noch Ligaturaufbrüche
> zu definieren sind) möchte ich  vermeiden.

Eine einfache Lösung fällt mir dafür momentan nicht ein.  Alles in ein
Ausnahmekommando zu stecken, würde wahrscheinlich zu einer unbenutzbaren
Syntax führen.  Allerdings vermute ich, dass s/ſ-Muster ebenso wie
Ligaturmuster sehr klein und treffsicher sein werden.  Es sind nur
jeweils ein Bruchteil der Wörter und n-Gramme aus der Wortliste
betroffen.  Ich hoffe und denke daher, dass Berichtigungen nur äußerst
selten notwendig werden.


>> Oh, an deinen Kode hatte ich gar nicht gedacht.  Den muss ich mir noch
>> einmal ansehen.  (Leider spreche ich Python nicht und habe Python hier
>> momentan auch nicht installiert.)
> 
> Ich hänge die Text-Fassung des Algorithmus an.

Schön!  Ich sehe gerade, dass das ursprüngliche Skript ja auch
vorbildlich dokumentiert ist.  :-)


> 
>> > Eine Umsetzung in Lua wäre sinnvoll, falls sich dann mehr Mitstreiter
>> > fänden.
> 
>> Ja.  Ich denke, im TeX-Umfeld wäre Lua der kleinere Nenner.
> 
> Wenn sich jemand findet, der mit der Portierung der
> Wortlisten-Verarbeitungsskripte von Perl nach Lua beginnt, erkläre ich
> mich bereit meinen Algorithmus ebenfalls zu Portieren.

+1

Zufälligerweise spreche ich auch Perl nicht.  Die extract*.pl-Skripten
würde ich mir jedoch zutrauen.  Das wäre mal ein Anlass, um mich in LPEG
einzuarbeiten.  Bis dahin können wir auch mit Python-Skripten leben.
Aber ein Zoo an Sprachen macht die Pflege nunmal nicht leichter.

Viele Grüße,
Stephan Hennig



Mehr Informationen über die Mailingliste Trennmuster