[Trennmuster] Entscheidungsmuster für Binnen- und Schluss-S in Frakturschriften

Werner LEMBERG wl at gnu.org
Do Jan 12 07:34:04 CET 2012


From: Rolf Niepraschk <Rolf.Niepraschk at gmx.de>
To: Werner Lemberg <wl at gnu.org>
Date: Wed, 11 Jan 2012 23:37:47 +0100

>>> FALLS im Text der String Vosberg vorkommt, ERSETZE ihn in jedem
>>> Fall vor dem Latexen durch Vos+berg.
> 
>> Es ist richts ehrenrühriges daran, sowas mit einem Extraprogramm
>> (Perl, Python, Awk, Ruby, ...) zu machen.
> 
> In den meisten Fällen ist am Silbenende ein Schluß-s zu schreiben.
> Ausnahmen sind Doppel-s (und in neuer Rechtschreibung st und sp).
> Daher wäre es schön, wenn man den LaTeX-schen Trennalgorithmus
> verwenden könnte.

In der Tat :-)  Allerdings würde »Vosberg«, da ein Name, nicht
abgedeckt werden.

> Gibt es eigentlich ein deutsches Wörterbuch in elektronischer Form,
> daß für das lang-s den passenden Unicode-Character ſ verwendet?

So etwas ist mir nicht bekannt.  Die Idee, »ſ« in meine Wortliste
einzupflegen, wurde schon an mich herangetragen, und ich bin durchaus
willens und damit einverstanden, habe aber selbst derzeit keine Zeit
daran zu arbeiten.  Es muß sich halt jemand finden, der nach dem
Anbringen eines regulären Ausdrucks auf die ganze Liste (um »s« in »ſ«
zu verwandeln) die Fehleinträge sucht – bei 430000 Wörtern muß man
schon einiges Sitzfleisch mitbringen.  Allerdings kann man durch
weitere reguläre Ausdrücke so einiges ausscheiden (z.B. Wörter ohne
»s« oder »ſ« am Silbenende), es bleibt aber bestimmt mehr als genug zu
tun.


    Werner


Mehr Informationen über die Mailingliste Trennmuster