[Trennmuster] "exotische" Buchstaben

Werner LEMBERG wl at gnu.org
Do Jun 19 07:15:07 CEST 2014


>> Was genau meinst Du mit »Varianten«?
> 
> Ich meine Schreibvarianten, die beide orthographisch zulässig sind,
> wobei je nach Anwendungsfall ("alte" (Antiqua) oder "neue"
> (gebrochene) Schrift) die eine oder andere zu verwenden
> ist. Anstelle zweier neuen Spalten 'de-1901-Latf' und 'de-1996-Latf'
> wird die Skriptvariante in die entsprechenden vorhandenen Spalten
> einsortiert:
> 
>   essen;es-sen
>   eſſen;eſ-ſen
>   hasten;-2-;ha-sten;has-ten
>   haſten;-2-;ha-ſten;haſ-ten

Ja, ganz genau, so habe ich die Muster mit »ſ« erstellt.  Und in
»wortliste« können wir alle ſ-Wörter weglassen, da Dein
»s2long-s«-Skript diese erzeugt.

> Adelung vs. Heise kenne ich nur von der ß-Schreibung.  Kannst Du das
> präzisieren?

Das hab' ich schlampig formuliert, pardon.  Gemeint habe ich, daß »ſ«
bei Wörtern wie »Graſsoden« beim Lesen hilft.

> Wenn der Aufwand wirklich gering ist, spricht vor allem die
> Einfachheit (keine neuen Mustersets, "works out of the box") für die
> Aufnahme der Lang-S-Varianten.

Ja, automatisch generiert mithilfe Deines Skripts.

[Du schreibst oft »Mustersets«, wenn Du die Liste an *Eingabewörtern*
 für patgen meinst, richtig?  Da »Trennmuster« die *Ausgabe* von
 patgen ist, verwirrt mich das manchmal.]

> Ist wirklich patgen deutlich langsamer, oder evt. der Vorlauf zum
> Generieren und "Einbasteln" der Lang-S Eingabemuster?

patgen ist deutlich langsamer, weil es ca. 200000 Wörter mehr zu
verarbeiten hat (nämlich die Ausgabe von »longs-s«)...

> Während `patgen` ja nur selten (und schon gar nicht bei jedem)
> läuft, ist zu überlegen/prüfen, inwieweit sich der größere
> Mustersatz auf die Dauer eines (La)TeX-Laufes beim Setzen "normaler"
> Texte auswirkt.  Wenn der Unterschied vernachlässigbar ist, bin ich
> für die Aufnahme der Lang-S-Varianten.

Wie erwähnt, wächst die Anzahl von Mustern um ca. 13%, und generell
ist die Geschwindigkeit des Trennalgorithmus praktisch nicht von der
Mustergröße abhängig, daher ist dieser Aspekt vernachlässigbar.


    Werner




Mehr Informationen über die Mailingliste Trennmuster