[Trennmuster] "exotische" Buchstaben
Werner LEMBERG
wl at gnu.org
Do Jun 19 07:15:07 CEST 2014
>> Was genau meinst Du mit »Varianten«?
>
> Ich meine Schreibvarianten, die beide orthographisch zulässig sind,
> wobei je nach Anwendungsfall ("alte" (Antiqua) oder "neue"
> (gebrochene) Schrift) die eine oder andere zu verwenden
> ist. Anstelle zweier neuen Spalten 'de-1901-Latf' und 'de-1996-Latf'
> wird die Skriptvariante in die entsprechenden vorhandenen Spalten
> einsortiert:
>
> essen;es-sen
> eſſen;eſ-ſen
> hasten;-2-;ha-sten;has-ten
> haſten;-2-;ha-ſten;haſ-ten
Ja, ganz genau, so habe ich die Muster mit »ſ« erstellt. Und in
»wortliste« können wir alle ſ-Wörter weglassen, da Dein
»s2long-s«-Skript diese erzeugt.
> Adelung vs. Heise kenne ich nur von der ß-Schreibung. Kannst Du das
> präzisieren?
Das hab' ich schlampig formuliert, pardon. Gemeint habe ich, daß »ſ«
bei Wörtern wie »Graſsoden« beim Lesen hilft.
> Wenn der Aufwand wirklich gering ist, spricht vor allem die
> Einfachheit (keine neuen Mustersets, "works out of the box") für die
> Aufnahme der Lang-S-Varianten.
Ja, automatisch generiert mithilfe Deines Skripts.
[Du schreibst oft »Mustersets«, wenn Du die Liste an *Eingabewörtern*
für patgen meinst, richtig? Da »Trennmuster« die *Ausgabe* von
patgen ist, verwirrt mich das manchmal.]
> Ist wirklich patgen deutlich langsamer, oder evt. der Vorlauf zum
> Generieren und "Einbasteln" der Lang-S Eingabemuster?
patgen ist deutlich langsamer, weil es ca. 200000 Wörter mehr zu
verarbeiten hat (nämlich die Ausgabe von »longs-s«)...
> Während `patgen` ja nur selten (und schon gar nicht bei jedem)
> läuft, ist zu überlegen/prüfen, inwieweit sich der größere
> Mustersatz auf die Dauer eines (La)TeX-Laufes beim Setzen "normaler"
> Texte auswirkt. Wenn der Unterschied vernachlässigbar ist, bin ich
> für die Aufnahme der Lang-S-Varianten.
Wie erwähnt, wächst die Anzahl von Mustern um ca. 13%, und generell
ist die Geschwindigkeit des Trennalgorithmus praktisch nicht von der
Mustergröße abhängig, daher ist dieser Aspekt vernachlässigbar.
Werner
Mehr Informationen über die Mailingliste Trennmuster