[Trennmuster] "exotische" Buchstaben

Guenter Milde milde at users.sf.net
Mi Jun 18 10:49:28 CEST 2014


On 14.06.14, Werner LEMBERG wrote:

> > Es gibt einige Gründe, Herrn Mitić nicht zu ignorieren.

Ohne den Künstler zu ignorieren: So kurz wie der Name ist, bekommt es ihm
im Allgemeinen beser, ungetrennt zu sein. Da müssen wir keine
Falschschreibung aufnehmen und für diesen Einzelfall auch nicht unbedingt
anfangen eine eigene "patgen-Eingabekodierung" zu erfinden.

...

> > 3. Gibt gerade die österreichische Geschichte nicht noch weiterer Namen
> > auf -ić her?

> Massenhaft.  Und trotzdem will ich all diese Namen nicht in einer
> Liste von deutschen Wörtern wissen.  Und wenn's unbedingt sein muß,
> dann bitte ohne Diakritika, somithin »eingedeutscht« im weitesten
> Sinne.  In Wien gibt's beispielsweise ganz viele Leute, die »Dvorak«
> heißen, und keiner kommt auf die Idee, diesen Namen plötzlich wieder
> mit Hatschek [sic! und nicht »Háček«] zu schreiben.

Das sind dann aber zwei unterschiedliche Namen, genau wie Meier und
Maier. Falls wir also wirklich alle Namen, die in deutschen Texten
auftauchen (könnten) in die Liste aufnehmen wollen, dann bitte auch in
allen korrekten Varianten:

...
Dvorac
Dvorak
Dvořak
Gunter
Günter
Maier
Mayer
Mayr
Meier
Meir
Meyer
...
Mitic
Mitić
...

oder doch erst bei einer noch festzulegenden Häufigkeit der Nutzung des
Namens in Texten anzufangen. (Und dabei bedenken, daß z.B. in
Geschäftsbriefen diese Häufigkeiten deutlich anders sind als in
Zeitungsartikeln, wo Prominente halt prominent sind.)



> Also wenn ich einen deutschen Text mit »ſ« schreibe und dann XeTeX
> oder luatex drüberlaufen lassen will, sollte das schon korrekt
> getrennt werden, oder?

Ja.

> Wie ich in einer vorigen E-Mail gezeigt habe, ist das Erstellen
> passender Trennmuster dafür keine Hexerei.

Gennerell ja.
Wir können uns entscheiden, Lang-S-Schreibungen als Varianten
aufzunehmen (analog zu Oevre/Œvre).

> Ich habe das Gefühl, daß ihr nur an den komplizierten Fall denkt, wo
> Frakturschriften den Glyphen »ſ« auf dem Code von »s« legen, was ich
> für eine sehr schlechte Lösung halte.[*]

Mir geht es darum, ob der Trennalgorithmus überhaupt auf explizite
Lang-S-Muster angewiesen ist um Lang-S-Wörter zu trennen, schließlich

* sind die Trennstellen der entsprechenden Rund-S-Wörter exakt gleich,
* ist die Wandlung ſ->s trivial,
* haben wir auch keine Großschreibung bei den Mustern.

Für 8-bit TeX brauchen wir keine Lang-S-Muster. LuaTeX kann man
nebenwirkungsfrei "hinbiegen". Lohnt der Aufwand für die paar
XeTeX-Nutzer, die mit Unicode-Fonts Fraktur schreiben?

Viele Grüße

Günter



Mehr Informationen über die Mailingliste Trennmuster