[Trennmuster] Gojko M.

Guenter Milde milde at users.sf.net
Sa Jun 14 22:14:32 CEST 2014


On 14.06.14, Georg Pfeiffer wrote:

Einen Unicode-fähigen patgen halte ich für sinnvoll, aber die Aufnahme
fremdsprachiger Wörter und Namen in die deutsche Trennmusterliste sehe ich
kritisch. Das mag in Ausnahmefällen häufig gebrauchter Namen sinnvoll sein,
würde aber bei kritikloser Übernahme zu Problemen und schlechterer Trennung
nicht erfaßter deutscher Wörter führen, da Regelmäßigkeiten der deutschen
Sprache durchbrochen werden.

> Ich habe manchmal Texte mit (u. U. langen) griechischen Zitaten. Die
> Worte habe ich dann in eine lokale Ergänzungsliste geschrieben und
> schlaumeyerlich „make pattern-trad“ drüberlaufen lassen. Hat aber
> leider nicht funktioniert. In TeX kann man ja im Text die Sprache
> umschalten, aber ich arbeite an HTML-Texten, für die ich mit
> make-hyphenlist.sh die Trennstellen hole und dann mit Suchen und
> Ersetzen einfüge. Es wäre schon toll, wenn das auch mit exotischen
> Textschnipseln funktionierte.

Auch in HTML kann man die Sprache eines Textteils markieren. (Das ist
wichtig, damit z.B. ein "screenreader" fremdsprachige Zitate auch richtig
ausspricht.)

Ein "HTML-Hyphenator" sollte also (wie in TeX) nicht nur die
Dokumentsprache, sondern (wenn angegeben) auch die Sprache des aktuellen
Elements berücksichtigen und entsprechende Trennmuster wählen. (Während
Deutsch und Russisch oder Griechisch (in Griechischer Schrift) ja noch
ko-existieren können, ist es z.B. bei englischen oder französischen Zitaten
sonst unmöglich, eine korrekte Trennung zu implementieren.


Günter



Mehr Informationen über die Mailingliste Trennmuster