[Trennmuster] Gojko M.

Stephan Hennig mailing_list at arcor.de
Sa Jun 14 13:54:36 CEST 2014


Am 12.06.2014 06:22, schrieb Werner LEMBERG:
> 
>> Entweder wir verzichten auf die korrekte Schreibung dieses Herren (Mitic
>> statt Mitić).
> 
> Lassen wir das doch fürs erste offen und schmeißen all diese
> nicht-deutschen Wörter in eine separate Datei – wenn überhaupt!  Ich
> meine, irgendwo müssen wir die Grenze ziehen, sonst fangen wir noch
> an, korrekte Trennstellen für Sanskrit-Wörter in Pāli oder
> lateinisiertes Arabisch zu entwickeln!

Es gibt einige Gründe, Herrn Mitić nicht zu ignorieren.

1. Vermutlich werden noch eine ganze Menge Texte über die jüngste
deutsche Geschichte geschrieben.  Herr Mitić hat regional eine mediale
Bekanntheit erreicht (seine Filme hatten auch eine, glücklicherweise
nicht im Vordergrund stehende, ideologische Funktion), die zumindest
eine Erwähnung dieses Mannes in kultur-historischen Texten nicht ganz
unwahrscheinlich macht.

2. Im Münchner Tatort gibt es eine Figur Ivo Batić (häufig auch Batic).

3. Gibt gerade die österreichische Geschichte nicht noch weiterer Namen
auf -ić her?


>> Nachteil der Cork-Kodierung ist die schlecht Unterstützung in
>> Editoren.  Das erschwert die Sichtprüfung von Patgens Ein- und
>> Ausgabe.
> 
> Nun ja, »make-full-pattern.sh« könnte durchaus die »pattmp.*«-Dateien
> automatisch wieder in UTF-8 zurückverwandeln.  Hmm, die Idee gefällt
> mir, ich denke, ich baue das ein :-)

Klingt gut.


>> Oder wir basteln uns selbst eine Kodierung, sinnvollerweise in
>> Anlehnung an ISO-8859-15.  Nachteil dieser Lösung wäre, dass wir
>> nicht mehr auf iconv zurückgreifen könnten, sondern was
>> selbstgestricktes benötigten.
> 
> Da »Cork« (auch »T1« genannt) eine Fontkodierung ist, wird es von
> iconv sowieso nicht abgedeckt...  Außerdem brauchen wir eine
> Modifikation davon, um »ſ« unterstützen zu können.
> 
> Beispielsweise könnte man »ſ« auf das Zeichen »£« legen:
> 
>   sed 's/ſ/£/g' \
>   | iconv -f utf-8 -t ISO-8859-15

Da sich die Schreibung des langen S aus der Trennung ableiten lässt, ist
ſ nicht signifikanter als die derzeitige Trennauszeichnung.  Daher meine
ich, dass /Patgen/ für reine Trennmuster ſ nicht kennen muss.

Viele Grüße,
Stephan Hennig




Mehr Informationen über die Mailingliste Trennmuster