[Trennmuster] Makefile
Stephan Hennig
mailing_list at arcor.de
So Jul 6 18:38:55 CEST 2014
Am 06.07.2014 16:03, schrieb Stephan Hennig:
> Um weitere Muster zu erstellen, müssen die Spaltenauswahl und die
> Ersetzung von beliebigen Markierungen in '-' sowieso logisch
> voneinander getrennt werden. Ich habe mir noch keine weiteren
> Gedanken darüber gemacht, aber ich bastele schnell man ein kleines
> Extraktionsskript in Lua und stelle das dann hier zur weiteren
> Diskussion.
Es scheint, das Skript extract-tex.pl sollte mit der Option -x genau das
tun, die Wörter einer bestimmten Rechtschreibung extrahieren und sonst
nichts:
> # -x Ignoriere Optionen »-g« und »-u« und gebe die sprachspezifischen
> # Felder unbearbeitet aus.
Allerdings erhalte ich nach einem Aufruf
$perl extract-tex.pl -t wortliste > wortliste.trad
eine Datei wortliste.trad
1. mit bereits aufgelösten Spezialtrennungen. Diese sind also nicht
mehr in der Form {.../...} vorhanden, so dass man die Liste für die
Erzeugung von Spezialtrennmustern weiter aufbereiten könnte.
2. mit seltsam kodierten Umlauten, weder Latin-irgendwas, noch UTF-8.
Kann das jemand nachvollziehen?
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster