[Trennmuster] Makefile

Stephan Hennig mailing_list at arcor.de
So Jul 6 18:38:55 CEST 2014


Am 06.07.2014 16:03, schrieb Stephan Hennig:

> Um weitere Muster zu erstellen, müssen die Spaltenauswahl und die
> Ersetzung von beliebigen Markierungen in '-' sowieso logisch
> voneinander getrennt werden.  Ich habe mir noch keine weiteren
> Gedanken darüber gemacht, aber ich bastele schnell man ein kleines
> Extraktionsskript in Lua und stelle das dann hier zur weiteren 
> Diskussion.

Es scheint, das Skript extract-tex.pl sollte mit der Option -x genau das
tun, die Wörter einer bestimmten Rechtschreibung extrahieren und sonst
nichts:

> # -x  Ignoriere Optionen »-g« und »-u« und gebe die sprachspezifischen
> #     Felder unbearbeitet aus.

Allerdings erhalte ich nach einem Aufruf

  $perl extract-tex.pl -t wortliste > wortliste.trad

eine Datei wortliste.trad

1. mit bereits aufgelösten Spezialtrennungen.  Diese sind also nicht
mehr in der Form {.../...} vorhanden, so dass man die Liste für die
Erzeugung von Spezialtrennmustern weiter aufbereiten könnte.

2. mit seltsam kodierten Umlauten, weder Latin-irgendwas, noch UTF-8.
Kann das jemand nachvollziehen?

Viele Grüße,
Stephan Hennig




Mehr Informationen über die Mailingliste Trennmuster