[Trennmuster] Makefile
Guenter Milde
milde at users.sf.net
Mo Jul 7 13:57:55 CEST 2014
On 6.07.14, Stephan Hennig wrote:
> Am 29.06.2014 23:19, schrieb Guenter Milde:
> > für Prüfzwecke und für die Zerlegung neuer Wörter an Fugen habe ich im
> > Makefile einen Versuch gestartet, "echte" Major-Muster zu generieren (aus
> > Disambiguationsgründen "fugen" genannt).
> Darf ich fragen, was du genau vorhast? Möchtest du Wortlisteneinträge
> mit Trennstellenkategorisierung trennmustergesteuert erstellen?
Auch. Und, wie geschrieben Prüfzwecke. Daher auch die Commits mit
"Konsistenzkorrekturen" bei der Markierung mit "=" vs. "<" oder ">".
> Ich habe lokal ein Lua-Skript, welches aus einer Datei mit einem Wort
> pro Zeile eine Liste im Wortlistenformat erstellt. Die Trennungen
> werden dabei mit den lokal installierten Trennmustern aus dem
> hyph-utf8-Paket ermittelt. Das Ergebnis kann nicht 1:1 in die
> Wortliste übernommen werden, da zum Beispiel Spezialtrennungen nicht
> markiert werden. Trennstellenkategorisierung müssen auch noch
> nachträglich vorgenommen werden. Allerdings ließe sich genau das mit
> entsprechenden Mustern auch automatisieren.
Genau das macht das Skript "hyphenate_neueintraege.py" - versuche für Wörter
oder Einträge die Trennstellen "kategorisiert" zu markieren. Es verwendet
die mit `make ...` erzeugten Pattern in den dehyph* Unterverzeichnissen des
wortliste-Wurzelverzeichnisses. Bei Spezialtrennungen gibt es natürlich
Beschränkungen:
* Alternativtrennungen werden (da in den pattern unterdrückt) nicht erkannt.
* Die Dreikonsonantenregel ist nicht berücksichtigt.
* Die ck-Regel klappt auch nicht (aber das ist kein Problem, weil
`prepare_patch.py neu` Fälle mit "c-k" erkennt und korrekt in de-1901
und de-1996 aufsplittet.
...
> Einen simples Programm zum Trennen von Wörtern -- pardon, zum
> Kennzeichen von sogenannten "Spots" in Wörtern, die ja eben auch etwas
> anderes als Trennstellen anzeigen können -- mit beliebigen Mustern ist
> ja bereits vorhanden.
Ist das eine Lua-Implementierung des TeX-Trennalgorithmus (ähnlich
skripte/python/hyphenation.py)?
> > Für Nicht-TeX-Anwendungen (apply-pattern.pl, hyphenation.py, OpenOffice,
> > ...) der generierten Muster sind die Verpackung in \patterns und die
> > \message hinderlich. Gebraucht wird das nur für das TeX-Paket dehyph-exptl.
> > Können wir ein Ziel einrichten, was diesen Wrapper wegläßt oder gibt es so
> > etwas schon?
> Gibt es bisher nicht. Wäre für Anwendungen/Tests des Padrinoma-Pakets
> aber auch sinnvoll.
Ich versuche mich dran, wenn die Zeit reicht.
Günter
Mehr Informationen über die Mailingliste Trennmuster