[Trennmuster] Makefile

Guenter Milde milde at users.sf.net
Mo Jul 7 13:57:55 CEST 2014


On  6.07.14, Stephan Hennig wrote:
> Am 29.06.2014 23:19, schrieb Guenter Milde:


> > für Prüfzwecke und für die Zerlegung neuer Wörter an Fugen habe ich im
> > Makefile einen Versuch gestartet, "echte" Major-Muster zu generieren (aus
> > Disambiguationsgründen "fugen" genannt).

> Darf ich fragen, was du genau vorhast?  Möchtest du Wortlisteneinträge
> mit Trennstellenkategorisierung trennmustergesteuert erstellen?

Auch. Und, wie geschrieben Prüfzwecke. Daher auch die Commits mit
"Konsistenzkorrekturen" bei der Markierung mit "=" vs. "<" oder ">".

> Ich habe lokal ein Lua-Skript, welches aus einer Datei mit einem Wort
> pro Zeile eine Liste im Wortlistenformat erstellt.  Die Trennungen
> werden dabei mit den lokal installierten Trennmustern aus dem
> hyph-utf8-Paket ermittelt.  Das Ergebnis kann nicht 1:1 in die
> Wortliste übernommen werden, da zum Beispiel Spezialtrennungen nicht
> markiert werden. Trennstellenkategorisierung müssen auch noch
> nachträglich vorgenommen werden.  Allerdings ließe sich genau das mit
> entsprechenden Mustern auch automatisieren.

Genau das macht das Skript "hyphenate_neueintraege.py" - versuche für Wörter
oder Einträge die Trennstellen "kategorisiert" zu markieren. Es verwendet
die mit `make ...` erzeugten Pattern in den dehyph* Unterverzeichnissen des
wortliste-Wurzelverzeichnisses. Bei Spezialtrennungen gibt es natürlich
Beschränkungen:

* Alternativtrennungen werden (da in den pattern unterdrückt) nicht erkannt.

* Die Dreikonsonantenregel ist nicht berücksichtigt.

* Die ck-Regel klappt auch nicht (aber das ist kein Problem, weil
  `prepare_patch.py neu` Fälle mit "c-k" erkennt und korrekt in de-1901
  und de-1996 aufsplittet.

...

> Einen simples Programm zum Trennen von Wörtern -- pardon, zum
> Kennzeichen von sogenannten "Spots" in Wörtern, die ja eben auch etwas
> anderes als Trennstellen anzeigen können -- mit beliebigen Mustern ist
> ja bereits vorhanden.

Ist das eine Lua-Implementierung des TeX-Trennalgorithmus (ähnlich
skripte/python/hyphenation.py)?

> > Für Nicht-TeX-Anwendungen (apply-pattern.pl, hyphenation.py, OpenOffice,
> > ...) der generierten Muster sind die Verpackung in \patterns und die
> > \message hinderlich. Gebraucht wird das nur für das TeX-Paket dehyph-exptl.
> > Können wir ein Ziel einrichten, was diesen Wrapper wegläßt oder gibt es so
> > etwas schon?

> Gibt es bisher nicht.  Wäre für Anwendungen/Tests des Padrinoma-Pakets
> aber auch sinnvoll.

Ich versuche mich dran, wenn die Zeit reicht.

Günter



Mehr Informationen über die Mailingliste Trennmuster