[Trennmuster] german.dic-Abgleich

Stephan Hennig sh-list at posteo.net
Mi Apr 29 23:28:46 CEST 2015


Am 29.04.2015 um 13:55 schrieb Tobias Wendorff:

> Gibt es ein Script, welches die Pattern für jedes Wort der
> Wortliste auswirft?

Ich hatte so etwas mal im Dateibereich der alten
Google-Trennmuster-Gruppe abgelegt.  Ich schicke dir das Archiv per PM,
aber ohne es mir nochmal angesehen zu haben.

Ansonsten kannst du, wie in dieser Diskussion schon gezeigt,
patternize.lua aus dem Padrinoma-Repositorium[1] mit der Option -v dazu
bewegen, die passenden Muster auszugeben.  Diese Ausgabe könntest du mit
einem geeigneten Skript weiterverarbeiten.

Außerdem enthält das Padrinoma-Repositorium ein weiteres Beispiel
examples/lua/which_strings, welches für jedes Muster eines Mustersatzes
ermittelt, auf wieviele (und welche) Wörter es passt.  Also eine Art
Umkehrung von patternize.lua.

  $texlua which_strings.lua -p musterdatei < wortliste


> Oder müsste man Patgen auf jedes Wort anwenden?

Mit Patgen kann man eine Wortliste mit gegebenen Mustern lediglich
trennen.  Die Zerlegungen behält es aber für sich.

Viele Grüße,
Stephan Hennig

[1] <URL:https://github.com/sh2d/padrinoma>




Mehr Informationen über die Mailingliste Trennmuster