[Trennmuster] german.dic-Abgleich
Stephan Hennig
sh-list at posteo.net
Mi Apr 29 23:28:46 CEST 2015
Am 29.04.2015 um 13:55 schrieb Tobias Wendorff:
> Gibt es ein Script, welches die Pattern für jedes Wort der
> Wortliste auswirft?
Ich hatte so etwas mal im Dateibereich der alten
Google-Trennmuster-Gruppe abgelegt. Ich schicke dir das Archiv per PM,
aber ohne es mir nochmal angesehen zu haben.
Ansonsten kannst du, wie in dieser Diskussion schon gezeigt,
patternize.lua aus dem Padrinoma-Repositorium[1] mit der Option -v dazu
bewegen, die passenden Muster auszugeben. Diese Ausgabe könntest du mit
einem geeigneten Skript weiterverarbeiten.
Außerdem enthält das Padrinoma-Repositorium ein weiteres Beispiel
examples/lua/which_strings, welches für jedes Muster eines Mustersatzes
ermittelt, auf wieviele (und welche) Wörter es passt. Also eine Art
Umkehrung von patternize.lua.
$texlua which_strings.lua -p musterdatei < wortliste
> Oder müsste man Patgen auf jedes Wort anwenden?
Mit Patgen kann man eine Wortliste mit gegebenen Mustern lediglich
trennen. Die Zerlegungen behält es aber für sich.
Viele Grüße,
Stephan Hennig
[1] <URL:https://github.com/sh2d/padrinoma>
Mehr Informationen über die Mailingliste Trennmuster