[Trennmuster] neuer Arbeitsansatz
Werner LEMBERG
wl at gnu.org
Sa Nov 5 22:27:27 CET 2016
>> * ob alle Felder eines Eintrags den gleichen "Schlüssel" haben
>> sollen.
>> * ob Einträge die sich aus Einträgen mit anderem Schlüssel
>> generieren lassen (z.B. -1-;Faß=brau-se aus Fass=brau-se)
>> weggelassen werden können/sollen.
>
> Von mir zweimal ja.
Du meinst sicher nein/ja. Mit »Schlüssel« ist gemeint, daß alle
Wörter in einer Zeile die exakt gleichen Buchstabenfolgen haben.
Besser ist aber, wenn alle *zugehörigen* Wortformen (so sie manuell
angegeben werden müssen) in einer Zeile stehen, so wie
süß=sau-.er;süß=sau-.er;süss=sau-.er;süss=sau-.er;sü{ss/ss=s}au-er
> Mir ist nicht klar, ob die Wortlisten der einzelnen Varietäten aus der
> (neuen) Urliste abgeleitet werden sollen oder aus der Langform?
Das ist im Prinzip egal – unsere derzeitigen Helferlein benützen die
»wortliste«-Datei, und das kann auch so bleiben. Falls jemand Zeit
hat, kann man die Werkzeuge aufs neue Format umstellen.
> Hm. Für die Erzeugung der Patgeneingabe wären Filter sinnvoll, die
> die Eingabe zeilenweise abarbeiten und das Ergebnis der
> Transformation für jede Eingabezeile in die Ausgabe schreibt.
Das haben wir schon: »extract-tex.pl«.
»Modularisierung« klingt nach viel Arbeit – wenn Du stattdessen
Kommandozeilenoptionen sagst, welche die Ausgabe kontrollieren, wird
alles leichter verständlich :-)
Das Wort »Filter«, so wie Du es verwendest, ist etwas irritierend,
denn im Prinzip sind fast alle Helferlein von Günter oder mir »Filter«
im UNIX-Sinne, d.h., sie lesen von der Standardeingabe und schreiben
zur die Standardausgabe.
Werner
Mehr Informationen über die Mailingliste Trennmuster