[Trennmuster] neuer Arbeitsansatz

Werner LEMBERG wl at gnu.org
Sa Nov 5 22:27:27 CET 2016


>> * ob alle Felder eines Eintrags den gleichen "Schlüssel" haben
>>   sollen.
>> * ob Einträge die sich aus Einträgen mit anderem Schlüssel
>>   generieren lassen (z.B. -1-;Faß=brau-se aus Fass=brau-se)
>>   weggelassen werden können/sollen.
> 
> Von mir zweimal ja.

Du meinst sicher nein/ja.  Mit »Schlüssel« ist gemeint, daß alle
Wörter in einer Zeile die exakt gleichen Buchstabenfolgen haben.
Besser ist aber, wenn alle *zugehörigen* Wortformen (so sie manuell
angegeben werden müssen) in einer Zeile stehen, so wie 

  süß=sau-.er;süß=sau-.er;süss=sau-.er;süss=sau-.er;sü{ss/ss=s}au-er

> Mir ist nicht klar, ob die Wortlisten der einzelnen Varietäten aus der
> (neuen) Urliste abgeleitet werden sollen oder aus der Langform?

Das ist im Prinzip egal – unsere derzeitigen Helferlein benützen die
»wortliste«-Datei, und das kann auch so bleiben.  Falls jemand Zeit
hat, kann man die Werkzeuge aufs neue Format umstellen.

> Hm.  Für die Erzeugung der Patgeneingabe wären Filter sinnvoll, die
> die Eingabe zeilenweise abarbeiten und das Ergebnis der
> Transformation für jede Eingabezeile in die Ausgabe schreibt.

Das haben wir schon: »extract-tex.pl«.

»Modularisierung« klingt nach viel Arbeit – wenn Du stattdessen
Kommandozeilenoptionen sagst, welche die Ausgabe kontrollieren, wird
alles leichter verständlich :-)

Das Wort »Filter«, so wie Du es verwendest, ist etwas irritierend,
denn im Prinzip sind fast alle Helferlein von Günter oder mir »Filter«
im UNIX-Sinne, d.h., sie lesen von der Standardeingabe und schreiben
zur die Standardausgabe.


    Werner




Mehr Informationen über die Mailingliste Trennmuster