[Trennmuster] neuer Arbeitsansatz
Werner LEMBERG
wl at gnu.org
Sa Nov 5 06:42:39 CET 2016
> Ob ansonsten zu jeder Schreibung oder nur zu jedem Wort ein Eintrag
> gewünscht ist hatte ich ja angefragt.
>
> Also, ob wir dann ggf. im "wortlisten" Zweig
>
> süß=sau-er;süß=sau-er;süss=sau-er;süss=sau-er;sü{ss/ss=s}au-er
>
> schreiben.
Das ist normalerweise nicht notwendig. Es würde der Eintrag
süß=sau-er
genügen, denn alle abgeleiteten Formen sind algorithmisch erzeugbar.
> Die Frage ist,
>
> * ob alle Felder eines Eintrags den gleichen "Schlüssel" haben
> sollen.
Ich schlage vor, im neuen internen Format darauf zu verzichten.
Grund: damit die Liste übersichtlicher wird, wollen wir ja automatisch
ableitbare Formen weglassen. Mein »a-z.pl«-Skript, an dem ich gerade
arbeite, wird Einträge im »wortlisten«-Format in diese neue,
kompaktere Form (hoffentlich) überführen können, sodaß beispielsweise
die drei Einträge
süßsauer;süß=sau-.er
süsssauer;-2-;-3-;-4-;süss=sau-.er
süssauer;-2-;-3-;-4-;-5-;-6-;-7-;sü{ss/ss=s}au-er
aufgrund des fehlenden ».« in »sü{ss/ss=s}au-er« in
süß=sau-.er;süß=sau-.er;süss=sau-.er;süss=sau-.er;sü{ss/ss=s}au-er
konvertiert werden.
Ich könnte auch versuchen, mein »wlgrep«-Skript intelligenter zu
machen, sodaß eine Suche nach »Haßliebe« den Eintrag »Hass=lie-be«
findet, der ja aufgrund der regelmäßig ableitbaren Form im neuen
Format fehlt.
> * ob Einträge die sich aus Einträgen mit anderem Schlüssel
> generieren lassen (z.B. -1-;Faß=brau-se aus Fass=brau-se)
> weggelassen werden können/sollen.
Ja, das sollte weggelassen werden.
Werner
Mehr Informationen über die Mailingliste Trennmuster