[Trennmuster] neuer Arbeitsansatz

Werner LEMBERG wl at gnu.org
Sa Nov 5 06:42:39 CET 2016


> Ob ansonsten zu jeder Schreibung oder nur zu jedem Wort ein Eintrag
> gewünscht ist hatte ich ja angefragt.
> 
> Also, ob wir dann ggf. im "wortlisten" Zweig
> 
> süß=sau-er;süß=sau-er;süss=sau-er;süss=sau-er;sü{ss/ss=s}au-er
> 
> schreiben.

Das ist normalerweise nicht notwendig.  Es würde der Eintrag

  süß=sau-er

genügen, denn alle abgeleiteten Formen sind algorithmisch erzeugbar.

> Die Frage ist, 
> 
> * ob alle Felder eines Eintrags den gleichen "Schlüssel" haben
>   sollen.

Ich schlage vor, im neuen internen Format darauf zu verzichten.
Grund: damit die Liste übersichtlicher wird, wollen wir ja automatisch
ableitbare Formen weglassen.  Mein »a-z.pl«-Skript, an dem ich gerade
arbeite, wird Einträge im »wortlisten«-Format in diese neue,
kompaktere Form (hoffentlich) überführen können, sodaß beispielsweise
die drei Einträge

  süßsauer;süß=sau-.er
  süsssauer;-2-;-3-;-4-;süss=sau-.er
  süssauer;-2-;-3-;-4-;-5-;-6-;-7-;sü{ss/ss=s}au-er

aufgrund des fehlenden ».« in »sü{ss/ss=s}au-er« in

  süß=sau-.er;süß=sau-.er;süss=sau-.er;süss=sau-.er;sü{ss/ss=s}au-er

konvertiert werden.

Ich könnte auch versuchen, mein »wlgrep«-Skript intelligenter zu
machen, sodaß eine Suche nach »Haßliebe« den Eintrag »Hass=lie-be«
findet, der ja aufgrund der regelmäßig ableitbaren Form im neuen
Format fehlt.

> * ob Einträge die sich aus Einträgen mit anderem Schlüssel
>   generieren lassen (z.B. -1-;Faß=brau-se aus Fass=brau-se)
>   weggelassen werden können/sollen.

Ja, das sollte weggelassen werden.


    Werner




Mehr Informationen über die Mailingliste Trennmuster