[Trennmuster] Datenstruktur

Stephan Hennig mailing_list at arcor.de
Mi Apr 2 23:46:01 CEST 2014


Am 02.04.2014 22:29, schrieb Georg Pfeiffer:

>  >> Mir ist so etwas nur leider nicht bekannt.
> 
> Das ist doch trivial und können wir selber machen, wenn man nur die Grundform 
> hat. Löschen wir probeweise alle .*>li-ch.+ -formen, das müßten um die 9000 
> seyn, und lassen nur die .+>lich\b stehen und fügen dann per Skript die (auf 1 
> lich etwa 15) Ableitungen wieder ein und sehen, wie das Ergebnis aussieht. Es 
> müßten danach etwas mehr Worte als vorher seyn, da bislang nicht alle Formen 
> drin sind.

   verblich
   verblichem
   verblichen
   verbliches


> Die Präfigierung wäre wohl doch nicht ganz so trivial, weil wir erst mal 
> feststellen müßten, welche Präfixe zu welchen Wortgruppen passen.

Ich denke, es ginge in keinem Fall ohne zusätzliche Auszeichnung.  Das
Problem mit der automatischen Präfixbildung ist, dass wir nicht einfach
auf alle Wortformen eines Grundwortes zugreifen können.  Die Wortliste
stellt keine Beziehungen zwischen den Wörtern her.  Anderenfalls könnte
man zum Beispiel per

  an|ab|hin|her|kommen

sämtliche Wortformen von 'kommen' mit den jeweils vorangestellten
Präfixen an, ab, hin, her erzeugen lassen.

Viele Grüße,
Stephan Hennig




Mehr Informationen über die Mailingliste Trennmuster