[Trennmuster] Einschübe
Guenter Milde
milde at users.sf.net
Mo Jun 15 12:20:06 CEST 2020
On 15.06.20, Werner LEMBERG wrote:
> > Allerdings haben wir damit keine Möglichkeit, den Unterschied von
> > eingeschobenem "zu" zu verschachtelt vorgesetztem "zu" zu markieren:
> >
> > an<zu<geben # (an- + -zu- + geben) < (an- + geben) + -zu-
> >
> > vs.
> >
> > un<zu<reichend # (un- + (zu- + reichend)) < un + (zureichend)
> >
> > Mit
> >
> > an=zu=geben
> >
> > wäre der Unterschied klar.
> OK. Ehrlich gesagt wäre es mir aber trotzdem lieber, wenn die
> Kategorisierung des Originalwortes erhalten bliebe, und daß Einschübe
> irgendwie markiert werden, z.B.
> an<(zu<)ge-ben
> oder
> an<ZU<ge-ben
> (wobei ich Lösungen wie das erstere favorisiere). Ich weiß, ich weiß,
> das würde wohl die Notwendigkeit von mehr Syntax verlangen, und das
> mag wirklich niemand, aber es würde bei der automatisierten
> Bearbeitung der Liste helfen.
Hypothesen:
* Diese Einschübe gibt es nur mit "ge" und "zu".
* Bei den 16400x "<ge<" gibt es nur Einschübe und keine
Verschachtelungen (PRÄFIX + ( ge- + STAMM)).
Für jedes "PRÄFIX <ge< STAMM" gibt es ein "PRÄFIX < STAMM".
* Bei den 5600x "<zu<" gibt es Fälle mit "PRÄFIX <zu< STAMM", wo
"PRÄFIX < STAMM" nicht existiert (un<zu<reichend aber nicht
un<reichend). Das ist dann kein Einschub, sondern eine Verschachtelung
(un- + (zu- + reichend).
* Die Verschachtelungen mit zu sind deutlich seltener als die Einschübe.
Wenn diese Hypothesen stimmen, könnten wir die komplexere Auszeichnung
für die Ausnahmen (Verschachtelungen mit <zu<) vornehmen:
* "<ge<" und "<zu<" kennzeichnen Einschübe
(Ausnahmeregel zur Assoziatät von "<").
"<<zu<" kennzeichnet eine Verschachtelung mit zu: un<<zu<reichend
Weitere Auszeichnungslternativen:
"|" als „symmetrisch assoziatives Präfixtrennzeichen“:
an|zu|geben ab|ge|legen
[X>] als „Einschub-Block“:
an<[zu<]geben ab<[ge<]legen
+1 […] ist schon als Sonderzeichen etabliert ([X/Y] == Trennalternative)
Solange wir keine Trennmuster mit hyphenmin3 anbieten und wenn dann solange
wir nicht "unzu-
reichnd" als deutlich ungünsig ansehen, können wir es auch erst einmal so
lassen wie es jetzt ist.
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster