[Trennmuster] Python-Skript wortzerlegung.py
Keno Wehr
wehr at abgol.de
Sa Okt 17 20:30:15 CEST 2020
Am 16.10.20 um 20:34 schrieb Guenter Milde:
>>> Wenn die Punkte in der Wortliste bleiben sollten, muss das Skript
>>> noch dazulernen...
>> Ja, bitte.
> Schon gemacht.
Danke!
Jetzt ist ein neues Problem entstanden: Es werden auch
Ungünstigkeitsmarker innerhalb eines Präfixes entfernt.
In der Zusatzliste „initialkonfixe“ haben wir „oe-.so“.
Dies kann mein Präfixkontrollskript jetzt nicht mehr in Übereinstimmung
mit „Oe-.so<pha-gus“ bringen, da wortzerlegung.py „oe-so“ ausgibt.
Man könnte natürlich einfach den Punkt aus der Zusatzliste entfernen,
aber ist der nicht vielleicht zu Kontrollzwecken ganz nützlich? Wenn
irgendwann mal „oe-so“ neben „oe-.so“ in der Wortliste steht, würde das
sonst durchrutschen.
Andererseits ist es natürlich möglich, dass in einem Präfix ein
Ungünstigkeitsmarker nur deshalb auftritt, weil die Trennstelle im
Zusammenhang mit einem vorangehenden Bestandteil einer Zusammensetzung
irreführend ist (zum Beispiel im hypothetischen „Wind=en-.do<plas-ma“);
dann wäre die Ausgabe des Punkts durch wortzerlegung.py eher
unerwünscht. So einen Fall scheint es aber derzeit nicht zu geben.
Was meint ihr?
Gruß
Keno
Mehr Informationen über die Mailingliste Trennmuster