[Trennmuster] Python-Skript wortzerlegung.py

Keno Wehr wehr at abgol.de
Sa Okt 17 20:30:15 CEST 2020


Am 16.10.20 um 20:34 schrieb Guenter Milde:
>>> Wenn die Punkte in der Wortliste bleiben sollten, muss das Skript
>>> noch dazulernen...
>> Ja, bitte.
> Schon gemacht.

Danke!

Jetzt ist ein neues Problem entstanden: Es werden auch 
Ungünstigkeitsmarker innerhalb eines Präfixes entfernt.
In der Zusatzliste „initialkonfixe“ haben wir „oe-.so“.
Dies kann mein Präfixkontrollskript jetzt nicht mehr in Übereinstimmung 
mit „Oe-.so<pha-gus“ bringen, da wortzerlegung.py „oe-so“ ausgibt.

Man könnte natürlich einfach den Punkt aus der Zusatzliste entfernen, 
aber ist der nicht vielleicht zu Kontrollzwecken ganz nützlich? Wenn 
irgendwann mal „oe-so“ neben „oe-.so“ in der Wortliste steht, würde das 
sonst durchrutschen.

Andererseits ist es natürlich möglich, dass in einem Präfix ein 
Ungünstigkeitsmarker nur deshalb auftritt, weil die Trennstelle im 
Zusammenhang mit einem vorangehenden Bestandteil einer Zusammensetzung 
irreführend ist (zum Beispiel im hypothetischen „Wind=en-.do<plas-ma“); 
dann wäre die Ausgabe des Punkts durch wortzerlegung.py eher 
unerwünscht. So einen Fall scheint es aber derzeit nicht zu geben.

Was meint ihr?

Gruß
Keno



Mehr Informationen über die Mailingliste Trennmuster