[Trennmuster] Fehler in »abgleich_neueintraege.py«?

Guenter Milde milde at users.sf.net
Do Apr 12 12:54:09 CEST 2018


On 12.04.18, Werner LEMBERG wrote:
> >>    Aalmolchs;-2-;Aal=;Aal=molchs
> > 
> > Ist ein nicht berücksichtigter Spezialfall:
> > 
> > Die einzige Fundstelle des Teilworts "Molchs" ist der des
> > "Kamm-Molchs" mit den Einträgen
> > 
> >  Kammmolchs;-2-;-3-;Kamm=molchs
> > 
> >  Kammolchs;-2-;Ka{mm/mm=m}olchs;-4-
> > 
> > Auf das Parsen der Zwei-von-Drei-Konsonanten-Wörter habe ich
> > verzichtet (ist zu komplex und kommt zu selten vor).

> Ah, ok.

> > Nach dem Eintrag von 
> > 
> >  Molches;Mol-ches
> >  Molchs;Molchs
> > 
> > klappt es wie gewünscht.

Allerdings ist die Ausgabe des "halben" Wortes "Aal=" tatsächlich ein
Fehler, es sollte (zwar auch nicht korrekt aber "weniger falsch")

   Aalmolchs;-2-;-3-;Aal=molchs

sein. Das war eine Folge einer Umstellung in wortliste.py und ist jetzt
korrigiert.

Dennoch gilt weiterhin für alle Skripte in python/edit_tools:
  
  .. Achtung:: Experimentell
  
    Die Skripte wurden für die eigene Arbeit mit der Wortliste entwickelt und
    erfordern zum Teil Anpassungen im Quelltext, eine gewisse Einarbeitung,
    Lesen der enthaltenen Dokumentation und gegebenenfalls Rücksprachen mit
    dem Autor.


Speziell bei "abgleich_neueintraege" sind viele Heuristiken eingebaut, und
auch die Arbeitsweise lässt viele Falschbildungen zu. Die Ergebsse müssen
immer "von Hand" geprüft werden.

> Gut zu wissen, danke!  Ich hab' noch einige andere solcher Fälle
> gesehen; ich werd' mir das unter diesem Blickwinkel demnächst genauer
> anschauen.

Danke.

> > Kommit folgt.

Die Korrekturen sind jetzt im Repositorium.


Viele Grüße

Günter




Mehr Informationen über die Mailingliste Trennmuster