[Trennmuster] Seltsames Verhalten von `abgleich-neueintraege.py`
Werner LEMBERG
wl at gnu.org
Do Apr 9 11:32:20 CEST 2020
Hallo Arthur!
> Das passiert ganz oft und erklärt viele anscheinend erstaunliche
> Einträge im Ergebnis des Skriptes. Ich schlage vor, die Zeilen
>
> e1.complete()
> e2.complete()
>
> durch
>
> e1 = e1.completed()
> e2 = e2.completed()
>
> zu ersetzen, die eine Kopie der jeweiligen Worteile ausgeben,
> anstatt sie an der Stelle zu verändern. Das korrigiert ganz viele
> Fehler und ich habe keinen Unterschied mit der Laufzeit gemerkt
> (61-62 Minuten auf meinem Server).
Danke für Deine Analyse – ich bin sicher, sie hilft Günter weiter.
Allerdings glaube ich nicht, daß dieser Patch korrekt ist. Nach einem
Durchlauf von »german.dic« mit Deinen Änderungen (angewandt auf Commit
54c6cf50) zu sehe ich im diff beispielsweise Einträge wie
-Aalkasten;-2-;Aal=ka-sten;Aal=kas-ten
+Aalkasten;-2-
> [Günter] Ich habe es so in ed7f03b5218cd451 übernommen.
Hmm, ich sehe den Commit nicht. Fehlt vielleicht ein »git push«?
Stand 54c6cf50 hat auch Probleme. Im Vergleich zu den letzten
Änderungen am Skript im git ergibt sich jetzt
-Abdichtungstechniken;Ab<dich-tungs=tech-ni-ken
+Abdichtungstechniken;Ab<dich-tungs=tech-n-iken .
bei einem Komplettdurchlauf von »german.dic«. Anscheinend stimmt
irgendwas nicht mit »...iken«, »...iker« u.ä. am Schluß eines Wortes.
Werner
Mehr Informationen über die Mailingliste Trennmuster