[Trennmuster] Regressionsverhinderung?
Guenter Milde
milde at users.sf.net
Do Jul 12 20:42:17 CEST 2018
On 12.07.18, Selke, Gisbert W. wrote:
> Liebe Trennmustler,
> Zufällig fiel mir auf, dass zwei der gestern korrigierten Wörter
> (Hohlraumanteil, Neolamarckismus) mit den Trennmustern vom 2018-03-31
> bereits korrekt getrennt worden waren - scheint also in der
> Zwischenzeit kaputtgegangen zu sein. bevor es jetzt repariert wurde.
> Klar ist, dass sich solche Regressionen nie sicher vermeiden lassen
> werden, denn die Regeresiionen betreffen ja Wörter, die eben noch nicht
> mit bekannt richtiger in der Wortliste stehen.
Da ist mir aufgefallen, dass ich mit "uralten" Pattern getestet habe
(dehyphn-x-2016-11-29.pat).
Außerdem: Zur Zeit ist das Repositorium in einem Bauzustand:
Die Mustererstellung mit `make` sortiert (noch) nicht die
Wahltrennungen aus, z.B. aus Re-al=ex<a-men wird Re-al-ex-a-men, nicht
wie gewünscht Re-al-ex-amen. Da nur wenige der Wahltrennungen markiert
sind kann das zu zusätzlichen Schwierigkeiten in der Generalisierung
auf nicht erfasste Wörter führen.
> Hat dennoch schon mal jemand eine Idee zu einer Heuristik gehabt, wie
> sich die (potenziell negativen) Auswirkungen von Änderungen oder
> Ergänzungen in der Wortliste überschaubar machen lassen könnten?
Soviel ich weiß, ist das nicht zuverlässig zu lösen. Das Problem ist ja,
dass wir zwar über die freien Wörterbücher einen Pool von weiteren
deutschen Wörtern haben, aber keine verläßlichen Angaben zu deren
Trennung.
Evt. lässt sich über die Analyse von Pattern aus Stichproben der Wortliste
eine Heuristik ableiten. Alternativ untersucht Werner die generierten
Pattern auf Problemstellen und Auffälligkeiten. Aber das ist alles ein
weites Feld.
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster