[Trennmuster] [TSX] patgen: what do these values mean?
Stephan Hennig
mailing_list at arcor.de
Do Apr 10 19:11:08 CEST 2014
Am 10.04.2014 08:24, schrieb Herbert Voss:
> Am 09.04.2014 23:29, schrieb Stephan Hennig:
>
>> dieser Parameter bzw. (a, a, 0) ist relativ klar. Wir verwenden
>> allerdings tatsächlich threshold = 1 und nicht 0 (siehe
>> skripte/make-full-pattern.sh). Weshalb?
>
> Weil man wenigstens ein gute Trennung mehr haben will.
OK.
>> Was soll damit bezweckt werden, schlechte Trennungen zu bestrafen? Da
>> abwechselnd ermöglichende und verhindernde Muster erzeugt werden,
>> besteht zwischen guten und schlechten Trennungen weitgehend Symmetrie.
>
> Was genau meinst du jetzt mit "schechten" Trennungen.?
Ich meinte tatsächlich falsche Trennungen. Aber es stellt sich mir
gleich eine neue Frage. Wie gehen übersehene Trennungen (missed) in
Patgens Abwägung ein?
>> Weshalb muss noch mit Strafpunkten nachgeholfen werden?
>
> Es ist doch alles nur wahscheinlichkeitsbasiert, also _in jedem Fall_
> fehlerhaft.
Hm, es gibt im Patgen-Lauf eine konkrete Liste. Da gibt es keine
Wahrscheinlichkeiten, nur feste Häufigkeiten, die gegeneinander
abgewogen werden. Welchen konkreten Effekt eine Erhöhung von bad_weight
hat, ist mir aber immer noch unklar. :/
>>> Genaueres findet man natürlich in der Dissertation. Aber auch dort
>>> wird faktisch nicht mehr beschrieben.
>>
>> Als ich die Dissertation gelesen hatte, hatte ich mich an einem anderen,
>> globalen Ansatz zur Mustererzeugung versucht. Die genaue Vorgehensweise
>> von Patgen hatte ich daher nie genau studiert. Mein Versuch ist
>> letztlich im Sande verlaufen (war aber nicht umsonst). :-)
>
> Man muss in den Quellcode von Patgen sehen,
Das werde ich bei Gelegenheit tun.
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster