[Postfixbuch-users] Prüfen ob gelernte Spam-Mails berücksichtigt werden

Thomas Schwenski postfixbuch at thomas-schwenski.de
Do Apr 3 13:18:00 CEST 2008


Christian Wally schrieb:
>> Ist es da eigentlich sinnvoll sämtliche Nachrichten per Alwayc-BCC als 
>> Ham zu füttern?
>> (Eventuell eben nur die selbe Anzahl wie Spams.)
>>
>> Oder hebt eine als Ham und später dann als Spam gelernte Nachricht 
>> diesen Mechanismus auf?
> Ich denke wenn Du das somachst müsstest Du vor dem spam learning mit
> --forget die mail als Ham wieder vergessen machen. Ob das aber nach
> Abholung mit tchmail noch zuverlässig funktioniert weiß ich nicht.

Davon abgesehen, wäre es wohl zuviel Handarbeit.


>> Wie handhabt Ihr das?
>>
> Mit zuverlässig kontrollierten Maildirs und false positives.

Soviel FPs kriege ich hier leider nicht.
Und mit MailDirs wird's wegen der unterschiedlichen Server leider auch nix.

> 
>>  > Ob die Mails richtig trainiert wurden und auch vom user vsan verwendet
>>  > werden, kannst Du mit sa-learn -dump feststellen.
>>  > Z.B.:
>>  > su -c 'sa-learn --dump magic' vscan.
> 
>> mail:/ # sa-learn -u vscan --dump magic
>> 0.000          0          3          0  non-token data: bayes db version
>> 0.000          0         39          0  non-token data: nspam
>> 0.000          0          1          0  non-token data: nham
> 
>> 0.000          0      33043          0  non-token data: ntokens
>> 0.000          0 1138207360          0  non-token data: oldest atime
>> 0.000          0 1138942183          0  non-token data: newest atime
>> 0.000          0          0          0  non-token data: last journal 
>> sync atime
>> 0.000          0          0          0  non-token data: last expiry atime
>> 0.000          0          0          0  non-token data: last expire 
>> atime delta
>> 0.000          0          0          0  non-token data: last expire 
>> reduction count

> Die bayes db dieses users hat 39 spam und 1 ham Mail zum Lernen
> bekommen.

Hm ... wieso steht da was von non-token-data?
was bedeuten die Zahlen bei "ntokens", "oldest atime" und "newest atime"?

Und was ist mit den zig Mails die ich als Spam und Ham verfüttert habe?


> Ich rufe sa-learn mit der Option --dbpath auf und gebe den Pfad zum
> Homeverzeichnis von amavis (in Deinem Fall vscan) an. Alsio zum
> Beispiel:
> sa-learn --dbpath /var/lib/amavis/.spamassassin/ --spam ...

Hier genauso, außer dass ich kein dbpath mit angebe.

> Aber die Zahlen an wöchentlichen Spammails die Du in Deiner original
> Post erwähnst horchen sich verdächtig hoch an. Wie schon andere erwähnt
> haben ist Bayes Training sicher nur das letzte finetuning von SA.

Es kommt aber doch noch was durch.
Also muss ich noch ein großes Loch hier haben.

Ich habe gestern "nur" circa 6500 E-Mail angenommen gegüber 14000 rejects.

Thomas



Mehr Informationen über die Mailingliste Postfixbuch-users