[Postfixbuch-users] Negative score-level bei spamassassin

Peer Heinlein p.heinlein at jpberlin.de
Mi Nov 3 09:21:29 CET 2004


Am Mittwoch, 3. November 2004 09:11 schrieb Roland M. Kruggel:

> Die Spam's werden von den Usern an den einen user 'spam' auf den
> Mailserver weitergeleitet. Dort von mir mittels procmail in ein
> verzeichnis geschoben und mit 'sa-learn --spam /verzeichniss' im
> cron-job gelernt. Ist doch ok, oder? Das gleiche mache ich mit ham.

Das ist wohl die passende Gelegenheit mal eine Grundsatzüberlegung 
aufzuschreiben, die nach lebhaften Diskussionen in unseren 
Postfix-Kursen entstanden ist:

Wenn man Software wie SA trainieren möchte, gibt`s mehrere 
Möglichkeiten:

1) Spamtrap installieren, also eine Mailadresse die nur Spammer kennen 
und die nicht anderswo verbreitet wird und Mails dieses Accounts direkt 
als SPAM lernen lassen.
-> Geht nicht mehr, Spammer machen Filter Poisening, d.h. ein großer 
Grundsatz der Spam-Mails sind "normale" Mails mit Wörterbuchlisten. Der 
Filter lernt dann normale Mails als SPAM und wird viel zu unrecht 
filtern.

2) User filtern lassen, indem sie die Mail an einen Account weiterleiten 
oder in einen Spam-Unterordner verschieben, der dann automatisch 
gelernt wird (also so wie bei dir).
-> Geht m.M.n. mir "normalen" Usern auch nicht, denn diese verschieben 
erstens auch nervende Filter-Poisening-Mails, zweitens auch nervende 
normale Mails (Mailinglistenmails, wo sie zu faul/blöd sind sich 
auszutragen). Der Filter wird schnell falsch trainiert, weil User nicht 
wissen, welche Auswirkungen es hat wenn sie normale Mails "melden". 
Geht m.M.n. mit einem Nutzerkreis technisch einigermaßen fitter Leute 
die überblicken, was hier passiert und die entsprechend angewiesen sind 
sorgfältig zu melden. Dieses Problem mache ich dafür verantwortlich, 
warum einige der 3-Buchstaben-Freemailer noch massiv normale Mails in 
Spamverdachtsordner filtern (und zum Beispiel einen Großteil unserer 
Mailinglistenmails).

3) Admin trainiert per Hand (Bzw. s/Admin/Praktikant/), d.h. ein 
Spamtrap-Account wird manuell gepflegt und gesäubert so daß nur Spam 
trainiert wird.
-> M.m.n. die einzige Variante die sicherstellt, daß nicht zu viele 
False Positives durch schlecht trainierte Filter entstehen.

Eure Meinung?

Lieben Gruß,

Peer





Mehr Informationen über die Mailingliste Postfixbuch-users