[Postfixbuch-users] Negative score-level bei spamassassin
Peer Heinlein
p.heinlein at jpberlin.de
Mi Nov 3 09:21:29 CET 2004
Am Mittwoch, 3. November 2004 09:11 schrieb Roland M. Kruggel:
> Die Spam's werden von den Usern an den einen user 'spam' auf den
> Mailserver weitergeleitet. Dort von mir mittels procmail in ein
> verzeichnis geschoben und mit 'sa-learn --spam /verzeichniss' im
> cron-job gelernt. Ist doch ok, oder? Das gleiche mache ich mit ham.
Das ist wohl die passende Gelegenheit mal eine Grundsatzüberlegung
aufzuschreiben, die nach lebhaften Diskussionen in unseren
Postfix-Kursen entstanden ist:
Wenn man Software wie SA trainieren möchte, gibt`s mehrere
Möglichkeiten:
1) Spamtrap installieren, also eine Mailadresse die nur Spammer kennen
und die nicht anderswo verbreitet wird und Mails dieses Accounts direkt
als SPAM lernen lassen.
-> Geht nicht mehr, Spammer machen Filter Poisening, d.h. ein großer
Grundsatz der Spam-Mails sind "normale" Mails mit Wörterbuchlisten. Der
Filter lernt dann normale Mails als SPAM und wird viel zu unrecht
filtern.
2) User filtern lassen, indem sie die Mail an einen Account weiterleiten
oder in einen Spam-Unterordner verschieben, der dann automatisch
gelernt wird (also so wie bei dir).
-> Geht m.M.n. mir "normalen" Usern auch nicht, denn diese verschieben
erstens auch nervende Filter-Poisening-Mails, zweitens auch nervende
normale Mails (Mailinglistenmails, wo sie zu faul/blöd sind sich
auszutragen). Der Filter wird schnell falsch trainiert, weil User nicht
wissen, welche Auswirkungen es hat wenn sie normale Mails "melden".
Geht m.M.n. mit einem Nutzerkreis technisch einigermaßen fitter Leute
die überblicken, was hier passiert und die entsprechend angewiesen sind
sorgfältig zu melden. Dieses Problem mache ich dafür verantwortlich,
warum einige der 3-Buchstaben-Freemailer noch massiv normale Mails in
Spamverdachtsordner filtern (und zum Beispiel einen Großteil unserer
Mailinglistenmails).
3) Admin trainiert per Hand (Bzw. s/Admin/Praktikant/), d.h. ein
Spamtrap-Account wird manuell gepflegt und gesäubert so daß nur Spam
trainiert wird.
-> M.m.n. die einzige Variante die sicherstellt, daß nicht zu viele
False Positives durch schlecht trainierte Filter entstehen.
Eure Meinung?
Lieben Gruß,
Peer
Mehr Informationen über die Mailingliste Postfixbuch-users