Training des BAYES Filters

Sa Feb 26 06:42:07 CET 2022

Guten Morgen,
> 
> Vermutlich die ganze Mail: https://github.com/rspamd/rspamd/issues/340
> 
Ja, so cool der rspamd ist, das „vermutlich“ zieht sich leider durch die 
ganze Dokumentation. Ich habe noch andere Fragen offen, aber in der 
offiziellen Mailingliste ist recht wenig los.
Ich habe schon überlegt, selbst eine rein deutschsprachige Liste zu 
starten, so wie diese hier zum Postfix, aber ich kann den 
administrativen Aufwand dafür nicht einschätzen. Und es wäre wohl 
besser, wenn sich die Verantwortung dafür auf 2-3 Leute verteilt.

> Die meisten Benutzer wollen nichts mit dem Spamfilter zu tun haben, es soll nur funktionieren.
> Deswegen lass ich global lernen und ausgewählte Personen erhalten einen IMAP-Ordner, in den sie nicht erkannte Spammails legen können.
> Ein Programm holt diese periodisch ab und legt sie zur Prüfung vor. So verhindere ich, dass ungewollte Newsletter als Spam gelernt werden und bei Bedarf kann man gleich noch ein paar Regeln anpassen.

Das Konzept finde ich auch besser, zumal es bei mir nur noch um wenige 
Mailboxen geht.

Zum Training von BAYES:
Es ist wohl besser, man bereitet das Trainingsmaterial insoweit vor, daß 
es dem rspamc so erscheint, als stünde die E-Mail vor der Einlieferung. 
Also am besten die Spam-Reports und internen Hops bis zum Mailstore aus 
den Headern entfernen, so wie den Betreff ggfls. wieder zurücksetzen.
Aus früheren Versuchen habe ich in Erinnerung, daß eine interne IP im 
Header zu False Positives geführt hatte.

Noch ein Tipp:
In dieser Anleitung wird die Verwaltung des rspamd auf verschiedene 
Instanzen von Redis aufgeteilt. Das finde ich sehr nützlich, falls doch 
mal etwas vergiftet ist.
https://kb.linuxlove.xyz/mail-server-rspamd.html

LG/A

-- 
Direktkontakt: ml-pbu at syntaxys.de