Training des BAYES Filters

Gerald Galster list+postfixbuch at gcore.biz
Sa Feb 26 14:20:19 CET 2022


Hallo Achim,

>> Vermutlich die ganze Mail: https://github.com/rspamd/rspamd/issues/340
> Ja, so cool der rspamd ist, das „vermutlich“ zieht sich leider durch die ganze Dokumentation. Ich habe noch andere Fragen offen, aber in der offiziellen Mailingliste ist recht wenig los.
> Ich habe schon überlegt, selbst eine rein deutschsprachige Liste zu starten, so wie diese hier zum Postfix, aber ich kann den administrativen Aufwand dafür nicht einschätzen. Und es wäre wohl besser, wenn sich die Verantwortung dafür auf 2-3 Leute verteilt.

wahrscheinlich bekommt man hier noch am ehesten eine Antwort auf Fragen zu rspamd.
Eine deutschsprachige, inoffizielle Mailingliste gab es schon mal:
https://roessner-network-solutions.com/tag/rspamd/

>> Die meisten Benutzer wollen nichts mit dem Spamfilter zu tun haben, es soll nur funktionieren.
>> Deswegen lass ich global lernen und ausgewählte Personen erhalten einen IMAP-Ordner, in den sie nicht erkannte Spammails legen können.
>> Ein Programm holt diese periodisch ab und legt sie zur Prüfung vor. So verhindere ich, dass ungewollte Newsletter als Spam gelernt werden und bei Bedarf kann man gleich noch ein paar Regeln anpassen.
> 
> Das Konzept finde ich auch besser, zumal es bei mir nur noch um wenige Mailboxen geht.
> 
> Zum Training von BAYES:
> Es ist wohl besser, man bereitet das Trainingsmaterial insoweit vor, daß es dem rspamc so erscheint, als stünde die E-Mail vor der Einlieferung. Also am besten die Spam-Reports und internen Hops bis zum Mailstore aus den Headern entfernen, so wie den Betreff ggfls. wieder zurücksetzen.
> Aus früheren Versuchen habe ich in Erinnerung, daß eine interne IP im Header zu False Positives geführt hatte.

Kommt wohl auf Mailflow und Durchsatz an. Wenn man genügend ein-/ausgehende Verbindungen von den selben IPs hat, sind diese normalerweise kein Kriterium mehr.

Alternativ kann man interne Hops entfernen, damit die Netzstruktur nicht nach außen dringt, z.B. via header_checks:
/^Received:.*by mx\d+\.intern \(Postfix\) with ESMTP/   IGNORE

> Noch ein Tipp:
> In dieser Anleitung wird die Verwaltung des rspamd auf verschiedene Instanzen von Redis aufgeteilt. Das finde ich sehr nützlich, falls doch mal etwas vergiftet ist.
> https://kb.linuxlove.xyz/mail-server-rspamd.html

Auch eine gute Idee wenn RAM/CPU knapp werden und man einzelne Dienste auf andere Server auslagern will.
Glücklicherweise kann man Redis-Dateien zum Backup einfach kopieren.

Viele Grüße
Gerald


Mehr Informationen über die Mailingliste Postfixbuch-users