[Postfixbuch-users] Prüfen ob gelernte Spam-Mails berücksichtigt werden

Do Apr 3 11:41:36 CEST 2008

Sandy Drobic schrieb:
> Vielleicht machst du dir zuviele Illusionen, wieviel der Bayes überhaupt zum 
> Endergebnis hinzuträgt. Selbst bei BAYES_99 ist der Punktewert nur 3.x oder so 
>   ähnlich und wird per Default keine Mails allein als Spam markieren.

Das wäre möglich.
Problem ist, dass wir hier "Spezialisten" haben, die sehr bekannte 
Adressen verwenden und viele internationale Kontakte haben.

Dadurch sammelt sich in deren Postfach eine ordentliche Menge Spam.

Eine Änderung von deren E-Mail-Adresse kommt auch nicht in Frage.

>> Wie kann ich validieren, ob die Nachrichten richtig gelernt werden und 
>> ob sich dadurch die Bewertung ändert?
> 
> Hast du einfach mal in die Header der Mails geschaut und geprüft, welche Test 
> wie start zum Ergebnis beigetragen haben?

Das sagt mir der Header:

X-Spam-Status: No, hits=4.466 tagged_above=-999 required=5 tests=BAYES_99,
  HTML_IMAGE_RATIO_02, HTML_LINK_PUSH_HERE, HTML_MESSAGE, HTML_WEB_BUGS,
  MIME_QP_LONG_LINE

Da fehlt sicher noch ein Parameter im Amavis - ich geh mal suchen.

>> Hat es eine Auswirkung, aus welchem Postfach fetchmail die Mails nimmt?
> 
> Fetchmail hat als allererstes die Auswirkung, dass der ganze Müll erst einmal 
> angenommen wurde. Das ist bereits der größte Fehler. Über 90% der Spams/Viren 
> würde ein halbwegs ordentlich eingerichteter Postfix direkt abweisen, wobei 
> nur sehr wenige erwünschte Mails (von falsch konfigurierten) Servern 
> abgewiesen werden.

Hier herrscht ein Misverständnis:
Mein Postfix steht als Relay vor einem Exchange-Server.
Auf dem Postfix wird schon mit geeigneten Restrictions & Greylisting 
vorgefiltert und entsprechend rejected.
Auch Uwes&Deine Dialin-Liste kommt zum Einsatz.
Eventuell kommt noch policyd-weight mit dazu.

Das was durchkommt durchläuft Amavis mit SpamAssassin und ClamAV.
Virenmails werden Discarded, Spammails mit Score zwischen 5 und 10 
werden getagt.
Was da noch durchkommt wird dann an den Exchange-Server weitergegeben 
und dort in die Postfächer der User sortiert.
Diese haben die Möglichkeit ungetagten Spam oder false-positives in 
"Öffentliche Ordner" "Spam" und "Ham" zu stellen, von wo ich diese hole, 
nochmal durchsehe und nochmal einiges was zwar in User-Augen Spam, 
tatsächlich aber z.B. ein vom User abonnierter Newsletter ist oder 
versehentlich erwischte valide Nachrichten aussortiere.
Den Rest schiebe ich dann zusammen mit etwas zusätzlichem HAM in ein 
spezielles Postfach auf dem Exchange-Server, von wo ich es per fetchmail 
dann an sa-learn auf dem Relay übergebe.

Also schnappt sich fetchmail mitnichten alles was ankommt, sondern nur 
das was übrig bleibt.

> Mit etwas Feinjustierung und Policy-Daemons/selektivem Greylisting lässt sich 
> dieser Wert auf etwa 98 Prozent steigern.

Passiert hier ja bereits.

> Erst den dann übrig gebliebenen Rest sollte Amavisd-new/SA überhaupt 
> vorgesetzt bekommen, und dann kann man anfangen, SA zu optimieren.

Hier der Fall (siehe oben).

Wobei ich in Sachen HAM nur eben Beschaffungsprobleme habe.
(Ich will ja auch nicht alles selbst selektieren müssen.)

Meine Frage wegen des Postfach's war eben nur so gemeint, dass 
SpamAssassin die gelernten Nachrichten nicht eben nur für den User, der 
Besitzer dieses Postfachs ist, lernt.

Thomas