[Postfixbuch-users] FuzzyOCR mit Bayes?
Heiner Mueller
hm0 at gmx.net
Do Jan 11 13:57:34 CET 2007
> > verwendet - es wäre aber evtl doch nett, wenn man statt dessen den
> > gefundenen Text z.B. mit der Bayes-DB abgleichen könnte (+ evtl.
> Varianten
> > in der Schreibweise?) - geht das? ggf. wie?
>
> also davon kann man nur abraten (meine ganz persönliche Meinung).
> FuzzyOCR
> arbeitet solange gut wie man die Wortlisten sauber pflegt und darauf
> achtet nicht zu kurze Wörter zu verwenden, ansonsten sind false positives
> quasi vorprogrammiert.
evtl. hast du mich da mißverstanden. Ich würde gerne den gesamten gefundenen Text aud der Grafik (ist ja selten/nie ein einzelnes Wort) zur Bewertung an Bayes geben. So wie ich es sehe, vergibt Bayes ja dann eine Gesamtwertung für den Text in Abhängigkeit davon, welche Worte im Text (nicht) vorkommen bzw. evtl. noch in welcher Häufigkeit/Konstellation. Daher sehe ich da keine größere Gefahr für false Positives als es auch bei normalen Text-Mails/Spams der Fall wäre.
Außerdem lernt Bayes ja auch dazu.
Grüße.
--
Der GMX SmartSurfer hilft bis zu 70% Ihrer Onlinekosten zu sparen!
Ideal für Modem und ISDN: http://www.gmx.net/de/go/smartsurfer
Mehr Informationen über die Mailingliste Postfixbuch-users