11-4 根据扫描结果,计算垃圾邮件的贝叶斯逆概率

过滤器扫描完邮件后得到的结论是“附带链接”。此时,就不必再考虑“无链接”的两种可能性,只需要考虑剩余的两种可能性,如图表11-4 所示。

11-4 根据扫描结果,计算垃圾邮件的贝叶斯逆概率 - 图1 图表11-4 可能性被限定为两种

恢复标准化条件(相加之和为1)之后,通过这张图可以计算出后验概率为:

在有链接的情况下,

(垃圾邮件的后验概率):(正常邮件的后验概率)

=0.5×0.6:0.5×0.2

=0.6:0.2

=3:1

=3/4:1/4

所以,过滤器判断出

(附带链接的垃圾邮件的后验概率)=3/4=0.75

在扫描之前,垃圾邮件的概率被设定为0.5;而通过扫描发现链接之后,垃圾邮件的概率上升到了0.75,如图表11-5 所示。

11-4 根据扫描结果,计算垃圾邮件的贝叶斯逆概率 - 图2 图表11-5 扫描前与扫描后

在这种情况下,“正常邮件的后验概率”为0.25,但这一概率并不为0,所以垃圾邮件的可能性增大 ,然而,并不能就此判定它就是垃圾邮件。例如,尽管在过滤器上设定了“如果垃圾邮件的后验概率超过0.95,就自动把它移到垃圾箱里”,但有可能这封邮件并没有被移动到垃圾箱里,而是被划分到收件箱中。