11-4 根据扫描结果,计算垃圾邮件的贝叶斯逆概率
过滤器扫描完邮件后得到的结论是“附带链接”。此时,就不必再考虑“无链接”的两种可能性,只需要考虑剩余的两种可能性,如图表11-4 所示。
图表11-4 可能性被限定为两种
恢复标准化条件(相加之和为1)之后,通过这张图可以计算出后验概率为:
在有链接的情况下,
(垃圾邮件的后验概率):(正常邮件的后验概率)
=0.5×0.6:0.5×0.2
=0.6:0.2
=3:1
=3/4:1/4
所以,过滤器判断出
(附带链接的垃圾邮件的后验概率)=3/4=0.75
在扫描之前,垃圾邮件的概率被设定为0.5;而通过扫描发现链接之后,垃圾邮件的概率上升到了0.75,如图表11-5 所示。
图表11-5 扫描前与扫描后
在这种情况下,“正常邮件的后验概率”为0.25,但这一概率并不为0,所以垃圾邮件的可能性增大 ,然而,并不能就此判定它就是垃圾邮件。例如,尽管在过滤器上设定了“如果垃圾邮件的后验概率超过0.95,就自动把它移到垃圾箱里”,但有可能这封邮件并没有被移动到垃圾箱里,而是被划分到收件箱中。
