12-2 把从信息①中得到的后验概率,设为“先验概率”

首先,我们来回顾上一节中最初的推理过程(从“附带链接”这一信息中得到的后验概率)。

事前设定“垃圾邮件”和“正常邮件”这2种类别,它们的先验概率均为0.5(理由不充分原理)。然后,将每个类别再分为“附带链接”和“无链接”两种情况,并计算每种可能性的概率。

现在,扫描出来的结果是检出了“附带链接”(我们将其称为信息①)。根据信息①计算后验概率,图表12-1中显示,推测结果是垃圾邮件的后验概率①为3/4,结果是普通邮件的后验概率①为1/4。

换言之,根据信息①,先验概率由各为0.5,变更(更新)为0.75和0.25这一后验概率,如图表12-2 所示。

接下来,我们来试着做一个有趣的构想:把计算出的后验概率再次设定为各个类别的先验概率,如图表12-3 所示。

12-2 把从信息①中得到的后验概率,设为“先验概率” - 图1 图表12-3 把从信息①得出的后验概率,设定为先验概率

这个构想的含义是:暂且不考虑变更的原因,而是先将目前正在检查的邮件中垃圾邮件的先验概率设定为0.75,普通邮件的先验概率设定为0.25。换言之也就是:虽然忘记了原因,但总结果是设定了这样的先验概率。

这个假设并非毫无道理。说起来,先验概率原本就是在没有根据的情况下设定的。 即便是从主观上来讲,这个问题都可以不作考虑。因此,即使把根据信息①推算出的后验概率设定为新的先验概率,也没有任何不妥。