11-2 在过滤器上设置“先验概率”
和前面的操作步骤相同,第一步是设定事前类别,并在获得一条信息之后,计算出后验概率。
在这里我们要做的,并不是“自己去判断收到的邮件是否为垃圾邮件”,而是为大家讲解“电脑会对所收到的邮件做出机械判断”的原理。
首先,电脑在对收到的邮件进行扫描之前,会为每个类别分配“这封邮件是垃圾邮件还是正常邮件”先验概率。在这里,利用“理由不充分原理”(见3-2),使双方各占0.5的概率。
这就意味着,对于接收到的邮件,过滤器会做出“垃圾邮件的概率是0.5,正常邮件的概率也是0.5”的判断。而此时如果有可信度更高的概率,也可以将其设定为先验概率,如图表11-1 所示。
图表11-1 理由不充分原理的先验概率
