第11讲 掌握多条信息时的推理②

以垃圾邮件过滤器为例

11-1 垃圾邮件过滤器以贝叶斯推理为基础

在进行统计推算与贝叶斯推理等概率推算时,通常需要两条以上的信息。并且,信息数量越多,推算出的结果可信度越高。后面的三讲,会讲解如何利用多条信息来进行推算的问题,而其中的要点则是上一讲中提到的“概率的乘法公式” 。在这一讲,会讲解如何利用两条信息来计算出后验概率。

本讲主要探讨垃圾邮件过滤器 的问题。

所谓的垃圾邮件,指的就是一些不良商家通过网络随意发送的广告邮件。而垃圾邮件过滤器的功能之一就是自动判别垃圾邮件,并把它归入“垃圾邮件”的分类中。

事实上,贝叶斯推理的实际应用中,最广为人知的正是这种垃圾邮件过滤器。而目前,垃圾邮件过滤器已经被引进更为广泛的网络邮件服务当中。读者们在使用该服务之后,都会为它在分类判断方面的准确性而惊叹不已,而这一切都要归功于贝叶斯推理。