第17讲 “贝塔分布”的性质由两个数字决定

17-1 贝叶斯推理中经常使用的连续型分布——“贝塔分布”

在我们之前介绍的贝叶斯推理中,为实现先验分布而设定的类别是有限的。例如,第1讲中,关于顾客购买商品的推理,分为“来买东西的人”和“随便逛逛的人”两类;第2讲中,癌症检查的结果,分为“癌症”和“健康”两类;第4讲中关于第二胎性别的案例,分为“生女孩的概率为0.4的夫妇”、“生女孩的概率为0.5的夫妇”、“生女孩的概率为0.6的夫妇”这三类。

像上述这样,在有限的类别中进行贝叶斯推理的情况并不少见,但也有很多时候,必须要分为无限个连续的类别才行。例如,第4讲中关于第二胎性别的案例,如果把“生女孩”的概率p仅仅设定为0.4、0.5、0.6这三种的话,显然是不够的。毫无疑问,在这个案例中,概率p的取值范围应该为0≤p≤1。那么,因为类别总共有连续的无限个,所以在设定先验概率时,需要设置为连续型概率分布。

本讲将介绍贝叶斯推理中出现频率很高的“贝塔分布”。理解“贝塔分布”,需要用到微分、积分等难度较大的数学知识,而本书在讲解时会尽量避免这种方式,而是采用直观的图解方法来进行说明。