19-5 在先验分布中运用贝塔分布的原因

读到这里,大家大概应该已经明白,为何把“某对夫妇生女孩的概率”的贝叶斯推理中的先验分布设定为贝塔分布的原因了吧。这是因为,后验分布也恰好为贝塔分布 。

生女孩的概率是把类别x 的概率密度乘以x ,生男孩的概率是用类别x 的概率密度乘以(1-x )计算出来的。之后,把类别x 的先验分布设定为贝塔分布,就知道后验分布也同样为贝塔分布了。

像这样,对于设定的概率模型,把后验分布设为与先验分布相同的分布,这样的先验分布称为“共轭先验分布”。 也就是说,生的是女孩或是男孩,这一概率模型的共轭先验分布,即为贝塔分布。

在贝叶斯推理中存在一个惯例:把想需要推理的概率模型的共轭先验分布作为先验分布来运用。 原因有二:

原因1: 若把先验分布和后验分布设为相同,那么计算就会变得简单很多。

原因2: 若先验分布和后验分布不同,那么从哲学角度来思考的话,会觉得很奇怪。

可以说,以上两种观点的出发点是截然不同的。前者从功能角度出发,而后者是从哲学角度出发的。不过,任何一种(或是两者)都能够帮助我们认同运用共轭先验分布的思维方式吧。