14-4 用概率符号来表示贝叶斯推理的先验概率

之前的那些贝叶斯推理的先验概率,可以使用以上事件和概率的符号重新表示出来。

例如,在第2讲的例子中,有“癌症”和“健康”两个类别。那么在概率模型中,基本事件的集合可以表示为:

{癌症,健康}

用分配给每一类别的先验概率来反映实际的罹患率,为:

p(癌症)=0.001,p(健康)=0.999

而这在图表14-3 (与图表2-1相同)中,分别对应面积为0.001的长方形和面积为0.999的长方形(由面积为1的长方形分割得来)。

14-4 用概率符号来表示贝叶斯推理的先验概率 - 图1 图表14-3 根据癌症罹患率得到的先验分布

另外,关于第4讲中介绍的“某对夫妇生的第一胎为女孩的概率为多少”的概率模型,可以将生女孩的概率p的数值设定为基本事件。在这里,将基本事件称为“概率”可能会让人感觉有些奇怪,事实上这并不突兀。可以将基本事件设定为{0.4}、{0.5}、{0.6}。在这里,{0.4}的含义是“该夫妇生的第一胎为女孩的概率为0.4”这一事件,可以理解为类似于掷骰子出现的点数。用概率符号来表示图表14-4 (与图表4-1相同)中长方形的面积的话,先验分布可以记为:

14-4 用概率符号来表示贝叶斯推理的先验概率 - 图2

14-4 用概率符号来表示贝叶斯推理的先验概率 - 图3 图表14-4 某对夫妇生的第一胎为女孩的概率的先验分布

写作p({0.4})的情况下,由于中间的0.4也表示概率,整体的p({0.4})也表示概率,所以可能有些难以理解。但因为中间的概率“0.4”是针对“某对夫妇生的第一胎为女孩”这一基本事件(事件)的,而整体的p({0.4})则用来表示:估计这一基本事件有多大的可能性,也就是所谓的“信念的程度” ,因此,可以理解为意思完全不同的两个概念。