4-6 在计算“第二胎生女孩的概率”时,使用“期待值”
我们通过计算得到的后验概率为:
(类别p=0.4的后验概率)=0.27
(类别p=0.5的后验概率)=0.33
(类别p=0.6的后验概率)=0.4
以上数值为各个类别的概率,换言之,也就是“概率的概率”。数值分为3部分、内容详细,十分难得。但是,它并不能作为“第二胎生女孩的概率是多少”这个问题的答案。于是,让我们最后再来了解一下该如何回答这个问题吧。
在求“这对夫妇第二胎生女孩的概率”时,需要用到“平均值”这一概念。 由于这也是概率方面的平均值,专业上把这个数值称为“期待值” 。关于期待值的具体内容将会在第18讲进行详细介绍,在这里暂且用图解的方式,对其含义进行简单说明。
首先,在表示所有可能发生的情况(生了女孩的情况)的长方形中,画出填入了后验概率的图。这个图由3个长方形构成的。左边的长方形:纵向长度为类别p=0.4、横向长度为其后验概率0.27。正中的长方形:纵向长度为类别p=0.5、横向长度为其后验概率0.33。右边的长方形:纵向长度为类别p=0.6、横向长度为其后验概率0.4。因此,各个长方形的面积如下:
左边的长方形→0.4×0.27=0.108
正中的长方形→0.5×0.33=0.165
右边的长方形→0.6×0.4=0.24
对于这3个长方形,需要画出一个使横向长度之和与面积之和一致的长方形,即虚线长方形。这个长方形,横边的长度刚好等于1。其理由是,由于3个长方形的横边长度为各类别的后验概率,根据标准化条件进行相加,其结果为1。因此,虚线长方形的纵向边长的长度,与3个长方形的面积之和完全一致。这是“把类别平均化的数值”,即为“类别的期待值”(图表4-8 )
图表4-8 计算类别的平均值
具体的计算过程如下所示:
(P的期待值)=0.4×0.27+0.5×0.33+0.6×0.4
=0.108+0.165+0.24
=0.513
因此,若把这对夫妇的类别(生女孩的概率)进行平均化,则得到结果0.513。这也能够成为解释“这对夫妇第二胎生女孩的概率” 的理由。在第19讲中,会针对“满足类别0≤p≤1中所有p的设定”的例子进行说明。
