19-3 第二胎依然为女孩时的推理

为了帮助大家了解采用贝塔分布的优势,下面我们针对该夫妇生的第二胎依然女孩的情况,进行贝叶斯推理。

由于关于类别的先验分布为均匀分布,那么,可以通过两胎连续生女孩的情况设定,来计算结果。而根据第12讲中解说的“贝叶斯推理的序贯理性” 这一性质(见12-4),把上一节中求出的后验分布(z=2x )再次设定为先验分布,并在此基础上,根据“这对夫妇再次生了女孩”的信息,可以得出后验分布是相等的结论。那么,下面我们就用这个方法进行贝叶斯推理吧。

19-3 第二胎依然为女孩时的推理 - 图1 图表19-5 先验分布和后验分布

首先看图表19-5 的左侧部分:x 轴上方的部分表示先验分布,如设定一样,贝塔分布为y=2x 。下方则表示,在获得“该夫妇生了女孩”的信息之后,各种可能性的划分。先说明结论:下图中涂有颜色部分的界限曲线为抛物线

z=2x 2  …(1)

该抛物线上方涂有颜色的部分,表示该夫妇在类别x 的情况下生女孩的概率密度。此外,该夫妇在类别x 的情况下,生男孩的概率密度为直线OF和抛物线(1)围成的部分。

第15讲中已经进行了解说:该夫妇在类别x 的情况下,生女孩的概率密度为(1)式,是依据“&的事件的概率法则”。由于该夫妇在类别x 的情况下,生女孩的概率密度为x ,那么在条件概率p(信息|类别)中,若类别=“x ”、信息=“女孩”,那么这个概率模型可以设定为:

p=(女孩|x )=x

因此,

p((该夫妇为类别x )&(类别x 的夫妇生了女孩))

=p(类别x )×p(女孩|x )

=2x ×x

=2x 2

下面,通过图表19-5 的右侧部分,来对于“为何概率密度和概率,都能够用乘法运算求出&的概率密度呢?”的问题进行说明(如果觉得这样的解说很烦琐,可以直接跳过以下内容)。以类别x =0.7为例:该夫妇的类别0.7这一可能性,近似于x 轴上方的小长方形。若把宽度设为d,那么关于以0.7为中心的宽度d的范围的类别x ,可以将其概率密度全部视为1.4。那么,该夫妇属于这个长方形(属于这种可能性)的概率为:d×1.4。这里,运用了将概率密度乘以宽度转换为概率的方法。由于属于该情况的夫妇,生女孩的概率为0.7,那么(该夫妇属于类别0.7)&(类别0.7的夫妇生女孩)这种可能性,便可以认为近似于x 轴下方以线段AD为长的长方形。

在这个长方形中,点D处于划分0.7和0.3的比率的位置,因此,这个面积为(d×1.4)×0.7。由此可以计算出AD的长度(除去宽度d)1.4×0.7=0.98。

之后,根据获得的“第二胎依然为女孩”的信息,可以排除掉图表19-5左侧部分的OF和抛物线(1)围成的部分,只留下抛物线(1)和x 轴围成的部分(涂有颜色的部分)。由于这个面积不等于1,因此需要像之前一样,使用标准化条件,使其面积变为1。

这里需要注意的是,二次函数y=(常数)x 2 为α=3、β=1时的贝塔分布。因此,满足标准化条件的后验分布为:(对于推理来说,“系数为3”并不重要,故此处省略原因)。

y=3x 2  (0≤x ≤1)

那么,根据上一讲中的公式,可以求出α=3、β=1的贝塔分布的期待值为:

19-3 第二胎依然为女孩时的推理 - 图2

也就是说,贝叶斯推理的结论是,该夫妇生的第一胎为女孩,那么第二胎依然为女孩的概率为 19-3 第二胎依然为女孩时的推理 - 图3

19-3 第二胎依然为女孩时的推理 - 图4 图表19-6 第二胎依然为女孩时的后验分布