2-2 根据医疗数据,设定“先验概率”

该推算的顺序,与第一讲中进行的推算顺序完全相同。因为具体事例有所区别,带给各位读者的印象可能会不太一样,因此,下文将沿袭第一讲的方式,对推算的顺序进行详细说明。

这个例子的特殊性在于,先验概率是一项客观存在的流行病学数据。第一讲中已经解释过,先验概率 ,是“在获得信息之前,各个类别的存在概率” 。在这个案例中共有两种类别:一种是“罹患癌症的人”,另一种是“健康的人”。

正如问题设定中所述,这种癌症的罹患率为0.001,因此流行病学认为,1000人中有1人会罹患这种癌症。因此,如果要在检查前推测自己是否罹患这种癌症的话,如下面的图表2-1 所示。

2-2 根据医疗数据,设定“先验概率” - 图1 图表2-1 根据癌症罹患率得出的先验分布

下面,重新解释一遍该图。

该图表示的是:在接受简易检查诊断之前,判断你是否罹患了癌症的可能性。你所在的世界分为左侧表示“罹患癌症”和右侧表示“身体健康”的两个“可能世界”,而你一定处在这两个可能世界中的一个当中。所以并不知道到底属于哪一个世界,仅仅是作为推测而已。也就是说,世界分为了两个互不相同的部分(可能性分为了两种) 。

但是,并非完全没有办法来推测你究竟处在哪个“可能世界”。通过流行病学数据我们知道,这种癌症的罹患率为0.001。也就是说,统计显示,1000人中有1人罹患这种癌症,所以,这可以作为判断你是否罹患该种癌症的参考。如果直接套用的话,可以推算罹患该种癌症的概率为0.001。也就是说,“你究竟属于两个可能世界中的哪一个”的问题,在没有任何个人信息的情况下,属于左侧世界的概率可被推算为0.001,属于右侧世界的概率可被推算为0.999。