第2讲 贝叶斯推理的结果,有时与直觉大相径庭①
使用客观数据时的注意事项
2-1 计算罹患癌症的概率
本讲是通过一些容易获取客观数据的案例,对于贝叶斯推理进行说明。需要了解的重点是 ,理解“如果从客观的数据来考虑的话,反而会容易陷入误解之中” 的问题。在这里,你会发现概率的不可思议。
下面,用医疗诊查来举例进行说明。
在医疗发达的当今社会,我们能够获得多数病症的统计数据。另外,在发觉自己出现了一定症状之前,就能够发现病情的技术也在不断发展进步。但是,依然存在一个问题:如何判断通过检查得出的“是/不是X病情”这一结果的准确性呢?
假设,你接受了一项“如果患了特定的癌症的话,结果有95%的概率为阳性的检查”,并且在之后收到了结果为阳性的报告。此时,你会判断自己患该癌症的概率为95%吗?
答案是“不会”。
如果“自己患癌症的概率真的为95%”的话,你肯定会对这个结果感到非常悲观。实际上,对此做出错误判断的人大概有很多吧。但是,从“阳性”这个结果来推断“你患了癌症的概率”,这也并不是一个特别高的数字。
在该推算中,由于是从“阳性”这一“结果”追溯到“患癌症”这一“原因”,因此可看作贝叶斯推理的典型案例。
在本讲中,我们首先进行问题的设定。以下数据是为了简化计算而假设的虚构数值,并非真实的数据。
问题设定
假设,某种特定的癌症的患病率为0.1%(0.001)。有一个简易的方法能够检查出是否患上这种癌症:患上这种癌症的人中有95%(0.95)的概率被诊断为阳性。但另一方面,健康人群也有2%(0.02)的可能性被误诊为阳性。那么,如果在这个检查中被诊断为阳性的时候,实际患上这种癌症的概率为多少呢?
