15-3 各个类别被赋予的概率=条件概率
若要在贝叶斯推理中使用条件概率,使用方法分为两个阶段。第一阶段:按照各自的类别设定数据概率的方法;第二阶段:计算后验概率时的方法。而重要的一点是,在这两个阶段中,都可以有效利用直积试验的特性。本节将会具体解说前一种情况。
在这里,将再一次使用第7讲和第13讲中关于壶和壶里有颜色的球的例子。下面对其设定再次进行说明。
问题设定
面前有一只壶,已知这个壶不是A壶就是B壶,但是单从外表看不出究竟是哪个。而目前已知的是:A壶中有9个白球和1个黑球,B壶中有2个白球和8个黑球。现在,如果从壶里取出1个球,并且这个球是黑色的,那么,面前的这个壶究竟是A还是B呢?
在这个案例中,所有的可能性共有4种。用专有名词可以表述为:基本事件的集合={A&黑球,A&白球,B&黑球,B&白球},也就是直积试验的各个事件,如图表15-2 所示。
第7讲和第13讲中虽然提出了“从A壶中取出的球是黑球的概率为0.1”的观点,但并没有对其含义进行严密的说明。实际上,“从A壶中取出的球是黑球的概率为0.1”,正是指上一节中所定义的条件概率,也就是在获得“该壶为A壶”这个信息之后,得出的“取出的球为黑球”的概率。
图表15-2 条件概率的设定
用公式来表达,即:
P(黑球|A)=0.1
此时,请回想一下第7讲中计算出的“A&黑球”的概率,为0.5×0.1。如果使用上一节中提到的条件概率来定义该计算,就能够理解一下这种整合性的计算方法。
图表15-3 A&黑球,是事件“A”和事件“黑球”的重叠部分
先来看一下图表15-3 ,在直积试验中,事件A可表示为:
A={A&黑球,A&白球}
即,“该壶为A壶,球为任意颜色”的事件。同理,事件“黑球”可表示为:
“黑球”={A&黑球,B&黑球}
也就是说,
事件A和事件“黑球”的重叠={A&黑球}
像这样,在直积试验中,事件的重叠自然与“&”是相同的。
那么,根据上一节中关于条件概率的定义,可以写为:
p(黑|A)=p(事件A和事件“黑球”的重叠)÷p(A)
=p(A&黑球)÷p(A)
用乘法算式来表达,则为:
p(A&黑球)=p(A)×p(黑|A)…(1)
这里,类别A的概率为0.5。此外,从A中观察到为黑球的条件概率p(黑|A)被设定为0.1,所以,
p(A&黑球)=0.5×0.1=0.05 …(2)
这样,便可以用乘法计算出A&黑球的概率。以上表示的是“概率即为长方形的面积” 以及“整合性”的问题。对上述进行抽象描述,即关于贝叶斯推理的公式:
&事件的概率法则
p(类别&信息)=p(类别)×p(信息|类别)
换言之,用&来连接的类别和信息所构成的可能性的概率为:将“类别的先验概率”和“在【这个类别】的基础上,能够得到这条信息的条件概率”相乘的结果。
