21-4 后验分布的含义
在说明计算方法之前,首先解释一下贝叶斯更新的概念:我们认为,洗澡用的热水水温,遵循事前为平均值42℃、标准偏差为3的正态分布。因此,若用1个数值来代表的话,则估计期待值(=平均值)为42℃。但是,由于用不准确的温度计测量出的水温为40℃,那么根据这条信息,就可以得出关于θ的后验分布,表示为图表21-1右侧的正态分布。这一概率分布的期待值在顶点位置(挑担人偶的支点),也就是正态分布的平均值,为40.6℃。以上为获得信息之后,对于水温的推理值。
上述贝叶斯推理过程,可以通过图表21-2 来理解。
图表21-2 通过温度计的测量结果,对信息进行修改
换言之,虽然最初的观点(预想)为42℃,但之后,以通过温度计得到的测量结果40℃为参考,进行了修改。虽然修改后的值,比起最初的42℃更接近40℃,但绝非40℃。之所以会出现这样的结果,是因为温度计的测量存在误差/偏差(标准偏差),所以这一部分的结果是不可信的。因此,我们并没有修改测量值为40℃,而是保留了40.6℃的结果。
这一结果,比起42℃和40℃的中间值41℃,更接近40℃,那么为何要修改为这一数值呢?原因在于,表示先验分布的误差/偏差的标准偏差为3,但温度计显示的测量的误差/偏差的标准偏差为2,后者的误差相对较小。这意味着,根据误差/偏差相对较小的温度计得出的结果,对于先验分布的推算影响较大 ,想来这也是自然的。
