21-2 用不准确的温度计推算洗澡水的温度
在贝叶斯推理中,通过各个类别的事前概率和各个类别中获得信息只有,必须要计算“~&~”这种形式的偶发事件的概率,这在之前已经操作过多次。用之前的例子进行说明,如第2讲中,从类别“癌症”“健康”和获得的信息“阳性”“阴性”中,计算“癌症&阳性”、“健康&阴性”等事件的概率;第3讲中,从类别“真命天子”“无关路人”和获得的信息“送出巧克力”“不送巧克力”中,计算“真命天子&不送”“无关路人&送出”等事件的概率。
若把正态分布设为共轭先验分布,也需要进行同样的操作。结论如下:“~&~”这种形式的事件的概率分布,也是上一讲中所解说的正态分布(为比例的分布)。第19讲中,在考虑“生女孩的概率”时,若把先验分布设为贝塔分布,虽然“(类别p)&女孩”的分布也是贝塔分布(为比例的分布),但也会出现同样的情况。由于共轭先验分布原本就是这个含义,因此自然会得出这样的结论。但正态分布的情况和贝塔分布不一样,若对这个部分进行普遍说明,将会难以理解。这是由于正态分布的公式本身就比较复杂。
那么,本讲采用“曲线救国”的方式:第一,在进行一般论述之前,一边具体解说贝叶斯推理的流程,一边解说“~&~”的概率密度公式;第二,省略解说“~&~”的概率密度公式为何会变成这样的原因。接下来,进入解说环节,概率模型如下:
用不准确的温度计测量热水的温度
要把洗澡水加热到适宜的温度42℃。当认为已经烧开的时候,便用温度计测量了水温。但由于所使用的温度计不够准确,因此设定测量的温度x ,遵循以实际温度θ为平均值、标准偏差为2℃的正态分布的概率分布。现在,温度计显示的温度为40℃。那么,实际的水温为多少度呢?
按照通过正态分布、用贝叶斯推理解答问题的流程,我们采用以往的步骤划分法来解决这个问题吧。
