第20讲 在抛硬币或天体观测时观察到的“正态分布”

20-1 统计学的主角——“正态分布”

在统计学中,最常用的是被称为“正态分布”的连续型概率分布。在标准统计学(内曼-皮尔逊统计学)中如此,在贝叶斯统计学中亦是如此。

正态分布之所以应用如此广泛的原因,主要有两个:

第一,正态分布有着十分便利的数学操作性, 这一点在后面将会涉及。第二,正态分布是一种在自然界和社会中频繁出现的概率分布。 本节将对第二点进行简要说明。

最初发现正态分布的实验是这样的:投掷N枚硬币时,把出现正面的x 枚硬币的概率 记为p(x ),当N足够大的时候,p(x )的分布图会呈现出特殊的形状(吊钟型)。亚伯拉罕-棣莫弗和拉普拉斯等数学家发现了该图表中对应的函数,即图表20-1 的公式。

此后,数学家高斯在担任天文台主任时,通过分析天体观测时的误差所呈现出来的概率分布,也推导出了同样的分布图。

第20讲 在抛硬币或天体观测时观察到的“正态分布” - 图1 图表20-1 标准正态分布

在高斯的研究之后,随着概率理论和统计学的进步,人们发现,在很多场合都能够观察到这样的正态分布。例如,通过观察包括人类在内的各种各样的生物种群,可以发现了同一种群的体长遵循正态分布的规律。此外,在体内的构成物(血液等)的分布,也呈正态分布趋势;在收到电波时出现的噪音中,也观察到了正态分布的现象。而最近的股票收益率也呈正态分布,这是个强有力的证明。总之,正态分布出现在我们身边的很多现象中。