4.11 让你最亲密的23个朋友震惊

    一组人中,至少有两个人是同一天生日的几率是多少?根据现在的人数来看,这个几率出奇地高。使用简单的概率规则,可以在聚会上使你的朋友对你印象深刻(也许还能在酒吧打赌赢得一些钱)。

    有些在逻辑上似乎不可能的事件,其实在某些情况下完全有可能。例如确定一组人中至少有两人的生日是同一天的概率。许多人震惊地得知,只要群组的人数不少于23,那么至少有两人生日相同的几率比50%还高!通过使用一些简单的概率规则,你可以算出任何规模的群组中,这一事件发生的几率,然后当你的预言成真时,你的朋友会吃惊。

    4.11 让你最亲密的23个朋友震惊 - 图1你也可以利用这个结果在酒吧下注,从而赚一些钱(只要那里至少有23个人)。

    那么,你如何算出至少两个人的生日是同一天的概率?为了解决这个问题,你需要对生日在总体中的分布做几个假设,并知道计算概率的一些规则方法。

    4.11.1 入门

    要确定至少有两个人生日是同一天的几率,我们必须对生日的分布做一些合理的假设。首先,我们假设生日在总体中是均匀分布的。这意味着在一年中,每一天出生的人数大致相同。

    这一假设不一定完全正确,但非常接近真实情况,足以让我们相信计算的结果。然而,这个假设对2月29日这个日期是绝对不正确的,因为它只在每4年一次的闰年发生。好消息是,没有那么多的人出生在2月29日,所以我们能够在忽略它的情况下仍然得到准确的估计。

    一旦我们做好了这两个假设,就可以相对容易地解决生日问题。

    4.11.2 运用全概率法

    在我们的问题中,只有两种互斥的可能结果:

    • 至少有两人的生日是同一天;
    • 没有人的生日是同一天。

    由于这两件事情必有其一发生,所以其概率之和始终等于1。统计学家把这称作全概率法则,而且在这个问题上派上了用场。

    4.11 让你最亲密的23个朋友震惊 - 图2术语“互斥”意味着,如果一件事情发生,另一件事情就不会发生,反之亦然。

    一个简单的抛硬币的例子可以帮助我们理解它的原理。抛一枚正常的硬币,得到正面的概率为0.5,得到反面的概率也是0.5(这是互斥事件的典型例子,因为抛掷硬币一次不能同时得到正面和反面!)。只要抛出硬币,两件事情必有其一要发生。它落地时一定要么正面朝上,要么反面朝上,所以正面或反面发生的概率是1(0.5+0.5)。进而我们能想到,正面的概率是1减去反面(1-0.5=0.5)的概率,反之亦然。

    有时候,计算一件事件没有发生的概率很容易,所以可用该信息来确定它发生的概率。所有人生日都不同的概率比较容易弄清楚,它只取决于组里有多少人。

    试想一下,我们这个组只有两个人。他们同一天生日的概率是多少?嗯,他们生日不是同一天的概率很容易计算:第一个人的生日是某天,第二个人的生日如果在其他的364天中的一天,那么他们的生日就不是同一天。所以,在数学上,概率是364除以365(可能的生日的总数),或0.997。

    由于两个人生日不是同一天的概率是0.997(非常高的概率),实际上他们同一天生日的概率等于1-0.997(0.003,非常低的概率)。这意味着,每1000对随机选定的人,只有3对的生日是同一天。到目前为止,这从逻辑意义上来说是完美的。然而,一旦我们开始在群里添加更多的人,事情就开始改变(迅速改变)!

    4.11.3 计算独立事件的概率

    解决我们的问题还需要另一个诀窍,即采用独立事件的概念。如果两件事情同时发生的概率等于它们各自独立发生概率的乘积,那这两件事被视作独立事件。

    我们再一次以典型的、简单而又易于理解的抛硬币为例。如果你抛两次硬币,两次都得到正面的概率等于正面的概率乘以正面的概率(0.5×0.5=0.25),因为抛一次硬币的结果对其他次抛硬币的结果没有影响(因此,它们是独立事件)。

    所以,当你抛两次硬币,有1/4的概率会出现连续两个正面。如果你想知道连续抛出3个正面的概率,答案是0.125(0.5×0.5×0.5),这意味着连续3个正面发生的概率只有1/8。

    在我们的生日问题里,每次添加一个人到组里,就相当于添加了一个独立的事件(因为一个人的生日不影响任何其他人的生日),因此,不管有多少人,我们都可以算出至少两个人同一天生日的概率,我们只需不断将概率相乘即可。

    检查一下,不管我们的小组有多少人,只有两个相互独立的事件发生:至少有两个人生日是同一天或者没有任何两个人生日相同。由全概率法则,我们得知,我们可以计算没有任何两个人同一天生日的概率,然后用1减去这个概率就等于至少有两个人生日相同的概率。最后,我们也知道,每个人的生日都独立于组里的其他成员。都明白了吗?好,那我们继续!

    4.11.4 解决生日问题

    我们已经确定了两人小组中,两人生日不是同一天的概率等于0.997。假如我们在这个组里添加了另一个人,所有人生日都不同的概率是多少?对于第三个人来说,如果生日在其他的363天,那么他们3人的生日不同。因此,第三个人和其他两人生日不同的概率是363/365,或0.995(略低)。

    但是,请记住,我们感兴趣的是,所有人生日都不同的概率,所以我们使用独立事件的法则,将前两个人生日不是同一天的概率,乘以第三人与这两个人生日不是同一天的概率:0.997×0.995=0.992。所以,在这个3人组里,所有人生日都不同的概率是0.992,这意味着至少有两个人生日相同的概率是0.008(1-0.992)。

    这意味着,随机选择出1000组3人小组,只有8组会有至少2人生日相同。这仍然是一个非常小的几率,但注意,相比两人小组,3人小组的概率翻番了(从0.003变成0.008)!

    一旦我们开始把越来越多的人添加到组里,至少2人生日相同的概率也随之增加得非常快。当我们的组员达到10人时,至少2人生日相同的概率高达0.117。我们应该如何确定这个值呢?对每个添加到该组的人,将他带来的额外分数和以往的分数相乘。每个额外分数都以365为分母,分子是365减去添加这个人之前小组的人数。

    因此,对于我们前面提到的10人小组,最后分数的分子是356(365-9),概率计算如下:

    4.11 让你最亲密的23个朋友震惊 - 图3

    这告诉我们,在10人小组中,所有人生日都不同的概率等于0.883(比2人或3人小组的概率要低得多),所以至少2人生日相同的概率是0.117(1-0.883)。

    第一个分数是第二人和第一个人生日不同的概率。第二个分数是第三人和前两个人生日不同的概率。第三个分数是第四个人和前3个人生日不同的概率,以此类推。第九个也是最后一个分数是第十个人和任何其他9个人生日不同的概率。

    4.11 让你最亲密的23个朋友震惊 - 图4所有人生日都不同意味着,一连串事件中的每一个事件都必须共同出现,所以我们通过将所有单个概率相乘来计算同一组所有事件发生的概率。每当我们添加一个人,我们就有一个分数进入方程,这使得最终乘积越来越小。

    4.11.5 任意规模小组的解决方案

    随着小组规模的增加,至少2人生日相同这一事件变得越来越有可能。这是非常合情合理的,但随着小组规模变大,至少2人生日相同的概率迅速变大的程度令大多数人震惊。图4-3说明当你添加越来越多的人时,概率上升的速率。

    4.11 让你最亲密的23个朋友震惊 - 图5

    图4-3:生日相同的概率

    对于20人来说,概率为0.411;30人的概率是0.706(即10次中有7次,你会在你的赌注上赢钱,这是相当不错的几率)。如果你组里有23人,至少2人生日相同的概率(0.507)只是比0.5稍微高一点。

    不管怎么说,这是一个非常巧妙的方法,人们从未停止过对它的惊叹。但要记住,只有当房间里至少有23人时(并且你愿意接受50/50的赔率),你才可以下注。人越多,它越有效,因为每添加一个人,你获胜的几率就会显著上升。为了有90%的几率让你赢得赌注,你需要保证房间里有41人(至少2人同一天生日的概率等于0.903)。如果房间里有50人,你会有97%的几率赢得钱。一旦人数超过60,实际上你能保证房间里至少有2人生日相同,当然,如果有366人出席,至少2人生日相同的几率是100%。如果你能让别人和你打赌,这些都是很好的选择!

    ——威廉·斯科朗普斯基