6.1 比超人更聪明
闪电可以击中同一个地方两次,但可能性非常小。概率法则使我们能够计算一系列罕见事件连续发生的可能性。
我们偶尔会听到一些极不可能发生的事件多次发生在同一个人身上,比如一个在森林里漫步的人被雷电击中了7次,或是一对新泽西夫妇两次赢得了彩票大奖。当他们出现在新闻中时,这些故事通常包含对当地统计教授的采访,教授会估计这种事情发生的几率。
计算一系列事件发生可能性的数学方法相当简单。难的是合理估计任意单一事件发生一次的概率。然后,你只需将这些单个概率相乘,就能得到全部怪异事件发生的可能性。
6.1.1 幸运的路易丝·莱恩
为了展示整个系列事件发生可能性的计算中涉及的步骤,我选择了文学名著中的例子。路易丝·莱恩(Lois Lane)漫画杂志的第56期描述了一系列罕见的事件,该期杂志由DC漫画在1965年4月出版。故事的通用模式是:路易丝有一些看似很难解释的超能力,但在故事的结尾会对此有某种简单的解释。
路易丝·莱恩,现在是漫画书中主人公超人的妻子(之前是他的女友和头号粉丝),是20世纪六七十年代DC漫画中非常受欢迎的人物。如今的资深漫画爱好者把那个时代的路易丝漫画作为独特奇怪的漫画创作来欣赏。路易丝几乎每天都能成功挑战概率。关于她的漫画应该被列为统计课程必读材料。
我们要讲的这个奇怪经历包含了一个统计Hack,在故事结尾,超人对其进行了解释。路易丝假装自己具有读心能力,借此待在绰号为“极小概率”的犯罪分子拉金身边,或许还能为她的报纸提供热点新闻素材。
一切进展顺利。她现在被拉金绑架了,拉金强迫她提供“读心能力”的信息,这样他就可以去犯罪。路易丝很幸运,犯罪分子也一样,她的盲目猜测是正确的,拉金让她一直活着。路易丝的猜测非常准确,以至于她自己都开始相信自己具有超能力。
最终,解救了路易丝的超人证明,路易丝只是幸运罢了!很幸运。令人吃惊的是,这是不可思议的幸运。路易丝正确预测冗长的系列和准确猜测的几率是极其微小的,她只是运气特好。恭喜,路易丝!
超人给出了路易丝实现这一梦幻般壮举的几率,但故事的作者(匿名)没有提供计算方法。让我们回顾一下路易丝做的随机猜测,我们自己计算,并检验一下超人的数学。为了确定这一系列的独立事件的概率,我们将应用乘法法则[Hack #25]。
6.1.2 猜测
在故事中,路易丝正确猜中了(注意,是完全随机地)如下问题:
1.5辆相同的装甲卡车,哪辆才是运送首都银行现金的;
2.公司里存放工资的保险箱密码;
3.未登记的、镇上首富的电话号码;
4.20 000棵树中,哪一棵的下面埋藏了银行抢劫犯的战利品。
超人救了她之后,她终于在猜测罐里软糖数量这道题上失败了。因为超人向莱恩女士解释说她没有超能力,他认为她随机猜中这4道题的几率是326 454 839 047(失败)比1(成功),或是1/326 454 839 048。
“我明白了,超人!”她说,“我很幸运地逮到‘那次机会'。”“是的,”超人说,“毕竟,也有人总是赢得彩票大奖(或某种类似的荒谬事情)。”由超人或他的超级电脑计算出的数字肯定是很大的,这好像是正确的,但我不认为这是正确的。我的猜测是,这个结果甚至会更加不可思议。
6.1.3 计算
让我们完成自己的计算。对于猜测1和猜测4,我们可以独立且非常准确地计算出猜中问题答案的几率。对于猜测2和猜测3,我们必须做一些假设。
下面是路易丝作出的猜测以及每个猜测几率的真实计算。
对于被要求给出一连串不可能事件的可能性解释的统计学家来说,这里所涉及的数学是工作中比较容易的一部分。困难的部分在于确定开始的值,以及确定等式的各个部分。正如你看到的,我们尝试估计路易丝有多么幸运,我们将要做一些适度狂野但合理的猜测,来或多或少估计任意特别事件发生的几率。大多数时候,统计学家无法准确获知事件的发生几率。他们往往专注于理论情况下事件发生的几率,而不关注莱恩女士那样的真实生活问题。
- 猜测一
5辆相同的装甲卡车,哪辆才是运送首都银行现金的?这是最简单的一个问题。5种可能性,有1个是正确的选择。几率是1/5。
- 猜测二
路易丝猜测存放大公司工资的保险箱的密码。这是一个真正的难题。路易丝不仅要猜中表盘需转至的5个数字,同时也得猜中5个不同数字必须遵循的顺序,并且要猜中转盘转动的方向。
在现实世界中,保险箱有多种不同类型的组合密码,所以很难确切知道我们应该对这个问题做什么假设。我对密码破译进行了一些研究(可以说是因为这个Hack),还对组合密码保险箱进行了一些了解。通常,密码箱共有1~8个数字的组合序列。我猜测,3个或5个数字的组合序列是最常见的。表盘上的数字可以是任意范围的值,但是0~99在大保险箱中很常见,比如故事中的工资保险箱。
所以,首先,比方说,她随机选择有3个或5个数字组合的保险箱。这个猜测的几率是1/2。假设她每次从0~99中随机挑选一个数字:序列中每个数被选中的几率都是1/100。她还必须猜测开始的方向。比方说,大多数保险箱(80%),开始是向左侧旋转的,而只有20%(1/5),开始是向右旋转(这是她的猜测)。
目前,一切良好。但是,路易丝实际的选择导致这一切非常棘手。她预测的是“11向右……13向左……5向左……向后旋到8……向前旋到15。”这是一个非常奇怪的组合。首先,我们通常会以另一种方式报出组合顺序:向左13,而不是13向左。第二,怎么可能连续两次向左旋转!毫无疑问,你必须改变表盘的方向以锁定序列中的每个数字。毕竟,表盘在其转动过程中会经过很多数字。它是如何知道是否要把每个经过的数字视作组合序列的一部分?我打算假装匿名作者误报了组合顺序了,否则,我不得不陷入无尽的混乱循环并因此被困此处,我的手指停在键盘上,再也无法继续下去。
最后,为什么路易丝不再说向左或向右,而开始说“后退”和“前进”?这只会使得她的方向不清楚。(难道是为了失败时为自己开脱?)再一次,我假定她使用这些术语意味着方向的变化,即使后退可能意味着向左,前进意味着向右,这也会使事情变得更复杂。那么,对于这样一个猜测的保守概率估计是1/2×1/5×1/100×1/100×1/100×1/100×1/100,即为1/100 000 000 000。
- 猜测三
路易丝还猜中了未公开登记的、镇上首富的电话号码。有几种方法可用于计算。
首先,如果路易丝考虑得很简单(没有冒犯路易丝粉丝的意思,但我如此猜测),她可能只设置这样的限制因素:电话号码必须有7位数字,并且不以0开头。根据这些规则,有9 000 000个可能的电话号码。这意味着我们开始时假定有10 000 000个可能的7位数(9 999 999是最大的7位数,再加上一个数0 000 000)。
如果我们不将以0开头的数字算入其中,就消除了0 000 000这个数字和所有的6位数字或6位数以下的数字(有999 999个)。我们几乎消除了百万种可能。那么,在这种情况下,路易丝猜中数字的几率将是1/9 000 000。让我们给路易丝一些考虑时间,并假设她不会猜自己的电话号码或其他她记住的电话号码。我猜这样的号码可能有10个。那么,路易丝将从8 999 990中选择1个。
如果更聪明一些,路易丝(比方说,为了论述的必要)可能知道大城市正在使用的特定总机号、那些可能被用作未登记的号码或小城镇富裕人群的号码,等等。在以前,一个特定区域代码的前3个数字有可能是总机号。我们一般估计一个城市的人口规模有50万左右,所以她可能从这里面选择。在“更聪明的路易丝”场景下,她的胜算有了很大的提高。现在,她可能是从500 000个数字中盲目猜测,而不是从9 000 000个数字中猜测。她猜中的几率可能是1/500 000。我对路易丝智商的粗略估计表明,这种情况不是最有可能的,但她是一名大城市报纸的记者,所以也许有这方面的知识。让我们仁慈一点,就这么假设吧。
- 猜测4
最后,路易丝猜中了银行抢劫犯的战利品究竟埋在20 000棵树中的哪一棵下面。如同猜测一,这也非常容易计算。如果树林里有20 000棵树的下面真的可能埋有战利品(这个数字很可能是估计的或四舍五入的),那么正确猜测的几率是1/20 000。
6.1.4 最终概率
那么,假定路易丝没有错,知道保险箱和电话号码系统的各种事情,她在这4个问题上连续正确猜中的几率是1/5×1/100 000 000 000×1/500 000×1/20 000。保守地说,这个序列被幸运猜中的几率是1/5 000 000 000 000 000 000 000,甚至比现在已经令人难以相信的1/326 454 839 048还要引人注目。
“我明白了,超人!我很幸运地抓住了正确机会。”路易丝总结道。的确如此。当然,这个几率比将来超人向路易丝求婚的几率更糟糕,但那发生了。那么,我应该向谁诉苦呢,超人还是超人夫人?
