6.2 揭秘惊人巧合

    概率的模式会产生一些不寻常却有趣的一致性。下面教你如何解释那些看起来令人难以置信的巧合。

    统计学家的职责偶尔也会令其伤感,其中之一就是把这个充满奇思妙想、美好意外发现以及不时冒出惊喜的世界,变成一个沉闷的、可预测的、无趣的地方。在这里,我也即将这么做,如果你宁可继续戴着乐观的眼镜,那现在就戴上它们,跳过这个Hack,选择另外一个Hack(我建议你选择更令人愉快的话题,比如赢得大富翁[Hack #51])。

    我选择科学性,并把世界视为理性的,建立在遵循因果链的结果之上。我的问题是(如果你和我具有相同的思考方式,也许你的也一样):当我面对异常(很难解释的,意想不到的事情)时,很容易把异常发生作为某种神秘的、超自然的或某种意义上超出科学已知范围的证据。巧合是一个很好的例子。当我看到一个令人难以置信的巧合时,我忍不住就陷入非科学解释的舒适的坑里,如命运或共时性(synchronicity)。

    6.2 揭秘惊人巧合 - 图1共时性是开创性心理医生卡尔·荣格(Carl Jung)提出的术语,代表个人的有意义的巧合。他把它们视作对无意识内心世界的洞察,但不排除用伪神秘去解释它们。他不是一个统计学家。

    我解决问题的方案是:思考一下,并应用概率的一些基本规则(也许这也是你的解决方案,如果你依然和我一样思考)。这样一来,我可以掌握真实情况,考虑到存在于宇宙中的大样本,把此类巧合视为是不可避免的。通过应用这些规则,我对我生活的世界感觉更好了。我可以在几率的怀里安然入睡,我不需要神秘的、神奇的解释。这里有3种策略可供你应对下一个遇到的惊人巧合。

    6.2.1 比较可能结果的数量

    当我还是个孩子时,我曾经在漫画书上看到一则广告(如,Statboy和他的名叫Parameter的飞天狗)。这则广告推销改变后的美国便士,便士不仅包括标准的林肯肖像,另外还有约翰·F. 肯尼迪的肖像。有一长串清单列出了这两位总统共有的“令人瞩目的”巧合,以便解释他们应该放在一起的原因(而且,我记得,如果我购买一整套便士,我甚至会得到一张小海报,海报上列出了这些相似点)。

    该清单不仅包括显而易见的事实,比如两个人都被暗杀,继任者都是名为约翰逊的副总统,还包括了一些其他事实。我可以(的确)把这些巧合解释为两者之间某种重要的、有神奇联系的证据。让我们以这些巧合为例,将其作为一个研究问题:这两位总统之间是否存在不寻常的相似点?

    6.2 揭秘惊人巧合 - 图2我现在突然想起来,当时那本漫画书上的广告促使我思考了一段时间,巧合(coincidence)一词源于单词硬币(coin)。当然,我很快就明白了(肯定是通过研究生院),这也只是一种巧合。

    当判断一个巧合是否令人瞩目或是否可预见时,有一个工具可供使用,那就是计算可能的结果数,然后判断给定的结果(巧合)是否会偶然发生。这是预测一群人中,是否有人同一天生日所用到的方法[Hack #45]。

    表6-1的第一列介绍了在那些老漫画书广告以及一些“难以置信”的出版物中列出的一些巧合。第二列是一个简短的清单,列出这俩人可能相同、实际却不同的特征。

    表6-1:比较亚伯拉罕·林肯和约翰·F. 肯尼迪

    一些惊人的巧合 一些不起眼的非巧合
    两人都被暗杀 身高不同
    都在60岁当选 体重不同
    刺杀肯尼迪的人从仓库中开枪,隐藏在剧院里;刺杀林肯的人在剧院里开枪,隐藏在仓库(嗯,至少是谷仓) 他们死时年龄不同(尽管他们出生时同龄)
    林肯在福特剧院被刺杀;肯尼迪在福特车中被刺杀 他们的出生年份和日期不同
    两人都在星期五被刺身亡 两人的中间名不同
    两人都坐在妻子旁边被刺身亡 两人的妻子有不同的姓名,可能还有不同尺码的鞋子
    两人的继任都叫约翰逊 两继任者的全名不同
    林肯留着胡子,肯尼迪没有(我想起来了,他们的脸型非常不同)
    肯尼迪偶尔可能会打保龄球,林肯一生从未打过一场保龄球比赛

    如果只注意林肯和肯尼迪之间相对较少的一致性(命中),而忽略所有的、几乎无限多的不一致(非命中),就很容易误以为存在一些不可思议的连接。当然,依然可能存在一些不可思议的连接,但“巧合”无法为它提供证据。

    6.2.2 找出实际几率

    如果你遵守任意一种规则去玩扑克牌(如果你是一位名气不大的好莱坞名人,你显然一直在打牌),知道自己很少会看到皇家同花顺:同一花色的10、J、Q、K、A,共5张牌。如果你的对手被发到了一个皇家同花顺,那会引人注目吗?你会怀疑他作弊了吗?这取决于你一生中共看到多少扑克手牌,或你最近看到了多少手牌。

    让我们用简单的5张牌做数学运算。为了计算发出的5张牌形成同花顺的几率,我们先计算出可能的5张手牌数,并和那些被定义为皇家同花顺的手牌组合数进行比较。这个过程需要3步。

    1.考虑扑克牌的顺序,计算可能的手牌组合数。我们以这种方式开始是因为这样的数学计算最容易。52张牌中的任意一张都可能成为第一张发出的牌,然后剩余51张中的任意一张都可能是下一张发出的牌,再然后剩余50张手牌中的任意一张,以此类推,直到48张手牌中的任意一张。所以,当顺序有影响时,可能的手牌数是:

    6.2 揭秘惊人巧合 - 图3

    2.但是,顺序无关紧要。所以,我们用这个巨大的、所有可能的手牌总数除以可能的不同序列数。不同序列数是5×4×3×2×1=120,所以可能的5张扑克手牌数是:

    6.2 揭秘惊人巧合 - 图4

    3.因为只有4种花色,所以只有4种可能的皇家同花顺,我们用这个积极的结果(4)除以可能结果数(2 598 960),概率是0.000 001 539,即1/649 740。

    每经历649 740次手牌,你的对手或你能被发到皇家同花顺的5张牌。所以,如果它确实发生了,那肯定是罕见的。如果它在同一场比赛中不止一次发生,你应该把它解释为非常惊人的巧合或是作弊的证据。你自己来决定是将其看为巧合还是作弊。我只知道我的计算和自己的猜测。

    6.2 揭秘惊人巧合 - 图5怎么能发到皇家同花顺?毕竟,在纸牌游戏和得州扑克中,玩家有机会改善他们的手牌或至少把它引向某个目标。在发牌中,如果你有4张牌能组成皇家同花顺,并希望放弃第五张牌而抽取一张新牌,你有1/47的成功几率,或0.021个百分点。如果你有两次机会来提高你的手牌,几率就上升至0.043%,即约每25次尝试成功1次。

    6.2.3 移除分配给无意义事件的意义

    当必须赋予数据意义时,人类的大脑处于最佳状态。我们令人瞩目的智慧甚至可以在没有意义的情况下找出意义。通常情况,我们会认为自己见证了一系列巧合奇迹。当我们寻找巧合时,我们就能看到巧合。

    非常不可能的事件一直在发生:每一天、每一小时,甚至每一分钟。对于非常不可能的事件,只有当我们认为它们有趣时,它们才是有趣的。想想我们的扑克例子。因为有大约260万种可能的5张扑克手牌,任何特定手牌的几率约是1/2 600 000。我们认为有特别意义的手牌,比如同是黑桃的10、J、Q、K和A,和我们认为不具有特别意义的手牌,比如梅花4、黑桃6、方片J、黑桃K和红桃A,几率是一样的。为什么你对发到皇家同花顺和任何其他随机手牌组合的惊奇程度不同?对所有扑克手牌来说,概率是相同的。我们对特定的结果赋予了意义。

    下一次,你在一个拥挤的地方(如,棒球比赛场、游乐园或机场)遇到某个认识的人,你认为这种巧合有意义只是因为你碰巧认识这个人。是的,你会遇到某个特定的人(除非你被跟踪)的几率非常渺茫,但你100%会遇到其他人。所有其他人只是碰巧与你在相同时间出现在相同地点。它是一个巧合,个体的这种特定组合在同一个时间同一地点发生是非常不可能的。但是,这对你来说不是一个有意义的巧合。

    6.2 揭秘惊人巧合 - 图6如果我们算上你认识的每一人,那么你遇到熟人的几率会更高。比方说,你认识200人,你某天晚上自己去堪萨斯城皇家队看棒球比赛。如果那200个人每人每赛季去看一次皇家队比赛,每个赛季有81场主场比赛,200人中每个人有1/81的几率和你在同一个晚上出现在那里。那个时候你不太可能会遇到特定的人,比如你的叔叔弗兰克,但那里非常可能有你认识的人。大约有92%的几率,你200个好友中的一个或多个会在那里,即使他们每个人都很少去看比赛。即使你只认识56个人,这56人中的一个或多个出现在那里的几率也是大于50%的。

    我们每天都经历大量事件,人和事以非常不可能的方式交互和巧合。有时,这些巧合对我们有意义,所以我们注意到它们。但令人诧异的是,我们没有花费更多的时间关注这些非常不可能的事件。