6.3 识别生活中真正的随机

    在你指责赌场经营不正当的赌博,或威胁你的老板你将起诉他只雇佣白肤金发碧眼的女人之前,这里有一个工具,可用来分离那些看起来非随机但可能随机的情境以及那些看起来非随机但可能没有随机发生的情境。也许吧。

    随着你越来越深刻地意识到几率在你周围世界扮演着重要角色,你开始习惯性地对每天的情境进行统计分析,并可能对看起来不正确的模式过于敏感。但是,不要滥用你新发现的力量,把概率视为确定性。此外,不要错误地期望人们认为随机的事件看起来也是随机的。

    6.3.1 随机是怎样的

    看起来随机和真正的随机是不一样的。当事件有不同的可能结果,而每个结果有等同的发生几率时,其中任何一个都有可能发生。但是,人们的一般思维是,有若干同几率结果的事件,其最终结果应该看起来是某种方式,在一定程度上,这种方式看起来也是随机的(不管那意味着什么)。

    举例来说,现实世界的研究发现,人们往往认为翻转硬币时,最可能的结果是那些看起来最为混杂的结果。为了说明这个观念,请看表6-2。(在没进行深入阅读前,不要看表6-3)你认为哪个确切的顺序最有可能发生?

    表6-2:硬币翻转模式(不显示概率)

    答  案 正面和反面的模式 概  率
    A 正面、反面、正面、正面、反面
    B 反面、反面、反面、反面、反面
    C 正面、正面、反面、反面、反面
    D 正面、正面、正面、正面、反面

    很多人给出的答案是“A”。也许你给出的也是这个答案。当被要求解释为什么A看起来是最可能出现的结果时,可能有以下这样的解释。

    • “其他的都太有顺序了。”
    • “A更混杂,所以它的可能性比较大。”
    • “A看起来更随机,就像它可能真的会发生一样。”

    即使你知道抛硬币是随机的(假设硬币没有被加重),看起来随机并不使得某事更有可能。所有这些抛硬币的模式实际上具有同样的可能性,如表6-3中的数学所示。

    表6-3:抛硬币模式(显示概率)

    答案 正面和反面的模式 概   率
    A 正面、反面、正面、正面、反面 1/2×1/2×1/2×1/2×1/2=1/32=0.031 25
    B 反面、反面、反面、反面、反面 1/2×1/2×1/2×1/2×1/2=1/32=0.031 25
    C 正面、正面、反面、反面、反面 1/2×1/2×1/2×1/2×1/2=1/32=0.031 25
    D 正面、正面、正面、正面、反面 1/2×1/2×1/2×1/2×1/2=1/32=0.031 25

    当被要求预测抛一系列硬币的特定结果时,所有可能的结果一定是相同概率的,因为每次抛硬币都是相互独立的。换言之,硬币不知道它上一次是头着地还是尾着地,硬币也没有办法知道它下一次被抛出时哪一面着地。一枚硬币,像骰子或轮盘赌一样,没有记忆。

    6.3.2 如何识别随机结果

    当你看到不同寻常的事件时,想要知道它是否为不寻常的事件,你需要确定你关注的是组合还是排列。在概率论中,我们讨论概率的计算时要分清是某种组合的概率(例如,以任何顺序出现的3个正面和2个反面),还是某种排列的概率(会产生3个正面和2个反面的确切序列,如正面、反面、正面、正面、反面,以这个特定顺序出现)。

    如果你被问到,哪个结果是最有可能的,或一个给定结果是否可能偶然发生,首先要确定你被问的是可能的组合(例如,以任何顺序出现正面和反面的总数,或是以不同方式发到相同花色的5张牌的总数)还是可能的排列。下面是两者的重要区别。

    • 组合

    组合是指当从某个总体中随机抽取时,能使结果达到某个特定数值的总方法数。硬币翻转就是从由50%正面和50%反面构成的、理论上无限大的总体中抽取的样本。组合的数量会有变化,这取决于感兴趣的特定值的数量。换句话说,对于抽5张牌或翻转硬币,抽到3张人头牌的方法比抽到5张人头牌方法要多。因此,抽到3张人头牌比抽到5张人头牌更有可能。

    • 排列

    排列是指给定数量的元素能以多少种方式排列。换句话说,它们是精确的序列数。在我们的硬币翻转例子中,5个元素,每个元素都有2种可能,进而导致32种不同的可能顺序结果。所以,表6-3所示的每个排列会发生的几率是1/32。

    6.3.3 如何计算组合

    可能的组合数量是通过把抽取的可能值的数目(例如,一枚硬币有2个值:正面或反面),在每次抽取时和它自身相乘得出:

    值的数量抽取次数

    5次硬币翻转,有32种可能的组合(25)。

    从总体中抽取特定元素的特定值(如3个正面)的方法数,计算方程如下:

    6.3 识别生活中真正的随机 - 图1

    这个方程,需要这些变量:

    n 元素或抽取的数量(例如,5次硬币翻转)。

    r 感兴趣的特定抽取(例如,3个正面)。

    ! 阶乘,表示这个数乘以比此数小1的数,然后乘以比此数小2的数,依此类推,直到最后乘以1。例如,5!代表5×4×3×2×1=120(顺便说一下,这就是在扑克手牌中,为什么5张牌有120种可能组合[Hack #62])。

    那么,5次硬币翻转获得3个正面的方式数为:

    6.3 识别生活中真正的随机 - 图2

    32种可能的组合中选出10种组合,意味着你通过5次抛硬币正好得到3个正面的几率是10/32,或约31%。

    在一个荒岛上进行统计黑客
    如果你在一个荒岛上,没有书籍或方程方法,但必须找出5次硬币翻转中正好出现3次正面的频率是多少时,你可以使用粗略近似的方法:把所有可能的翻转模式列出来,并数出它们之中有多少正好有3个正面。它会如下面这样,符合要求的结果(3次正面)以粗体显示:
    HHHHH THHHH HHHHT THHHT HHTTHTHTTH HHTTT THTTT HHHTH THHTH HHHTT THHTT HHTHH THTHH HHTHT THTHT HTHHH TTHHH HTHHT TTHHT HTTTH TTTTH HTHTT TTHTT HTTHH TTTHH HTTTT TTTTT HTHTH TTHTH HTTHT TTTHT

    6.3.4 什么时候需持怀疑态度

    判断一个模式是否随机(即,什么被期望为偶然出现的),需要:

    • 知道某种组合的几率(不是排列);
    • 克服“期望随机结果不会产生可识别模式”的心理预期;
    • 在质疑数据前,设置事件需达到的不可能发生的概率标准。

    让我们回到硬币翻转表,现在表6-4新增了感兴趣的结果概率。

    表6-4:硬币翻转结果和概率

    顺序 顺序概率 结果 结果概率
    正面、反面、正面、正面、反面 0.031 25 3个正面 0.312 50
    反面、反面、反面、反面、反面 0.031 25 5个反面 0.031 25
    正面、正面、反面、反面、反面 0.031 25 3个反面 0.312 50
    正面、正面、正面、反面、正面 0.031 25 4个正面 0.156 25

    这些结果中,最稀有的是5个正面,5枚硬币翻转,100次中会有3次出现5个正面。在一个给定的尝试下,这不太可能发生,但在一系列尝试中,它偶尔会发生。如果在一系列的尝试中经常发生,其中一定有某种原因。

    你习惯什么水平的可能性?事件得有多罕见,你才能判断其不是偶然发生的?科学家们已设定了5%的标准。如果研究表明,这个结果偶然出现的几率只有5%或更少,那它通常被认为是显著,可能作为有几率以外的因素在起作用的证据。

    不过,当你想指责某人是骗子时,你必须自己决定。祝你做决定时好运!它导致打架的几率应该小于5%。

    ——吉尔·罗米尔和布鲁斯·弗雷