第6章 为最艰难的抉择组织信息

当我们命悬一线的时候

“我桌面上的所有事情都是棘手的”,奥巴马总统说道,“不然别人早就已经处理了。”那些答案很显然的决定——非常容易的问题—实际上已经由比总统级别低的人做出了。没人愿意浪费我们宝贵的时间。总统所面对的问题都是那些比他级别更低的人所无法决定的问题。

美国总统所做出的决定大多会带来重大影响——性命的丢失、国家之间局势的紧张、可能会导致失业的经济变化。与这些决定有关的信息大多不充分。总统的顾问团不希望他考虑任何新的可能——虽然他有时会这样做。顾问团将问题向上提交,这并不是因为他们的智商不够,无法解决这些问题,而是这些决定常常涉及两大损失、两大负面效应之间的抉择,总统需要决定哪种才是更能接受的。这时候,奥巴马总统会说,“你最终还得处理多种可能性。你需要意识到,你所做的决定有三四成的概率不会起作用”。

我在第3章的时候提到过永利集团的史蒂夫·永利,他是这样看待决策的:“对大集团而言,即使已经有了有效的管理系统,决策者还是会面临各种层次的金三角。当需要我做出决定,且唯一答案都会产生负面效应的时候,例如,工人失业、公司大量财产损失,通常这些决定已经注定会产生两大负面影响。我只需要在这两大负面影响中选择一个我们能接受的而已。”

医学决策通常也是这样——需要在两大负面效果中选择。我们就像是在赌博:如果什么都不做,我们的健康状态会变差;如果选择某种医学治疗,我们又可能面临潜在的痛苦以及各种开销。理性地分析结果真的很难。

我们中的大多数人天生都无法自己估算这些可能性。我们不但不会自己估算这些可能性,即使通过训练,我们也无法实现理性分析。我们每天都会面临一些影响生计、幸福、健康的决定,这些决定中的大多数——尽管我们一开始并不曾意识到——都面临各种可能性。如果医生们从概率论的角度给病人解释医学决定,病人很可能根本无法有效地抓住这些信息。这些信息都是在我们情感脆弱、认知过载的时候向我们袭来的(你可以想想当你拿到诊断书的时候,会有怎样的感受)。当医生们解释说,有35%的概率会这样、有5%的概率会那样的时候,我们实际上已经被干扰了,我们的大脑会思考可能面临的医疗账单与医疗保险,以及我们究竟应该怎样请病假。当我们还在想象各种痛苦与不舒适、思考遗嘱、思考住院期间狗狗该拜托给谁照顾的时候,医生的声音实际上已经被淹没成为背景。

在这一章中,我们将提供一些组织健康方面有关信息的简单工具,它们适用于最艰难的决策。但当我们面临未知信息、思考生命意义的时候,医学信息的复杂性必然涉及强烈的情感体验。无论你有多少助手,无论你有多能干,医学决策都会给我们有组织的大脑带来巨大的挑战。

直线思考各种可能性

抉择之所以那么困难,原因在于它涉及各种不稳定性。如果没有各种不确定,抉择将变得非常简单。由于未来是未知的,我们不知道自己的决策是否会带来最可能的好结果,所以,抉择必然存在不确定性。认知科学已经教会我们,如果仅仅依靠直觉,我们通常会做出一些错误的决定,尤其面对统计信息时。

假设有一个40岁的妇女打算要小孩。她了解到,与更年轻的女性相比,她生下的小孩患上某种先天性疾病的概率要高出5倍。乍一看,这似乎是一个无法接受的风险。对小孩的渴望与科学数据之间的斗争在她心里激烈进行。那么统计信息能填补空白,让她得出正确的结论,做出对她更有利的决定吗?

维持有组织的大脑与有组织的生活的一部分就是需要我们将最好的决策变成现实。错误的决策会消耗我们的精力与能量,更不用说当一切偏离正轨时,我们花在修正决策上的时间。那些经常做出高风险决策的人通常会将决策分成好几类,他们会采取治疗类选法,这类似于我们在第3章所讲的分类列表:

1.你可以现在做出的决策,因为答案是显然的。

2.可以将其分配给其他有更多时间或更多经验的人的决策。

3.一些你已经掌握相关信息,但仍需要时间处理、消化信息的决策。这也是法官在面临复杂案件时通常的做法。这并不是由于他们没有掌握信息——他们只是希望从不同角度和大局思考问题。这些决策通常也需要一个截止时间。

4.你需要更多信息才能做出的决策。这时候,你可以依靠帮手获取信息,也可以备注自己需要的信息。这些决策通常也需要一个期限,即使是那些最随意的决策。这样,你才能将它们从列表中删除。

医学决策通常都属于第一类(需要立刻决定),例如你的牙科医生告诉你,你有一颗新的蛀牙,需要补牙。补牙是很寻常的事情,你几乎没有其他选择。也许你之前有过糟糕的补牙经历,或者你知道其他人有过糟糕的经历,抑或你熟悉补牙的程序,知道补牙会有风险,但与不补牙可能的风险相比,大多数人都会认为这些风险算不上什么。你的牙科医生不需要花时间解释其他的选择,也不需要花时间告诉你不补牙可能带来的后果。但大多数处理严重疾病的医生都不会这么简单地看问题,因为最好的治疗方案也存在多种不确定性。

一些医学决策属于第二类(分配给其他人),尤其是那些要么矛盾、要么显而易见的决策。我们会甩甩手,然后问我们的医生:“你会怎么做?”我们这样其实已经将决定权交给了医生。

当第一次面对问题时,或者当我们面临第二与第四类(获取更多的信息)决策的时候,第三类决策(反复思考)似乎是我们最正确的决定。毕竟,对于那些影响更大的决策,我们不能贸然做出决定。

许多医学决策属于第四类——你只是需要更多的信息。医生可以提供一些信息,但你很可能需要更多信息,然后分析这些信息,做出最正确的决定。我们的直觉还没有进化到能够处理可能性思维的程度,但我们可以在某个下午训练大脑使其成为一个有逻辑的、有效率的决策机器。如果你想做出更好的医学决策——尤其是在危急情况下,当情感疲劳影响我们做决策时——你也许需要更多地了解这些可能性。

我们每天都会使用可能性来指代两个不同的概念,有必要将这两大概念进行区分。某些时候,我们进行科学计算会得到多个可能性中的某种特定结果——客观计算;而某些时候,我们却指代了一些更主观的东西——意见。

第一种概念的可能性描述了那些可以计算的、可数的事件——更重要的是——从理论角度而言,它们是可以重复的。我们可以描述某些事件,例如掷硬币、杀人游戏、拿到扑克牌的大小王和中彩票。可计算意味着我们可以在公式中设置特定数值,然后得到答案;可数意味着我们可以通过试验调查、分析结果,根据经验确定可能性。可重复性指我们可以重复进行试验,得到问题事件可能性的相似描述。

对很多问题而言,计算都是很简单的。我们会考量所有可能的结果和感兴趣的结果,然后设置一个等式。从一副牌中拿到大小王(或者大小王中的一张)的概率为1/52,因为我们可能从52张牌中拿到任何一张,而我们只对其中一张感兴趣。从一副牌中拿到任意一张王的概率为4/52,因为一副牌有52张,我们只对其中的4张牌感兴趣。如果某期彩票的销量为1亿张,而你只买了1张,那么你中奖的概率为1亿分之一。我们需要认识到,在彩票与医学决策中,你可以做一些事情从很大程度上增加概率,但这样做实际上是不现实的,也没有实际意义。你可以买100张彩票,将中奖的概率提高100倍,但中奖的概率仍然很低——100万分之一,这绝对不是一个合理的投资。你可能被告知,如果接受某种特定治疗,你患病的概率将降低50%;但是如果你患病的概率本身只有万分之一,再接受某些治疗来降低负面效应和风险的话,就很不值得。

一些主观事件的概率很难计算,但可以计算,至少从原理上来看是这样。例如,如果一位朋友问你在一副牌中拿到顺子的概率——同一花色的连续5张牌——如果不参考教科书,你很难算出这个概率。但理论上,你是可以通过计算得到答案的。你可以连续好几天都玩扑克,然后写下你拿到顺子的概率;答案也许会很接近理论上的正确答案0.0015%(百万分之十五)。你进行实验的时间越长——实验次数越多——你的计算结果就越有可能接近正确值。这就是大数法则:当样本容量更大的时候,你得到的结果就越可能接近理论值。拿到顺子的概率是可以计算的,也是可以重复的:如果你找到朋友跟你一块玩扑克,你会得出相同的结论,前提是你要进行足够长时间的实验,获得大量实验数据。

某些事件的结论,理论上是无法计算的,但它们仍然可以计算。生男孩的概率、离婚的概率、榆树街房子着火的概率,都属于这一类。对于这类问题,我们需要观察——我们会计算,因为公式告诉我们怎样计算可能性。我们可以调查某地区医院的出生记录,可以阅读某地区十年内的火灾报告。汽车生产商可以从成千上万的喷油嘴失误数据中计算出喷油嘴在使用多少次之后会发生故障。

然而,客观可能性需要理论计算或观察考量,第二种可能性——主观可能性——它是无法计算也无法考量的。在这种情况下,我们使用“可能”这个词语来表达对未来事件的主观自信。例如,如果我说下周五我有90%的可能性会参加苏珊的聚会,这并不是基于我之前的计算或是任何其他人的概率——这种事件根本无法计算;相反,这是基于我对这一结果的自信。这种说法看起来很准确,但实际上根本不存在任何准确性。

所以,尽管这两种可能性中一种是主观的,另一种是客观的,但没有人会注意到其中的差别——我们每天都会使用可能这个词语,盲目地使用它,将两种不同的可能混为一谈。

当我们听到这些话:“有60%的可能性两国的冲突将会升级为战争”或者“有10%的概率,某个野蛮的国家会在未来10年内引爆原子武器”,这些都是对第一种可能性的计算;我们还有第二种可能性的主观表达,说话者对某一事件发生的可能性的自信。第二种事件并不像第一种事件那样是可重复的。与榆树街发生火灾或玩扑克不同,它们是无法计算或考量的。世界上并没有那么多有相似原子武器的野蛮国家可以供我们做出计算。在这种情况下,当有学问、有知识的观察者谈及可能性时,他们实际上只是在猜测。由于这些事件存在主观性,所以某些专家通常不赞成这样的可能性。

连续拿到两次大王的概率几乎为零。为什么呢?我们可以通过将两个事件的概率相乘得到两个事件同时发生的概率。第一次从一整副扑克中拿到大王的概率为1/52,第二次从一整副扑克中拿到大王的概率也为1/52(如果你将第一次拿到的大王再放回去,凑成整副牌)。那么1/52×1/52=1/2704,那么掷硬币中连续3次转到字的概率就是将每个事件的概率1/2乘以3次:1/2×1/2×1/2=1/8。你也可以做个小小的实验,投掷硬币多次,得到连续3次字。从长远来说,你得到连续3次字的概率为1/8。

这种乘法运算成立的前提是:这些事件必须是独立的。也就是说,第一次卡牌与第二次卡牌必须是独立的,互不影响。如果我们已经洗了牌,这个结果一定是正确的。当然,某些事件并不是互相独立的。如果你将第一次拿到的大王放在牌底,我第二次从牌底再拿牌,这些事件就不是独立的。如果气象学家预测今天、明天都会下雨,你想知道连续两天都下雨的概率,这些事件就不是独立的,因为气象流通常需要一定时间才能穿过某些区域。如果这些时间不互相独立,数学计算将会更加复杂——尽管可能也不是那么复杂。

我们应该仔细思考这些独立事件。被闪电击中是很少见的事件——根据美国国家气象服务中心的数据,这种概率为万分之一。所以被雷电两次击中的概率就是1/10000×1/10000(亿分之一)吗?这个结论的前提是:这些事件是相互独立的,但实际上它们可能并不是这样。如果你居住在一个经常发生雷电的地方,并且经常在雷电天气中出门,你会比居住在其他地方、采取更多预防措施的人更容易遭受雷击。曾经有人在两分钟内被雷电击中过两次,一个在弗吉尼亚公园散步的人一生中曾经被雷电击中7次。

如果你说“我曾经被雷电击中过,所以我可以随心所欲地在雷雨天散步”,那你一定很愚蠢,因为这是没有受过教育的人才会犯的逻辑错误。几年前,一对年轻夫妇在旅行社商量订哪个航班的时候,我曾经听到过这样的对话(我确信自己没有记错):

艾丽斯:“我不想乘坐布兰克航空公司的航班——他们去年曾经发生过空难。”

鲍勃:“发生空难的概率为百万分之一。布兰克航空公司的航班已经发生过空难,所以他们不会再发生空难了。”

由于不了解布兰克航空公司空难发生的情况,艾丽斯的言论很显然构成了一个理所当然的恐惧。空难事件的发生通常都不是随机事件:这其中一定隐含着航班操作方面的隐性问题——训练不够的飞行员、粗心的机械师、老化的飞机。布兰克航空公司航班连续发生两次空难不应该被视为独立事件。鲍勃使用的是“直觉推理”,而不是“逻辑推理”,这种推理就像你说“曾经被雷电击中过,所以不会再被雷电击中”一样。按照这种错误的伪逻辑,你可以想象鲍勃会这样想,“飞机上有炸弹的概率为百万分之一,因此,如果带一枚炸弹上飞机,飞机上有两枚炸弹的概率就会大大增加”。

尽管空难是独立事件,但是仅仅凭借“它已经发生过”而断定不会再发生,就会陷入赌博的谬论,认为目前就是最安全的航班。这种概念不能保证下次空难之前已经有了100万次航班,也无法保证下一次空难会在所有的航班中均匀分布。所以,任何一家航空公司连续遭遇两次空难的事件都不能视为独立事件。

客观获得的可能性也不是一种保证。尽管从长远来看,我们会认为一枚硬币出现字的概率为50%,但可能性并不是一个自己会纠正的过程。硬币没有记忆、知识、意志力和意愿。没有任何一种可能性的理论能确保每件事都会像我们所期望的那样。如果你连续10次都得到字,下一次你得到花的可能性仍然会是50%。花的可能性不会更大,也没有过期。概率会自我矫正,这个理论是赌博者谬论的一种,它已经让许多赌场老板成为亿万富翁,包括史蒂夫·永利。数以百万计的人源源不断地将钱投入赌博机,幻想他们得到回报的时机就是现在。尽管可能性会达到均衡,但这都是从长远的角度来说的。从长远来看,我们会花费所拥有的更多的时间与金钱。

我们可能会疑惑,直觉告诉我们,连续11次得到字的概率几乎为0。这是正确的——但只是部分正确。

这里的推理错误在于,将连续得到10次字的概率与连续得到11次字的概率混淆——事实上,两者并不是完全不同的。连续10次得到字后的第11次,出现字和出现花的概率是相等的。

我们人类天生不擅长构造随机序列。当我们被要求生成随机序列时,相较于实际随机序列,我们倾向于写下更多轮替(字—花—字—花),我们很少会写出连续序列(字—字—字)。在一次试验中,测试者被要求写下抛掷100次硬币的随机序列。几乎没人写下连续7次相同面的序列,尽管在100次抛掷中,出现这种序列的概率会增加一半。直觉会让我们在短的序列中将得到正反两面的概率分摊,尽管稳定的五五概率通常需要在长序列中才能出现——数以百万次的硬币抛掷中。

我们需要压制这种直觉。如果你连续抛掷硬币3次,得到连续字的概率确实是1/8。但是我们会被事实迷惑,我们观察到的只是短的序列。平均来说,我们只需要抛掷14次就能够得到连续3次字;如果我们抛掷100次硬币,至少出现一组连续3次字的概率将超过99.9%。

我们会陷入这种思维逻辑——思考序列中可能性的改变——某些情况下,可能性确实会变。确实是这样!玩扑克牌时,你一直在等着A的出现,等待的时间越长,A出现的概率就越大。当已经出现了48张扑克牌的时候,下一张牌为A的概率为1(剩下的所有的牌都是A)。如果你正在寻找上一个暑假所看见的那种果树,每次没能找到果树都会增加你下一次找到果树的概率。除非你停下来仔细思考,我们常常会将这些不同的可能性模型混淆。

我们感兴趣的许多事情都曾经发生过,所以我们才能经常估算出它发生的概率。事物的基础概率就是它出现的背景概率。我们中的大多数人都会有这种直觉:如果你的汽车发动机出现杂音,你将它送到维修厂,机械师可能看都没看就会说:“很可能是同步带出现问题了——我们遇到的情况中有90%都是这种问题;也可能是喷油嘴的问题,但喷油嘴几乎很少出错。”这位机械师使用的正是信息预测基本概率。

如果你被邀请参加苏珊家的某个聚会,聚会中有一大群你从未见过的人,与你最后谈话的人是医生而不是总统内阁成员的概率有多少?医生的数量显然多过内阁成员的数量。医生的基数更大,所以,如果你对这次聚会一无所知,肯定会猜测在聚会上会遇见更多的医生。同样,如果突然头痛或者感到焦虑,你也许会担心自己患上脑瘤。无法解释的头痛实际上是很常见的,但脑瘤不是。医学诊断上有这样的老生常谈:“当听到蹄声时,会想到是马的蹄声,而不是斑马的。”也就是说,当我们有某种症状时,不要忘记基础概率。

认知心理学试验已经告诉我们,做出判断和决定的时候,我们通常会遗忘基数,反而会相信医学术语。在苏珊的聚会上,如果与你谈话的人衣服上有美国国旗翻领胸针,很懂政治、被美国特工处追踪,那么你会认为她是一位内阁成员,因为她拥有内阁成员的所有特质。但是你忘了基础概率。全美一共有85万名医生,但仅仅只有15位内阁成员。在这85万名医生中,一定会有人佩戴美国国旗翻领胸针、懂政治,甚至出于某种原因会被美国特工处追踪。例如,第111次国会的时候,内阁成员中有16位医生——比内阁成员中其他职业都要多。还有一些医生在军队、联邦调查局、中央情报局工作,肯定会有医生的配偶、父母、孩子是高级公务员——其中的某些人需要采取保密措施。85万名位医生中,可能有人需要安全许可,或者出于某种原因牵涉到特工处,从而需要参与调查。这种推理错误是如此的根深蒂固,它甚至有个名字——代表性启发法。它的意思是某些有代表性的人或情形会有效压倒我们大脑的推理能力,让我们忽视数据或基数信息。

在某篇论文的经典试验中,你需要阅读某个场景。你被告知,在某个特定的大学,10%的人是工程师,90%的人不是工程师。你参加一个聚会,看见某人穿着塑料防护服(不用说,许多人都认为这种打扮是工程师的典型形象),你被要求猜测那个人是否是工程师。许多人都认为他是工程师。防护服是如此典型,确凿证据,很难让人想到那个人会从事其他职业。但我们需要考虑这样一个事实:这所大学很少有工程师。也许这个人是工程师的概率不会与基础概率一样低——10%,但它肯定也不会有100%那么高——其他人也会穿防护服。

这就是有趣的地方。研究者然后设置了相同的情形——一所大学的聚会中,10%的人都是工程师,90%的人都不是工程师——然后试验人员解释道:“你会遇见某个穿防护服的人,也可能遇见某个不穿防护服的人,但是你无法分辨他们,因为他们都穿着夹克。”当试验人员要求猜测某个人是否为工程师时,测试者通常会说“一半一半”。被问及原因时,他们回答说,“他也许穿着防护服也许没有——我们不知道。”这里,人们再一次犯了将基础概率考虑进去的错误。如果你对那个人一无所知,那么他是工程师的概率为10%,而不是50%。只有两种选择并不意味着这两种选择出现的概率是相同的。

再举一个更直观清晰的例子。想象一下你在家附近的超市散步,突然撞上某个人。她可能是伊丽莎白女王也可能不是。但她是伊丽莎白女王的概率有多大呢?大多数人都不会认为这是一半一半。女王出现在超市的概率有多大?更不用说她是我们所撞见的那个人。当可能性较小的时候,我们的大脑会打结。做决策需要我们将基础概率信息与其他相关诊断信息结合。这种类型的推理由数学家兼长老派牧师托马斯·贝叶斯发现,因此以他的名字命名:贝叶斯定理。

贝叶斯定理让我们得以修正预测。例如,我们读到“大致一半的婚姻最终都会离婚”,如果我们了解更多信息,例如年龄、宗教、涉及人群的位置,我们就可以修正预测,因为一半的数据都是针对某个群体的,一些地区的离婚率肯定高于其他地区。

还记得那个有10%的工程师、90%非工程师的聚会吗?一些其他信息可以帮你预测某个穿防护服的人是否为工程师的概率。也许你知道聚会的主人与某个工程师已经绝交,她不会再邀请工程师;也许你知道医科大学预科学生中50%都会穿防护服。这样的信息能让我们用新的信息更新原始基础概率。定量更新后的可能性是贝叶斯定理的一种应用。

我们不会再问简单的、单一的问题:“身穿防护服的人是工程师的概率为多少”;相反,我们会问更复杂的问题:“在已知医科大学预科学生中50%都会穿防护服的情况下,身穿防护服的人是工程师的概率为多少”。工程师的罕见与防护服的特殊性之间有着某种冲突。

我们可以简单地将医学问题升级为:“三天之前我曾经接触过患流感的人,那么我现在喉咙痛预示已经患上流感的概率为多少呢”,或者“我在花粉季节出门,那么我现在喉咙痛预示我感染花粉热的概率为多少呢”。我们会在大脑中进行这种更新,但仍然有一些工具可以帮助我们对新信息进行定量分析。解决这一问题的关键在于我们的大脑无法自动生成正确的答案。我们的大脑已经进化到可以解决一部分问题,但贝叶斯问题仍然存在。

哦,不!我的检查结果为阳性

这样的消息有多严重?这种问题,如果采用我在学校学到的戏法——四格表(也称为情形分析表)来解决的话,事情就变得简单多了。这不是运用直觉或预感就能简单解决的问题。假设某一天早晨你醒来的时候发现自己视力模糊。我们进一步假设,有一种很罕见的疾病叫作光学模糊。在美国,一共只有38000名这样的患者,也就是说基础概率为1/10000(38000∶3800000000)。你刚刚才知道这一点,现在就开始害怕起来。你开始思考,究竟是什么样的原因让你突然视力模糊呢?

你做了一个模糊的血液样本检查,结果显示为阳性。你和你的医生试着搞清楚下一步应该怎么办。这里有一个问题,治疗模糊症的一种名为chlorohydroxelene的药物,有5%的概率会产生严重副作用,包括背部可能产生的严重的、不可逆转的瘙痒(你可以吃药治疗瘙痒,但证据表明,这种药有80%的概率会造成你的血压升高)。5%也许不是一个很大的概率,你也许会打算服用药物治疗视力模糊(5%属于第一种客观可能性——不属于主观猜测,而是从上万份药物服用记录中得出的概率)。很自然地,在使用这种药物、冒着患上瘙痒症的风险之前,你会想要进一步了解自己患上这种疾病的概率为多少。

四格表可以帮助我们列出信息,这种方法很容易得出结论。如果这些数字和分数让你想从房间里冲出去尖叫,请不要担心——附录包括了一些细节。这一章将会为我们大概介绍一下(也许是一个模糊视角,但毕竟,你现在正表现出模糊症的症状)。

看看我们已经了解到的信息:

•模糊症的基础比例为万分之一或者0.0001;

•使用chlorohydroxelene产生副作用的概率为5%,或0.05。

你也许会认为,如果结果为阳性,那么你已经患上了这种病。但检查并不是这样的——大多数检查都是不完美的。现在你已经对贝叶斯思维有所了解,你也许会问一些更精确的问题:“当结果为阳性的时候,我患上这种病的概率为多少?”记住,基础概率告诉我们,随机选择一些人,这些人患上这种病的概率为0.0001。但你不是那些随机选择的人。你的视力确实模糊,你的医生也为你做了检查。

我们需要处理更多信息。我们需要知道检查结果不准确的概率为多少。检查结果可能会从两个方面发生错误:一是你已经患上了这种病,你得到——错误的阳性;二是你没有患上这种病,你得到——错误的阴性。我们暂时认为这些数字的概率都为2%。在现实生活中,这些数字可能会有所不同,但我们暂且认为每个概率都为2%。

我们开始画一个四格表,然后按照如下方式标记它们:

表6–1 检查结果四格表

296-i

我们先暂时不管这些结果是否准确——我们仅仅展示怎么运用这个表格得出结论。表头显示出某个特定患者要么已经患上某种疾病,要么没有。每个方格都代表了表头与竖行的交集。我们看到,在患上该疾病的人中,某些人结果为阳性(左上角方格),某些人为阴性(右上角)。对于诊断结果为没有患病的那一列也同样是这样:某些人结果为阳性,某些人为阴性。你会希望即使你的测试结果为阳性(左上角方格),你也同样没有患上疾病(左下角)。

将已知的信息填充进去之后(我会在附录中具体展示),我们就可以问这个问题:“当结果为阳性的时候,我患上这种病的概率为多少?”

表6–2 填入信息后的四格表

296-2-i

让我们一块来看看那些结果为阳性的人的数据:

表6–3 检查结果为阳性的人的数据

297-i

你可以看到,在1万个人中,有201个人(左侧一栏总和)都有跟你一样的阳性结果。但在201个人中,只有一个人真正患病—你只有1/201的概率患上这种病。我们可以用1/201×100%来计算百分比,得到0.49%—这个概率并没有你想得那么高……在你做检查之前,你的患病概率为万分之一;现在概率是1/201,你有大约99.51%的概率没有患上这种疾病。这应该能让你想到我们之前所讲到的中彩票的概率。你的思路已经发生了巨大转变,但这没有以一种有效的方式影响实际结果。检查结果并没有告诉你所需要知道的所有信息。将结果拿回家之后你需要做的事情是运用基础概率以及错误概率信息来帮助我们搞清楚状况。这就是四格表的用途。即使在患病过程中某些症状减弱,例如视力模糊症状减弱,或者一些其他症状减弱,例如无力状态减弱,这些都不重要;四格表可以帮助你以一种易懂的方式组织所有信息。理想状态下,你还需要与医生一块合作考虑其他并发症、并存症状、家族病史,以做出更准确的预测。

让我们再来看另一条信息:可以治愈模糊症的神奇药物——chlorohydroxelene。这种药物有20%的概率会产生副作用(实际上20%的副作用概率对真正的药物来讲,也不算很反常)。如果服用这种药物,你需要权衡这1/5患上后背瘙痒症的可能,以及那1/201的治愈病情的概率。也就是说,如果201个人服用这种药物,只有1个人会治愈(因为其他服用这种药物的人根本就没有患病呀!)现在,服用药物的201个人中,20%的人,40个人,会出现副作用。服用药物的40人会患上后背瘙痒症,但实际上只有1个人治好了。因此,如果你服用这种药物,产生副作用的概率比治愈的概率高出40倍。不幸的是,这些数字都是美国卫生部门中很常见的数字。我们还会好奇,开销是否会大到不受控制?

阿莫斯说,想象一下自己在饭店吃完饭,醒来后感觉非常糟糕。你站在镜子面前,发现脸都变蓝了。你的内科医师告诉你,有两种食物中毒的疾病,其中一种会让你的脸变蓝,另外一种会让你的脸变绿(我们认为在这一事件中,没有其他可能性会让你的脸变蓝或变绿)。幸运的是,这两种病都有药可救。如果你身体健康,这种药不会对你产生任何副作用;但是如果你患上这两种疾病中的一种,一旦吃错药就会死亡。想象一下,在这两种病情中,你的脸的颜色会有75%的可能性与你的病情一致,出现脸绿的概率会比出现脸蓝的概率大5倍。你会选择哪一种药?

大多数人的直觉(阿莫斯询问的其他医师也有相同的直觉)会告诉他们,他们应该选择蓝色药片,因为你的脸是蓝色的,大多数时候,75%的时候蓝色都与病情一致。但他们都忽略了疾病的基础比例。

我们再次使用四格表。我们不知道样本容量是多少,所以为了填充表格,我们假设样本容量为120(这是表格外更小的样本容量),这样,我们就有了充足的信息来填充表格。

如果绿色疾病比蓝色疾病高出4倍,那么,患病的120个人中,一定有100个人患上了绿色疾病,20个人患上了蓝色疾病。

表6–4 绿色疾病与蓝色疾病患病人数对照表

299-i

由于你的脸的颜色与疾病一致的概率为75%,那么,75%的患蓝色疾病的人的脸都会是蓝色的,也就是75%×20=15。那么我们可以这样填充表格:

表6–5 脸的颜色与疾病一致的数字分析

299-2-i

现在,在你服用蓝色药片之前——哪种能治愈你,哪种能杀了你——你需要问的贝叶斯问题是:“在我的脸是蓝色的情况下,患蓝色疾病的概率是多少?”答案是,在40个脸色为蓝色的人中,15人都患上了蓝色疾病:15÷40=0.38,即38%。当你脸色为蓝色时,你患上绿色疾病的概率为25÷40=0.62,即62%。无论你的脸是什么颜色,最好都服用绿色药片,这是因为绿色疾病比蓝色疾病更常见。我们需要再一次平衡基础概率与症状。我们已经学会:不应该忽略基础概率。我们的大脑很难进行这样复杂的运算——四格表给了我们一种很直观的信息组织方式。这样的计算就是为什么医生通常会在拿到检查报告之前,让病人先服用抗生素的原因——抗生素常常能抵抗大多数疾病。

在我之前所提到的模糊症的例子中,201人测试结果为阳性,但其中只有1人真正患上了这种疾病。在许多实际医疗情境中,所有201人都会接受药物治疗。这涉及医疗实践中一个很重要的概念:需要治疗的人数,即在病愈之前,需要接受某种治疗的人的数量,例如药物、手术。在今天,201,这个需要接受治疗的人数的数字已经很常见了。在某些常规手术中,需要治疗的人数为48,而需要服用药物的人数可以超过300。

除去之前提到的蓝脸以及我们想象出来的各种疾病,那些与我们的道德直接矛盾的决定又是怎样呢?医生告诉你有种药有40%的概率能让你多活5年,你会怎样评估这种药?

当我们面临两难问题或者相同的清晰的概率时,有一种方法可以帮助我们思考决定:期待价值。某个事件的期待价值等于它的可能性乘以结果值。公司董事通常都会采用这种办法评估经济决策。假设某次聚会上,有人朝你走过来,邀请你一块玩游戏。他会抛掷硬币,如果硬币字朝上,你就可以得到1美元,那么你会为这个游戏付出多少钱?(假设你暂时不想玩这个游戏,但你也不是很介意这个游戏——你真正感兴趣的是赚钱)这个游戏的结果值是50分,硬币字朝上的概率为一半,你能得到的也就是一半。我们需要注意,期待价值通常不是你在任何一个游戏中实际得到的价值:你要么一分钱也得不到,要么你能得到一美元。但如果完成成千上万次游戏的话,你平局每局能得到50分。如果每局都支付少于50分,长远来说,你会赢得胜利。

期待价值也可以用于计算损失。假设你尝试算出到底是应该将车停在停车场还是冒着被开罚单的危险,将车停在下客区。假设停车场收费20美元,罚单是50美元。经验告诉你,你只有1/4的概率会被开罚单。这样,将车停在停车场的预期价值就是–20美元:很肯定,将车停在停车场的话,你一定会支付20美元(在这里,我用减号来表示损失)。

我们可以这样决定:

a.停在停车场:百分之百需要支付20美元。

b.不停在停车场:1/4的概率会损失50美元。

罚单的预期价值为:25%×–$50=–$12.5。现在,你一定讨厌罚单,想要避免被罚。你也许感觉自己今天运气不好,所以,你也许会支付20美元的停车费,以避免50美元的罚单。但更理性的方式是从更长远的角度来评估决定。很显然,在日常生活中,我们会面临上百个这样的抉择。最重要的是我们怎样算出平均数。这种特殊决定的期待价值是你能通过开罚单获得长期的回报:平均12.5美元的损失与20美元的损失。如果一年中每周都在这一特定街道停车一次,你将会有650美元的罚单或者1040美元的停车费的损失——这是一个巨大的差距。当然,某一天,你可以更新贝叶斯定理。如果某天你发现有交警在朝你停车的下客区走来,最好将车停在停车场。

期待价值也适用于非金钱结果。当两种医疗方案在疗效与长期帮助方面都差不多的时候,你需要根据它们所消耗的时间来确定究竟应该选择谁。

方案1:50%的可能性需要6周的时间才能康复,50%的可能性需要两周才能康复。

方案2:10%的可能性需要12周的时间才能康复,90%的可能性半周就能康复。

我们再一次用减号来表达损失的时间。方案1中的预期价值(以时间计算)为:

0.5×(–6周)+0.5×(–2周)=–3周+(–1周)=–4周

方案2中的预期价值为:

0.1×(–12周)+0.9×(–0.5周)=–1.2周+(–0.45周)=–1.65周

在忽略其他因素的情况下,你最好选择第二种方案,因为你只需要花费一周半的时间(平均);然而在方案1中,你需要花费4周时间(平均)。

当然,你不可能忽略所有其他因素:最大化地减少康复时间也许不是你唯一考虑的问题。如果你刚刚才订了前往非洲的机票,机票无法退订改签,你需要离开11周,那么你一定无法选择12周康复时间的治疗方案。那么方案1就会更好,因为最坏的情况是你只需要卧床休息6周。所以,预期价值对我们计算平均数是有好处的,但我们通常需要考虑最好与最坏的情况。最情有可原的理由是,某种方案会带来某种致命风险或严重残疾。预期价值还可以帮助我们组织信息。

不管怎样都有风险

在人生的某些时刻,你经常需要针对个人健康或者在乎的人做出某些重要的决定。某些决定会增加我们的身体与心理压力,严重削弱我们做出决定的能力,这样问题就变得更复杂了。如果你询问医生检查结果的准确性是多少,也许他也不知道。如果针对不同治疗方案做出研究,你会发现医生处理这些数据也很困难。医生在疾病诊断中是必不可少的,他们可以给出不同的治疗意见,可以治疗病人,可以跟踪治疗以确保治疗是有效的。然而,正如一位医学博士指出的那样,“医生掌握的关于疗效的知识多于风险的知识,这必然会影响决策的准确性”。此外,研究调查往往关注某种治疗是否有效,对副作用研究没什么兴趣;医生们学到的也往往是成功的治疗方案,而不是副作用——所以,对负面结果的调查是你需要做的事情,这是另一种类型的影子工作。

以心脏搭桥手术为例。美国每年都有50万人接受这种手术。有价值的证据是什么?随机医学试验告诉我们,接受过这种手术的病人大多没有得到任何实际生存价值。但外科医生都不相信这个说法,因为治疗方案中的逻辑性已经足以说服他们:“血管堵塞,搭一根管道,问题就解决了。”如果认为某种方案有效,他们会相信它真的有效,即使没有任何医疗证据。

血管成形手术在一年的时间内从0增加到10万例,没有任何医学试验——正如心脏搭桥手术一样,它最为人们所熟知的地方在于其中的逻辑性,但医学试验并没有显示任何生存益处。一些医生告诉他们的病人,血管成形手术能够让他们多活10年;但对于那些有长期冠心病的人,试验表明,这种手术只能将他们的寿命延长1天。

难道所有病人都傻吗?他们不傻,他们只是太脆弱。当医生说,“你已经患上某种致死的疾病,但我有有效的治疗方案”,我们会很自然地抓住这个机会。我们会问问题,但不会问太多——我们希望挽救自己的性命,愿意听医生的指令。试验证明,当我们感觉无助的时候,会倾向于关闭自己的决策系统。在专家给出建议之后,需要做出选择的病人通常会关闭控制独立决策系统的大脑区域,转而将决定权转交给专家。

此外,寿命长短并不是事件的全部,尽管这是心脏病专家向病人推荐搭桥手术和血管成形手术的方式。许多病人都指出,接受手术后,他们的生活质量大大提高了,他们做自己喜欢的事情的能力也提高了。他们的寿命也许并没有延长,但生活得更好了。这在许多医学选择中都是很重要的因素,也是我们不应该忽视的因素。不要只问医生有关疗效与死亡率的问题,也问问生活质量,问问可能产生的负面效果。事实上,比起寿命长短,许多人更看重生活的质量,他们可能更愿意做出不同的选择。

医学决策中容易犯错误的一个强有力的例子来自前列腺癌的治疗。据估算,美国大约有250万男性患有前列腺癌,其中3%的人死于这种疾病。这种病并没有排在死亡疾病前10名之列,但它却是男性致死的第二大疾病,仅次于肺癌。几乎每个得到这个消息的泌尿科医师都会建议患者采取激进的治疗方案来移除癌症区域。乍一听,确实很有道理——我们看见了癌症区域,我们切除癌症区域。

好几种关于前列腺癌的想法在我们的大脑中徘徊。一方面,这种病确实是一种过程缓慢的癌症——大多数人伴随癌症死亡,而不是因为癌症死亡。然而另一方面,它是如此吓人,许多男性都会想“根除它,治愈它”。他们愿意忍受副作用,他们只想知道癌症已经发展到什么程度了。但要知道,手术之后通常都会有一个很高的复发率。那副作用呢?这一概率——接受手术后的病人产生副作用的概率有多大——我们将其表示在下面的圆括号中。

•性能力不足(80%)

•阴茎缩短一英寸(50%)

•尿失禁(35%)

•大便失禁(25%)

•疝气(17%)

•尿道切断(6%)

这些副作用是很吓人的。许多人会说这些副作用比死亡好很多,他们认为除了手术之外,唯一的选择是死亡。但数据却告诉了我们一些其他信息。首先,由于大多数前列腺癌发病过程缓慢,大多数人都没有任何症状,所以很多男性都没有及时发现并治疗。有多少男性呢?48个人中有47个人都属于这种情况。也就是说,每48位接受前列腺手术的人中,只有一个人的寿命能够延长——其他47个人还是只能活以前那么长,当然也不用遭受那些副作用。这样,需要接受手术治愈的人数就是48人。现在,就副作用而言,97%的患者都有可能出现其中至少一种副作用。如果我们忽略性交方面的影响——前两个副作用——转而关注其他副作用,这些病人仍然有大于50%的机会会遭受其中至少一种副作用。他们遭受其中两种副作用的概率也很大。因此,在那些没有接受手术的47个人中,大致有24个人会遭受至少一种副作用。我们来简要回顾一下,每48例前列腺手术中,其中有24人不会遭受任何副作用,其中有1人能够治愈。相较于治愈而言,你遭受副作用的概率会高出24倍。在那些接受手术的病人中,20%的人会对他们的决定感到后悔。显然,我们需要将生活的质量也纳入决策的考虑范围之内。

那么,为什么几乎所有内科医师都建议手术治疗呢?一方面,这个手术是已知的最复杂、最困难的手术之一。你会为他们不推荐手术想到一个很好的理由,但实际上,他们已经花了大量时间学习怎样做手术。训练所需要的东西是很多的,学会这种手术的人都被视为有价值的人。此外,患者及其亲属都会期待他们的医生能做些什么。如果一个医生说,“我们再观察观察”,那么病人常常会感到不满意。如果一个感冒病人走进诊所,空着手出来,没有任何处方的话,他一定很不满意。许多研究都显示,病人要么觉得医生不重视他们,要么觉得他们不仔细,或者兼而有之。

另一方面,手术的目的在于根除癌症,最低限度地减少复发的可能性。病人通常也有这种看法:“真的很难告诉医生,我不管我的癌症了”,前列腺癌协会主席乔纳森·西蒙斯解释道。医学院教育医生们,手术是治疗大多数癌症的最佳方案,与其他方案相比,手术的存活率更高,患者也更容易解决问题。他们会统计,在接受治疗的人中,5~10年间有多少人死于癌症。但这种统计忽略了一些重要的数据,例如患上其他疾病、手术后的生活质量以及恢复时间。

巴尼·克内特是一位来自曼哈顿的皮肤科医生,发现这一切实际上很有趣。“外科医生通常被告知,根除的概率就是治愈的概率,”他说道,“这是他们文化中根深蒂固的东西。在你告知我的那些关于癌症的例子中,所有的事实与数据都经过了仔细分析,疾病治疗这门科学与行医这门艺术相冲突——行医是一门艺术。”

医学院和外科医生都不担心生活的质量,但你需要担心。许多医学决策都围绕着你愿意承担风险,你愿意忍受不便、痛苦与副作用。你愿意花多少时间投入预约看病、就诊、等待结果?这些问题的答案都不简单,但统计学可以从长远的角度解释这些问题。我们再回过头来看看前列腺手术,这种手术的建议康复周期是6周。考虑到它可以挽救你的性命,这似乎不是一个不可接受的时间。

但我们应该问的问题不是“我愿意花6周时间来挽救性命吗”,而是:“我的性命真的能够被挽回吗?我是那47位不需要接受手术中的一位吗?或者我只是那一位不需要接受手术的人吗?”虽然无法知道答案,但统计数据告诉我们,手术不太可能帮到你,除非你有具体信息表明癌症已经恶化。另外一条能帮助我们做出明智决定的信息是:平均来说,手术可以让患者多活6周时间。这一数据来源于47位寿命没能延长的人(由于手术的复杂性,某些患者的寿命甚至缩短了)以及那一位寿命得以延长的人。通过手术,他的生命延长了5年半。在这种情况下,延长的6周时间差不多等于6周的康复时间。这样,我们就可以这样做出决定:当你还年轻健康的时候,你愿意接受一个也许根本就不需要的手术,然后为此卧床6周吗?或者,你还是愿意在老了没力气的时候少活6周时间呢?

许多手术过程与药物治疗方案实际上都面临这样的折中:康复时间可以等于或超过你所挽救回来的时间。锻炼对于延长寿命的效果也差不多是这样的。不要误会我——锻炼确实有许多好处,包括有益于身心、增强免疫力、提高肌肉紧张度(因此改善整体长相)。一些研究显示,锻炼还可以提高思维的清晰度。但我们来看一条广受关注的消息:如果每天进行有氧锻炼一小时,达到你的目标心跳频率,寿命将得到延长。这听起来很不错,但它究竟能延长多长时间呢?一些研究显示:每锻炼一个小时,你的寿命将延长一个小时。如果你喜欢锻炼,这绝对是不错的主意——你正在从事自己所热爱的活动,将自己的寿命延长相同的时间。这就像是告诉我们,如果你每性交一个小时、每吃一个小时冰淇淋,就能多活一个小时。这是很简单的选择——你花在这些活动上的时间都是“免费的”,没有占用一生限定的时间。但是如果你不喜欢锻炼,觉得锻炼没意思,你赚的时间就等于你所损失的时间。每天锻炼还有很多其他好处,但延长寿命绝对不是其中之一。我们没有理由不进行锻炼——但我们需要理性期待结果。

反对这种说法的人有两种意见。第一,在做出有关生死的决定时,算平均数是没有任何意义的,因为并没有任何前列腺手术病人真正将他们的寿命平均延长了6周——1个人将寿命延长了5年半,47个人一分钟也没有延长。这种6周的平均延长寿命仅仅只是统计虚构,就跟我们之前所说的停车的例子一样。

确实是这样,没有人真正将其寿命延长了6周:这个平均数无法与任何单个个体匹配,但这并不能抵消其背后的逻辑性。这样就引出了第二种反对声音:“你不能像对待抛掷硬币、玩扑克游戏一样估算医学决策的可能性。可能性与预期价值只在多次试验、多个结果中才有意义。”但看待这些决定的理性方式应该是:将其看作一项提议,它是你一生中需要做出决定的一部分,而不是“一次性的”,是完全与时间和生活经验脱节的。虽然每个人的决定都不一样,但我们一生中会面临很多问题,每个问题都有其可能性和预期价值。当你做出很多决定时,你需要这样做,例如,决定是否需要服用维生素、锻炼、每顿饭后使用牙线、注射流感疫苗或是否接受活检。真正理性的决策需要我们关注每个决定的预期价值。

每个决定都存在不确定性与风险性,通常,时间与便利性的消长都会在未来带来某些未知的后果。如果你百分之百确信:每天饭后使用牙线,就能拥有一个良好的口腔环境,那么你当然可以这样做。你是否期待过长期使用牙线能有这样的效果?我们大多数人都不相信,每天使用牙线3次带来的麻烦似乎超过它的价值。

获得准确的数据听起来很容易,实际上很难。我们以活检为例。活检是一项很正常、很常规的检测,但甚至很多外科医生都不知道其中隐藏的风险。活检测试需要将小的针头扎进组织中,然后提取出小的样本以供分析,病理学家需要观察样本以确定细胞是否已经感染癌症。活检过程本身算不上一种科学——这不像美剧《犯罪现场调查》中,技术员将样本输入电脑,然后从另一端获得结果。

活检分析涉及人类判断,它更像是一个“它看起来好笑吗”的检查。病理学家或组织学家在显微镜下观察样本,他们会注意那些需要判断的区域内的异常现象。然后,他们会将这些区域计数,将其视为整个样本中的一部分。病理报告或许会指出,“样本中的5%存在异常细胞”或者“我们在50%的样本中观察到了癌细胞”。不同的病理学家通常会对分析结果有着不同的意见,甚至会对相同的样本给出不同的癌症等级判定。这就是为什么你需要听取其他意见——除非必要,不然你不会希望开始准备手术、接受化疗或者治疗。你肯定不会对阴性活检报告置之不理。

我们继续来看上面的前列腺癌的例子,我曾经与医学院的6位外科医生进行过交谈,向他们请教前列腺活检的副作用。他们中的5人告诉我风险率大概为5%,这与你在医学杂志中所能看到的数字一致。还有一位告诉我没有任何风险——确实是这样,根本没有任何风险。大多数文献所提及的副作用中,最常见的是脓毒症,紧随其后的是直肠撕裂,然后是尿失禁。脓毒症很危险,可以致命。活检针头穿过直肠,脓毒症的风险来自前列腺的感染以及粪便物质对腹腔的感染。如果患者能够在进行活检之前服用抗生素,这个风险通常能够减少。但即使采取了预防措施,仍然有5%的风险会产生副作用。

与我交谈的6位外科医生中,没有任何人提及活检的康复期,他们委婉地称其为“不便”。这些并不会威胁我们的健康,只是会让我们很不愉快。直到我查阅《泌尿学》杂志上2008年的一项研究时,我才知道,接受过活检的患者,41%的人会在一个月之后存在勃起功能障碍,15%的人会在6个月后存在勃起功能障碍。其他一些“不便”包括腹泻、痔疮、胃肠道不适,以及长达几个月的精液带血。两位医生不好意思地承认他们故意隐瞒了这些信息。正如其中一位所说的那样,“我们之所以不对患者提及这些,原因在于他们可能会不愿意接受活检,但对他们而言,活检又是必不可少的”。这就是我们大多数人都不喜欢的家长式作风,这也违背了知情同意的基本原则。

现在,也许5%的副作用听起来并不是很糟糕,但我们需要想一想:许多很早就诊断为前列腺癌或诊断为轻度前列腺癌的男性,都选择与癌症共存,监视病情。这是一种名为观察等待或主动监测的计划。主动监测治疗就是泌尿科医师会定期要求病人接受活检,也许是每12周或24个月。对于那些也许10年都不会有任何症状的慢性病而言,这就意味着一些患者可能至少需要多接受5次活检。如果你接受5次活检,那么你患上脓毒病或产生其他副作用的风险是多少呢?每次5%。

这种风险的计算跟我之前所列出的第一种乘法计算方式不同;如果想要知道所有5次活检产生副作用的可能性,我们需要用到第一种乘法计算方式,就像计算连续5次得到硬币正面的可能性一样。但这里不需要四格表,因为我们并不是在问贝叶斯问题,不是在问诸如“在活检结果为阳性的情况下,我患上癌症的概率为多少”此类的问题(病理学家也会犯错——这就像是我们之前看到的血液检查诊断一样)。当我们谈及5次活检中至少1次产生副作用的风险时——或者说5次抛掷硬币至少得到1次正面的风险时,我们需要用到二项式定理。二项式定理可以告诉你,5次中,至少1次产生副作用的风险概率,或者你想知道的其他任何风险。想一想,你就会发现,在这种情况下,最有用的数据不是你5次活检每次产生副作用的概率(而且我们已经知道计算方式,我们可以使用乘法法则),而是至少1次产生副作用的概率,即1次或多次活检产生的副作用。这是不同的可能性。

最简单的办法是使用在线计算器,例如这个:http://www.stat.tamu.edu/~west/applets/binomialdemo.html。

你需要在屏幕方框中输入以下信息:

n代表你需要接受治疗的次数(数学领域称之为“试验”)

p代表副作用的可能性(数学领域称之为“事件”)

x代表事件发生的次数

在以上的例子中,我们对接受5次活检,至少1次产生副作用(结果)的概率更感兴趣。因此:

n=5(5次活检)

p=5%,或者0.05

x=1(1次副作用)

将这些数字都输入二次方程式中,我们发现,如果你接受了5次活检,至少1次产生副作用的概率为23%。

在承认前列腺活检会5%产生副作用的5位医生中,只有一个人明白,风险来源于每一次活检。他们中有3个人认为5%的风险来自终身活检——你可以拥有所需要的一切,但风险不会增加。

我向他们解释,每次活检都是一个独立事件,两次活检比一次的风险更大。他们中没有人知道这一点。我的第一次对话是这样的:

“据我所知,活检带来副作用的概率为5%。”

“确实是这样。”

“所以,如果一位病人接受5次活检,这个风险就会接近25%。”

“你不能简单地把可能性相加。”

“我同意,不能这样简单相加。你需要采用二次方程式,然后你会得到23%的结果——非常接近25%。”

“我从未听说过二次方程式,我确定这里不能用这种方法。我不奢望你能明白。这需要统计学训练。”

“好吧,我曾经接受过统计学训练。我认为我可以明白。”

“你转行了?”

“我是一位科研人员——神经科学家。我在大学教授统计课程,也发表过好几篇统计学相关文章。”

“但你不是像我一样的医学博士。你的问题在于你不懂药物。你要知道,医学统计与其他统计不一样。”

“有什么不一样?”

“我从医已经有20年了,你有几年经验?我一直在实际操作,你只有所谓的理论,你其实什么都不知道。我每天都会看病人,我知道我在处理什么。”

另一位外科医生是世界级达·芬奇“机器人”导引术专家,他告诉我,“这些数据不正确。我曾经做过500次活检,没见过超过24个脓毒症案例”。

“好吧,24/500约等于5%。”

“哦,好吧,我确信没有那么多。如果有5%,我一定已经注意到了。”

不管是因为享受批评,还是我本身就是一位乐观主义者,我再一次拜访了一家技术领先的医院的肿瘤学部门头头。我指出,如果一个人患上了前列腺癌,他们最好不要接受手术治疗,因为在需要接受治疗的人中,只有2%的病人能够从中获益。

“假设你被诊断出了这种疾病”,他说,“你一定不会放弃手术。如果你就是那2%中的一员呢?”

“好吧,我也有可能不属于呢?”

“但你不知道啊。”

“你是对的,我不知道,但是根据定义,这不可能——只有2%的概率让我属于那2%中的一员。”

“但你不知道你不属于啊。如果你属于呢?那么你就会想要接受手术。你到底是怎么了?”

我与另一位医学院泌尿系统肿瘤专家就这个问题进行了探讨。他是一位临床研究专家,曾经在科学杂志中发表过多篇有关前列腺癌的文章。他的文章就曾用到了统计学知识。当他听完我与他的同事的对话后,并没有感到吃惊,而是似乎有点失望。他解释说,前列腺癌的一部分问题在于:其常用测试PSA(前列腺特异抗原)很少被人熟知,期待结果方面的数据也不完整。活检存在很多问题,因为它只是依靠前列腺样本,而某些区域比其他区域更容易获取样本。最后他指出,医学成像是一种很有前途的方式——例如磁共振成像和超声——但预期效果有关方面的研究还太少。某些时候,即使是高分辨率核磁共振成像也会错过活检中2/3的癌细胞。然而,活检用于诊断、手术、放射治疗,依然是控制前列腺癌的黄金标准。医生接受的都是有关采用有效方式治疗病人的知识,但他们没有接受科学或可能性思维的训练——你需要训练自己的理性思维,理想情况下,与你的医生共同进行理性思考。

医生能提供什么

如果医学博士都这么不擅长理性思维,那药物怎么会减轻我们如此多的痛苦、挽救那么多人的生命呢?我太过关注那些引人注目的案例——前列腺癌、心脏手术——在这些案例中,药物会不断进行调整;我也太过关注那些特别困难的问题,一些会暴露认知弱点的问题。但实际上也有很多医学成功的案例,例如免疫防护、感染治疗、器官移植、预防保健和神经外科(正如我们在第4章讲到的萨尔瓦托雷·亚科尼斯)。

事实上,如果出现某些问题,你不会去查阅资料书,而是会去找医生。行医既是一种艺术也是一门科学。一些医生会运用贝叶斯定理,但他们实际上并不知道自己在干什么。他们运用接受的训练与观察能力来进行模式匹配——他们知道病人已经匹配某种症状,然后他们会冒着风险因素进行诊断和预后判断。

正如加利福尼亚大学圣塔芭芭拉分校的顶级神经学家斯科特·格拉夫顿所说的那样,“经验与隐性知识真的都很重要。最近,我曾与两名急诊室的医生查房。这两位医生都拥有超过50年的临床经验。没有卡尼曼和特韦尔斯基的口舌之争,也没有任何形式逻辑,他们只是指出了一个问题。通过刻苦学习,他们已经掌握了本领,获得了卓越的有关模式识别系统的知识。放射学家通过X射线很容易理解这种模式识别。对于任何临床医生来说都是这样的。他们根据多年的经验分析测试结果、检查身体、了解病人的病史,然后据此生成非常准确的贝叶斯可能性”。一位好的医生已经接触了数千个这种案例,形成了丰富的统计历史(贝叶斯称为先验分布),他们可以给新病人提出建议。好的医生不需要任何努力就可以运用这种原理,然后得出有利于病人的最佳治疗方案。

格拉夫顿接着说:“贝叶斯与启发式论据的问题在于,他们无法意识到医生需要学习直接从病人身上获取信息,并制定个性化的决策方案。这种方式非常有效。当一位优秀的医生走进病房时,他会闻到死亡的味道。”例如,许多医生走进重症监护室,他们都会看一些重要的指标与图表;当格拉夫顿走进重症监护室时,他会看看病人,用他人类的本能来了解他人的内心与身体状态。

优秀的医生会与他们的病人交谈,了解他们的病史与症状。他们会巧妙地运用模式配对。科学会告诉他们怎样判断,但他们不会依赖任何检查。在之前所提到的蓝脸、绿脸以及视力模糊的故事中,我掩盖了一个现实医学决策中重要的因素。你的医生不会要求你接受检查,除非他认为根据检查以及病史,你很可能已经患上了这种疾病。在我所编造的模糊症的案例中,尽管基础概率是1/10000,但这并不是模糊症患者走进医生办公室进行检查的人数。如果基础概率为1/9500,你可以重新填充四格表,然后,你会发现患模糊症的概率会从1/201下降到1/20。这就是贝叶斯更新——找到与你相关的数据并利用这些数据。你可以将问题限制在与你在某些维度上相似的一组人,然后得出可能性预测值。例如,问题不在于“我中风的概率是多少”,而是“与我年纪、性别、血压、血糖都相似的人,中风的概率为多少”。这就需要将医学这门科学与艺术相结合。

尽管针对某些疾病,医药效果并不明显,但我们不能否认过去几百年来医药所取得的巨大成就。位于美国亚特兰大的疾病预防控制中心曾报道了一起几乎被完全消除的疾病的报告——发病率下降了99%——1900—1998年,导致成千上万美国人死亡的9种疾病:天花、白喉、破伤风、麻疹、腮腺炎、风疹、流感嗜血杆菌、百日咳和脊髓灰质炎。白喉从175000例下降到1例,麻疹从500000例下降到大约90例。在人类大多数历史中,从公元前1万年到1820年,我们的寿命延长了25年;在那之后,世界平均寿命已经增加至60多岁;自1979年以后,美国人均寿命从71岁上升到了79岁。

那些更多医生干预的疾病呢?毕竟,寿命的长短可以得益于其他因素,例如卫生条件的改善。在战场上,即使武器越来越具破坏性,但士兵的治愈率仍然能够大幅提升战争的胜算:在美国内战与世界大战中,士兵因伤死亡的比例为1∶2.5;在伊拉克战争中,这个比例已经下降到1∶8.2。婴儿、新生儿以及不到一周岁的新生儿的死亡率都已经大大降低。1915年,每1000个新生儿就会有100个在满周岁之前死亡;2011年,这一数字降至到了15。尽管前列腺癌、乳腺癌、胰腺癌都很难治疗,但儿童白血病的存活率已经从1950年的0上升到了现在的80%。

显然,医药发挥了很大的作用,当然其背后还有科学的力量。但现在,假药仍然是一个灰色地带,存在很多问题,因为它会让真正需要医学治疗的病人的病情判断蒙上阴影,这个区域的管理太混乱了。

替代疗法:违背知情同意

知情同意是现代医疗最核心的原则之一——你已经完全知晓自己所接受的治疗的利弊;你已经知晓所有的信息,以便做出明智的决定。

不幸的是,知情同意并没有在现代医疗中真的实现。在情感最脆弱的时候,我们被信息轰炸,大多数信息都是不完整、有偏见和不公平的,我们还没来得及准备好处理这些信息。对替代药物与替代疗法而言,更是如此。

越来越多的人在生病后都会寻找专业医疗—住院系统的替代疗法。由于这个产业监管不严,我们很难获取准确的数字,但《经济学家》预测,这项产业涉及全球600亿美元。四成美国人指出他们曾使用过替代疗法,包括草药、顺势疗法、精神或心理治疗疗法,以及其他以治疗为目的进行的身体及心理非医疗操作。鉴于替代疗法在我们生活中的突出地位,那些支持替代疗法的人有必要了解一些信息。

替代药物通常是没有疗效证据的药物。一旦某种治疗方案被证实具有科学性,那么它就不再是替代药物——它就被称为医药了。在某种方案成为传统药物之前,它需要经过一系列严格可控的试验,以获取其安全有效的证据。但对于那些替代药物,研究者们还暂时没能发现任何疗效。如果某人认为某种特定的干预有效,那这种干预就会成为一种“替代”。知情同意意味着我们必须知晓方案的效果与潜在风险,但这一切都是替代药物所缺失的。

公平地说,没有证据并不意味着方案无效,这只能说明效果还没有能够得到证实——我们是不可知论者。但“替代药物”这个名字本身就具有迷惑性。它是替代的,但不是药物。(这就不禁让人发问:那它替代的是什么?)

科学与伪科学之间的差别在哪儿?伪科学通常采用科学的术语与观察,但它们往往不会运用严谨的试验控制与可证伪的假设。一个很好的例子就是顺势疗法药物。这是一种产生于19世纪的疗法,其中包含了很少剂量的(或实际没有剂量可言)声称能治愈病人的有害物质。这种疗法有两大好处。第一,当一个人出现失眠、胃痛、发热、咳嗽或颤抖的反应时,服用正常剂量引起这些症状的药物可以治疗这些疾病。但这种结论没有任何科学论断。如果你服食了有毒的常春藤,我会给你更多的有毒的常春藤,我能做的就是给予你更多的有毒的常春藤。这不是治疗——这是一个大问题!第二,反复稀释物质可以让原来物质的残余变得活跃且具备疗效,稀释次数越多,物质的疗效越好。根据顺势疗法的说法,原物质的“震动”把能量传输到水中并且留下对原始物质的记忆。

此外,物质的稀释还需要遵循某些特殊的步骤。顺势疗法技术人员取出一份化学物质,倒入10份水,上下、左右、前后各晃动10次;然后再取出一份溶液,倒入10份水稀释,然后按照上面的做法再次稀释。他需要反复如此20次,得到一个含有一份化学物质、100000000000000000000份水的溶液。用于出售的溶液的规格为1后面再加30个0,你经常还会得到1后面1500个0的溶液。这就好比将米碾碎成粉末,然后将其放入太阳系大小的碗中。我还忘记了:这一过程还需重复26次。顺势疗法的产生早于阿伏伽德罗定律的发现。这一定律由意大利科学家阿莫迪欧·阿伏伽德罗发现,并以他的名字来命名,该定律阐述了溶液(6.02×1023 )中原子或分子的数量。按照这个标准,用于销售的顺势疗法溶液中完全不存在原始物质。但这对顺势疗法而言却是一个好消息,稀释次数越多,疗效越好。这一切都引来专业怀疑论者詹姆斯·兰迪的怀疑,过量服用顺势疗法药物的方法就是什么也不吃(兰迪连续10多年,提供100万美元用于奖励那些能提供证据证明顺势疗法有用的人)。

顺势疗法是伪科学的原因是:(1)它经不起控制试验的检验;(2)它采用科学的语言,如稀释和分子;(3)它的原因与效果都没有任何科学意义。

撇开顺势疗法不谈,某些严重疾病,如癌症、感染、帕金森病、肺炎,或甚至更温和的疾病,如普通感冒和流感,没有任何证据表明替代医学是有效的。英国研究科学家恩斯特查阅了大量研究数据发现,95%的治疗与没有接受治疗效果一样——这些替代疗法相当于安慰剂(剩余有疗效的5%也许也是出于试验误差,因为科学研究通常都存在一个误差值);维生素和营养物质也没有任何效果。经过多年的医学试验以及各种不同的试验研究,研究者们已经发现,复合维生素实际上是没有任何效果的;实际上,维生素还可能造成伤害:维生素E和叶酸会增加癌症风险;过量的维生素D会增加患心脏炎症的概率;过量的维生素B6与神经损伤有关。在正常食量下——如果我们没有依靠补充物质——这些维生素都不是问题,但补充物质及非处方维生素片却可能是有害的。尽管数以百万计的美国人声称,他们会在觉得要感冒时服用维生素C或紫锥菊,这能让他们感觉更好,但很少有证据表明这些物质真的起到了某些作用。他们为什么会这么认为呢?

我们的大脑已经进化到让我们足以发现事件之间的并发关系,但我们一直缺乏关注事件发生规律的能力。这就与我们之前看到的四格表有关:大脑天生会关注左上角的方格——心理学家称之为虚假相关效应。

虚假相关效应产生的原因在于,左上角的方格并没有我们所需要的做出最佳决定的信息。想象一下,当感觉自己要感冒时,你会开始服用大量紫锥菊。你会注意到自己真的没有感冒症状了。一旦这一事件出现5次,你就会认为紫锥菊是有疗效的。你的四格表就会是这样的:

表6–6 5次第二天感觉一切良好填入后的四格表

321-i

这种四格表太令人印象深刻了。但这里面存在一些问题:如果你什么也不做,有些感冒自己也会消失。你肯定遇见过这种情况:你感觉自己快要感冒了,什么也没做,然后你快速遗忘了这件事。如果你在进行某项科学研究的话,你会比普通人收集到更细致的数据。也就是说如果从科学角度出发,你的四格表剩下部分的信息是这样的:

表6–7 填入更细致数据后的四格表

321-2-i

请注意,为了更完整地观察事件,你需要知道自己没有服用紫锥菊和没有感冒的天数——这一定会是大多数时间!了解这些似乎是违反我们的直觉的——但这确实是最关键的一点,我们的大脑很难察觉这些信息。从四格表中可以看出,即使我们服用了紫锥菊,感冒的概率仍是没有服用的2倍(右栏)。将这些数据带入贝叶斯定理,我们得到:如果你服用紫锥菊,你患感冒的概率仍然为0.67。

此外,安慰剂效应——一旦我们服食某种药物,即使其中没有任何药物成分,我们都会感觉更好,当然,事实上,我们也常常真的更好了。大的药片比小的药片有更强的安慰剂效应。许多没有医学价值的产品都可能会产生安慰剂相应。这就是为什么双盲的、随机的临床对照试验如此必要的原因:研究中的每个人都会得到一个药片,没人知道自己得到的具体是什么。他们中的许多人拿到的都是无效药片,这增加了与什么也没有拿的人之间的关联,但如果药物真的有作用,它的效果一定会好于安慰剂。这就是新的治疗方案被证实的过程。

破坏我们因果推理的不只是紫锥菊和维生素C,我们一直都被虚假相关效应所欺骗。你有没有过这种经历:突然间想起某个人,而你已经很久没有想起过这个人了。突然,电话响了——哇!正是他。在匆忙得出超能力的结论之前,我们有必要知晓另外3条信息:你是否经常会想起某个不会给你打电话的人?你是否经常想不起某个给你打电话的人?你是否经常想不起不会给你打电话的人?如果将这些都填入四格表,你会发现这一偶然事件已经被其他3种事件所淹没,这只是虚假相关效应而已。

我们的大脑显然已经演化到本能关注左上角、关注偶然事件,而忘记了其他东西。我之前的一位老师保罗·斯洛维克,称之为分母忽略。斯洛维克认为,当我们想到分子时(你听到车祸中的某个悲剧故事),我们往往想不到分母(成千上万次安全的汽车旅行)。分母忽视会以很奇怪的方式出现。在一项调查中,第一批人被告知,一种疾病会导致每10000人中1286人死亡;第二批人被告知,这种疾病的致死概率为24.14%。结果,第一批人相较于第二批人认为这种疾病更危险。我们需要注意,1286/10000实际上还不到13%。所以,实际上它的危险性只有一半。但在第一个案例中,我们太过关注分子,关注死亡的1286人,我们开始想象很多人躺在医院病床上;在第二个案例中,我们听到24.14%,大脑会将其视为抽象数据,没有任何实际个体的参与。

分母忽略会让我们倾向于想到最严重的场景,从而无法从正确的统计角度看待问题。正如丹尼尔·卡尼曼所写的那样,“每一位等待聚会晚归女儿的家长都会有这种感觉。你知道,你根本(几乎)没什么好担心的,但你就是忍不住要去想象各种灾难场景”。

灾难的生动性,加之本能地忽略分母,造成我们做出严重错误的决定。2011年“9·11”恐怖袭击后的两个月,很多美国人都害怕乘坐飞机,他们宁愿乘坐汽车也不愿意乘坐飞机。10月与11月并没有增加任何空难事故,但在人们纷纷选择乘坐汽车的两个月期间,汽车事故的死亡人数增加了2170人。人们关注于分子(搭乘航班的246人),而忽视了分母(美国每年数十亿次安全飞行)。正如另一位研究者所说的那样:“恐怖分子可以伤害我们两次——第一次,直接杀人;第二次,通过他们的危险行为在人们的心中留下恐惧感。”

与此相关的是我们常常过度关注罕见事物。卡尼曼向我们描述了这样一个场景:试想一下,情报人员确定自杀式炸弹袭击者已进入两个不同的城市,并准备开始行动。其中一个城市有一个自杀式炸弹,另一个城市有两个。逻辑上来说,第一个城市的居民已经比第二个城市的居民的安全感高出2倍。但事实并非如此。他们的想象是如此生动,他们有着一样的恐惧。现在,如果有100个自杀式炸弹,结果又会不一样了。但这里的关键在于,大脑结构决定了我们对数学并不敏感。幸运的是,我们可以训练自己的大脑。

寻求替代药物,以及它所宣称的虚假关联的效果,这些都与分母忽略相关。替代药物吸引人的一部分原因在于,越来越多的人对“西药”产生了怀疑,他们需要寻求替代药物。这就是现在医疗管理的不完善。我们需要对抗那些没有疗效、价格高昂的药品。人们怀疑医药厂商(以及一些医药)的巨额利益,对一些能够获取巨大利益的治疗方案保持警惕——我们担心,医生给我们开的一些药物也许并不是因为对自己有好处,而是这些药物能让他们获取更大的经济价值。不幸的是,最新的新闻故事告诉我们,有些时候,我们的担心确实是存在的。

替代医学爱好者还会抱怨一些医生家长式的傲慢态度(如“我知道什么才是对你最好的,你不需要了解”),从与我就活检数据推理谈话的泌尿肿瘤科医生身上,我们就看出了这一点。在美国最领先的医院,接受放疗的乳腺癌患者通常没有被告知他们可能会遭受痛苦的放射烧伤,因为肿瘤科医生已经替他们决定,治疗的好处远远大于痛苦与不舒适。但这明显违背了知情同意。所有病人都应该被告知所有信息,以便他们决定自己是否愿意接受治疗。

我们需要担心的另一件事情是:一些医生缺乏精准的判断。一项研究显示,医生的预后判断仅仅只有20%的准确率;另一项研究中,研究者们收集了大量在医院死亡的患者的活检结果,然后将这些结果与患者医生在其生前所做出的预后判断进行对比。这个实验好的一面是医生们都在他们的预后判断中表现出了自信;但在那些“完全确信”的预后判断报告中,有40%都做出了错误的判断。鉴于医学问题的复杂性以及测试的不完整性,我们认为这么多的预后判断错误是可以被理解与宽恕的。但他们如此自信,我们真的无法理解,因为,这说明医生们并不在意结果。

替代医学的吸引力反映了越来越多的人对医学制度的不信任。替代医学给了人们这样一种希望:自然产品可以给他们带来自然的、没有伤害的治愈过程。替代疗法的使用通常都包含了这样一个幼稚的想法,认为某些植物如果是自然生长的,就一定是好的(但显然这个想法是错误的:想想毒芹、蓖麻豆种子、茉莉浆果和毒蘑菇)。另一个问题在于,草药以及一些其他植物药片在美国以及很多国家都没有得到监管。美国食品药品监督管理局估计,七成公司的产品都达不到基本质量控制标准。一方面,质量控制是一大问题;另一方面,许多产品含有大量污染物与添加剂。这些补充物质自身,即使不是由不达标企业生产,也会对人们造成一定损害。2012年,一位17岁的美国得克萨斯州青年克里斯托弗·赫雷拉,出现在休斯敦的急诊室。他的胸口、脸和眼睛都呈亮黄色,“几乎是黄色荧光笔的颜色”,当时医治他的医生施里娜·帕特尔说道。他在营养品专卖店购买了一瓶绿茶提取物用于燃烧脂肪,随后他就出现了严重的肝功能损伤,不得不进行肝脏移植。目前,膳食补充剂占毒物有关的肝损伤的20%,这一数字是10年前的3倍。

我们中的很多人都听说过某些人被某种类型的替代药物治愈,无论是感冒、背痛还是癌症。我的一位好朋友曾经被诊断为前列腺癌,医生告诉他,他只剩下6个月的时间了。“处理好你的后事,干你想干的事吧。”医生告诉他。“也许我会去夏威夷度假吧,”他回答道,“我一直希望的就是自己能活得更长久”,然后他走出了医生办公室。

我的这位朋友听说一位医生擅长替代疗法。医生给他做了一种替代血液检查,然后开了很特别的饮食配方,并嘱咐他多锻炼。医生给了他很多可食用的与不可食用的食物清单,我的朋友每天都需要花费三四个小时来准备饮食。他严格遵守饮食与锻炼计划,注意生活的方方面面。这种严格的作息,让他在38岁的时候成为一家知名国际公司的总裁。

距离医生给他的6个月的大限已经过去了12年,我的朋友仍然很健康,甚至比之前更好了。在他被宣布大限的2年后,他又去找了他的医生,做了一系列检查。他的PSA已经下降到几乎为0,其他一切生物指标也都很正常、很稳定。“你上一次来做检查的时候,一定中间出现了某些差错。”医生只能这样回答。

我认识好几个有这样故事的人。他们的故事都很吸引人,我很感谢上苍,我的朋友还活着。但这里的关键在于这些都不是科学研究,它们仅仅是故事而已。他们的故事振奋人心,让人啼笑皆非,引人深思,还带着神秘感,但它们终究只是故事而已。再多的故事也无法构成数据。没有试验控制,患者也没有被随机安排到某种环境或另一种环境之中,更没有研究人员记录患病或治愈的全过程。我们无从知晓,如果我的朋友更改了饮食或放弃了锻炼,故事的结局会是怎样——他也许还能活这么长时间,也许不会每月花8个小时在厨房里切菜,或者他也许已经死了。不久前,我问他,有没有回去做活体检查或其他医学成像检查以确定他的癌细胞已经死亡。“我为什么要那样做?”他问道,“我比以前更健康了,我感觉很棒,也不会根据他们所发现的而改变我的习惯。”

我的朋友通过饮食与锻炼战胜癌症的故事既不与科学一致,也不与科学相悖,他的故事完全在科学甄别以外,因为所有的数据都没有以科学的方式收集。

正如医生们都渴望相信有着合理机制的心脏搭桥手术和血管成形手术一样,即使在没有科学支撑的情况下,我们也会相信饮食与锻炼可以战胜癌症。对我们而言,这已经很合理,也很具有直观意义。我们中没有人完全了解饮食、锻炼与疾病、健康之间的关系。听到故事,我们开始思考:“哦,这其中一定有某种道理。”我们看待这一切时是基于机制的合理性,而不是基于数据。试着想想,如果我的朋友没有按照他的饮食与锻炼计划进行,而是选在一个金字塔形状的帐篷中倒立睡觉,我们一定会认为他已经疯了。

科学最吸引人的一点在于它能容纳像我朋友一样的故事,这样才不会错失新的重要的治疗方案。大多数科学研究都是从简单的观察,通常都是偶然的发现开始,然后才是细致研究。想想牛顿的苹果,再想想阿基米德在浴缸里的排水过程。

慢慢等待“替代药物”的效果,也许它们能够治愈某些癌症以及其他一些疾病。目前,数百个实验室正在研究世界各地的测试草药制剂、替代药品和疗法。但在被证实有效之前,它们都是有危险的,也许会延迟患者寻找正确治疗方案的时间。甚至当他们找到正确的药物时,也已经无力回天。这就是发生在史蒂夫·乔布斯身上的故事,他拒绝手术,转而求助于针灸、膳食补充剂以及果汁。后来,他意识到这些根本就没有作用,而且还耽误了专家给出的可能能延长生命的传统治疗方案。

每年,成千上万的美国人死于某些原本西药可以预防或治疗的疾病。这一科学手段在过去200年来对推动文明所做的贡献远远大于其他所有手段在过去1000万年对文明进步所做的贡献。医学研究人员明白,一些患者的生命在他们医学试验的过程中已经危在旦夕——即使医学试验还未完成,科学家也能看到其中的好处,并会提前结束试验,以便更早地生产出药物。这样患者就不用再等待了,因为他们中的某些人已经病入膏肓,没有了等待的时间。

的确,由于某些替代疗法,如饮食和锻炼,确实能够起到某种作用,我有太多朋友发生过类似的故事。美国国立卫生研究院下设了一个补充物及替代药物的分院,专门用科学的手段来探索这些替代药物。截至目前,美国国立卫生研究院已经报告了大量没有效果或者收效甚微的替代药物,换句话说,只有一小部分人从替代疗法中获益,大多数人没有收获任何好处。例如,在一个经典的研究中,为了验证维生素D可能治愈癌症与心血管疾病的假说,试验人员给100万名实验人员随机分配了维生素D与安慰剂。结果显示,在需要连续5年服用维生素D的150人中,只有一个人的性命被挽救了;在没有任何实际疗效的149人中,药物对他们产生了一系列负面影响,包括肾结石、疲劳、胰腺炎、骨疼痛。我们不知道维生素D治疗的长期效果,但新的证据表明,过量维生素D将指向死亡。可见,我们仍然有很多工作要做。

你怎么想?你怎么做?

当需要选择最佳治疗方案的时候,你会发现很大程度上你需要依靠自己。你需要收集信息,需要用到四格表。对于那些有相似风险的替代药物,我们通常很难决定。部分原因在于每个人愿意承受的风险不同,愿意忍受的痛苦(身体与心理)程度也不同。在作家杰尔姆·格罗波曼和帕梅拉·哈茨班德撰写的《你的医学思维》(Your Medical Mind )一书中,他们详细地讲述了病人的决策过程。

你会存在怎样的药物偏见?我们都会有偏见。杰尔姆·格罗波曼和帕梅拉·哈茨班德描述了四种病人:极简主义、极繁主义、自然主义和技术专家。极简主义不愿意与药物、医生有太多接触;极繁主义认为每个问题、每次疼痛都有一个医学答案;自然主义认为,人的身体可以自己治愈,这也许需要基于植物和精神的某种补救措施;技术专家认为一定会有比眼前更好的新的药物与疗法,他们相信新的才是最有效的。

这些都是比较极端的;我们每个人身上多多少少都带着一点这四种类型。你可能会在牙齿护理方面主张极简主义,但在肉毒杆菌和“青春保养”方面主张极繁主义;你可能会对感冒和流感保持自然主义,但当你需要面对阑尾破裂手术时又成了技术专家。而这些倾向通常会交互进行。当然主张极繁主义的自然主义者可能会有好几个书架,上面都是关于草药的书籍,但主张极简主义的自然主义者可能会认为越少越好。但是,如果需要手术,他们一定会要求采用最新的高科技机器人引导的1.21千兆瓦磁通电容制导系统激光手术。了解自己属于哪种类型可以帮助你更有效地做出决定,也能让你和医生之间的对话更有意义。如果你能够直接告诉医生,自己倾向于哪种风格,你一定能够获益不少。

但了解可能性,了解四格表里的数字,也常常可以帮到我们。无论我们的可能性是多少,事实证明,这绝对是大有裨益的。

你会听到这样的话:如果你采取一些补救措施或遵循一些新的方案,你患×疾病的风险就会减少50%。这听起来像一个傻子都知道的问题。请时刻记住我们的基础概率,想想那个40岁打算生小孩的妇女,医生告知她,鉴于她的年纪(贝叶斯定理思考问题的结构),她生下的小孩的缺陷率将高达年轻孕妇生下孩子的5倍。假设年轻女士生下的小孩的缺陷率为1/50000,那么40岁女性生下的小孩的缺陷率将达到1/10000。这仍然是一个不太可能发生的概率。即使风险概率提高至5倍,但基础概率仍然很低。尽管听到的百分比让我们印象深刻,但它并没有任何实际意义。如果你想到了我们在第4章所提到的网上交友离婚率的统计把戏,那么,你一定没想错。从7.7%下降到6%,25%的离婚下降率,实际上没有任何实际意义。这种下降也许具有某种统计意义(这是研究者们要思考的地方),但它没有任何实际意义。

相反,如果遭遇某种灾难的概率为80%,你能够将这一概率减少25%,即下降到60%的话,那么这就是有价值的——25%的下降在刻度的顶端更有意义。这是因为我们都可能概率中招。知道这一点,这是因为我们具有心理学和行为经济学思维,我们称之为前景理论与预期效用。我们中的大多数人都没有理性的决策头脑,我们看重损失大过看重收获。也就是说,损失100美元比收获100美元对我们的影响更大。换一种说法,我们大部分人都会投入更多用于避免损失,而不是收获什么。

卡尼曼和特韦尔斯基最伟大的见解之一是:损失或收获都是非线性的,也就是说,相同量的收获(或损失)并不会带来相同量的幸福(与悲伤)——这都是相对你现在的状态而言的。如果你破产了,那么获得1美元就会变得很重要;如果你是一个百万富翁,那么1美元就无所谓了。还有其他很多非线性的例子:假设你被诊断出某种特殊疾病,医生给你推荐了某个治疗方案,这将让你的康复概率提高10个百分点。根据你的初始康复概率,10%的增加也有着不同的意义。我们考虑一下这些场景:

A.将你的康复概率从0增加到10%。

B.将你的康复概率从10%增加到20%。

C.将你的康复概率从45%增加到55%。

D.将你的康复概率从90%增加到100%。

如果你跟大多数人一样,场景A与场景D将会比场景B和场景C更吸引人。场景A将绝对的死亡变成了活的希望。虽然可能性仍是很小,但我们都渴望求生,当看到这样的替代方案时,我们会看到其中积极的一面。场景D将死的可能性转变成绝对的生存。我们会选择A或D;我们希望了解更多的关于B和C的信息,以确定它们是否值得。

我们的直觉系统天生不太能够理解统计学,也不太能够总是做出理性的决策——这就是卡尼曼《思考,快与慢》一书背后的中心思想。例如,我们大多数人都会对一个问题的呈现形式敏感——问题是如何构成的——某些简单的,甚至是可笑的操控都可以在很大程度上影响决定与倾向。例如,想想下列癌症手术治疗与放疗的假设数据,你会选择哪一个?

a.在100个接受手术治疗的人中,90个人能够挺过手术,34个人多活了5年。

b.在100个接受放疗的人中,所有人能够挺过治疗,22个人多活了5年。

如果选择手术,你会跟大多数人一样——多活5年确实很吸引人,尽管放疗的即时效果更好。

现在,我们将上面事例中的数字从存活率改为死亡率——你会怎么选择?

2a.在100个接受手术治疗的人中,10个人死于手术过程中,66个人5年之后死亡。

2b.在100个接受放疗的人中,所有人能够挺过治疗,5年后,78人死亡。

这两种说法,从数学角度来说是一样的——100个人中死亡10个相当于存活了90个——但是它们从心理角度来说却是不一样的。在第一种场景下,我们更倾向于选择手术治疗;而在第二种场景下,我们更倾向于放疗。在第一种场景中,我们的注意力显然关注了5年的存活率,手术的存活率为34%,放疗的存活率为22%。第二种场景的说法显然更能让我们关注手术本身的风险:放疗可以将死亡风险从10%降至0。这种效应不但会出现在病人身上,还会出现在有经验的医生与精明的商人身上。

我们大多数人比起原始数字,往往更关注图形,这就是为什么大学采用画图解决较难的微积分课程的原因。医生经常会使用的一种帮助病人了解风险的方法是:告诉病人如果有100个病人,那么实际出现结果的会有多少人。图6–1的例子是关于用抗生素治疗中耳感染(中耳炎)的风险与好处。需要接受治疗的人数为20人(在100个服用抗生素的人中,只有5个人获益);此外,9人没有治愈,需要后续治疗;86人没有得到帮助也没有受到伤害——至少从身体上看是这样(也许他们在经济上遭受了一定的损失)。我们服用的大量抗生素实际上只能取得很小的效果。但这样的图片可以帮助病人了解风险,更好地做出决定,因为他们可以看到每一个类别下人数的比重。

333-i

图6–1 用抗生素治疗中耳炎的风险与好处对比图

决策心理学的另一个影响因素是避免后悔。阿莫斯·特沃斯基曾说过,后悔是风险规避的驱动力,这是一个强大的心理力量。当需要做出决定时,我们都会试着避免由于错误决定导致的遗憾,尽管有时这些决定可能会与我们的预期价值截然不同。尽管×方案只有10%的概率会帮到我们,而且还具有较高的副作用风险,但你仍然会选择它,因为你不想以后后悔,你可能就是那受益的10%中的一个。人类在后悔上面的情感开销是巨大的。正如一位乳腺癌幸存者所说的那样,“他们告诉我,他们也不知道手术后的放疗究竟有没有作用。但我仍然会想:如果乳腺癌复发了,而我又没有接受治疗,我该怎么办?我感觉自己就像是个傻子。”

我的车的两个前轮胎已经用了5年了,车胎中心仍还有很多胎面胶,但我注意到,车胎边缘有磨损(这可能是由于充气不足或大量山区驾驶引起的)。我向一位轮胎专家咨询了此事,他指出,车胎在使用5年之后会变得不稳固,会破裂,导致胎面胶、传送带与轮胎其他部分分离。再加上较低的边缘胎面,轮胎很少采取保护措施,因此,很可能发生爆胎。

现在,我已经有多年驾车经历和几十万的驾车里程,但目前只发生过两三次爆胎。这些都没有发生在很危险的情况下,但它们就是很不方便。你需要将车胎取下,给车架上支架,然后装上备用车胎。如果一切都顺利,你可能只是约会迟到半个小时,衣服被弄脏而已。但如果爆胎发生在暴风雨时,或者发生在没有路肩的山路或高速公路,情况可能就不那么理想了,甚至可能会很危险。无论是我的机械师还是美国交通运输部门都无法告诉我,中心胎面磨损完之前如果我没有更换车胎,究竟发生事故的概率会是多少。即使缺少这样的信息,我的直觉——以及我的机械师的直觉——也认为,更换车胎的预期价值或益处远远低于更换它们的损失。

我的朋友艾伦喜欢省钱。我的意思是,他钟爱省钱,他经常告诉我们怎样在一元店购买盘子、在救世军店购买衣服。这并不是由于他负担不起——他有足够的钱——他只是觉得自己是一位藐视现代世界消费文化的领军人物。他会经常吹嘘自己因为没有更换轮胎又节约了200美元,他愿意承担未来可能的不便,尽管他也不知道这个概率是多少。我宁愿用金钱来交换便利与安全。其他人可能需要更多的保障,他们也愿意为此付出。这就是保险——如果火灾保险对房屋主人而言难以负担,那么保险公司就不会成为如此富有的跨国公司。不要搞错,对他们而言,这确实是一笔划算的交易。但我们喜欢保险带给我们的内心宁静。我买了新的轮胎(当艾伦读到这一页的时候,他让我告诉读者们,他认为我是被非理性的恐惧驱使,我太过担心还未发生的事情)。

在这样的决策过程中,后悔确实起着很重要的作用。如果真的由于我没有花那200美元,而导致自己错过了美好的郊游,或者弄脏了精美的衣服,又或者遭遇了事故,我一定会感觉自己是个傻子。如果艾伦能够用那两个旧轮胎再行驶两年,他一定会兴高采烈地砸200美元现金在我的脸上,然后告诉我,我就是一个杞人忧天的笨蛋。

显然,医疗决策也被后悔的恐惧所驱使。我们中的一些人会愿意拿现在的不便与不适来交换以避免未来很小的,甚至只有5%的出错概率,避免自己会后悔“如果我按照医生说的做了会怎样?我到底是怎么了?——我的性命已经命悬一线了”。而艾伦希望无限放大眼前的快乐,他看中自由,不愿意被今天并非绝对需要的健康机制或医学体质所束缚。

当我们面对这样的问题时,组织医疗信息的最佳策略是让自己知晓更多准确的数据,了解自己对风险与后悔的偏好与口味。如果你发现自己迷失了、困惑了,朋友和亲人通常能够提醒你,你赖以生存的核心价值是什么。

药物,数学,做出最有意义的选择

本书中的其他章节都在关注注意力与记忆力,但当我们做出重大决策时,最能帮到我们的是数学,它被称为科学的皇后。有时候,数学很无聊、很没意思,但当需要组织我们的大脑时,我们需要抛开对那些看起来不怎么人性的可能性分析与数学计算的厌恶。

日常生活中,当面对很严重的后果、很难做出决定时,我们常常会感到很害怕、困惑和沮丧。当生命真的命悬一线时,我们需要将自己的信念转向数字。尽可能多地收集信息,与专家一起沟通。如果你需要手术,请找经验丰富的医生完成你的手术。作为自身健康管理的首席执行官,你需要明白怎样利用医生给你的信息,然后在四格表中分析它,运用贝叶斯定理,这样可以让你在决策时省去很多的猜测,将决定转变为可以评价的数字,因为我们中的大多数人都没有豪斯医生如此敏锐的直觉。

花一点时间做决定,从数学的角度思考问题。与你的医生交谈,找到愿意与你谈论数学的人。你需要克服不愿意问问题和不愿意与医生争论的尴尬,让你所爱的人做你的后盾,确保你们的谈话时间足够长——询问你的医生:“你需要我治疗多久?”

当生病或受伤时,我们的生命似乎被专家所控制,但事实上并不是这样。我们可以掌握自己的疾病,了解更多的相关知识,向更多的医生寻求专业意见。当然,医生也是人,他们也会有自己不同的个性、风格和特长。我们需要找到与自己的风格匹配的医生,找到明白我们的需要、可以帮助我们战胜疾病的医生。你和医生之间的关系不应该是家长与孩子的关系,而应该是一种合作关系,你们应该是为了共同的目标而合作的伙伴。