挣钱的方法就是,股价下跌时买入股票,等到股价上涨时再把它卖掉。
    如果股价没有上涨,就不要买股票。
    ——威尔·罗杰斯(Will Rogers),美国幽默作家

    第一台计算机问世后不久,它犯的错误就成了世人的笑柄。编程过程中最小的错误也能酿成大错,如清除客户的账户数据、开出数额奇怪的账单或使计算机陷入一直犯相同错误的状态中。 [45]这种令人抓狂的缺乏常识的现象,使很多用户认为计算机永远也不可能变得智能。

    如今,计算机的表现更好了。一些程序在下棋方面甚至胜过了人类;其他程序则可以检测出心脏病;还有一些程序可以识别人脸图像,组装工厂里的汽车,甚至可以开船和驾驶飞机。但到目前为止,却还没有机器能够铺床、读书或照顾婴儿。

    是什么阻碍了计算机完成大多数人都能胜任的事情?难道计算机需要更多存储空间和更快的速度,变得更复杂吗?难道计算机建立在错误的基础上吗?难道因为只会使用0和1的事实造成了它们的诸多局限?难道因为计算机缺乏人类固有的魔法属性?本章认为,以上所有问题都不是计算机效率低的原因;恰恰相反,这些局限性来自程序员落后的编程方式。

    所有的现代程序都不具备常识性知识。每个现代程序本身包含的知识只能解决某些特殊的问题。本章的第一部分主要讨论人们拥有大量的知识以及使用这些知识时所必备的技能。例如,如果有人说用“绳子”系紧包裹,那你肯定能理解这种“显而易见”的事实,但计算机却一点儿也不明白。

    ● 你可以用绳子拉而不是推东西。

    ● 如果把绳子拽得太紧,它会断。

    ● 在用绳子系紧包裹前,必须装满包裹。

    ● 要松一松绳子,以免它缠住或打结。

    现代程序并没有明确的目标。如今,我们仅仅让程序完成事情,而不告诉它们为什么需要完成这些事情。因此,这些程序也无法辨别自己是否达成了用户的预期目标、完成的质量以及花费的成本如何。本章后文将讨论这些目标的本质和计算机完成目标的方法。

    ● 外面下雨时,人们喜欢待在室内。(人们不喜欢被雨淋湿)

    ● 人们不喜欢被打断。(人们喜欢被倾听)

    ● 在吵闹的环境里听不清楚别人说话。(人们想要听听别人的看法)

    ● 没有人知道你在想什么。(人们尊重隐私)

    所有的现代程序都不够智能。程序缺乏本身需要的知识或无法使用自带的方法时,便会自行停止运行,但人类依然会寻找其他方法来继续完成目标。本章最后将讨论人们在毫无头绪时使用的一些方法,例如,通过类比法。

    ● 以前经历过这样的情景吗?

    ● 这个问题和哪一个问题很相似?

    ● 我是怎样解决这个问题的?

    ● 我可以使用这些方法解决这个问题吗?

    正是由于缺乏这种能力,计算机才会一旦出现故障就停止运行,而不是寻找更好的方法。为什么它们不能从经验中学习?那正是因为计算机缺乏常识!

    在日常生活中,我们根本意识不到人类使用的程序是多么复杂。本章将讨论的是:我们所做的许多常识性事情,要比吸引更多关注、获得令人敬仰的专业技能复杂得多。

    什么是常识

    爱因斯坦

    常识就是人到18岁为止所积累的各种偏见。

    与其抱怨计算机自身的缺点,不如尝试赋予计算机更多知识,不仅包括“常识”,即一种我们大多数人都理解的事实和观念,也包括常识性推理,即人们应用知识的技能。

    学生:你能更详细地定义你所说的“常识”吗?

    我们使用术语“常识”来指代其他人能够理解并认为显而易见的事情。

    社会学家:“常识”一词的意思因人而异,因为那些我们认为显而易见的事情取决于我们生长的社区环境,像一个人的家庭、邻居、语言、宗族、国家、宗教信仰、学校和职业等,每一个小分类都有不同的知识、信仰和思维方式。儿童心理学家:即使只知道孩子的年龄,你依然能知道很多孩子了解的事情。近代最有名的儿童心理学家让·皮亚杰(Jean Piaget)等研究人员研究了世界各地的儿童,发现儿童的思想领域中有着相似的观念和信仰。
    大众:当人们以一种近似愚蠢的方式互相争论时,我们便经常说人们“缺乏常识”,并不是因为他们真的缺乏常识,而是因为他们没有恰当地使用常识。

    每个人都在不断学习,不仅学习新知识,还要学习新的思维方式。我们从自己的经验、父母和朋友们的教导,以及我们遇到的其他人身上学习,因此人们碰巧了解的知识和别人认为显而易见的知识会变得难以区分,这也增加了预测别人想法的难度。

    打电话

    西蒙·派珀特

    Seymour Papert

    近代人工智能领域的

    先驱之一

    在大脑没有进行任何思考的情况下,你根本无法思考思考行为本身。

    我们听从派珀特的建议,想出一些方法来讨论以下这个典型而普通的例子:

    琼听到电话铃声响了,便拿起电话,查尔斯打来是想回答琼之前问他的一个医疗程序方面的问题,他建议琼去读一本书,因为查尔斯是琼的邻居,所以决定过一会儿把书拿给琼。琼感谢了查尔斯并挂了电话。不久后,查尔斯来到她家,把书给了琼。

    这个故事中的每一个词语都能在你的大脑里引发以下几个方面的理解:

    ● 琼听到了电话铃声。她认为这种特殊的铃声意味着有人希望和她说话。

    ● 琼拿起电话。想去接电话,琼便要穿过房间,拿起电话放在耳边。

    ● 查尔斯正在回答琼问到的问题。查尔斯在另一个房间里,他们俩都知道怎么使用电话。

    ● 查尔斯建议琼去读一本书。琼听懂了查尔斯的话中之意。

    ● 琼感谢了查尔斯。那仅是一种客套还是琼发自内心的呢?

    ● 查尔斯很快来到琼身旁。查尔斯来到时,琼并不感到意外。

    ● 查尔斯把书给了琼。我们不知道这是查尔斯借给她的书还是送给她的礼物。

    我们如此轻易地得到了这些结论,根本不曾意识到这些结论其实正是自己下的,所以,现在来回顾一下要理解琼听到铃声、接听电话这一事实所需涉及的过程。

    首先,琼看到电话时,她只看到了电话的一个侧面,但她感觉自己已经看到了整部电话;甚至在开始接听电话时,她仍然在想自己能否抓住电话以及电话碰到耳朵时的感觉,她也知道电话代表着一个人在一边说话而另一个人在另一边回答。琼知道,如果自己拨通一个号码,电话铃便会在另一个地方响起,如果有人刚好接到电话,她便可以开始和那个人交谈了。

    这些快速获得知识的过程似乎是看待物体时的一个自然方面,但人们才刚刚看到冰山一角!如此少的证据怎么会让你认为自己“看见”的东西已经被完全传送到大脑里了呢?在大脑里,你可以移动、感受以及改变这些记忆,甚至将其打开查看内部构造吗?答案是,你所“看到”的并不完全来自视觉,还来自这些视觉引发的其他知识。

    然而,另一方面,如果对这方面的知识了解过多且所有知识同时“出席”,大脑可能会被其淹没。因此,本章后文将讨论人类的大脑如何分离部分知识,从而仅仅获得自己所需要的。

    平行类比

    道格拉斯·勒奈(Douglas Lenat,1998):如果从一本书中抽出孤立的一句话来,那么这句话就会变得毫无意义。例如,你把一句不带有任何语境的句子拿给别人看,这句话很可能会错失其部分甚至全部意义。所以,信息的表达意义大部分来源于信息形成的语境,这会是很大的优势。从某种程度上说,两个具有思考能力的人如果享有共同的语境,他们可能会使用这些信号沟通交流复杂的思想。

    每一个词语、事件、想法或事物对我们来说都有不同的意义。你听到“查尔斯将书给了琼时”,可能会觉得书本只是一个物质实体、所属物或礼物罢了。至少你可能从以下三种思维领域来解释这种“给予”行为。

    物理领域:“给予”指书通过空间传递,从查尔斯到琼(见图6-1)。

    空标题文档 - 图1

    图6-1 物理领域

    社会领域:我们想知道查尔斯的动机。他是慷慨大方,还是想让琼讨好自己(见图6-2)?

    空标题文档 - 图2

    图6-2 社会领域

    主权领域:我们可以推测出琼不仅拿着那本书,也拥有那本书的使用权(见图6-3)。

    空标题文档 - 图3

    图6-3 主权领域

    在这三者中,主权领域尤其重要,因为你需要工具、货源和材料来解决问题或完成计划。但是文明世界中的大多数物体是由人或组织控制的,不经过他们的同意则没有任何使用权。

    “给”在这里有三种意思(见图6-4),每种意思之间都有相似的结构。第8章表明,在这种情况下,在大范围内的结构中,大脑可以把不同领域(不同观点)中相似的知识和相同的“作用”(roles)或“槽”(slots)联系起来。

    空标题文档 - 图4

    图6-4 “给”的三种意思

    图6-4例证了一种被称为“平行类比”的结构。图6-4表明,思维方式在有关物体、想法或情况之间实现快速的转变,例如,当琼伸手拿书时,她预估了(在物理领域)书本的重量,并知道如果自己松手,书必然会滑落;同时,(在主权领域)琼需要表明是自己拥有这本书还是必须将其还给查尔斯;所以,如果查尔斯告诉琼这是自己送给她的礼物,琼则会解除债务关系。

    当在不适当的思维领域解释事件时会发生什么?一旦意识到这一点,也无需从头开始,大脑会立刻转到有用的想法上,如何快速做到这些?第8章指出,这些行动可能源于对平行类比的使用:如果你已经将同样的象征和多种合适的意思联系起来,并且在这些领域内起作用的大脑部位已经处理过相似的事件,那么这种转变根本无须再花时间,例如,它可能发生在以下这些情况之间:把那本书看成物体、所属物或潜在知识的集合。

    一般说来,我们接触到的观念都会涉及几种不同的领域,例如,图6-5中小女孩正在玩积木,就可能包括以下几种不同的关注点。

    空标题文档 - 图5

    图6-5 玩积木的小女孩

    ● 物质:我把最底层的积木抽出来会发生什么?

    ● 社会:我是该帮助小男孩搭塔还是推倒塔? [46]

    ● 情感:他会作出何种反应?

    ● 记忆:我把小块的三角形积木放到哪里去了?

    ● 策略:我能从这里够到那个拱形门形状的积木吗?

    ● 视觉:那块既长又平的积木是不是在那堆积木后面?

    ● 触觉:同时抓住3块积木是什么感觉?

    ● 建筑学:有额外的积木可以用来搭桌子吗?

    我们再次遇到了这样的情况:物体或观点如何被赋予各种不同意义。有时我们称这种现象为“歧义”,并把其视为表达或交流中的缺憾,但当我们把这些缺憾和平行类比联系起来时,就可以在不同领域内进行思考,而不用一切重新开始。

    学生:查尔斯送书给琼的例子表明,我们可以使用相同的技巧来表示空间的流动,比如转移所有权和传递知识。但是什么使我们的思维能使用相似的方式处理如此不同的想法呢?

    在英语中,“传递”(transfer)、“运送”(transport)、“传播”(transmit)、“翻译”(translate)和“变位”(transpose)等不同的词语都使用了相同的前缀“trans”,这是因为简单的“trans”为我们引入了非常广泛而有用的类比。 [47]每个人都认识成千上万的词汇,每次在学习别人如何使用这些词汇时,我们都学习了另一种新的平行类比。

    学生:许多领域是如何被人们用来思考特定的观念或物体的?每次最多能同时处理多少个领域?人们是怎么知道转换领域的时间的?在何种程度上,不同的人会把各自所处的世界分为相似的领域?

    对语义的研究最终会解答这些问题,但下面几个小节将主要讨论人们在想到电话时涉及的领域。

    电话世界的子领域

    我们在上面只提到了每个电话用户都知道的问题。但是,为了使用有关电话的知识,你也需要知道该如何交谈,如何理解自己听到的事情;同样,你还需了解对方是谁,他们如何思考;因为只有这样你才能成功地把他们的注意力吸引到你所想讨论的主题上来。我们首先来看一下,琼的电话内容涉及多少个不同的知识领域。

    ● 物理领域:琼就在电话旁边,但查尔斯必定在离琼远一点儿的地方。

    ● 主权领域:琼和查尔斯都有电话,而且查尔斯拥有那本书。但我们不知道他们拥有什么其他物品。

    ● 程序领域:人们如何打电话?我们可以用脚本的方式描述这个动作,在这个脚本中,一些动作是已经规定的、明确的,另一些动作则需要即兴创作(见图6-6)。

    空标题文档 - 图6

    图6-6 打电话的脚本

    首先,你必须找到电话,拨电话号码;其次,一旦接通电话,你应该说些问候语;接着,你应该表明打电话的原因,这时就开始即兴创作;最后,以“再见”和“挂断电话”结束。一般情况下,这种行为脚本以常规的步骤开始或结束,其间也掺杂着即兴发挥的部分。同样,如果脚本出现任何问题,你必须放弃脚本,并知道出现以下情况时该如何处理:拨错电话时该怎么办,电话没人接听时怎么办,调制解调器出现故障时怎么办,以及电话中出现很多噪音怎么办。

    社会领域。当房间里响起电话铃声时,琼必须穿过房间接听电话,她知道说“电话,请你过来”是没有任何作用的。要移动一个无生命的物体,你必须推、拉或提,但如果想要人过来,以上这些动作又显得不礼貌了,相反,你应该发出邀请。孩子们学会这种社会规则通常需要花数年时间。

    经济领域。每个动作都需要付出代价,不仅是以物质、时间和能量的形式,还可能以拒绝可能带来利益的另一种选择的形式。这就向我们提出了一个全新的问题:在比较不同选择所花的代价时,应该花多少精力和时间?我认为这个问题的答案并不简单,因为它取决于每个人当时的精神状态。

    对话领域。许多人很擅长对话,但对话过程中却涉及非常复杂的技能。你必须时刻跟踪话题、目标和社会角色。为了保持听众对你的关注,你需要记得他们本已知晓的事实,记得他们说过的话,这样才不会重复。重复说人们已经知道的事实会招人厌烦,比如“人永远无法正视自己的缺点”,因此,听者关于对话过程的了解是对话的部分基础。

    你可以表达自己的意图或希望,或者尝试对其进行伪装;你知道如何通过表达来增强或削弱社会关系;每个词语都可能说服或威慑、安抚或激怒、逢迎或赶走对方。你需要观察对方在何种程度上理解了你的表述,以及你为什么要告诉对方这些事。

    人类学家:电话交流是面对面交流的次等替代方式。电话不具备“人情味儿”,不像在面对面交谈时你可以通过手势让他人更为自在,传达出个人情感的强度。

    人们在不同的地点沟通交流时,会表现出细微的区别。一方面,我们并不总能意识到面对面交流中造成的误解。如果刚认识的陌生人和你的好朋友或敌人有几分相似怎么办?如果这个陌生人使你想起了之前的印刻者,或许会引起喜爱或威胁的误导,或许你认为以后自己可以修正这种错误,但人们并不能完全消除“第一印象”。

    感觉和运动领域。我们还拥有一些其他“非常识”能力,比如琼用来接听电话的物理技能。伸出胳膊和“接听电话”之间的时间几乎不到一秒,但在这么短的时间内,她就已经实现了以下诸多子目标:

    ● 确定电话的位置;

    ● 确定电话的形状或方位;

    ● 把手移到电话的位置;

    ● 用手抓住电话;

    ● 把电话送到耳边。

    以上每一步都存在共同的问题:我们如何更快地完成这些事?我们可以为计算机编程,让它来完成这些事,但自己并不知道到底要如何完成。人们普遍认为,这些行为的完成需要不断“反馈控制”,即不断缩短与目标距离的过程,然而,这也不一定正确,因为人类的反应非常缓慢,需要花费0.2秒的时间对未预料到的事件作出反应,这意味着你并没有能力改变自己正在做的事,唯一能做的就是修改之后的计划。所以,当琼伸出手接听电话时,她必须在手臂撞到电话之前减速。如果后来没有放慢速度,琼无疑会撞到电话。

    肌肉运动知觉和触觉领域。把手机放在肩膀和脸颊之间时,你必须首先预估手机的形状和重量,从而调整手掌接触面的大小使其不致滑落,而且你要知道,只要放下电话,这个重量就会消失。你很清楚,一旦松手,手机就一定会滑落,遭受重压时手机也会被压坏。大量的知识存储在脊髓、小脑和大脑中,但这些系统很难接近,我们也根本无法对其进行研究。

    认知领域。我们甚至不擅长描述思考时使用的系统,例如,我们完全意识不到自己如何获取或融合各部分知识,也无法知道当处理不确定的事情时该如何处理出现错误的情况。

    自觉领域。无论做什么事,你都需要认清自己的能力,否则永远不能完成自己的目标,实现不了自己的计划,或在利益之间频繁转换,因为正如第9章要讨论的,除非坚持目标,否则很难完成任何目标。

    扩充以上领域很容易,但明确区分不同领域却是件非常困难的事。

    常识性知识和推理

    罗伯逊·戴维斯(Robertson Davies,1992):你认为大脑像一个整洁的机器般进行高效、严密的工作,没有多余的部件;我认为大脑像一个垃圾箱,里面装满漂亮的布、奇怪的宝石、廉价但吸引人的古玩、金箔、木刻和一些泥土。轻轻摇一摇机器,机器就会失灵;但摇一摇垃圾箱,其内容物只会换一下排列方式。

    我曾经遇见一位刚下课的大学教授,我问他,课上得怎么样。他回答说,并不怎么样,因为“我记不得哪些概念比较难以理解”。这表明专家已经把高层次的技能转变为低层次的脚本,因此很少在记忆里留下痕迹,所以他也无法解释自己要如何完成这些工作。很多思想家把知识分为以下两种:

    知事类知识(Knowing What):这是一种“命题性知识”或“显性知识”,可以用手势或言语来表达;
    知能类知识(Knowing How):这是一种“程序性知识”或“隐性技能”(像走路和想象),我们很难描述。

    但是,这种流行的分类方法并不能描述这类知识的功能,按照思维应用的种类来区分知识的做法或许更好:

    ● 正面经验(Positive Expertise):知道在哪种情况下该使用哪种类型的知识;负面经验(Negative Expertise):知道不该采取哪种行动,因为可能会使事情变得更糟糕;

    ● 调试技能(Debugging Skills):当常规方法不再适用时,还有其他可供选择的方法;

    ● 适应技能(Adaptive Skills):知道怎样把原有知识应用到新情况之中。

    首先想到对常识进行分类的是道格拉斯·勒奈,他在1984年做过一个叫作“CYC”的项目,本节的很多观点都受到了他实验结果的影响。

    道格拉斯·勒奈(1998):在当代美国,常识包罗万象:近代历史和时事政治、物理学、“家庭”化学、畅销书、电影、歌曲、广告、名人、营养学、附加物和天气等……也包括很多规则条例,大部分来源于约会、开车、进餐、做白日梦等人们共同的经历和人类认知经济学(记忆错误和误解等)以及共有的高层次(归纳、直觉、灵感或孵化)和低层次的推理能力(演绎、辩证、表面类比和归档等)。

    勒奈分析了这句话:“Fred told the waiter he wanted some chips.”(弗雷德告诉服务员他想要薯条。)他研究了人们需要多少知识才能真正理解这句话的意思。 [48]

    单词“he”指代弗雷德,而不是服务员。这个事件发生在餐馆里。弗雷德是一个顾客,在那里进餐。弗雷德和服务员之间只有几米远。服务员正在工作,等待弗雷德点餐。
    弗雷德需要薯条,而不是小木片。他也不想要某些特定类型的薯条。
    弗雷德通过与服务员交流完成点餐。两个人,都是人类,都说着同一种语言,都到了能够说话的年龄,而且服务员也到了工作年龄。
    弗雷德感到饥饿。他希望并认为服务员会在几分钟之内端来一盘薯条,不久后弗雷德就可以开始吃薯条。
    我们假设弗雷德知道服务员明白他说的一切。

    下面是说明人们需要何种知识才能理解日常所说的话的另一个例子。

    “乔的女儿生病了,乔去请医生。”(Joe’s daughter was sick so he called the doctor.)
    我们认为乔很关心自己的女儿,并希望她健健康康的,因此当女儿生病时,乔一定很伤心。乔是通过观察女儿的症状才发现她生病这一事实的。
    人各有所长,乔自己也无法治愈女儿的疾病,但人们在自己无法做某事时总会求助他人来帮忙。因此,乔去请医生来帮助治自己女儿的病。
    在某种意义上,乔的女儿属于乔。人们关心自己的女儿胜过关心别人的女儿。如果有人建议,乔肯定会带着自己的女儿到医生那里去看病,但就算到了医生那里,乔的女儿仍然属于乔。
    医疗服务会很昂贵,但乔必然会放弃其他花销来找医生治女儿的病。

    以上是“每个人都明白的事”,我们会用它们来理解日常生活中发生的小故事。但只有当我们拥有帮助我们实现自己具体目标的额外的知识时,这些知识才有用处。

    一个人知道多少

    爱因斯坦

    一知半解是件危险的事情,知道过多同样危险。

    每个人关于特定的物体、话题和想法都有很多了解,这可能会让我们认为每个人都拥有强大的记忆力。许多研究者提出,由于每个人都拥有上万亿个突触,那么我们至少可以利用这些突触储存上百万条记忆。然而,如果这种论证正确的话,我们对知识的反应能力就不会如此迅速。

    无论如何,我们首先来做一次保守估计。众所周知,每个人都掌握着成千上万个词,并且可以有把握地说,一个词或许与我们脑海中1000多条其他记忆都有联系,那么一个人的语言系统可能产生了上百万条联系。

    与其相似,在物理领域,每个人都熟悉成千上万个物体,而且每种物体可能与成千上万个其他物体和使用方式相联系。同样,在社会领域,你可能了解一百个人的成千上万件事情,或许还有一千个人的数万件事情。

    这表明,在每个重要领域,每个人都可能熟悉几百万种事物;然而想出几十种这样的领域虽然简单,但想起几百种却非常艰难。那么,如果一台机器能像人类一样思考和推理,它们可能需要几亿条知识。 [49]

    大众:或许是这样的,但我听别人说过关于记忆的奇闻,比如,一个记忆很好的人只需要读一遍书本就能记住上面的每一个字。从某种程度上说,我们记得的恰恰是发生在我们周围的事情吗?

    我们都听过关于记忆的奇闻,但是我们一旦开始研究这类事情,却难以找到原因,或会发现某人只是被一场魅力展示所蒙骗了而已。我们遇到过能够完整背下几本厚书的人,但从未听说有人能背下几百本类似书籍。 [50]下面是一位心理学家对一位拥有惊人记忆力的人的描述:

    亚历山大·鲁利亚(Alexander Luria,1968):约30年来,我有幸能够对一个有着超凡记忆力的人进行系统的观察,为了许多现实的目的,无论是一系列有意义的单词还是无意义的音节、数字或者声音,无论是以口语的形式还是以书面形式,他的记忆力都不会受影响。他需要的仅仅是每一个符号之间相隔3~4个间隙,而且在15年后,他仍然能够回忆起这些数字、音节或声音。

    这些能力看起来令人印象深刻,但并不是真的独一无二,因为托马斯·兰道尔(Thomas Landauer,1986)总结道,在任何延长的间歇中,受试者并不能以每秒两个字节的速度学习和记忆,无论其领域是视觉、语言、音乐还是其他方面。因此,如鲁利亚的受试者记忆每个单词需要几秒时间,则其表现就符合兰道尔的估计。 [51]

    学生:我不赞同这个观点,我同意记忆能力更适用于较高层次的知识,但我们的感官和运动技能却是以大量的信息为基础的。

    我们并没有估量这些事情的较好的方法,作出这样的估计却能引发知识在储备和连接等方面的难题。另外,我们也没有可靠的证据证明每个人的能力都超出了兰道尔的研究上限。 [52]

    第7章将探索人类知识的组织方式,一旦不能使用其中一种方法,我们可以寻找其他方法,但接下来我们主要讨论如何赋予计算机人类拥有的那种常识。

    我们可以建造一个“儿童机”吗

    有一个极受欢迎的古老梦想:建立以简单方式运行的机器,之后再研究使机器变得智能的有效方法。

    企业家:为什么不建造一台从经验中学习的“儿童机”?为机器人添加传感器和发动机,为其编程,机器人就可以通过与现实世界的联系而学习,而这一直是婴儿的学习方法。从简单的If→Then模式开始,之后过渡到更为详细的模式。

    事实上,有几个正在进行的项目研究的就是这个方法,最初,每个这样的系统都能取得进步,但最后却都停止了发展。 [53]我认为这是非常常见的,因为很多程序并没有研究出表征知识的更好方法。一直以来,研究出表征知识的好方法是计算机科学的主要目标,然而,即使新的方法得以发明,它们也无法得到广泛和快速的应用,这是因为,为更有效地配合方法的使用,人们也必须拥有更好的技能,然而技能也需要时间来掌握,所以其使用者也需要忍受一段日子:因为在这段日子里机器的表现并没有变得更好,反而变得更差 [54](详见本章和第9章)。无论如何,到目前为止,还没有人发明能够不断创新有效表现方式的儿童机。

    建造儿童机的另一个问题是,如果系统不加选择地学习新规则,那么该机器很可能积累太多不相关的信息,从而恶化其表现。第8章认为,只有机器加以选择地学习,即作出合适的“信用赋能”,才能从其经验中学习。

    企业家:为什么不建立一个机器,使其能够浏览网页,从上百万内容丰富的文章中汲取知识,而不是尝试建立自我学习的系统?

    这确实是个比较有诱惑力的想法,因为互联网储存的内容要比我们任何人所学到的都多,但是,互联网上的文章不能明确地列出人们理解文章时所用的知识。 [55]所以来看看下面这个我们从儿童读物里摘录的故事:

    玛丽被邀请参加杰克的舞会。她觉得杰克可能会喜欢风筝,于是她摇了摇小猪形状的存钱罐,但没有听到任何声音。

    一般读者会认为,杰克要开生日晚会,所以玛丽想要送杰克一份生日礼物。 [56]对方喜欢的礼物才称得上是好礼物,“杰克可能会喜欢风筝”这一想法也表明杰克只是个孩子,因此风筝会是一个合适的玩具。“摇小猪形状的存钱罐”暗示着玛丽想买一只风筝,需要用钱。如果存钱罐里有钱,摇一摇它就会发出声响。然而,如果读者不知道所有事实,这个“简单”的故事就会变得毫无意义可言,因为每句话之间并没有任何明显的联系。

    神经学家:为什么不尝试利用脑科学家对大脑各部分功能的了解来复制大脑?

    我们每周都在学习一些新的内容,但仍然不知道该如何模拟蝴蝶或蛇。

    程序员:那其他的选择呢?如建造一个大型机器,使其能够存储大量的统计数据。

    这样的系统可以学习完成有用的事,但我却认为它们不能发挥任何智慧,因为它们使用数字来表示学到的各种知识。所以,除非我们赋予其较高层次水平的思维,否则它们根本不能表达理解这些数据所需的各种概念。

    进化论者:如果我们不知道如何建造儿童机,或许我们可以让它们自动演化发展而成。首先编一套程序,使其能够自己创造出程序,其次,制造出很多变体程序,最后让这些程序为适应栩栩如生的环境而竞争。

    我们经历了几亿年才从早期的脊椎鱼类演化为现代的人类,同样,我们花费了几乎永世的时间才发展出第5章中描述的拥有高级反应层次的结构。余下几章将主要讨论每个孩子如何广泛使用这类高层次结构发展人类特有的表现新知识和过程的方式。建造儿童机的目标没有取得明显效果的原因是,你无法学习自己无法表达的事情。

    约翰·麦卡锡(John McCarthy,1959):如果人们想使机器也拥有识别抽象事物的能力,那么更可能的是也必须以相对简单的方式表现出这种抽象性。

    我无意否定建造儿童机的全部可能,我只是认为所有尝试的发展都非常缓慢,除非(或直到)机器有了足够的表达知识的方式(参见第8章)。不管怎样,显而易见的是,人类大脑天生就拥有高效学习的能力(其中一些能力要等到人类出生后很长时间才能发挥作用)。尝试建立这类机器的研究人员已经使用了独特的方案,但在我看来,所有机器陷入瓶颈的原因在于没有更合适的方式可用来解决以下问题:

    最优悖论(The Optimization Paradox):原有系统的效率越高,系统的每个变化都会使其效率降低,因此,系统很难找到改善自身的方式。
    投资原则(The Investment Principle):某个程序的作用越好,我们越依赖它,也就越不愿意寻找新选择,尤其是熟悉其使用后才能产生良好效果的新技术。
    复杂性屏障(The Complexity Barrier):与系统相连的部位越多,变化就越能带来意料不到的副作用。

    人们经常认为进化是选择变化的过程,但大部分进化会摒弃具有副作用的改变,这也是很多物种占领狭窄、特殊、由多种障碍和陷阱维护的地域的原因。基因性质的演化发展可以“学习”避免常见错误,但实际上却不能从大量的非常见错误中进行学习,而人们通常意识不到这一点。只有一些“高级动物”能够跳过这些错误,发展类似语言的系统,通过这个系统告诉后代发生在祖先以及亲属之间的一些事。

    这表明,机器持续发展是件非常困难的事,除非机器进化出能保护自己不受变化影响的保护机制,因为这些变化只会带来副作用。一个实现此效果的有效方式就是把整个系统分成独立运行的部分,无论是在工程学,还是在生物学领域。这就是所有有生命的物体进化成独立集合的原因(也就是我们所说的“器官”),每一个部分都与其他部分有关联(见图6-7)。

    空标题文档 - 图7

    图6-7 两种系统

    在以器官为基础的结构里,器官里的变化对其他器官内部的活动没有任何影响,这也是人类大脑的资源被“组织”成多个中心和层次的原因。

    艾伦·图灵(Alan Turing,1950)[7]:在初次尝试中,我们不能奢望建成优秀的儿童机。首先必须在一台机器上做实验,教会机器技能,从而观察机器如何学习。其次,与其他机器比较,观察其表现出的结果。但是适者生存的理念不能快速地衡量其优点,而实验者通过智能练习,应该有能力加快衡量的速度。因为如果实验者能找出其弱点出现的原因,同样也能够想出改善机器的方法。

    记忆

    一旦我们拥有解决问题的新想法或方式,就可以创造记忆记录,但是你必须有方法能“重新获得”记忆,解决当前面对的问题,否则这种记忆记录就毫无用处,我认为这一过程需要很多机制。

    大众:如果存储如此复杂,但它为什么看起来如此轻松、简单和自然呢?每一种想法都能让我想到相似的想法,继而想到相关的观点,直到想到自己需要的那个想法。

    为什么“记忆”看起来如此轻松?只要你记得,一般都能回忆起过去发生的事。然而,最早时候发生的事你为什么记不得了?尤其是回忆不起自己当初是如何发展能力的,或许这是因为你并没有发展出制造这些记忆的技能。

    这种“婴儿失忆症”(Amnesia of Infancy)让我们了解了记忆的定义以及记忆的工作机制等简单的问题。你也可能觉得自己的记忆就像便签簿,可以在里面记下思维的笔记;或在每一个重大的事件发生后把它存储在记忆箱里,当你想找回记忆时,如果足够幸运的话,便可以从记忆箱中找出这些“事件”。但我们使用怎样的结构来表达这种“事件”,又如何在需要时找回这些“事件”呢?记忆在具备以下两个条件时才能发挥作用:第一,与我们当前的目标相关;第二,需要时能够重新得到这些回忆。

    为了快速地找回信息,计算机专家可能会建议我们把所有记忆存储在单一的“数据库”里,使用一般目的“匹配”技术。然而,大部分系统仍然是以描述事情的方式而不是以有助于我们实现目标的方式来划分事物的。以实现目标的方式划分事物尤其重要,因为相比了解的事物类型,我们更熟悉想要实现的目标,因为人类总是会面对各种各样的困难,并产生解决这些困难的欲望。

    因此,比起使用一些“一般”的方式,我认为每个孩子都应该有能力把知识和想要实现的目标联系起来,这有助于我们回答以下问题:

    ● 这些知识条目服务于什么类型的目标?它们可以帮助我们解决怎样的困难,克服怎样的障碍?

    ● 知识与什么情形相关?在何种情况下,知识能起到帮助作用?能首先实现什么子目标?

    ● 知识在过去是如何应用的?类似案例是怎样的?与其他什么记录相关?(详见第8章)

    每一种知识也需要了解本身的不足、应用风险和成本:

    ● 知识的副作用是什么?知识对我们是否弊大于利?

    ● 应用知识的成本有多少?值得我们为之付出努力吗?

    ● 知识有什么例外情况或漏洞?在什么情况下知识可能不会发生作用,有什么较好的替代方法?

    我们也把知识、来源和其他人了解的情况联系起来:

    ● 知识是否有可靠的来源?一些知识可能是错误的,另一些知识可能会误导我们。

    ● 知识会很快过时吗?这也就是本书不讨论当前有关大脑运行方式的流行观点的原因。

    ● 其他人更可能了解知识的哪一面?社会活动在很大程度上取决于知晓其他人理解的内容。

    以上这些内容提出了一个问题:我们是如何在每一部分知识之间建立起如此之多的联系的?我认为,人们不可能同时做到这些,有证据显示,建立长久记忆需要花费几个小时甚至几天时间(包括做梦的时间)。与此同时,我们每次获得新知识时都会拥有新的联系,因为我们可能会问自己这样的问题:“这条知识会如何帮助(或阻碍)我克服这个障碍?”近些年来的一些研究表明,我们所谓的长期记忆并不像我们所想的那样长久,可能会被建议或其他经验改变。

    众所周知,记忆系统有时也会失效。有一些事情我们根本记不住,而且有时我们回忆起的是我们更想相信的版本,而不是实际发生的版本。有时我们根本记不起某些相关的事情,但几分钟或几天后却会忽然想起来,对自己说:“我太傻了,其实我一直知道!”这是有可能发生的,因为现存的记忆需要很长时间才能获取,记忆并没有真正发生,所以需要使用推理程序构建新的想法。

    无论如何,我们应该预料到类似此种“记忆失效”的问题,因为我们的记忆是选择型的。第4章讨论过,如果人们一次性记起所有事会有多么糟糕:记忆会激发上百万件事,从而将我们淹没。然而,所有这些都没有回答“我们如何获取当前需要的信息”这个问题,我认为我们可以通过以上讨论的联系的方法来获取需要的信息,但构建这些联系需要额外的技能,我们将在第8章讨论。

    本节伊始,我们就已提出如何获取所需知识的问题。本章认为部分答案在于众多的联系,其联系和目标相关,而知识则有助于目标的实现。为了使陈述更加具体,其余章节将主要讨论知识的定义及其运行方式。

    意图和目标

    阿兰·瓦兹(Alan Watts,英国哲学家、作家,1960):没人觉得交响乐应该在播放时提高质量,或弹奏交响乐的目的在于最后的终曲。音乐的意义在于弹奏和倾听的过程。生活也是如此。如果我们过度关注提高生活质量,可能会导致我们完全享受不到生活本来的美好。

    有时,我们看起来是如此被动,会对发生在自己身边的事情作出反应;但有时我们又是如此具有控制欲,感觉自己能够主动选择自己的目标。我认为这些情况主要发生在两个以上目标被同时激活的状态下,从而导致了冲突的发生。正如我们在第4章中观察到的那样,当常识性思考陷入困局时,较高层级的反应就会介入。

    例如,当我们生气或贪婪时,就会为当时所做的事情感到羞愧和内疚;我们就会找理由来为自己辩护,“当时的冲动太过强烈,我根本无法阻挡”或“我做那件事是不由自主的”,这种借口与当前目标和高层次理想之间的冲突相关,每个社会都会说服自己的成员控制违反常规惯例的冲动。我们称之为“自我控制”(seIf-control,详见第9章),每一种文化都有关于情感的座右铭。

    道德家:美德从不建立在出于自私欲望的行动之上。
    精神病学家:人们必须学会控制潜意识中的欲望。
    法理学家:犯罪可能是无意的,但冒犯却必定是蓄意的。

    犯罪的人可能会否认,“我不是故意做这些事的”,说得好像不该为无意识的行为负责任似的。但什么样的行为才会让我们认为人们“蓄意”做了某些事,或是由于某些不能控制的情绪而导致的?

    我们对物理实体持有的相似的看法容易理解这个问题——我们发现一些物体难以控制时,一般会认为这个物体自身也有能动性:“这块拼图好像不想进这个空里去”“我的汽车偏不启动”。我们清楚地知道,物体不会有这样的意识,为什么我们还是会这样看待它们?

    大脑中也会发生同样的事情:目标强烈到根本无法思考其他事情时,决定看起来根本就不像自己作出的,不知怎的,就像施加在自己身上的选择一样。但是什么让我们追求自己并不想要的目标?当某个具体的目标与高层次价值观冲突时,或当你的目标里又有其他目标时,这种情况就会发生。无论如何,我们没有理由期待所有目标都能一致。

    然而,对于目标为什么像一股力量,如“那种欲望根本令人无法拒绝”,上述解释并没有提供具体的回答。确实如此,“强大”的目标看起来能把其他目标推到一边,甚至在你试图否定这个目标却又没有进行过分强烈的否定时,它仍然会占据上风。所以,力量和目标之间享有相同的特征:

    ● 两者都朝着某个方向;

    ● 当我们尝试改变它们时,两者都试图“推回”这种力量;

    ● 两者都具有某种“力量”和“强度”;

    ● 除非导致两者的原因中止,否则两者会一直坚持下去。

    例如,假设外来力量对胳膊施力,力量足够大而导致疼痛时,大脑便会试图推回(或摆脱)这种力量,但无论你做什么,这股力量仍在不停向你施压。这种情况下,大脑只能看到一系列独立的事件。但较高层次的反应模式能够识别这种情况,并将其匹配到以下模式中:

    某件东西正在阻止我使其停止的努力。我认识到了这个过程,因而表现出了一些坚韧的力量、目标和智能。

    另外,大脑中的一些资源以一种无法控制的方式作出选择,就像你在做一件“自己无法控制的事情”时会识别出这类相似的结构,这种结构就像一种施加在你身上的外部力量一样。因此,把意图比喻为力量或对手具有现实意义。

    学生:把目标说成一种力量,难道它仅仅是一个比喻吗?当然,使用相同的词去描述具有不同特点的物体是很糟糕的。

    我们永远不应该使用“仅仅”来修饰比喻,这是因为“仅仅”是所有描述的共同特点。我们无法说明事情是什么,仅可以描述它像什么。也就是说用其他特点相似的物体描述,而后再来考虑这些差异,为其冠以相同或相似的名称,因此之前的词或短语将包括这些附加的意义,这也就是我们大多数词语都像一些“手提箱”式词语的原因。第9章中将讨论,词语的模糊语义是我们从祖先那里继承过来的最珍贵的财富。

    在本书中我们曾多次提到目标,但从未讨论过目标的运行方式。因此,下面我们将从讨论目标给我们的感觉转为讨论目标可能是什么。

    差分机

    亚里士多德:我们所得到的与期望得到的不一致时,差异就形成了,因为假如没能得到自己想要的东西,就像什么也没有得到一样。

    有时,人们表现得像是没有任何方向和目标,而有时又像是有目标。但什么是目标,我们又如何拥有目标呢?如果使用日常的词汇回答这些问题,像“目标就是人们想要实现的事”,你会发现自己陷入了一个循环,因为你需要知道什么是需要,之后你可能会尝试使用如“动机”“欲望”“目的”“希望”“渴望”和“恳求”等其他一些词来进行解释。

    一般来说,当你尝试使用其他一些心理学词汇来描述这类思维状态时,会陷入一个怪圈,因为这些词都不能描述潜在的机制。但是我们可以把陈述分为以下几个部分:

    当系统坚持尝试各种不同的技巧,直到当前状态改变为另一种状态时,系统看起来便拥有了目标。

    这就使我们走出了心理学领域,进而去问这样的问题:什么类型的机器能够完成这样的事情?以下是这种程序运行的方法之一:

    ● 目标:首先开始于对某个特定未来情况的描述,目标也可以识别不同情况之间的区别和差异,称之为“特定的其他情况”。

    ● 智能:此过程指一些能够缩小差异的方法。

    ● 坚持:如果在此过程中持续使用这种方法,在心理学领域,其目标意在把当前拥有的变成其中“想要”的。

    接下来的几章中会说明,物体的这3种属性能够解释我们口中“动机”和“目标”的作用,能够回答我们在第2章中提出的问题:

    ● 伴随目标的感觉是怎样的?

    ● 目标坚定或摇摆不定的原因是什么?

    ● 是什么使冲动“强大到不可抵抗”?

    ● 什么使得某些目标保持“活跃”?

    ● 什么决定了目标的持续时间?

    没有机器能够表现出目标、智能和坚持这些特性,直到1957年,艾伦·纽厄尔(Allen Newell)、克利福德·肖(Clifford Shaw)和赫伯特·西蒙(Herbert Simon)发明设计了“通用问题求解系统”(General Problem Solver,GPS)计算机程序,下面是对其工作过程的简单描述,我们称之为“差分机”(Difference-Engine,见图6-8) [57]

    空标题文档 - 图8

    图6-8 差分机的工作原理

    每进行一步,差分机就会对当前和未来情况的描述进行比较,列出两者之间的差异;之后它会关注最为显著的不同点,利用之前设计好的技巧来缩小这些差异。如果这个方法有效,程序会自动缩小到最为显著的区别。然而,一旦其中一个步骤使事情变得糟糕,系统会自动返回,尝试不同的方法。

    因此,正如我们在第2章中提到的,每个婴儿天生就有保持自己体温的系统,当身体过热时,孩子会出汗、喘息、伸展身体或血管扩张;然而,当孩子感到寒冷时,他则会蜷缩、颤抖消耗热量或提高新陈代谢速度(参见图2-2)。

    起初,我们意识不到这种过程,因为本能反应是在比较低层次的认知水平下进行的,例如,当你感到太过炎热时,身体会自动出汗。然而,当你意识到出汗时,汗水已经流很多了,你会想:“我必须找办法降低这种炎热。”你之前学习到的知识暗示你,还有其他的方法可以使用,如到一个有空调的地方去。如果感到太过寒冷,你可能会穿上外套、打开炉子或开始运动(运动能使你产生高达10倍之多的热量)。现在我们可以将“拥有目标”理解为差分机移除了这些差异。

    学生:为了拥有目标,人们需要呈现理想的状态吗?仅仅拥有理想的属性表就够了吗?

    这只是程度上的不同而已,因为每个人都不能完整地描述情况。我们可以只把“理想情况”描述成简单、大致的轮廓,像一个属性表,或只是一些简单的属性(比如会造成疼痛)。

    学生:但是,难道我们不该区分“拥有目标”和积极地“想要实现目标”吗?我认为你的差分机就是一个“欲望机”,目标本身是你所谓“目标”的一个组成部分:对一些未来情况的当前描述。

    这位学生的想法是正确的:在我们的日常生活中,“目标”一词有两种不同的意思。当人们改变事情的进程使其符合描述时,潜在目标就被激活;日常生活中使用的语言并没有有效区分我们所需要的差异,这也就是每个专业领域需要发展本行业的“专业术语”的原因。但是,我认为在不同的语境中描述“目标”没有任何问题。

    浪漫主义家:差分机的想法解释了“有目标”的意义,但它并没有解释成功的喜悦和没有实现预期愿望的沮丧。

    我同意,“目标”的单一含义并不能解释这些纷繁复杂的情感,因为“想要”是一个“手提箱”式词语,任何单一的想法都不能概括其全部。另外,人们做的很多事情根本没有目标,或者没有意识到目标的存在。然而,差分机对“目标”含义的涵盖要比我所见过的其他任何描述都广。

    学生:当差分机同时发现几个不同的差异时会发生什么?它是同时还是一个一个地处理这些差异?

    “通用问题求解系统”的发明者总结道,当检测到不同的差异时,机器会首先尝试移除最为显著的,因为最显著的差异在环境中会造成较大的变化(首先移除小差异会是一种浪费时间的行为)。为了做到这些,一般问题解决器必须对差异划分优先等级。

    学生:如果缩小这些差异导致其他差异更糟糕时该怎么办?如果卡罗尔把其中一块积木移动到阻碍其他积木搭成拱形门的地方该怎么办?

    当任何行动使最大的区别变得更大时,人们需要提前寻找其他方法,例如使用第5章中的方法。但如果没有制订计划的机制,差分机本身也无法通过短期的牺牲来实现更大的计划。

    显然,这种限制使纽厄尔和西蒙开始探究其他领域,比如纽厄尔在1972年的研究。我认为他们本该坚持在基本差分机模式的基础上增加更多的反思层级,因为人们认为系统陷入困境的原因是没有足够多的方法反思自己的行为表现,而这就是人们每次“停下来思考”时使用的方式。在一篇较少被引用的出色文章中,纽厄尔、肖和西蒙提出了一种与此前完全不同的建立差分机的方式,这种差分机能够进行反思,改善前一个差分机的行为。然而,并没有研究人员(包括他们自己)继续研究下去。

    如果就算使用了反思和计划,人们仍没能成功解决问题,该怎么办?这时人们可能会想,这个目标不值得为之付出努力,这种沮丧可以导致“自我意识”去思考哪种目标“真正”值得实现。如果过于频繁地陷入这种层次的思考,人们可能会问这样的问题:“我到底为什么会有目标”或“拥有目标到底有什么意义”。所谓的“存在主义者”根本无法对这样麻烦的问题给出使人信服的回答。

    但最明显的答案就是,我们根本没有什么个人选择:我们拥有目标是因为我们大脑发展的需要:没有目标的人灭亡了,是因为他们根本无法参与竞争。 [58]

    目标与子目标

    亚里士多德:此外,我们考虑的不是目的,而是实现目的的手段……我们首先确定一个目的,然后考虑用什么手段和方式来达到它。如果有几种方式,他们考虑的就是哪种方式最有可能实现目的……随后我们考虑怎样利用这一方式去达到目的,这一方式又可以通过哪种方式来获得,直到我们完成第一步(我们最后才会发现这点)。 [59]

    如何让子目标与目标互相联系?子目标又是如何产生的呢?第2章讨论了这一系列问题。然而,差分机本身就可以产生子目标,因为每次需要减少的差异都可被变为其目标的另一个子目标。例如,如果琼这时正在波士顿,但她明天想到纽约介绍计划案,那么她将不得不减少以下差异。

    ● 会议在300公里之外召开;

    ● 她的报告尚未完成;

    ● 她必须支付交通费用……

    虽然距离差异太大,不能步行去开会,但琼却可以开车或乘火车去,且她还知道乘坐飞机的一些“脚本”,如图6-9所示。

    空标题文档 - 图9

    图6-9 乘坐飞机的脚本

    然而,每一段这样的脚本都需要几个步骤。她可以骑自行车、乘出租车或公共汽车到达机场,但她决定自己开车前往,而开车去机场的目标本身所具有的脚本又包含图6-10中的子目标。

    空标题文档 - 图10

    图6-10 乘汽车脚本中的子目标

    琼想到,虽然从家乡到纽约的飞行时长不超过1小时,但乘坐飞机会把大量时间花在停车和进行各项检查上,而火车虽然需要4小时,但终点站离她的目的地较近,因此从终点站到目的地可以省下很多时间,这段时间可以被用到其他工作上。于是,她改变了主意,转而乘火车。

    同样,如果卡罗尔想要用积木搭建塔,她需要将建塔的工作分成几部分,然后利用图6-11中的步骤制订计划。

    空标题文档 - 图11

    图6-11 塔的搭建过程

    那么,每一个这样的子目标都可被分成几个更多的部分和过程。所以,当我们研发机器来做同样的工作时,其软件也需要几百个不同的部分,例如,“添加积木”就可被分成图6-12中子目标的分支网络。

    空标题文档 - 图12

    图6-12 添加积木的分支网络

    当然,每个子目标本身就相当复杂了。“选择积木”时必须避免那些已在支撑塔顶的;“看见”必须能够识别不同颜色、尺寸和灯光的积木,甚至能够识别被其他积木部分遮盖的;“抓住”必须让机器的手能够适应要移动的积木的尺寸和形状;“移动”必须指引其双手,避免碰到顶端的积木和孩子们的脸,以这种路径来操纵机械手臂。

    我们需要哪些子目标来完成工作,人们又是如何发现这些的呢?你可以采用反复试验的方法,或是通过大脑进行的模拟实验,或是通过回忆一些过去的经历来发现这些子目标,而所有这些方法中最有用的一个就是使用差分机,因为每一个差异都会成为新的子目标。

    总而言之,我的想法是,拥有被激活的目标,就相当于运行一个与差分机相类似的过程。我认为,人类的大脑中有许多类似的过程在不同的领域以不同的层级同时运行着,从每时每刻都在运行着的反应系统(就像那些维持我们体温的系统)到自我意识的层次,无所不包。在这种意识形态中,我们很少会思考自己想成为什么样的人。 [60]

    人们什么时候才会真正地使用我们一直讲的技能呢?这些技能如精心设计的计划,将工作划分为更小的部分。事实上,我们所做的大部分事情都可以采用更为简单的方式来完成,因为我们已经知道该做什么了:当你多次重复做某件事时(如在“练习”新技能时),它会逐渐转变为一个脚本或一连串动作,通常来说,这种转变并不需要较高层次思维活动的参与。

    弗兰克·赖特

    Frank Wright

    美国最伟大的建筑师之一

    专家是一位无须思考就知道结果的人。

    结果是,只有当我们面临新型问题时(或者说将其当作陌生问题),我们才需要搜索和规划的技能。但是,“练习”是如何提高技能,产生“专家级”表现的?一种旧时的理论认为,每次使用“大脑轨迹”都会加深一些记忆槽,这导致人们在未来会更容易遵循这些轨迹。而另一种现代版的理论则认为,大脑细胞之间的突触被更多地使用时,会具有更好的传导性,这种观点也具有一定的道理。

    但是,第8章将提出“练习”提升表现的一些更高级的方法,例如,一些过程可通过只包含通往成功步骤的简单脚本来代替穷举搜索。换言之,人们可学习通过特殊的路径来代替地图式的广泛搜索,而其他过程则可通过仅有的相关特征进行反映,使用反复尝试的方法来代替If的复杂规则。然而,这可能会构建新的批评家和内隐束缚,以此来防止各种常见的错误。

    无论如何,伴随着熟练程度的提高,人们会感觉自己达到了精通的水平,就好像理解了所有复杂的领域一样,把它作为一个简单的整体来思考,但这可能只是一种幻觉,只是暂时遗忘了自己学习技能时付出的努力,将其变为高效却未加思考的脚本而已,简言之,即通过毫无思考的反应机器代替“求解”过程。这种情况的发生,可能就是许多成功人士无法教会他人模仿自己的原因之一。

    差异的“幻想”世界

    培根(1620):有些人的大脑较强于和较适合于察见事物的相异之点,有些的大脑则较强于和较适于察见事物的相似之点。大凡沉稳的和锐利的大脑能够固定其思辨而贯注和紧盯在一些最精微的区别上面;而高昂的和散远的大脑则能见到最精纯的和最普通的相似之点,并把它们合拢在一起。但这两种大脑都容易因过度而发生错误:一则求异而急切误攫等差,一则求似而急切间徒捉空影。

    有人给你讲故事时,你会对故事中超乎想象的部分作出强烈的反应,而对单独的每句话却鲜有反应,这同样适用于我们对其他事物的看法。例如,如果你将手放入一碗冰水,就会感到强烈的寒意,但这种感觉很快便烟消云散了,就如同皮肤上稳定的压力骤减的感觉一般。新的气味、口味或连续声音的刺激也同样如此:起初,这种感觉似乎很强烈,但随后很快便会“消失”了。我们对这种感觉有各种不同的称谓,如顺应、适应、驯化、习惯或仅仅习惯于某些东西。

    学生:尽管如此,这却并不适用于视觉。只要我想看,我就可以(长时间地)看着任何物体,其图像并不会暗淡,实际上,我还能一直看到它更多的特征。生理学家:实际上,如果你目不转睛地看,图像很快就会暗淡。通常来说,明智的选择是不断地改变你的视网膜图像。 [61]

    因此,大部分的外部传感器(如视觉、味觉、听觉等)只会对相当快速的条件变化作出反应(然而,我们仍拥有不会衰弱的附加传感器,可对某些特别有害的条件作出持续的反应)。

    现在,我们将这种思想(即“主要对变化产生反应的系统”)应用到具有认知层次的塔式大脑上来,这将有助于我们解释某些现象。例如,坐火车旅行时,你会听到钢轨上的车轮声,但是,(如果这种声音很常见的话)很快你就不会再注意到这些声音了。此时,也许你的A脑仍在对声音作出本能反应,但B脑却已停止对声音作出反应了。对景色的视觉同样如此,当火车进入一片森林时,一开始,你会观察这些树木,但是不久后,你就会开始忽略它们。是什么导致这些含义消失了呢?

    重复语句的情形也同样如此。对于“兔子”一词,如果某人重复数百次,并在此期间把注意力集中在这个词的含义上,那么这个词的含义将很快消失或者被其他含义所取代。你听流行音乐时,同样的情况也会发生:起初,你会听到很多几乎完全相同的小节,但这段音乐的细节将很快将被忽略,你也不会再注意到它们了,但我们为何对这些重复不感到反感呢?

    这是因为我们倾向于在连续不断的较长时间内,根据情况变化来解释这样的“故事”。在大多数音乐中,这种结构是很明确的:一开始,我们将独立的音符集合成长度相同的“小节”,然后,将这些节拍集合成更大的节,直到整段音乐看上去具有故事般的结构。 [62]在视觉和语言中,我也会这样做,通过将更小的事件集合成多层次的大事件、插曲、片段、乐节和情节,通过最少的重复观察音乐结构中最清楚的形式(见图6-13)。

    空标题文档 - 图13

    图6-13 不同领域的相似层次

    ● “要素探测器”识别休止符、音符和各种其他语音,如和声、速度和音色等。

    ● “节拍器”将这些归为词块,在音乐上,作曲家通过等长度的小节来使这些音乐形式更易被人们接受,这也有助于我们感受连续的词块之间的区别。

    ● “乐句和主题探测器”之后代表的是更大的事件和关系如:“主题是先上扬而后下沉,最后以3个独立短音符结束。”

    ● “乐节构建器”将这些音乐形式归入更大规模的几部分中,如:“有3种类似的片段形成一个在音乐最高点上升的序列”。 [63]

    最后,“讲故事的人”在不同的领域内解释类似的作品,诸如描绘穿越空间和时间的旅行,或是个性之间的冲突。音乐的独特魅力在于它如何有效地描绘我们所谓的“抽象情感剧本”。它讲述的故事似乎都是关于我们毫无了解的内容的,但我们能够识别其个性特征,例如,这个曲调是温暖而富有爱意的,而那个是冰冷而麻木的。那么,我们就能对音乐产生共鸣,有“号在袭击着单簧管,而弦乐器正试图让它们冷静下来”这样的感觉,体会到诸如冲突、冒险、惊讶和沮丧的精神状态。

    现在,假设大脑中每个较高的层次主要对它下一层次的变化产生反应。如果这样,那么当信号在A脑层次上重复时,B脑便会对此默不做声。而且,如果信号进入B脑层次而形成一系列重复,使得B脑一直看到相同的图案,那么C脑将会视其为“常态”,因此对其以上的层次都会默不做声。更普遍的情况是,我们可以看到被发出的任何重复信号部分“麻痹”在它之上的下一个层次。所以,尽管双脚可以继续敲击出有节奏的节拍,但这些较小事件的大多数细节最终都将被忽视。

    我们的大脑为何会以这种方式运行呢?如果某些状况长期存在,且没有什么不利的事情发生,那么就不可能给你带来任何危险。因此,你就可能不会注意到它,也不会投入更多宝贵的资源来关注它。

    但是,这也会导致其他反应。一旦一个层次通过来自其下层的重复信号而免受控制,那么这个层次就会开始“向下发送信号”,指导那些较低层次检测其他不同类型的证据。例如,在坐火车时,一开始,也许你听到火车在轨道上发出的声音形成的模式为“咣铛咣铛咣铛咣铛”,即四拍子,随后这个声音便消失了。但后来,你可能会突然切换到“咣铛咣铛咣铛”的模式,即三拍子。是什么改变了你的印象呢?也许只是因为某些较高的层次转而形成了不同假设而已。

    同样,当重复信号麻痹大脑中的某些区域时,其释放的其他一些资源会以全新的、不同寻常的方式来思考,这可能是某些类型的冥想能够因祷文和咏唱而蓬勃发展的原因。这也会促进某些音乐变得流行:通过隔离听众的某些常识“输入”,重复信号就可以靠释放更高层次的系统来追求其自身的想法。那么,就像第5章所说的那样,可以通过释放某些“仿生刺激物”使较低层次的资源能够模拟虚构的幻想。

    为什么我们会喜欢某些音乐

    马修·麦考利

    Matthew McCauley

    音乐让我们经历短暂的情绪状态,通过使我们熟悉情绪状态的过渡,教会我们如何管理自己的情绪,从而在处理这些情绪时显得游刃有余。

    音乐(或艺术、修辞学)通过使你产生如从喜悦和快乐到悲伤和痛苦的强烈的情绪,将你的注意力从世俗事务上转移。音乐可以激发你的雄心壮志,激励你采取行动,也可以使你平静下来并放松身心,甚至可以将你带入一种恍惚状态。为此,这些信号必须抑制或增强各种情感资源集。但是,为何这种仿生刺激物对感觉和思维有如此重大的影响呢?

    众所周知,某些时间上的模式能够引发特定的思维状态。一个突然间的动作或一声撞击都会引起惊慌和恐惧,渐变的旋律或触碰则会引起欢乐和宁静感。 [64]其中一些反应是与生俱来的,例如,父母与婴幼儿之间建立关系。因为那时,任何一方对另一方的某些控制都超越了对方的感觉、思想和行为所能表达的内容。

    因此,随着我们长大成人,我们开始学习以同样的方式进行自我控制,可以通过音乐、歌曲来实现,也可以利用其他外在的事物来进行,如药品、娱乐或者环境的改变。同样,我们也会寻求“来自内心”的技术,以影响自己的思维状态,例如,通过“倾听”自己内心深处的音乐(人们抱怨某些曲调一直在脑中打转时,就可能会产生负面影响)。

    最终,对我们每个人来说,某些特定的景象和声音会具有更加明确的意义,就如同军号和战鼓具有描绘战争和枪炮的意义一般。然而,对于每一段音乐所表达的意义,我们通常持有不同的观点,尤其是在这些音乐片段让我们回忆起在某些以往的经历中的感受时。这使一些思想家认为音乐所抒发的是自身的感情,不过,这些感受中的大多数却并不直接。

    斯宾塞·布朗(G.Spencer Brown,1972):在音乐创作中,作曲家甚至没有试着去描述他们自己引起的情感集合,而是写下一系列指令。如果听众遵守这些指令,对后者而言,这些指令便可能会再现作曲家的原创经历。

    作曲家费利克斯·门德尔松(Felix Mendelssohn)说过:“乐曲传达出的意义是语言无法表达的。这不是因为音乐不够具体,而是因为它太过具体了。”或许门德尔松的脑海中也有类似的感受。然而,如前所述,某些思想家却不以为然。

    马赛尔·普鲁斯特(1927):读者所读的只是自己的内心世界。书籍仅为一类光学设备,作者提供这类光学设备,目的就是让读者发现自己,只有在书籍的帮助下,读者才能发现自己内心世界里的某些东西。

    上述所有意义似乎都提出了人们并不心甘情愿回答的问题,如:“为何这么多人非常喜欢音乐,并花费大量时间来聆听它呢?” [65]我们还可能会问:为何童谣和摇篮曲会出现在这么多社会和文化当中?在《音乐、思维及意义》(Music,Mind and Meaning)一书中,我对此问题提出了一些可能的解释:或许,我们把整齐的音符和曲调当成了简化的“虚拟”世界,以此用来对差分-检测器(Difference-Detectors)进行提炼。然后,我们能够使用这些检测器,将其他领域内更复杂的事浓缩成更为有序的故事类脚本。

    差分网络,让所作所为与所需所求达成和谐

    每当想完成某个目标时,你都会回忆一些有助实现某些行为或目标的相关知识,但当你的所作所为与自己的所需所求并不能精确匹配时又该怎么办?那时你会寻找某些虽形态各异,但也没有太大差异的替代物,例如,假设你想坐下来,就会去寻找椅子,但是眼下却没有椅子。然而,如果眼下有条长凳,那么你会认为这也是合适的。是什么让你将长凳而不是书籍或者灯具当作椅子的替代物呢?又是什么让我们选择注意到与椅子相关的物体的呢?电子工程和计算机科学专家帕特里克·温斯顿(Patrick Winston)认为,人们的这种行为是通过组织某些知识体,并建立我们所谓的“差分网络”(Difference-Networks)来实现的。例如各种家具之间的关系,如图6-14所示。

    空标题文档 - 图14

    图6-14 利用“差分网络”解析几种家具间的关系

    为使用这种结构,首先,我们必须拥有对其所表征对象的一些描述,因此,椅子的典型概念包含4条椅腿、水平椅座和垂直椅背。在此,椅腿必须在地板以上的合适的高度支撑椅座,而长凳除了更宽和无椅背之外,其余与椅子相似(见图6-15)。

    空标题文档 - 图15

    图6-15 利用“差分网络”解析椅子和长凳的区别

    如今,找到与你对椅子的描述相匹配的东西时,你脑中的家具网络会将长凳作为一个类似物,然后,你也可以以长凳太宽且没有椅背为由,选择接受或拒绝这个类似物。

    我们如何积累这些有用的差异链接(Difference-Links)集呢?其中一种方式应该是,每当我们发现A“几乎”伴随着实际运行的B“运行”时(即我们目前的目标),便用差异链接来表示两者之间的连接,即“除了差异D之外,A近似于B”。然后,这样的网络同样会收录我们需要用来将我们所有的变为我们所需要的知识的知识,并在现有的知识不能描述时提出可供选择的意见。因此,差分网络有助于我们获得相关的记忆。

    最传统的程序设计使用了多层次结构,如把椅子当作家具的一个实例,把桌子仅当作家具的另一个实例。这样的层次架构通常有助我们找到合适的类似物,但是却无法做到足够的区分,我怀疑,虽然这两种技术都得到了运用,但差分网络中的“横向”链接却比我们构建的类比更重要,虽然这些类比是我们思考事物最为有用的方式。

    在不确定性中,作出最优决策

    《一千零一夜》

    这条在底下流淌的河,一定会通过外面重见亮光的地方。于是我设想,如果我有一个木筏子,它也许会载着我,把我带到有人烟的地方。即使我被淹死,那也不过是换个死法而已;但如果事情正好相反,我平安地走出这个要命的地方,那就不仅逃脱了像我同伴那样死亡的厄运,而且还可能有机会再发一次财。 [66]

    当一个事物优于其他事物时,似乎很容易作出选择,但当发现事物之间难以比较时,你就不得不深思熟虑了。作出选择的方式之一就是幻想一下你对每种可能结果作出的反应;随后,以某种方式比较这些反应;再者,选择看起来似乎是最好的那个。

    亚里士多德

    《论灵魂》

    ( On the Soul)

    在动物中,敏感的想象随处可见,但有意识的想象却仅存在于能够计划的人们的心中:因为无论这样还是那样应该发生的想象,都已俨然成为一个正需要计划的任务。

    人们“计算”的一个方法是:为每一选择分别打分,然后选择分数最高的那个。

    大众:近来,我一直试着在乡村住宅和城里公寓之间作出选择。前者提供宽敞的房间并面向美丽的山景,而后者与我的工作地点不远,还有一位很友好的邻居,但每年成本开支却很高。但是,话说回来,人们如何预估或比较在很多方面不同的情况呢?

    如果每个人都能对拥有物的相对价值达成一致,那事情会变得很方便。然而,人人都有不同的目标集,并且通常情况下,这些目标是相互冲突的。你仍然可以尝试着想象,每一种这样的情况都是如何帮助或阻止你实现各种各样的目标的。

    大众:这可能会使问题变得更糟,因为以后你可能不得不判定与各种目标价值有关的情感。
    本杰明·富兰克林(1772):当困难出现时,它之所以被认为困难,主要是因为当我们把困难置于考虑之列时,所有赞成和反对的因素并不会同时了然于胸。但是,有时候一个因素呈现时,在其他时候,另一个因素也出现了,这时第一个因素就被忽略了。因此,出现了各种可选择的目标或占据上风的偏好,这种不确定性让我们变得十分迷惑。

    然而,富兰克林继续提出了取消这些判定的一个方式:

    对于该问题,我的解决之道是将一张纸划线并一分为二,一边写着“赞成”,一边写着“反对”,然后在相应位置根据赞成和反对的意图写下简短的提示,这些意图在不同时刻向我呈现出判定支持或反对的意见。因此,在我将所有这些提示归结在一起形成一个观点时,我会再努力评估它们各自的重要性。当一边各有一个元素相当时,就把这两个元素划掉;如果“赞成”的一个要素与“反对”的两个要素相当,就划掉3个;如果2个“反对”的要素与3个“赞成”的相当,就划掉5个,继续这样下去,直到最后两边平衡为止。
    如果在一到两天的更进一步的考虑过后,在“赞成”和“反对”的任何一边都不再出现新的意图,我就可以做决定了。虽然要素的重要性不能和代数数量的精确性等量齐观,但每一个要素都要单独比较权衡而定,当所有要素呈现在面前时,我想我能够很好地作出判断,而不至于仓促决定。事实上,我已从这种等价中发现了更多的优势,据此可称之为“德智代数法”(Moral and Prudential Algebra)。

    当然,如果运用以上选择过程得出的结论是这几个选项一样好,那么你就必须转而使用另一门技术。有时,你会若有所思地作出选择,但在其他时候,在思维的其他部分不知道该如何做决定的时候,你可能会说“我使用了自己的‘感觉’”或是“我使用了‘直觉’”,你也可能会宣称自己是“本能地”作出选择的。

    保罗·萨伽德(Paul Thagard,加拿大认知科学家、哲学家,2001):许多人更相信自己的感觉……你可能会对更有趣的主题有更强烈的积极性,而对与自己的事业更加息息相关的主题有着强烈的消极感,也可能正好与之相反。更可能的情况是,你对这两种选择都有积极的感觉,而这种积极的感觉与焦虑相伴,这种焦虑是由自己无法看到更明确可行的选择引起的。最后,直觉决策者会基于情绪反应告知自己的可行选项来作出选择。 [67]

    然而,使用“情绪”这个词却无助于我们观察发生的事,因为一种感觉是“积极的”还是“消极的”,仍取决于人们的精神活动如何处理富兰克林在信中所写的“所有赞同和反对的原因”。事实上,我们经常有这样的体验——我们在作出决策后不久会发现“感觉不对”,并回头重新思考。

    大众:即使在选项同等重要的情况下,我依然能作出选择,你的这种理论如何有针对性地解释人类的“自由选择”呢?

    当人们说“我用自己的自由意志做了决定”时,似乎的确如此。与其大致类似的说法是:“某些过程让我停止思考,并让我采取了在那时看起来似乎最好的选择。”换言之,“自由意志”并非我们用来做决定的过程,而是我们用来停止其他过程的过程!我们可能会从积极的方面来思考它,但是,也许它也是被用来压制“我们是被迫作出决定的”这种感觉的——不是来自外部压力,就是来自内部压力。“我的决定是自由的”这句话的意思其实是“我不想知道是什么导致我作出决定的”。 [68]

    相似推理

    林肯

    如果给我8个小时来砍倒一棵树的话,我将会花6个小时来磨斧头。

    解决问题的最佳方式是已经知道问题的其中一个解决方案,这就是常识的用处所在。但如果这个问题你从未见过,那该怎么办?当缺乏解决问题必备的知识时,你又如何继续工作下去呢?答案很明显:你就不得不进行猜测了。但是,怎么才能猜对?通常来说,我们所做的猜测如此顺理成章,我们几乎对猜测的过程毫无察觉,而且,如果某人询问我们是如何猜测的,我们往往会将其归功于直觉、洞察力、创造力或智能等神秘的特质。

    一般来说,每当有什么东西吸引自己的注意力时,不管是物体、想法还是问题,你可能都会这样问自己:这是什么东西?它为什么在这里?是否有什么警示作用?但是,通常情况下,我们并不会问这是什么,只会描述这像什么,然后再开始思考以下问题:

    ● 这类东西与什么相似?

    ● 我以前见过这些东西吗?

    ● 这些东西又让我们想起了什么?

    类比的想法之所以重要,是因为它有助于我们处理新情况。事实上,类比的想法几乎总是这样的,因为没有任何两种情况会是一样的,这就意味着我们总是在做类比。例如,如果你一直面临的问题提醒自己,这个问题在过去就应该得到解决,那么你可能会运用同样的知识来解决这个问题,其过程如下。

    我现在正设法解决的问题让我想起了过去解决过的类似问题,但是,
    过去解决问题的成功方法并不能解决我现在正面临的问题。然而,如果我能够描述出老问题和新问题之间的差别,这些差异便可能有助于改善旧方法,让其继续为我服务。

    我们将这个过程称为“相似推理”(reasoning by analogy),而且我认为,这是我们解决问题最有效的方式。通常来说,我们采用类比是因为旧方法很少奏效,而新情况永远都不会一样。因此,取而代之的方法是类比法。但是,为何类比法会如此有效呢?以下是我见过的对这一问题的所有解释中最好的方法。

    道格拉斯·勒奈(1997):类比法之所以会奏效,是因为世间存在常见的因果关系,而常见的原因导致了系统、现象或者其他任何事物之间时间的交叉重叠。作为人类,我们仅能观察到以上交叉重叠及在当今世界的这个层次上发生的事的一小部分……因此,每当我们在这个层次上发现交叉重叠部分时,值得我们注意的是,是否存在额外的交叉重叠属性,即使我们并不理解这些属性背后的原因或因果关系。

    因此,以下我们来检验这样一个例子。

    一个几何推理程序

    人人都听说过计算机运算速率和容量得到了极大提高,却鲜为人知的是,计算机在其基本性能上并没有太大的改变。计算机最初是被用来进行高级运算的,人们通常认为这是所有计算机一直具备的功能,这也是人们将其误称作“计算机”的原因。

    然而,不久以后,人们就开始编写程序来处理非数值型事物了,如语言表达、图形图像和各种形式的推理。同样,利用大范围不同的尝试而非跟随严格过程的方法,一些程序被设计为利用反复试验的方法进行搜索,而不是预编程步骤来解决一些问题。一些早期的非数值程序精通于解决某些难题和游戏,而另一些程序则能非常熟练地设计不同类型的设备和电路。 [69]

    然而,除了这些引人注目的性能之外,很明确的是,这些早期的“专家”问题解决程序中的每一个都只能在某些有限的领域内进行操作和使用。许多观察者认为,计算机应用领域的狭隘是出于其自身的限制。他们认为,计算机仅能解决“定义准确的问题”,而不能处理模糊不清的问题,或者说不能使用使人们拥有多种多样思维的那些类比。

    对物体之间进行类比是发现它们之间相似性的一种方法,但我们是何时又如何认为这两种东西是相似的呢?假设它们具有某些共性,但也具有某些差别,那么它们表面的相似程度将会取决于人们忽略了哪些差异。但是,人们当前的意图和目标却决定了每个差异的重要性,例如,某件物体的实际用途决定了人们对物体的形状、尺寸、重量或成本的关注度。因此,人们的当前目标必将决定其所使用的种类,但在差分机这种想法诞生之前,很少有人相信机器能够拥有目标和理想。

    大众:但如果你这种关于人们运用类比的方法来决定其思考过程的理论是正确的,那么机器能做到吗?人们总是说,机器只能做符合逻辑的事或解决被精确定义的问题,也就是说机器是不能处理模糊类比的。

    为反驳以上观点,托马斯·埃文斯(Thomas Evans,1963)曾经编写过这样的程序,它在许多人认为模糊、不确定的情况下运行得出奇的好。具体而言,该程序可以在广泛的“智能测试”下回答人们对于“几何推理”的所有问题。例如,有人展示图6-16中的图形,并让程序回答问题:“如果A对应B,那么C对应哪个?”多数年长者都会选择图3,这和埃文斯的程序选择的图一模一样,程序在这种测试中的得分和典型的16岁孩子的得分也基本一致。

    空标题文档 - 图16

    图6-16 几何推理问题举例

    当年,许多思想家都很难想象任何一台计算机都能够解决这类问题的那一天会到来,因为他们认为答案的选择必须来自某些“直观”感觉,而这种感觉是不能以逻辑规则的形式来表现的。然而,埃文斯却发现了一种方法,将这种感觉转化为一个不再神秘的问题。在此,我们就不详细描述其他程序了,我们将只展示程序如何运用与人们在这种情况下产生的行为相类似的方法解决问题。因为,如果问人们为何会选择图3,他们通常会给出以下答案:

    你可以通过下移图A中的大圆形来得到图B,同样道理,你也可以通过下移图C中的大三角形来得到图3。

    上述回答希望读者能够明白,这两句话都是在描述事物的共性,即使图3中并没有大圆形。然而,更善于表达的人也可能会这样说:

    你可以通过下移图A中最大的图形来得到图B,同样道理,你也可以通过下移图C中最大的图形来得到图3。

    现在这两句话就一样了,而且,这也表明在上述描述的基础上,人们可以使用3个步骤来实现这个描述。首先,为顶行的每一个图形虚构描述,例如可以这样描述:

    ● 图A展示了高大、高小和低小的3个物体;

    ● 图B展示了低大、高小和低小的3个物体;

    ● 图C展示了高大、高小和低小的3个物体。

    其次,为图A可能如何改变图B虚构一个解释,例如,可以简单解释为:将“高大”变为“低大”。

    最后,使用这个解释来改变图C的描述。其结果为:图C展示了低大、高小和低小的3个物体。

    比起其他答案,如果任何一种可行答案与关于图C改变方式的预测更为匹配的话,那么这个可行答案就是我们要选择的。事实上,只有图3与图C相匹配,这也同样是大多数人们的选择。(如果有两个或者更多图形与图C相匹配的话,那么埃文斯的程序就会利用相似图像的不同描述,对图形不断进行反复匹配。)这个程序对余下情况的匹配也像典型十几岁的孩子所选择的那样。

    当然,每当需要做决定时,与我们关系最紧密的差异将取决于自己的目标。如果卡罗尔只想搭建一个拱门,那么图6-17的中所有形式似乎并不太令人满意;但是,如果她打算在拱门上放更多物体,那么最右边的搭建方式将不太合适。

    空标题文档 - 图17

    图6-17 4种拱形门,哪种更好

    尽管在日常生活中,这些特别的“相似原理”问题并不普遍,但埃文斯的程序却展示了改变我们描述的价值所在,除非我们能够找到描述事物的不同方法,让它们看起来不再如此相似。而这种价值经常促使我们通过一种事物来理解关于其他事物的知识。而且,发现看待事物的新方式是我们最强大的常识性过程之一。

    乔治·波利亚(George Pólya,著名数学家、数学教育家,1954):我们可以学习使用基本的精神操作,如归纳、特化和类比法。不管是在初等数学、高等数学还是在任何学科上,如果没有这些运算,特别是类比法,那么这些学科都将毫无发展。

    注意,若要创造并使用类比,你必须同时致力于3种不同层次的描述:对原始对象的描述;对原始对象与类比对象关系的描述;对这些关系之间差异的描述。当然,正如第5章所示,所有这些描述并不太过具体(或者这些描述不能使用其他例子),而且所有这些描述也并不太过抽象(或者这些描述不能代表其相关的差异)。 [70]

    正面经验和负面经验的博弈

    拿破仑

    当你的敌人犯错误的时候,千万不要去打扰他。

    伊戈尔·斯特拉文斯基

    Igor Stravinsky

    作为一名作曲家,我穷尽一生,通过所犯的错误以及不断对未发生错误进行假想来学习,而不是炫耀灵感和知识。

    在第1章的开头部分我们就已指出,许多被我们看作“正面的”情感,部分是在删改了负面事物后产生的。因此,对于当前活跃的精神活动,某些特定的情况可能看似“令人愉快”,但是,对于当前被抑制的其他精神活动就不那么让人愉快了。

    例如,在抚养孩子的过程中,孩子的饮食、卫生、衣着、教育、居所以及对孩子的爱护都需要父母持续多年的辛劳付出。是什么样的诱因使得父母放弃如此多的目标,变得如此无私和以孩子为中心呢?当然,我们视母爱为正面的,但如果人们没有进化出一些方式来抑制如此多令人失望的方面,那么人们将不会有子孙后代。以下是我们隐瞒事情令人不快的方面的几个例子。

    幽默:尽管开玩笑是基于负面的事实,但幽默通常被视为正面的。就此意义而言,玩笑总是谈及人们不应该做的事情,因为这些事是被社会禁止的或是荒诞可笑的。
    果断:我们经常谈及“选择”,好像它是故意的行为似的。然而,事实上,此“行为”可能只不过是你在某一时刻停止比较替代品的某些过程罢了。而且在默认情况下,你只是采纳了选择列表中最顶端的一个选择。在此情况下,人们更可能会谈到使用了“自由意志”。但是,观察者也可能会仅仅将其视作一种接纳(甚至是一种吹嘘),这样一来,人们并不清楚精神活动将会产生什么样的结果。
    美:我们往往将美视为正面的。但是,当人们说某个东西很美,而且你问是什么让他们这么喜欢这个东西时,他们可能表现得像受到了攻击一样,仍然坚持说:“我就是喜欢它。”这或许表明,某些正在工作的过程正阻止其注意到这个东西的缺陷或瑕疵。
    快乐:当我们认为自己正在选择自己最喜欢的选项时,这样的选择实际上可能来自于一些压制其他竞争者的过程。每一个入迷者都会对其他事物无欲无求。如果果真如此,那么我们感觉越快乐,就会有越多影响其他精神活动的负面情感被隐藏!在这种情况下,“我正享受这种感觉”可能意味着“我想要保持目前的状态,因此,我将努力抑制所有可能改变它的情感”。

    有时,利用促使另一个过程与当前过程进行竞争的方法,我们同样可以使当前的过程变得无效,而不用直接抵制当前的过程。例如,第8章展示了人们如何通过幻想一个干扰状态来抵抗睡眠,人们也可以简单地重复仿生刺激物,直到这个过程不再有任何反应为止,就像狼来了的古老传说一样。

    教师:我曾学到,学习过程主要是通过运用快乐来“强化”导向成功的连接而运作的,而失败却威慑并阻止了我们成功。因此,教师应该多给学生奖励或鼓励,使(其教的)每节课都变得生动有趣。

    每种学习体验都应该是“正面的”,这一想法在很大程度上基于以鸽子和老鼠为主要研究对象的研究结果。后来,许多教育工作者将这种结果推广到人类学习中,并总结道:最好是用非常小的步骤来教授每一门学科,通常这种做法,学生更易获得成功。然而,为理解复杂的情况,人们同样需要学习事物是如何出错的,以此来避免最常见的错误。

    教师:当然,我们可以开发教学方法来教育人们如何采用愉快和积极的方法来避免错误。我们可以对那些通过复杂任务对错误进行检测和反应,对具有持续性和独创性的人们进行褒奖。智能本身不能被强化的根本原因是什么?

    在第9章中,我认为答案既是肯定的,又是否定的。因为所涉及的答案似乎就是一种悖论:完成一项艰巨的任务是“快乐的”,但是在此过程中也总是包含着间歇发作的严重痛苦和不适。因此,对于学生学习这些知识,我在第9章中认为,这些学生需要学习隐忍痛苦的方法,甚至喜欢这些发作的痛苦。同样,从另一方面说,只尝试奖励成功可能并非一个很好的策略,其中一些原因如下:

    强化可能导致死板:如果系统已在工作,额外的“强化”会导致某些内部连接比其所需更加强烈,那么这可能会使系统更难适应新的情况。
    强化可能带来不良副作用:如果某个资源运作良好,其他过程就会依赖它,那么对这个资源的任何改变都很可能会破坏其他过程的表现(因为计划之外的改变通常会使系统变得更糟)。
    派珀特定理(Papert’s Principle) [71]:在精神发展的过程中,某些最关键的步骤并非简单地建立在获取新技能的基础上,而是建立在发展更好、高层次的资源以帮助我们选择使用已存在的技能的基础上。

    当然,我并不是说正强化不好,而是说我们通常从失败中学到的东西比从成功中学到的要多,尤其在我们不仅要学习避免失败的方法,还要学习失败发生的方式和原因时。换言之,当人们是去调查而不仅是去庆祝时,所学到的知识会更多。

    持怀疑态度的老师可能想知道,本节所述的想法是否已被相关的动物试验证明,答案是否定的。因为我们讨论的大多数过程可能仅发生在反思的层次,而这个层次是其他动物不具备的。

    学生:我不明白为何学习过程包含了反思。为何我们不能从失败的次数中学习,或是直接通过打断我们使用的连接来学习。这样做的话,在我们犯了严重的错误之后,大脑往往就不会再犯此类错误了。

    去除连接的做法有时会很有效,但这也将我们暴露在不同的风险中:每当你对一个系统的连接作出改变,可能同样会对依附于这些连接的其他资源造成损害。如果你不明白系统是如何工作的,那么你可能会因为盲目地纠正明显的错误而将自己推进更糟糕的境地。

    程序员:每一次尝试改进程序都可能导致新的错误。新程序通常包含大部分以往的代码,其原因在于无人知道这些程序是如何运行的,这样,他们就会害怕改变以往的代码。因此,如果某个程序出错,需要你去修改,那么最好的方式是安装一个位于本地的小“补丁”,并希望程序的其余部分依然可以运行下去。

    一般来说,人们通常是采用一步步的试验来提高自己的技能的,但是最终,这些改变并不会再产生任何帮助,因为你已达到局部峰值,想更进一步提高技能可能需要承受某些不适和失望。以下是这种情况的一个简单例子。

    查尔斯在坦桑尼亚。虽然站在地平面以上,但他总想到达尽可能高的地方。因此,他所走的每一步都朝着最快上升(steepest ascent)的方向前进,最终,他可能到达一座小山峰,也许他会幸运地到达乞力马扎罗山的最高峰,但他的策略将永远不会到达珠穆朗玛峰的顶点,因为每一条这样的路线都包括某些向下的脚步。

    当然,在我们试图提高自己的思维能力时,这也同样适用。我们暂且通过作出许多愉快的小变化来使用“最快上升”的方法,但是随后,为获得更大的进步,我们至少要被迫忍受某些苦恼。因此,虽然快乐能帮助我们更轻松地学习,但当我们需要通过较大程度的思维方式改变来学习时,我们必须学会“享受”一些困难。据此,第9章将提出,太过愉快的教育方式可能会妨碍孩子们在学习时翻越脑海中的概念山脉。

    本章讨论了常识性知识的主体,即人类在文明世界中相处下去会涉及的许多问题,如我们所说的常识性问题,目标是什么以及它们是如何实现的,我们平常是如何通过类比来推理,以及我们如何猜测哪一项知识可能与决策方式相关联。关于如何避免犯错,我同样强调了“负面经验”扮演的角色。

    然而,仅知道这些是不够的,我们同样还必须应用这些知识。因此,接下来的一章将会讨论我们在许多常识性思考中用到的过程。