笛卡儿(1637):尽管机器在某些方面的能力和人类一样好,甚至更强,但是它们在其他方面的能力却落后于人类。从其落后的方面来看,我们发现,机器并不是以知识而只是以其部位的排列方式来完成任务的。

    人类习惯依靠机器来完成工作,这是因为机器变得日益强大和快速,但在第一台计算机出现之前,人们很难想象机器能同时完成多项工作,或许这就是笛卡儿进而推测计算机永远也不能像人类一样智能的原因。

    笛卡儿(1637):因为推理是普遍的工具,适用于每一个场合,所以机器的部件也需要具体的排列方式才能在每个特定的场合发挥作用。因而,想要使得单一机器像推理一样促使我们行动,机器必须拥有足够多的排列方式,才能应对生活中出现的各种各样的情况,而这几乎是不可能的。

    早期,人类和其他动物的能力之间似乎有着不可逾越的鸿沟,因此,在《人类的演化》一书中,达尔文观察到:“许多作者坚持认为,人类和其他低等动物之间不可逾越的差别是人类具有思维能力。”但达尔文也同时指出这种差别只在程度上略有不同。

    达尔文(1871):我认为,人类和其他高等动物,尤其是灵长类动物,都拥有相同的知觉、直觉和感觉,相似的激情、爱恋和情感,甚至更复杂的情感如嫉妒、怀疑、模仿、感恩和宽容……他们在以下方面的能力也极为一致:模仿、专注、沉思、选择、记忆、想象、综合想法和理性思考的能力,尽管只是程度不同罢了。

    达尔文后来观察到,“每个物种的个体智力都会从愚笨逐渐进化到优秀”,即使最高级的人类思维也本应从这个过程发展而来,因为在这一点上并没有任何难以逾越的障碍。

    达尔文(1871):这种进化至少是可能实现的,而不应该被否定,因为我们可以从孩子们身上看到这些能力的发展历程;与之相似,我们也可以发现从思维迟钝到思维巨人之间完美的渐变历程。

    然而,我们仍然想要细致地了解动物思维转换到人类思维过程中的先后顺序。事实上,仍然有人坚持认为这些变化太过复杂,不能被小而有用的变体所发现。但持有怀疑态度的人根本就不了解以下这个惊人却简单的事实:

    想极大地提高计算机的能力,只需几个简单而结构性的变化即可,直到1936年,当图灵发明了制造“通用”计算机的方法时,人们才发现这个事实。“通用”计算机,换句话说,就是一台能够独立完成其他所有计算机可能完成的工作的计算机。

    具体地说,图灵向我们展示了如何制造出可以描述其他机器行为的机器,之后机器会把描述当作指令,完成一些其他机器能够完成的任务。 [81]同样道理,我们也可以让这台机器记忆其他机器的指令,通过在指令之间来回转换,同一台机器会逐渐学会如何完成其他机器需要完成的任务。

    也就是说,图灵向我们展示了一台“通用机”如何使用多种不同的思维方式。如今,所有的现代计算机都在使用这个方法来存储对其他机器的描述(事实上,这也是所谓的“计算机程序”)。它正是能让我们使用同一台计算机来安排约会、编辑文本或向朋友们发送消息的原因。另外,一旦这些指令被存储在计算机内,我们便可以编写出让其他程序发生变化的程序,计算机从而可以使用这些程序来扩展自己的能力,这说明笛卡儿观察到的局限性并不是机器本身固有的,而是由人类制造或编程的落后方式所导致的。现代机器出现之前,以前的机器只能胜任一种任务,然而人类却不同,因为其一旦陷入困境,便会想出其他解决问题的方法。

    但许多思想家坚持认为,机器永远不能完成一些壮举,如建构理论和编写交响乐,他们也经常会把这样的壮举归功于费解的“才能”或“天赋”。但一旦我们认识到人类智能来源于多种思维方式这个事实,这些能力将不再如此神秘。实际上,本书的前几章已讨论了人类思维提供这些选择的方法:

    ● 第1章,我们天生便拥有各种各样的资源;

    ● 第2章,我们向印刻者和朋友们学习;

    ● 第3章,我们会摒弃不应该做的事情;

    ● 第4章,我们可以反思自己的想法;

    ● 第5章,我们可以预测行动的结果;

    ● 第6章,我们会使用大量的常识性知识;

    ● 第7章,我们可以在不同的思维方式中转换。

    然而,本章将讨论一些使人类思维变得如此多功能的其他特征:

    ● 我们可以通过多种视角来观察事物;

    ● 我们拥有快速进行视角转换的方法;

    ● 我们拥有高效学习的特殊方式;

    ● 我们拥有获得相关知识的有效方式;

    ● 我们可以不断扩大思维方式的范围;

    ● 我们拥有表征事物的多种方式;

    ● 我们拥有组织这些表征的有效方式。

    在本书伊始我们提到,要把自己想象成机器是非常困难的,因为我们过去了解的机器根本不能理解事物本身的意义。一些哲学家认为,这一定是因为机器只是物质,但意义却存在于物质领域之外的观念世界中。但第1章的结论表明,我们如此狭隘地规定这些意义,限制了机器的发展,以至于人类自身也无法表征意义的多样性:

    如果仅以一种方式去“理解”事物,你可能根本无法理解它,因为假如这种方式是错误的,你便陷入了理解的死胡同。但如果以几种方式表征事物,那么当其中一种方式出错时,你便可以转而使用其他方式,也可以在脑海中搜索不同的思维方式,直到找到一种可以解决问题的方式为止!

    为了了解这种多样性如何造就了人类思维多功能的现状,我们首先要讨论一下人们用来估测与事物之间距离的多种方法。

    预估距离

    亚历山大·波普

    《人论》

    人为什么没有显微镜般观察入微的眼睛?
    理由很简单:人不是苍蝇。
    光学到底有什么用?
    我可以观察螨虫,但却不能理解苍穹。

    口渴时,你会去找喝的;如果注意到附近有杯子,你会伸手去拿;但是如果杯子离自己距离较远,则需要你走过去拿。但你是如何知道自己会拿到什么东西的呢?天真的人会认为这根本没有任何难度,因为“当你看到一个物体时,你也就看到了物体的位置”。但琼在第4章中看到疾驰而来的汽车或在第6章中拿起书本时,是如何预估汽车或书本与她本人之间的距离的?

    在远古时代,人类需要猜测捕食者与他们自身之间的距离,如今,我们仅需要判断自己是否有足够的时间穿过街道,但尽管如此,这个简单的判断却决定了我们的生死。幸运的是,每个人都有很多种方式来预测自身与事物间的距离。

    例如,你知道杯子有人类的手掌般大小,因此,如果杯子占据的空间和伸开的手掌一样大,则你可以从任何位置拿到杯子。与之相似,你可以判断自己离某把椅子的距离,因为你已经知道了椅子的大小。

    然而,即使你不知道物体的大小,仍然可以预估自己与物体的距离。例如,如果假设两个物体大小相似,那么较小的物体看起来就离得更远一些。如果其中的一个物体是小模型或玩具,这个推论则可能是错误的;而且任何时候只要两个物体重叠,无论物体表面上看起来有多大,前面的一个物体必定离你较近(见图8-1)。

    空标题文档 - 图1

    图8-1 物体的前后关系

    你也可以从物体表面部分的亮暗程度以及其角度和所处场景,获得一些空间上的信息(见图8-2)。然而,这些线索有时也会起误导作用,图8-3中两个积木的图像是完全一样的,但其所在的场景暗示它们有不同的体积。

    空标题文档 - 图2

    图8-2 亮暗的区别

    空标题文档 - 图3

    图8-3 体积不同的积木

    假设两个物体在同一平面上,较高的那个物体离得较远(见图8-4),同样,细粒度纹理的物体看起来远一些,模糊的物体看起来也会远一些(见图8-5)。

    空标题文档 - 图4

    图8-4 同一平面上两个物体的对比

    空标题文档 - 图5

    图8-5 清晰与模糊的对比

    你也可以通过以下方式来判断物体的距离:物体离你双眼的方向的不同(见图8-6)或图像之间的细微差别(见图8-7)。

    空标题文档 - 图6

    图8-6 物体到人双眼的不同方向

    空标题文档 - 图7

    图8-7 图像间的细微差别

    另外,如果是移动中的物体,离你较近的那个物体看起来速度较快(见图8-8)。你也可以通过改变眼睛的焦点预测物体的范围(见图8-9)。

    空标题文档 - 图8

    图8-8 速度与距离

    空标题文档 - 图9

    图8-9 变焦

    最后,除了这些视觉感知的方法之外,在完全不借助视力的情况下,人们也可以判断物体的位置,这是因为你以前见过的物体,其位置仍然会存储在你的记忆当中!

    学生:对两三种方法就能解决的问题,我们为何还需要这么多不同的方法?

    每时每刻,我们都会评估不同物体的距离,我们很少从椅子上跌倒或撞上门窗,但是,每一种预估距离的方式也会有这样或那样的缺点。聚焦只对附近的物体起作用,还有很多人根本不具备聚焦的能力。肉眼观察也只对较远的物体起作用,但相当多的人却无法使用双眼来比较图像。平面不太平坦时,一些方法可能会出现错误,纹理和模糊度也经常不可用。知识也只适用于熟悉的物体,但物体的形状也千差万别,尽管如此,我们也很少会犯严重的错误,正因为我们拥有许许多多的技巧。

    然而,每一种方法都有利弊,那么我们如何知道哪种方式更可靠?以下的几节将主要讨论这一中心思想:人类如何在不同的思维方式之间迅速地来回转换。

    学生:为什么我们需要这种转换?为什么不能同时使用所有的方式?

    人们可以同时完成多件事,这个事实本身总会有很多局限性。你可以同时触摸、倾听和观察物体,因为在这些过程中你使用了大脑的不同部位。但我们很少有人能够用双手同时画出不同的物体,或许是因为这个过程中使用的资源只能一次完成一个任务。

    平行类比

    众所周知,知道实现同一目标的多种方法大有用处,但在不同方式之间的转换却降低了我们的速度,除非我们知道该如何加快转换过程。本节将讨论一些能够使我们的大脑立刻在不同选择之间进行转换的机制。

    例如,当你读到第6章中“查尔斯送书给琼”时,你会将“书”解读为不同意义上的书,例如,把书当成物质实体、人的所有物或知识的载体。但当你在这些范围内转换时,同样的句子将有三种不同的解释,如琼从空间位置转变成礼物的接受者,再度转换成阅读那本书的人。另外,你在这些意义之间转换得如此迅速,根本意识不到这种转换过程。 [82]

    在第6章中,我们使用术语“平行类比”描述机制,它把不同意义之间的相似特征与大型化结构的某些部件联系了起来(参见图6-4)。同样,你可以把汽车想象成交通工具、复杂的机械或宝贵的财产;可以把城市想象成人们的居住地、社会服务的网络或一个需要水、食物和能源的客体。第9章将提出,一旦想到自我,你会平行类比到精神层面上的自己。

    我认为我们在使用相同的技巧来理解视觉场景。例如,一旦走进房间,你会看到对面的墙壁,背对着房门的你此时也看不到房门(见图8-10)。

    空标题文档 - 图10

    图8-10 走进房间时的视觉场景

    现在,走向西面的墙壁(即你左面的墙壁),转过身来,面对着右面的墙壁,则你会面朝东(见图8-11)。

    空标题文档 - 图11

    图8-11 转身后的视觉场景

    现在的情况是,南墙进入视野,西墙将转到你身后。尽管西墙已经看不见了,但毫无疑问,你知道它仍然存在。你为什么不认为南墙刚刚出现,或西墙已经消失了?这必然是因为你认为自己一直以来就身处一个箱子一样的房间里,因此你知道的和预想中一样:房间的四面墙壁一直存在。

    想一想,你每移动一个地方,看到的每一个物体都在眼睛中的视网膜上投射了不同的形状,但这些物体却看起来并没有任何变化!例如,尽管北墙的视觉形状已经发生变化,但你仍然可以看出它是矩形的。是什么使得这些物体的意义保持不变? [83]同样,你现在看到的椅子也已经反转过来,但你通常根本不会注意到这些,这是因为你的大脑知道是你自己而不是椅子在移动。你也可以看到进来时的门,但你对这所有的一切都不会感到惊讶。

    你转过身来面对南墙时会怎样?北墙和椅子会消失,西墙将重新映入眼帘,人们能预想到这一切(见图8-12)。

    空标题文档 - 图12

    图8-12 再次转身后的视觉场景

    你常常作出这样的推测,也根本不知道大脑是如何处理不断变化的平面的,那么你如何得知哪些物体仍然存在?哪些物体不断改变着自身的形状?哪些物体在不断移动着?你又如何知道自己仍然身处在相同的房间里?

    学生:或许这些问题根本就不会产生,因为我们经常看到这些物体。如果它们突然改变,我们也会察觉。

    事实上,我们的眼睛总是在飞速地移动,因此,我们的视觉并不是连续的。 [84]这些证据似乎表明,甚至在走进房间之前,不知何故,你已经知道自己可能看到很多物体。

    明斯基(1986):秘诀就是视觉和记忆的相互交织。当与你新交的朋友面对面交流时,你似乎能立刻认出他来,但这并不是由于你所看到的东西,而是由于你的视觉“提醒”你,你才想起的。一旦看到朋友出现,心中的很多假设便被唤醒,人们基本上都是这样的。与此同时,某些表面特征会让你想起之前见过的某个人。下意识中,你会发现这个陌生人和他们很像,不仅仅是外表相像,内在的一些特征也像。这些表面的相似性特征影响了我们的推测,从而影响了我们的判断和决定,这也是任何程度的自制力都不能改变的事实。

    如果人们在每次移动后都需要重新认识看见的物体,那么会发生什么?你将需要重新评估每个物体,并寻找新的证据来证明。如果这样,你的视力将会变得非常弱,几乎和盲人一样,但显而易见的是,事实并非如此。

    明斯基(1974):进入一个房间时,我们似乎能立刻观察到房间内所有的场景,但实际上,观察、理解所有的细节以及确认它们是否符合我们的期望和期待需要花很长时间。我们的第一印象往往需要被重新修正,而问题是,这些视觉线索如何快速地形成一致的观点?又如何解释令人目眩的视觉速度?

    答案是,我们不需要不断“看见”所有事物,因为我们在大脑中建构了视觉的虚拟世界。来听一听我最喜欢的神经学家的观点。

    威廉·卡尔文(1966):你通常观察到的看似稳定的场景实际上是你所建构的一个精神模型。眼睛事实上在快速地四处浏览,在视网膜上产生一个像新手拍摄的视频一样的抖动的图像,许多你认为自己看到了的东西其实只是记忆的填充而已。

    我们可以非常顺利地构建这些思维模型,因此没有必要知道大脑是如何构建以及使用这些思维模型的。然而,我们需要一个理论来解释为何在我们的身体移动的同时,周围的物体仍保持不动。你第一次看到那间房间里的三面墙壁时,可能会产生类似图8-13中所示的这个网状结构来呈现它们。

    空标题文档 - 图13

    图8-13 网状结构

    然而这种呈现是不完全的,因为即使在走进房间之前,你仍然期待房间有四面墙壁,而且已经知道如何呈现箱子式四面墙壁的房间了。因此,你“默认”房间的棱角、角落、天花板和地板都是一个较大的、非移动架构的一部分,且这些部分并不取决于当前的视觉角度。换句话说,我们感知到的“现实”建立在思维模型的基础之上,这些模型通常不会改变自己的形状或消失,尽管它们的表面在不断变化。我们主要对自己所期待的物体作出反应,也倾向于呈现看到的物体,尽管这些物体在我们移动的时候并没有发生任何变化(见图8-14)。 [85]

    空标题文档 - 图14

    图8-14 不同视角观察到的场景

    如果你使用之前提到的大型化框架,则可以一边漫步一边记下对稳定框架中物体部位的描述。例如,如果你记得椅子靠近北墙,且门是南墙的一部分,那么这些物体将有一个固定的“精神位置”,与你所在的地点和观察的时间无关;甚至在你看不到这些物体时,它们的位置也是固定的(而如果一些物体被移动过而你又不知道,则可能会造成意外)。

    因为视力会把不同领域内的特征与大型化框架中相似的角色联系起来,所以从不同角度观察时,我们周围的地点看似仍然保持不变。

    我们很少会有新的想法,却通常会在已有的想法上修修补补,或把新想法和原有想法的一部分结合起来。这是因为你还没有获得任何新想法之前,很可能就已经回想起了相似的物体或事件,因此,你就可以复制或更改你已经拥有的结构,这尤为重要,因为如果你想要构建一个全新的精神结构,同样也需要构建新的方法,好重新获得这个结构,或构建使用这个结构所需的技能。然而,如果这个旧有物体或事件属于平行类比,那么你需要重新添加新的概念,它才能继承所有获得或应用旧有想法的技巧。

    例如,你可以把椅子想象成物理实体,它包括椅背、椅座和椅腿。在这个物理实体中,椅腿支撑椅座,椅腿和椅座共同支撑椅背。你也可以把椅子想象成使人们舒服的工具。因此,椅座的设计是为了支撑人的重量,椅背是用来支撑人的背部,而椅腿则是为了把人固定在既定的高度,从而达到放松的效果(见图8-15)。

    空标题文档 - 图15

    图8-15 从不同角度看椅子

    你同样可以把椅子看成个人财产、一件艺术品或木工活,每个不同的环境都会使你以不同的方式来描述椅子。当你对椅子的描述没有任何意义时,批评家可以告诉你转换到一个不同的精神领域去;如果你已经把相似的特征和平行类比联系起来,那么这个转换则会快速地进行。

    学生:我们如何作出这样的平行类比?建构和保持这些平行类比的难度如何?作出平行类比的才能是与生俱来的还是后天习得的?我们如何学习利用它们?我们应该把它们放在大脑中的什么位置?

    我认为我们不需要“学习”这些技能,因为大脑的构造已经演化出了这样的结构,它能够很容易地让我们把学习过的知识碎片和已掌握的知识联系起来,从而也能够从其他视角看到此领域或相同事物中相似的结构。我们可以如此自如地作出这样一系列的动作,看起来根本不需要任何推理;然而本章后文将提出,智能学习需要的机制要比想象中多得多,而且这些机制大多与心理学的旧有理论有关。

    学生:难道这些联系不会使你把看到的误解为自己想到的其他事吗?如果这样,你总会搞不清什么是什么。

    是的,我们不断犯这类“错误”,但矛盾的是,这样的“错误”却会使我们不致混淆,因为你把椅子当成全新的物体,椅子就不会对你有任何的意义。然而,如果每一把新椅子都会使你想起相似的物体,那么你就能看出椅子的许多用处。

    通过使用平行类比的方法来表征知识的做法有很多优点。平行类比是一种有效方式,通过不断改变知识的环境或领域而进入类比的“槽”,最终使用相同的结构完成几个不同的目的。我们已经知道平行类比可以如何使我们快速地在相同物体的不同意义之间转换,以及每个这样的想法是如何帮助我们克服其他想法中的缺陷的。一般说来,这是表征许多种不同隐喻和类比的直接方法。总结了这些后,我认为我们的大脑是以平行类比的方式来表征常识性知识的。[8]

    如果我们的记忆大部分由平行类比组成,则我们的大多数想法将变得模棱两可。但这是个优点而非缺点,因为人类大部分智能都来源于对产生这种现象的类比的使用。

    高效率学习的奥秘

    很久以前,哲学家大卫·休谟就提出了一个问题:我们为什么能学习?

    大卫·休谟(1748):所有基于经验的推理,正如推理的原理,认为未来会和过去相似,同样的力量会和可感知的品质联合。如果对自然进程有任何的怀疑,过去或许就不会统治未来,所有经验将毫无用处,无法提供任何的参照或总结。

    换句话说,学习本身只发生在适当统一的环境中。然而,我们仍然需要了解学习机制如何运行,尤其需要了解人类的学习机制,因为任何其他生物都不会和人类一样拥有相似的学习能力。另外与其他动物相比,人类可以以惊人的速度学习,因此我们主要关注这一问题:人类如何通过观察简单的例子实现高效率的学习。 [86]

    杰克看见一条狗在玩游戏,因此他想教自己的宠物来玩这个游戏,但杰克的狗需要学成百上千次才能学会,而杰克只看一次就会了。为什么杰克能够如此快速地学会这个游戏,尽管他只看到一次?

    人们有时也需要长时间地练习,但我们需要解释人们能从单个经验中高效学习的现象。一个理论认为,杰克其实也经历了很多次重复,但他却通过使用头脑中“动物训练师”的方式完成了学习过程,也使用“动物训练师”来训练大脑中其他资源,正如他亲自训练宠物时那样。

    为了完成这次学习,杰克使用了类似于差分机的程序,首先,他开始描述自己短时记忆中的游戏;其次,杰克的“精神动物训练师”会在其他地点更永久地存储这种描述,通过重复改变新的复制方法,直到训练师分辨不出短时记忆和长时记忆之间的区别时为止。我们可以改变图6-8描述的过程,要把这些转变为复制机,我们仅需要改变其第2个描述,直到长时记忆中出现的结构和短时记忆中的结构一样(见图8-16)。 [87]

    空标题文档 - 图16

    图8-16 “精神动物训练师”

    如果杰克对游戏的描述很具体,那么这个改变复制的循环将需要更多重复。 [88]因此,关于如何制造新的长期记忆,“动物训练师”理论表明,人类在这方面的确和其他动物很像,也需要加倍重复。然而,我们很少意识到这些,大概是因为大脑运行的过程,以及反思性思维根本就“看”不到。

    学生:也可以在存储短期记忆的位置将其变为更加持久的记忆,从而记住事物。为什么我们不使用这种方法?为什么我们需要把它们复制到大脑中的其他位置上?

    这是经济学上的问题:短时记忆是有限的,因为它们占用了昂贵的资源。例如,大多数人可以记忆5~6种物品,但当有多于10种物品时,我们就需要将其写下来。或许这种能力上的限制是因为我们每个快速获取的“记忆盒”都包含很多专业化的机制,而大脑只包含其中的几个。因此,每次我们使短期记忆的联系更为长久时,就将失去一个珍贵的短时记忆盒!

    巧合的是,现代计算机也以同样的方式发展:在发展的每一阶段,高速运转的记忆单位都要比缓慢的方式付出更大代价。因此,计算机设计者们发明了“高速缓存器”,即使用昂贵的、高速运转的设备存储重复使用的信息。每个现代化的计算机都有几个这样的高速缓存器,并且每个这样的高速缓存器的工作速度各不相同,速度越快,体积越小。或许这种设备也存在于我们人类的大脑中。

    这就解释了众所周知的事实:我们所学习的任何事情都首先被暂时存储起来,之后需要一个小时左右的时间把其转化为长期记忆。 [89]所以,头上的重击会导致人们丧失记忆能力,记不住之前发生的事情以及事件本身。这种“转变到长期记忆”的过程有时需要一整天或更长的时间,并且需要充足的睡眠来保证。

    长期记忆的形成需要如此多的时间和过程,有以下几个方面的原因。

    检索:人们制造一段记忆记录后,如果没有提供任何重新获得记忆的方法,那么存储记忆的行为是没有任何意义的。这意味着每一条记录都必须和一些链接相接,才能在相关的时候激活记忆记录。(例如,把每一条新记忆和旧有的其他记忆平行类比联系起来。)
    信用赋能:如果记忆的记录只能运用到一种情况上,那么这条记忆在未来将不会有太大作用。下文将主要讨论一些我们扩展记忆记录相关的技巧。长期记忆的“不动产”问题:“动物训练师”如何在大脑中为将要进行的复制寻找空间?它又是如何在寻找适当的大脑细胞组织的同时不扰乱希望留存的联系和记录的?为新的记忆寻找地点必须涉及复杂的局限和要求,这也就是为什么制造记忆记录需要花如此多的时间。
    复制复杂描述:想出记录简单标志或实物的方法比较简单,但我还未见到过任何使人信服的方案,能够让大脑快速地复制有着复杂联系的结构。因此,本节提出了一系列差分机似的方案。(我曾在1986年提出,相似的方案必须用在口头交流中。)

    人类学习的知识如何发挥作用

    日常生活中,“学习”一词非常有用,但仔细观察时,你会发现学习包含大脑改变自身的很多种方式。为了了解思维是如何发展的,我们需要知道人们如何学习使用不同的技能,如建楼塔、系鞋带,如何理解新词语的意思和如何猜测朋友们的想法。如果我们试图描述学习的所有方法,那么会发现自己需要学习很多技巧,其中包括:

    ● 添加If→Do Then规则;

    ● 改变低层次联系;

    ● 形成新的子目标或目标;

    ● 选择更好的搜索技巧;

    ● 改变高水平的描述;

    ● 形成新的外显抑制和内隐束缚;

    ● 生成新的选择器和批评家;

    ● 联系原有的知识碎片;

    ● 形成新的平行类比的种类;

    ● 形成新的模型或虚拟世界。

    在孩童时代,我们不仅学习具体的事物,也获得了新的思维方式,但婴儿无法自己独立、全面地发展并拥有成人的智能。因此,我们最为重要的技能是如何学习,不仅通过自我的经验学习,也通过别人的教导学习。

    信用赋能

    对于乐观者,杯里还有半杯水。
    对于悲观者,杯里只剩下半杯水。
    对于工程师,杯子比所需要的大了一倍。

    本书第2章,我们首先看到卡罗尔学习使用勺子转移液体,但随后,我们知道了她在多次实验中获得成功的那次尝试:

    她的学习应该包括那天穿的鞋子、天气(多云还是晴天)或事件发生的地点吗?她的哪一部分思想应该被记录在记忆中?如果在使用叉子时笑容满面,而使用勺子时却眉头紧锁又会如何?是什么让她不去学习不相关的规则,如“皱眉会让你在向杯中倒满液体时更轻松”? [90]

    早期关于动物学习的观点都是基于这样一种方案建立的:每一次的成功都会换来小小的奖励,从而使得动物的大脑中这种奖励和“正强化学习”相联系,而每一次失望都会造成相应的弱化学习行为。在简单的案例中,这种方案能让大脑识别出正确的特征;然而,在更复杂的情况中,这种方法就不太适合寻找相关特征了,那么我们就需要进行更深入的思考。

    其他有关学习运作机制的理论认为,这种行为包含对If→Do规则的制造和存储。这就是杰克的狗需要进行如此多次重复的原因之一:或许,每次狗试图玩那个游戏时,一些If会为一些Do作出一些改变,但它却记录了仅获得报偿的改变和变化。

    简单地添加全新的If→Do规则就能让人进行简单的学习,但这可能也需要你作出一些关键决定。如果If规则太过宽泛,那么任何的If→Do规则都可能无法发挥任何作用(因为规则的应用太过随意);如果If规定太多的细节,之后它可能就永不适用,因为任何两种情况都不会完全一样。这种情况同样适用于规则的Do。因此,每一个If和Do都必须足够抽象,从而能够适用于“相似”的情况,且无法适用于不甚相同的情况,否则,杰克的狗对其每一个姿势或所处的地点都可能需要一个完全不同的规则。所有这些都意味着,原有的“正强化”方案可能用来解释某些动物的学习方式,但却不能帮助解释动物是如何学习更为复杂的事物。

    这就使我们回到了最初的问题上:人们如何在进行快速学习的同时不需要太多重复?之前,我们知道自己实际上可以进行多次重复,但这却是后来在大脑中进行的,但现在,我们从另一种视角讨论如何使用高层次的过程来决定从事件中学习的内容。当我们想要了解成功的因素并反思近来的想法时,以下是“信用赋能”所可能涉及的一些过程: [91]

    ● 对情景的描述方法将影响未来的相似情况;

    ● 学习有助于思考的部分,忘记不相关的部分;

    ● 把知识碎片联系起来,因此可以在需要的时候获得这些知识。

    越是作出有利的决定,就越可能从经验中获利。信用赋能的质量是被人们称作“智能”的众多特征中的一个方面。只记录解决问题的方法仅仅有助于我们解决相似的问题,而如果我们可以记录自己是如何发现这些解决方法的,就有助于处理更为广泛的情况。

    例如,像玩西洋棋或围棋一样,如果你碰巧赢了一局,只记录自己走过的棋谱,是学不到任何有用信息的,这是因为你很难遇到相似的情况。然而,如果你知道哪些高层次决定有助于自己获得成功,你会做得更好,正如艾伦·纽厄尔50多年前观察到的那样。

    艾伦·纽厄尔(1955):整个游戏的“胜利、失败和平局”是否能够给予我们很多启示,这是值得怀疑的,(因此,为了更有效率)游戏的每一局都必须给予我们更多的信息……如果实现了一个目标,而且子目标没有被禁止的话,它必定会得到强化……创造的每个方法都能提供一些消息,从而暗示方法规则的成功或失败;每个对手的行动都会暗示我们成功或失败的可能。

    因此,当你最终实现目标时,应该为高层次方法进行信用赋能,你可以使用这些高层次方法把目标划分为子目标,而不仅仅是存储解决问题的答案,要用这些经验来改善自己的策略。

    学生:但随后,可能你也想记住产生这些策略的方法,因此你就开始了一个永无止境的过程。

    人们到底需要花多长时间思考取得成功的经验,至今仍因人而异。有时,成功的实现需要被推迟几分钟、几个小时甚至几天(正如第7章中讲到的那样)。这表明我们的一些信用赋能涉及遍布其他大脑部位的广泛区域。

    例如,我们有时拥有这样的“启示”,如“我知道这个问题的解决方法”或“我突然知道为什么那样可以了”。但是,正如我们在第7章中提到的那样,有些问题正是在一些特殊的时刻解决的,因为我们根本意识不到问题解决之前进行了哪些无意识工作。如果这样,这可能就像批评家们说的,“这已经花了太多时间,是时候停下来了,采用之前想到的方法策略,效果可能会更好”。 [92]

    我们常常不假思索地进行信用赋能,但有时,一个人在完成比较困难的工作之后经常会这样对自己说:“我真傻,浪费了好多时间,其实我一直知道该怎么做这件事。”为了弥补这一缺陷,他们可能会重新建构一个新的批评家,或改变已有的批评家,因为后者无法提醒他们获得特定的知识碎片。

    然而,这样的自我反思经常不能发挥作用,因为人们会发现,寻找解决方法要比解决问题本身更困难;尤其是在我们不清楚思维的运行方式时。换句话说,我们比较欠缺“内省”能力,如果不是这样,我们也根本不需要任何心理学家了。所以,若想了解人们如何学习,我们需要对以下问题进行更多的探究:婴儿能够进行怎样的信用赋能?儿童如何发展更精湛的技巧,这种过程持续多长时间?我们可以在何种程度上学习控制它们?第9章也会讨论快乐的情感与如何制造出信用赋能的相关性。

    学习迁移到其他领域。每个老师都知道,当孩子为了通过考试而学习,却从不使用学习方法解决其他问题时,挫折感便产生了。是什么使某些学生擅长把知识灵活运用到其他不同领域,而其他学生似乎在每一领域都需要重新学习相同的知识?

    我们可能会轻易地说一些孩子更“聪明”,但这却不能解释他们是如何利用自己的经历作出更有意义的归纳的。部分原因是:一些孩子擅长创造和使用平行类比,但也可能因为这些较为“聪明”的孩子能更有效率地学习,因为他们学会了(可能是无意识地)反思自己学习过程的能力,因此能够找到方法改善自己的学习过程,例如,这种反思有利于发现他们应该学习哪种类型的知识。

    显而易见,学习方法的好坏很大程度上取决于如何进行更好的信用赋能。这意味着做不到这一点的人很可能有一些缺陷,从而不能很好地把所学知识运用到新的情况中,这也就是心理学家所说的“学习迁移”(Transfer of Learning)。 [93]

    另外,如果我们把成功归因于以下几点:导致成功或失败的最后行为甚至是最后行动的策略,或之前所做的选择,对我们对成功策略的选择的影响或许我们学习的知识会更加深刻。人类进行信用赋能的能力是我们超越动物的最重要的方面。

    创造力和天才

    莱纳斯·鲍林

    Linus Pauling

    量子化学和结构生物学的先驱之一

    获得好想法的最好方式就是想出很多想法。

    我们钦佩爱因斯坦、莎士比亚和贝多芬这些天才,而且很多人坚持认为,他们的成功是无法解释的“天赋”使然。如果这样,机器将永远无法完成这些事情,因为(至少当前比较流行的观点认为)没有任何一台机器能够如此神秘。

    然而,当人们有幸亲眼看到那些堪称“伟大”的人物时,却并没有发现使其成就卓越、非同寻常的特质。与此相反,(至少在我看来)我们发现的任何的不平凡都是由其他平凡的特质组成的:

    ● 他们精通自己的领域。(但就其本身而言,我们称之为专长)

    ● 他们非常自信。(因此,能够更好地承受同行的讥讽)

    ● 其他人放弃时,他们能够坚持。(但是,其他人可能称之为固执)

    ● 他们拥有更多思维方式。(因此需要更好的转换方式)

    ● 他们习惯以新奇的思维来思考事物。(其他人也这样做,只是不那么频繁而已)

    ● 他们能够更好地进行自我控制。(因此,不会将时间浪费在不相关的事情上)

    ● 他们排斥流行的神话和信仰。(尤其是关于无法成功的想法)

    ● 他们往往勤于思考。(不会在徒然的想法上浪费精力)

    ● 他们擅长解释自己所做的事。(因此,他们完成的工作极少被人忽视)

    ● 他们往往能够进行更好的信用赋能。(因此可以以较少的经历获得较多的学习成果)

    每个人或多或少都有这样的天分,但很少有人能把这些天分发挥到极致。

    大众:这些特征有助于解释普通人如何解决日常的困难,但费曼、弗洛伊德和阿西莫夫等伟大的思想家也的确拥有非同寻常之处。

    天才来自独有的天赋或特质,统计数据的结论却与之相悖:

    假设有20种使人超乎常人的特质,且每一个人都有平等的机会获得其中的一个,我们中却只有一人能够在百万人之中脱颖而出。

    然而,即使以上论证是正确的,也不能解释某些人能够同时拥有这些特质的原因。例如,或许为了获得这些品质,人们应该首先掌握一些好的学习方法。无论如何,大量的证据表明,我们的内在特质在很大程度上是靠基因遗传的,但我却认为,偶然的精神层面的赞美机遇的影响更加重要。例如,大多数儿童都有很多方法把自己的玩具积木堆成柱子或排;并且如果得到旁观者的赞扬,孩子们会继续改善自己的技能,其中的一些孩子会继续寻找全新的思维方式。然而,当没有旁观者能察觉到这些精神活动时,某些孩子可能会学会自我赞扬的方法。这表明,当孩子完成了不起的事情时,外人根本看不到其成功的原因,因而倾向于把孩子们这种全新的能力用一些毫无用处的术语来描述,如天资、天赋、天分和天赐。

    心理学家哈罗德·麦科迪(Harold McCurdy)表示,特定的“幸运的意外”可以让孩子显露出独特的天分,也就是说有比普通人更优秀的双亲。

    哈罗德·麦科迪(1960):我们调查了20位天才的自传资料后发现,典型的发展模式包括以下几个重要的方面:第一,父母亲和其他成人对孩子的高度关注,表现在加强其接受的教育以及对其充分爱护;第二,与其他孩子隔绝,尤其是家族以外的;第三,丰富的幻想能力(比如创造力),能够对之前条件作出反应……而公立学校的大众化教育把以上3点因素的价值影响降到了最低。

    据说,出色的思想家一定拥有高效的方式,能够帮助他们组织和应用自己学习的知识。如果这样,天才的发展应部分归功于“思维管理”的技能。或许,一旦理解了这些,我们将更多地教授儿童发展更强大的精神层面的技巧,而不是教给他们各种具体技能。

    大众:我们真的希望自己理解这些事情吗?在我看来,人们想象和创造的方式具有某种程度的魔力。

    许多现象在我们找到其最终根源之前都具有某种魔力。在这种情况下,我们仍然对常识性思考的运行方式知之甚少,因此认为“常规的”和“有具体创造力的”想法之间具有本质上的不同仍为时过早。那么我们为什么会坚持相信英雄们总具有神秘天赋这种神话?或许我们对这种想法感兴趣的原因在于,如果这些成功人士完美的技能与生俱来,我们就不会对自己的缺陷和不完美感到羞愧,也不会赞扬这些艺术家和思想家所取得的伟大成就。

    本节主要解释为什么一些人拥有更好的想法,但是,如果我们对问题稍作改变,问“是什么使一个人比另一个智能?”以下这个过程可能会限制人们的多向发展:

    投资原则:如果你知道解决同一种问题的两种方法,通常会使用自己最熟悉的那种。随着时间的流逝,这个方法会变得格外有影响力,因此人们会专门使用这种方法,即使有人告诉你另一种方法更好。

    因此,有时学习新思维方式的主要障碍在于,人们需要忍受不熟练或表现不好所带来的不适。所以,“创造力的秘诀”之一就是养成一种能够享受这种不适的习惯。我们在第9章讨论“冒险”话题时会详细讨论这个问题。

    说到“创造力”,为计算机设计程序,使其产生前所未有的、不计其数的物体是一件轻而易举的事。但使所谓“有创造力”的思想家脱颖而出的不是其想出了多少种想法,也不是这些概念有多新颖,而是他们如何选择新的想法,从而继续思考和发展。这表明,这些艺术家有方法来压制(或根本就避免产生)太过新颖的想法。

    亚伦·斯洛曼(1992):科学世界中最重要的发现不是新规律或新理论,而是可能性,正是在这种可能性里形成了新规律和新理论,从而加深了我们对世界“形式”的认识,而与世界“内容”或“局限”相悖的规律。

    记忆与表征结构

    威廉·詹姆斯(1890):没有任何性能是只属于某一物体的。同样的性能可能在某一场合被看作一个物体的本质,但也会变成其他物体的非必要特征。

    每个人都可以想象事物,我们可以听到大脑里的字词或短语;我们勾勒出并不存在的环境,并借助这些形象来预测未来行动可能带来的影响。人类的大部分智能来源于对物体、事件或概念的精神表征的处理能力。

    但表征(representation)具体指什么?在我看来,表征指存在于大脑内的任何结构,它可以用来回答问题。只有当表征和所谈论的物体相似时,这些答案才有意义。

    我们有时会使用具体的物理实体来表征事物,如使用图片或地图来寻找城市里的道路。然而,回答过去发生的事情时,我们必须使用所谓的“记忆”,但“记忆”指什么?每一条记忆都是对过去发生事件的记录或追踪,当然,你不能追踪事件本身,至多能记录与那个事件相关的物体、想法、关系以及事件对你当时精神状态的影响,例如,当你听到“查尔斯送给琼一本书时”,可能以一种类似脚本程序的一系列If→Do Then规则来描述这个场景(见图8-17)。

    空标题文档 - 图17

    图8-17 查尔斯给琼书时的If→Do Then规则

    然而,你也想知道那本书是个礼物还是个借出物,查尔斯是否想讨好琼,场景中的两个人着装如何以及他们的谈话意义如何。因此,我们对任何特殊事件都会作出几个典型的表征。例如,这些记录可能包含以下内容:

    ● 对事件的口头描述;

    ● 对场景的视觉刺激;

    ● 涉及人物的一些模型;

    ● 人物情感的模拟;

    ● 相似场景的平行类比;

    ● 对未来可能事件的预测。

    为什么大脑能够以多种不同的方式来表征同一事件呢?如果涉及想法的每一领域都留下了其他记录或痕迹,它们将会让你用各种各样的方式思考同一个事件,例如,通过使用口头推理或操纵精神图式,或幻想参与者的手势和面部表情。

    如今,我们对大脑如何作出这样的记忆、如何获得以及“重放”记忆所知甚少。尽管我们对大脑细胞的行为运行方式知之甚多,但对细胞如何组成更大结构来表征对过去事件的记忆却一无所知。反思也不能帮助我们了解这些过程的细节,通常情况下,我们可以说的最多只是我们“记得”某些发生在自己身上的事情。所以,下面将主要描述几个结构,它们可能会被大脑用来表达存储在记忆中的知识。让我们继续思考这些结构在大脑中排列的方式。

    表征知识的多种方式

    我们与动物的区别在哪里?最重要的不同就是其他动物都不会问这样的问题!人类似乎有着独一无二的能力,能把想法当成事物看待,换句话说,就是使之“概念化”(conceptualize)。

    然而,为了创造并使用新的概念,我们必须使用存储在大脑网里的结构形式来表达这些新的想法,因为任何细小的知识碎片都没有任何意义,除非这些细小的知识碎片是大型化框架中的一部分,且大型化框架与大脑知识网中的其他部位相联系。然而,这些联系的呈现方式无关紧要,相同的计算机可以用金属丝和开关组成,甚至可以用滑轮、积木或绳子组成,重要的是相关部分改变时,其他每一部分如何作出改变以回应这些变化。

    换句话说,知识并不是由悬浮在精神世界里的单独实体“想法”构成的,它们也需要相互关联。把想法和观念想象成“抽象概念”,以图式的符号形式或以句子和篇章形式来表征想法,这通常都是有益的。然而,想要思想或概念具有实际的效果,例如使用双手移动积木、使声带发声或想出另一个想法,就必须有一些物理结构来联系大脑内部的不同表达。

    本节回顾了研究者们经常用来表征计算机内部知识的一些当代观念,以及一些还没有被验证的观念和想法。由于篇幅的限制,我们并没有讨论太多细节,《心智社会》一书详细地讨论了本节中的话题。 [94]

    把事件描述成故事或脚本

    或许我们用来表征事件的最熟悉的方式就是把它当作一个及时描述系列事件的故事或脚本,也就是说,以故事或叙述的方式。我们在分析“查尔斯送书”的场景以及卡罗尔计划建造拱形门时,都已经使用到了这种脚本(见图8-18)。

    空标题文档 - 图18

    图8-18 将事件描述成故事或脚本

    并不是所有的过程都顺次排列,大多数计算机程序主要由像这样的系列行动组成,但在某些时候,这种顺序可能会被分支的If情况打断,因此脚本可能朝向不同的方向,这取决于特定的当前条件。尽管如此,过程一旦完成,人们便可以通过列举其选择的路径简化或总结过程,如“我在尝试使用玩具积木制造拱形门,我发现必须首先建造支架,然后搭上顶盖”,这其中省略了许多在学习搭建积木时所走过的弯路。

    用语义网络描述结构

    故事或脚本中的每一个名目都有可能代指其他更复杂的结构,例如,为了理解“琼”或“书”的意思,读者必须首先拥有表征这两个术语的结构。一旦我们需要描述更多的细节,比如物体部分之间的关系,使用类似图8-19描述的结构便能够更好地表征人物或书本。 [95]

    空标题文档 - 图19

    图8-19 语义网络

    每个所谓的“语义网络”都是符号的集合,与其他标记的联系相连。它们拥有丰富的表征形式,因为每个联系本身代指很多表征类型,图8-20中的语义网络就描述了3块拱形门积木的众多部位之间的联系。

    空标题文档 - 图20

    图8-20 拱形门积木中的语义网络

    每一个部分、支撑和不接触的联系反过来代指其他结构、资源和过程,人们可以利用这些理解语义网络对其他事情的表征,例如,代表“支撑”的联系可以用来预测这种情况:如果我们移除下面支撑的积木,最上面的积木就会掉下来。

    用传送框架表征多个行动

    为了表达行动的效果,使用一对语义网络来表达已经发生变化的行动是非常方便的。在第5章中,我们知道如何通过改变一个名称或高层次表征的关系来替代拱顶,而不是改变成千上万的点来形成图片似的图像(参见图5-33)。

    我们使用术语“传送框架”(Trans-Frame)来命名这对表征,它呈现的是行动完成之前和之后的条件。我们可以通过将一些传送框架相连,从而形成故事或叙述,来表达一系列行动的效果。图8-17所示的“查尔斯送给琼一本书”这一行动就包含5个这样的“传送框架”。

    图8-21是“查尔斯送给琼一本书”这个事件的另一个版本,只有3个表达,每个框架却展示了更多的细节。

    空标题文档 - 图21

    图8-21 另一版本的3种表达

    用框架表示常识

    在1974年和1986年的两本书中,我描述了框架和传送框架的概念,因此,在这里我将不再重复其细节。然而,关于其使用方法,有几个重要的知识点要重申一下。传送框架能够通过描述行动之前或之后的条件来表达行动的效果,但它也可以囊括常识的信息,如下面这些知识。

    ● 谁执行了行动?为何执行?行动对其他事情造成了何种影响?

    ● 行动从哪里、何时开始?

    ● 行动是否有意的?它有什么目的?

    ● 使用了什么方法或工具?

    ● 克服了什么困难?它的副作用是什么?

    ● 行动涉及了什么资源?接下来会发生什么?

    例如,图8-22是一个传送框架,描述了琼从波士顿到纽约的旅程,其中可能有许多像下面所描述的额外的“槽”。

    空标题文档 - 图22

    图8-22 琼从波士顿到纽约的传送框架

    这个传送框架包括两个语义网络,描述行动旅程开始之前和之后的条件,但它也包括了表达信息的槽,告知琼何时、以什么方式以及为什么开始了那场旅行。这些槽也包括普通问题的简单答案,换句话说,传送框架的槽通过“默认”方式涵盖了大量被我们称作常识的知识。

    例如,当某人说“苹果”时,你似乎立刻就会知道苹果是长在树上的,又圆又红,人类的手掌大小,有着特殊的纹理、味道和口感,听到苹果这个词后,根本不需要反应就会知道这些常识。第6章和第7章提出了是什么使得我们的大脑如此迅速地获得其需要的常识性知识的问题。部分原因是,每个传送框架中的槽已被最为普通和典型的信息填满,而且你可以通过这些信息判断自己是否需要额外的信息。

    如图8-23,你会“默认”苹果是红的,但如果你知道某个苹果是绿色的,可能会在颜色槽里用“绿色”替代“红色”。换句话说,一个典型框架描述的模式是,“默认假设”(default assumptions)通常是正确的,但一旦遇到特殊的例外情况,必须确保能够轻易作出改变。 [96]

    空标题文档 - 图23

    图8-23 苹果的信息

    所有成年人都知道很多这样的条目,并把它们视为日常生活中的常识,但每个儿童却都需要花费几年时间学习传送框架在不同条件和领域下表现出的所有细微差别。例如,人们知道,如果在物理领域移动一个物体,会改变物体所在的位置,但如果你告诉朋友们这些信息,这条相同的信息将分布在不同的两个地方。同样,如果你听说查尔斯紧紧抓住书,也不会询问他为什么要这么做,因为你默认他和其他大多数人一样,拥有最平常的常识,他这样做就是为了不让书掉到地上。

    “默认假设”的想法有助于解释人们如何快速地获得常识性知识:只要你激活了框架,许多你可能会问的问题在你开口询问之前就已经有了答案。 [97]

    通过构建“知识线”来学习

    假设你刚刚想出一个有助于解决某个难题P的好主意,你能从这个经验中学习到什么?其中之一就是创建新的规则:如果(If)你面对的问题就是问题P,那么(Then)尝试着寻找以前出现过的有助于解决问题P的方法。If→Then规则能够帮助你解决与问题P相似的问题,但无法帮你解决不甚相似的问题。然而,如果你能记录下寻找解决方法的思维方式,会更容易在更为广阔的情形下寻找解决的方法。

    当然,复制人类思维整个状态的行为是不切实际的;但是,如果你想在发现解决问题P的方式时重新激活一些资源,则有很大可能成功。你可以创建一个全新的联系选择器,从而有助激活这些近期使用过的资源完成目标。我们称这样的结构为“知识线”(knowledge-line,或简称为“K线”),这样的知识线发挥着精神活动中的“快照”作用,因为当你后来再次激活那些资源时,它会将你置入一个相似的状态(见图8-24)。

    空标题文档 - 图24

    图8-24 K线激活资源

    以下是一个类比,说明了知识线的运行方式。

    肯尼斯·哈泽(Kenneth Haase,1968):你想修自行车,在开始之前,双手都是红色的油漆,你使用的每一个工具上也都沾满红色的油漆。修好之后,你会记得“红色”适合“装饰自行车”。如果你使用了不同的颜色来做不同的工作,一些工具上就会有几种不同的颜色……之后,当你有一些工作需要完成时,你只需要触发一套工具,其合适的颜色和可用的资源都任你使用。

    这样一来,对于每个问题或工作,知识线都会使你的大脑充满多种相关的想法,会使你进入一个有助于自己完成工作的相似的状态。

    学生:我能理解新的知识线是如何被当作新思维方式的选择器的,但当需要激活这些选择器时,如何创造新的批评家?

    如果我们想要使用新的知识线来解决相似的问题P,那么这个批评家应该识别一些问题P特征的组合(见图8-25)。

    空标题文档 - 图25

    图8-25 问题P特征的组合

    然而,如果只有当问题P的特征全部出现时,这样的批评家才会作出反应,也就是说批评家可能无法识别与问题P稍微不同的情况,因此每个新的批评家应该仅能识别有帮助性作用的特征。

    学生:我明白你的意思。假设在修理自行车时,你恰巧使用了一件把自行车变得更糟糕的工具,把工具刷红也没有任何作用,因为之后你可能会浪费更多时间。

    这表明,当我们制作新的选择器和批评家时,大体说来,只要通过学习,我们就应该试着确保学到的知识能够真正地起到帮助作用。下面关于信用赋能的部分将主要讨论一些有助于确保学到的知识与未来的事情相关的过程。

    学生:如果每条知识线仅被用来重新访问你已经熟悉其使用方法的思维方式,那么这些知识线还会有助于创造全新的事物吗?

    这不成问题,因为当你激活知识线时,它并不能完全替代你当前的思维方式,原因是知识线在关闭一些资源的同时激活了另一些资源,但是你当前的很多资源仍能参与其中。因此,大脑中两种不同的资源集将同时处于激活状态:一种被用于当前的思考,一种被用于记忆。如果这些资源相互匹配,那么这两种资源可能会共同协助解决当前面临的难题。你可以把这两种资源以外的其他资源相结合,以一个新知识线的形式存储起来,结果就是,你为新的思维方式创造出了新的选择器。

    如果当前的资源与知识线激活的资源不相匹配,该怎么办?其中一个办法就是优先考虑知识线激活的资源。但这个方法也有些副作用:我们并不希望自己的记忆重新且紧密地还原为原有的思维状态,淹没当前的想法。这是因为如果这样,我们可能会丢掉自己当前的目标,近期完成的所有工作也可能会消失。另外的办法就是,给予当前活跃的资源而不是记忆中的资源优先权,或者两种资源都进行压制。

    我的答案是,使用一种方法可能永远无法取得令人满意的结果,因此,智能的人们在处理纷繁复杂的情形时总会寻找方法来(使用高层次的策略)决定哪种方式最合适。无论使用哪一种方法,最后的思维状态肯定与之前的思维状态有些许不同。所以,每种新情况都可能形成全新的思维方式,并且如果你能快速地将其“记录”下来,将会拥有一条全新的知识线。[98]

    我们应该注意到,心理表征几乎从不“白手起家”,原因是无论我们何时制作新的心理表征,它总是与旧有的心理表征相关。例如,当你理解“查尔斯送给琼一本书”这件事时,你对它的表征几乎全部是以前所建构的查尔斯、琼和书本的表征的总和。因此,听到句子之后,你的思维状态也囊括了其他概念所使用的资源。

    所以,如果你尝试作出能够再现精神状态的单一知识线,那么知识线将需要和不计其数的其他资源相联系。然而,你也可以仅仅通过作出一条与查尔斯、琼和书的原有表征相联系的知识线来实现同样的效果。之后,每当你尝试激活这条新的知识线时,它会给予你一种重新经历这些精神活动的感觉(见图8-26)。

    空标题文档 - 图26

    图8-26 依附于其他3种知识线的知识线

    联结主义和数据表征

    让我们来比较以下两种不同的表征“苹果”这一常识性知识的方式。苹果是一种可食用的水果,颜色有红黄绿三种,果肉脆,色泽鲜亮,味道酸甜,种类繁多且产自欧亚地区(见图8-27)。

    空标题文档 - 图27

    图8-27 苹果的两种表达方式

    图8-27左图是关于苹果的语义网络,描述了苹果各个部分、方面的特点以及它们之间的关系。右图是“联结主义网络”(Connectionist Network)模型的例子,也展示了苹果的一些方面,但缺乏简单的方法来区分各部分之间的不同关系,只列了一些数字,表明不同特征是如何紧密“联系”的。联结主义系统有很多实际的应用,原因是这种系统可以进行学习,从而识别模式的重要类型,而不再需要为其编程。

    然而,这些基于数字的网状模型也有局限性,限制了它们进行反思。人们有时可以把这些数字价值解释为关联或可能,但因为它们并没有线索来暗示这些联系的内涵,因此其他资源很难使用这样的信息。问题是,联结主义网络模型必须将每个关系缩减为单一价值或“力量”,因此,任何形成它的证据几乎都无法存留,例如,如果你看见数字12,你是不能分辨出是代表了5+7、9+3或27-15,还是描述了房间里的人数或是人们坐的椅子的椅腿数目的。简而言之,数字表达成为高层次思维方式的障碍,而语义网络就可以清楚地解释各种各样的关系。

    我提到这些,主要是因为尽管我在发明语义网络的过程中发挥了作用,但是近年来我看到,这种网络概念的普及阻碍了对人类心理学机制中高层次思想的探索。据我了解,对常识性知识的探索1980年前在不断进步,之后,人们普遍认为未来的进步取决于能否找到获取和组织上百万个常识性知识碎片的方法。这个前景如此令人震惊和宏伟,许多研究人员决定尝试着发明能够独立学习的机器,学习本身所需要的知识,概括说来,也就是发明类似第6章提到的儿童机。

    很多这样的学习机器确实能学习做一些有用的事情,但很少有机器能形成较高层次的反思思维方式,我猜测主要是因为它们尝试使用数字的方法表征知识,因此很难产生富有表现力的解释。

    然而,我并不认为这些语义网络不重要,我们将在“表征等级”一节中看到,可以认为,大脑中很多低层次的过程必须使用联结主义模型的一些形式。

    语境知识的微粒体

    我们经常面对一些模棱两可的情况,一件事情的意义取决于精神环境中余下的部分,这也适用于思维中的多种活动,因为活动的意义在于激活了哪种精神资源。[99]换句话说,任何符号或物体本身并没有任何意义,而你对这些符号或物体的解释则取决于自己身处的精神环境。例如,当你听到词语“木块”时,你可能会认为它是进步的绊脚石、矩形的物体、用来在上面砍东西的木板子或用于在拍卖会上展示物体的木台。你会选择何种解释?

    这样的选择经常取决于你自身当前的精神环境,它会让你从一系列选择中作出抉择:

    ● 概念的或物质的;

    ● 已证实的或猜测的;

    ● 强健的、脆弱的或可修理的;

    ● 公众的或私人的;

    ● 城市、农村、森林或农场;

    ● 不规则的或对称的;

    ● 动物、矿物或植物;

    ● 普通的、稀有的或独一无二的;

    ● 室内的或室外的;

    ● 居住地、办公室、剧院或汽车里;

    ● 颜色、纹理、硬度或强度;

    ● 合作的或竞争的等。

    许多像这样的环境特征都有共同的名字,但许多其他事物却没有这样的表达,正如我们不具备很多描述味道和气味、手势和语调、态度和性情的词语。我建议使用术语“微粒体”(micronemes)来表达许多影响和改变我们对事物看法但难以形容的线索,图8-28表明一些环境特征可以通过机制来影响我们的精神过程。 [100]想象一下,大脑包括成千上万根线状纤维,它们贯穿大脑内部的其他结构,因此每一个微粒体的状态都能对许多其他过程产生影响。

    空标题文档 - 图28

    图8-28 微粒体的输入与输出

    在输入层,我们应该假定很多精神资源,例如知识线、框架槽或If→Do Then规则,都能改变一些微粒体的状态。你当前的微粒体状态能够代表很多当前的精神环境,随着这些纤维状态的改变,深远的微粒体将会向许多其他的精神资源播撒这些信息,因而会改变你的态度、观点和思维状态。

    表征等级

    上一节已经简要地描述了我们可能用来表征不同类型知识的几种结构,但每个表征都有优缺点,因此,每个表征都需要另外的关联,通过关联利用其他种类的表达。这表明,我们的大脑需要大型化的组织来对各种表征知识的方法进行关联,或许最简单的排列方法就是等级(见图8-29)。

    图8-29显示了对大脑如何形成多样的方式来表征知识的一种解释。然而,我们也不必期待真实的大脑会以这样整齐的方式排列。如果解剖学家们发现大脑的不同区域涉及不同的组织,用以支持不同领域内的精神功能,例如维持身体功能、操纵物质实体、发展社会关系以及进行反思和组织语言,我们也不必对此感到太过惊讶。同样的道理,如果这些图式最后被证明很好地描述了某功能与其他功能联系的方式,那么图中一些与之相邻的结构实际上可能相距很远。人类大脑中的大部分都包含无数条神经,用以连接相隔很远的区域之间的关系。 [101]

    空标题文档 - 图29

    图8-29 等级示意图

    不过,表达不大可能总是排列得如此具有层级性。在生物界,新结构通常以旧有结构的复制品形式发展,从而导致了更多的旧层级。然而,由于脑细胞如此奇特,能够联系不同的点,也就更能轻易地参与到层级结构不那么明显的组织之中。

    我们如何学习新的表征方式

    我们从哪里得到表征知识的方式,为何我们能够轻易地把知识组织到平行类比的结构中?这些能力是通过基因遗传到儿时的记忆系统中的,还是我们从个人的经历中学习的?这些问题有一个共同特点:我们到底是如何学习的?正如古典哲学创始人伊曼努尔·康德(Immanuel Kant)曾指出的那样,学会学习是我们不能完全依靠经验获得的技能之一。

    伊曼努尔·康德(1787):毫无疑问,我们所有的知识都始于经验,认知的机制应该通过训练而非影响我们情感的物体被唤醒。这是为什么呢?部分认知产生表达,部分认知激发我们在某些方面的能力,如理解活动、比较、连接和分离,因而能够把我们情感的原材料转化成对物体的知识……尽管我们所有的知识都始于经验,但这绝不意味着知识起源于经验。恰恰相反,我们的经验知识很有可能是我们通过印象获得的知识总和,而且(额外的知识)全部独立于经验……认知的能力自给自足,感官的感觉只是偶尔出现。

    所以,尽管感觉给予我们学习的“机会”,也不是说它让我们“有能力”学习,原因在于我们首先必须拥有大脑所需要的额外的知识,正如康德所说的那样,“产生表征”和“连接表征”。 [102]这样的额外知识也包括天生具有识别相互关系和其他感觉关系的方法。我认为,就物理实体来说,大脑天生拥有能够帮助我们进行“比较、连接和分离”的机制,因此我们可以以存在的方式表达它们。

    所有这些都使我认为,我们天生拥有以下结构的最初形式,如知识线、框架和语义网络,因而任何婴儿都不需要重新创造上面描述的各种表达。然而,我怀疑,虽然我们天生就完整地拥有这些结构,仍需要精力和时间来改善这些原始的表征,使其成为成人的形式。我希望有关这些发展过程的研究工作不久将得到开展。

    有没有人发明过全新类型的表征?这样的情况极少,因为如果没有任何有效的技能处理表征,那么任何种类的表征都会变得毫无用处,任何新技能也需要时间慢慢成长与发展。同样,任何知识碎片,除非以一种熟悉的方式呈现,否则都毫无用处。基于这样的原因,成人的表征要么来自改善初期的表达形式,要么来自对文化的处理,这种猜测在某种程度上是有意义的。然而,一旦某个人学会使用几种不同的表征,那么他便更有能力发明新的表征。出色的作家、艺术家、发明家和科学家的优秀成绩的根源可能就是他们可以不断发现新的有用的表征方式。

    大脑如何选择使用哪种表征呢?对此,我们已经重申了几次,每一种描述都有优缺点。因此,问这样的问题则更有意义:哪种方式有助于解决我现在面临的困难?哪种表征更可能适用于这些方法?

    如今,大多数计算机程序仍然只能完成某一项具体的任务,只使用一种表征方式,然而人类的大脑却可以积累多种方式来描述我们当前面临的困难。这意味着我们也需要一些方法来决定在每种情况下应该使用哪种方法,并且需要知道,当我们不能使用某种方法解决问题时,应该学会换一种方法。

    目的性决定表征的使用

    程序员开发程序时,他们通常首先选择一种能够表征自己程序所需要的知识的方法,但是每种表征只在某些领域内起作用,没有一种表征能够在所有领域内都起作用,但我们也经常听到对什么是表征知识的最好方式的讨论。

    数学家:表征事物的最好方式是使用逻辑。
    联结主义者:不,对表征常识性知识来说,逻辑太过死板。相反,应该使用联结网来表征知识。
    语言学家:不,联结网更显僵化,它们总是以数据的方式来表征事物,很难转化为有用的抽象概念。相反,为什么不尝试使用日常生活中使用的语言,它们不是更有表现力吗?
    概念主义者:不,语言太过模糊,应该使用语义网络,语义网络里特定的概念与想法是相关的!
    统计学家:这些联系太过确定,不能表达我们面对的不确定性,因此我们可以使用概率。
    数学家:所有这些非正式方案都不受强制,因此可能是自相矛盾的。只有逻辑能让我们避免陷入永无止境的矛盾中。

    这表明,想要寻找一种表征知识的方式根本没有任何意义,因为每种特殊形式的表征都有自身的局限性,例如,基于逻辑的系统非常精确,但却很难以类比的方式推理。与其相似,数据系统在预测方面非常有用,但无法很好地解释有些预测正确的原因。人们普遍认为,即使在古代,我们也要以多种方式来表征事物。

    亚里士多德(《论灵魂》):一个人可能把一间房子描述为一个“避难所,保护人们免受来自风、雨和炎热的摧残”;而另一个人可能把房子描述为“石头、砖块和木材”;可能也存在第3种描述,说房子以某种原料为基础形式,有着何种目的。那么,作出哪种描述的人有资格被称为真正的物理学家?是描述原料的人,还是那个重视功能的人,或是那个支持两种说法的人?

    然而,有时不去组合这些描述,效果反而更好。

    理查德·费曼(1965):从心理方面来说,我们必须在头脑中有这些想法,并且每个理论物理学家对同样的物理现象都需要知道六七种不同的理论表达。他知道,这些表达同等重要,没有人能决定哪一种表达在其层次上是正确的,而且他也把这些表达都记在脑中,希望能为以后的猜测提供参考。

    这里的关键词是“猜测”,因为每种理论都有优缺点,任何单一的表征对我们面临的难题都不是最好的解决方法。因此,大部分人类智能来自拥有表征同一情况的多种方式,所以每个不同的方面都能规避另一种方式的缺点。人们又是如何知道何时以及怎样选择特定的表征的呢?我在1992年关于因果多样性(Causal Diversity)的一篇文章中提出了几点建议,在此不再赘述。