10 一般智力因素
剑桥:我要解开智力的谜团
“我要给他发邮件。”我对朋友说。她惊讶地看着我,像看着一个疯子。这种反应我已经见怪不怪了。“斯科特,你怎么能随随便便给剑桥大学心理系主任发邮件呢?任谁也不会这么做的!”我坐下来琢磨这事儿。我真的很想一探剑桥这个“虎穴”,到那儿将智力领域研究个透。我需要一位导师。而且我当时挺害怕待在美国,因为不久前发生了恐怖袭击。所以我就在网上搜索了英格兰的智力研究专家。我找到一位智商和人类智力研究的专家——尼古拉斯·麦金托什教授。他当时在剑桥大学,我自然地联想到了尖塔、常春藤以及彩色玻璃窗,这让我回想起当年没录取我的预备学校的种种画面。“发个邮件也没有坏处。”我对朋友说道。
麦金托什教授的回应超乎我的意料,他很欢迎我与他共事。卡内基梅隆大学准我离校一个学期,也就是6个月。为了商讨细节问题,我专程飞往英格兰与麦金托什教授见了一面。当我坐在那儿等着见这位剑桥大学实验心理系主任时,感觉就像做梦一般。我心跳加速,内心很激动。要是我太驽钝,无法胜任可怎么办?这可是剑桥啊!他们要是测我智商怎么办?我正想着,门开了。
“你是考夫曼先生?”我站起身来,面前是一位仪表堂堂的长者。他的微笑让我的紧张感顿时消失了。“进来吧。”我走进他的办公室,四下看了看,里面有不少关于智力的书。我心里一震,我终于可以解开智力的谜团了吗?这些谜团曾给孩提时期的我带来如此多的痛苦和焦虑。
他一边挠着银发一边问道:“你想从美国的大学腾出半年时间向我学习有关智力的所有知识?”我点点头。这时,进来了一位高挑的中年女士。“这是希拉。”他说道,示意她坐在我旁边,“她在一所地方第六级学院任教,相当于美国的高中。我们在进行一项关于空间智力的研究,很欢迎你加入,不知道你是否愿意参加这样的工作?”
我当时激动不已,只感觉屋子里天旋地转。他接着说:“你在剑桥期间,我们可以安排你在国王学院做访问学者,你可以参加学院里的社交活动。那里很不错的,今天晚些时候我带你参观一下。”
那时我已经激动得喘不上气来了。剑桥大学有31个学院,学生在这里生活、工作。国王学院是历史最悠久的学院之一(建于1441年),可以说也是最漂亮的学院,以其雄伟的哥特式教堂最为著名。我抬头看了看麦金托什教授,又回头看了看希拉。我已激动得天旋地转,重新振作起力量回复道:“我愿意加入。”
就这样,我踏上了掌握智力科学的道路。我正竭力学习关于智力测量的一切,并对自己的过去绝口不提。这时我有了不少惊奇的发现,而最令我吃惊的是,对智商的实际应用感兴趣的临床医生与对理解人类智力本质感兴趣的科学家之间并没有交集。在过去的100年时间里,研究智力的大部分科学家对智商本身并不感兴趣。对他们来说,智商只是一般智力因素(general intelligence factor,简称g)的代名词,而一般智力因素在很多科学家眼中是人类智力的本质。其实在首个智商测验出现的前一年,首份关于一般智力因素的科学研究成果就发表了。
我意识到,要想真正理解现代智商测验得以建立与应用的理论依据,我必须攻克一般智力因素。
为什么一门考得好就门门考得好
在进入20世纪时,英国心理学家查尔斯·斯皮尔曼(Charles Spearman)有了一项惊人的发现。他去邻近村庄的地方学校里搜集学生等级、教师评价以及感觉辨别测试得分等资料,然后按这些数据对每个孩子的表现进行排名,并手工计算出这些数据彼此间的相关度。表10-1是他得到的6门功课成绩之间的相关度。
表10-1 6门功课成绩间的相关度

表10-1中,每个数字都代表着每两个科目之间的相关度,从0.40到0.83不等,斯皮尔曼对这一结果感到吃惊。有的科目间的相关性很说得通,比如古典文学和法语,相关度为0.83,毕竟这两者都牵涉语言能力。但是有的科目之间的相关度就不那么好解释了,比如数学和音高辨别,音高辨别属于音乐领域,但与数学的相关度也达到了0.45。
最令人吃惊的是,各科目之间的联系都呈正相关。一般认为,学生在某一门科目上花费的时间增多,其他科目的表现可能会退步,但事实并非如此。往往一门科目出色的学生,其他科目的表现也很出色。斯皮尔曼将这种现象称为正向复写(positive manifold)。
以学生成绩为基础,斯皮尔曼从单一维度对所有学生进行排名,他把这一维度称作一般智力因素,其在不同程度上影响着每个学生的成绩。比如古典文学与一般智力因素的相关度达0.95,远高于音乐与一般智力因素的相关度0.65,但是所有科目与一般智力因素都呈正相关。斯皮尔曼还表示,每门科目都有自己的一组独特的技能(例如,古典文学要求学习拉丁语动词变化),并将这种技能称作特殊智力因素。1904年,他发表了一篇开创性的论文,题为《客观确定和测量的“一般智力”》(Genral Intelligence, Objectively Determined and Measured)。他在论文中提出,一般智力因素的根源是一般认知能力,即“一般智力”(general intelligence)。1
一般智力因素是各科目成绩不同的主要原因,斯皮尔曼假定一般智力因素代表着他所谓的“一般智力”。但是要知道,将这种因素称作“一般智力”只是斯皮尔曼的个人做法。要推知一般智力因素,斯皮尔曼使用了一种叫作要素分析的统计方法,这种潜在有用的方法通过数据来说明问题。通过找到常见的变异来源,这种方法简化了大量的相关性。通过要素分析,要素的数量有限,从而可以进行操作,不然我们就要面对测试获得的庞大数据。
如果斯皮尔曼真想以事实为基础的话,他应该把一般智力因素称作“一般测试能力”,或者“迅速选出心理学家设置的正确答案的能力”。但是,这种标题作为论文的题目太乏味了,而且听起来也不够科学,毕竟斯皮尔曼很骄傲自己“客观地”发现了“一般智力”,就像他发现了一项人性的规律,并且这项规律如同其他自然物理规律一样。
根据这种说法,经常有人指责斯皮尔曼并歪曲他的立场。已故的哈佛古生物学家斯蒂芬·古尔德(Stephen Jay Gould)在《人的误测》(The Mismeasure of Man)一书中指责斯皮尔曼将一般智力因素具体化了(将一般智力因素当做真实存在的东西2)。尽管这种针对当代智力科学家(见第13章)的指责并非不公,但仔细阅读斯皮尔曼的书我们会发现他说得更在理。他明白一般智力因素和“一般智力”之间的区别,他认为“一般智力”是使得一般智力因素得以产生的心理能力。
斯皮尔曼发现了正向复写,但他的变量彼此呈正相关:既非必须如此也绝非意料之中。正向复写才真正需要阐释:为什么在一种认知测验中表现出色的人在所有其他测验中的表现也同样出色呢?斯皮尔曼主张一般智力是一种先天的一般的“心理能量”,在所有的认知测验中普遍地起作用。这只是一种假设,斯皮尔曼知道这种假设需要进一步的测验来证实。
智力可以分三级
斯皮尔曼的一般智力理论受到过挑战。3美国心理计量学家路易斯·瑟斯顿(Louis Turstone)表示他的成套测验建立了明确的能力集群。4例如,他的空间测验与空间测验之间的相关度比空间测验与言语测验之间的相关度更高。他采用的要素分析方法与斯皮尔曼的不同,并认为一般智力因素并不存在。相反,他认为人们的智力差异体现在7个独立的基本心理能力上:语文理解、语词流畅、数字运算、空间关系、联想记忆、知觉速度、一般推理。
对于那个时代最紧迫的问题,斯皮尔曼和瑟斯顿采取的不同立场深刻地影响了他们各自的理论。斯皮尔曼避免“官能”心理学,因为官能心理学试图将人的心智分解为彼此区分的官能。瑟斯顿则接受了对人类心智的划分,并坚信人类智力来自多个独立的部分。
孰是孰非?斯皮尔曼竭力无视瑟斯顿的基本心理能力理论,但只要他对大规模群集测验进行细致分析,就无法绕过这些基本心理能力。同时,瑟斯顿也在竭力通过自己独特的要素分析方法——“简单结构旋转法”(rotation to simple structure)消除一般智力因素,但结果发现各个认知能力之间还是呈正相关。5
这样一个事实再次被一些批评家忽略。古尔德认为,一般智力因素存在与否取决于所采用的要素分析方法。这是个错误的观点。现在借助一些方程式,可以用数学的方式对不同要素分析方法计算出来的一般智力因素进行转换。6其实,这是一个在每代人中都被反复叙说的故事。20世纪60年代,雷蒙·卡泰尔(Raymond Cattel)及其学生约翰·霍恩认为“流体智力”和“晶体智力”是彼此独立的能力。7他们声称“流体智力”受生物层面上的影响,不受教育与经验的影响,而“晶体智力”受到学习与经验的影响,并牵涉知识积累和技能方面。然而他们很快发现,他们所做的所有测验都呈正相关。到20世纪90年代,他们的智力模型包括了9~10个互相呈正相关的不同的认知能力。8
最后,终于实现了调和。1993年,约翰·卡罗尔发表了对50多年来要素分析研究的分析,具有里程碑意义。9他分析了400多份数据,包括斯皮尔曼和瑟斯顿曾使用过的一些。他着眼的认知能力测验范围很广(当然并非全部涵盖),包括语言、推理、记忆、学习、视觉知觉、听觉知觉、创造力、认知速度和心理运动能力。有的测验不包括学校中明确教导的认知能力,有的测验并没有限时,还有一些测验采用的不是传统笔答形式。尽管这些认知能力测验的内容和形式很多元,却依旧证明了一般智力因素的存在。
基于认真的分析,卡罗尔认为智力是一种层级模型,他称作“三层级理论”(Three Straturn Theory)。最高层级(第三层级)是一般智力因素——所有不同测验中的普遍因素,这一层级最为抽象,而且不代表任何实际的认知能力。一般智力因素脱离每种测验的特性,只代表它们的共性。“第二层级”由8种宽域能力组成,每种能力与一般智力因素的关系都极为不同。这些能力分别是:流体智力、晶体智力、一般记忆和学习、视觉知觉、听觉知觉、记忆提取、认知速度、决策速度。
最底部是“第一层级”,是组成8个宽域能力的窄域能力,共69个。例如,“流体智力”由非言语能力、言语演绎能力、定量流体推理能力组成,而“晶体智力”由阅读理解能力、根据上下文推断特定词义的能力、阅读解码能力、阅读速度、拼写能力、写作能力、词汇知识、听力、语言编码能力等。正如我们在第2章中所见,卡罗尔的认知能力模型深刻影响了认知能力的CHC理论,而CHC理论指导了当代无数智商测验的结构。
毫无疑问,卡罗尔的大规模综合研究成果赢得了同行们的无限尊崇。霍恩称卡罗尔的书为“集大成之力作”,其功堪比“门德列夫首创化学元素周期表”。10能获得同行们的如此赞誉,对大多数人来说是可望而不可即的!
问题似乎都解决了。智力领域终于有了一幅路线图——在范围广阔(依旧有限)的认知能力集合中有了协变模式的分类。虽然关于层级理论的精确结构至今还有争议,但是更新、更精密的统计方法已证实这种层级结构能达到最佳的数据拟合。11而且,要对顶层不是一般智力因素的诸多认知能力的个体差异进行分类,无疑是有很大困难的。
但现在的问题是,一般智力因素的普遍性有多大呢?
看似无处不在的“一般智力因素”到底在哪
阿尔弗雷德·比奈成功地设计了一种测验,与学习表现高度相关:一般智力因素与同时期的学术成就高度相关,而且在通过数据预测学业表现方面也发挥了很好的作用。伊恩·迪尔瑞和同事搜集了7万多名学生参加认知能力测试(Cognitive Abilities Test,简称CAT)的数据,该测试测量言语的、定量的以及非言语的流体推理能力。12他们发现,学生在11岁时测得的一般智力因素与16岁时25门功课的标准考试成绩之间呈正相关,尽管相关程度并不相同。
相关度最高的三门科目是数学(0.77)、科学(0.68)和英语(0.67),相关度最低的科目是艺术与设计(0.43)。不过,所有的相关度都在中高等,连体育(0.55)、戏剧(0.47)、宗教教育(0.52)、商科(0.56)等都与一般智力因素有中度的相关。从实际来看,一般智力因素导致总体学习成绩65%的总变差,剩下35%的学习成绩差异原因还不清楚。一些学习科目,如艺术和设计,则有超过80%的差异无法找到原因,这便给了学生很大的空间去获得更好的成绩,超过根据一般智力因素排名所做的成绩预测,这也为其他影响学习成绩的因素留下了余地,如特殊认知能力、动力、心理定向、自我调节、环境支持等。然而科学地看,这些相关性是很惊人的,它的确表明一般智力因素对学习各类知识有影响。
一方面,一般智力因素在各门科目的学习中起普遍作用,另一方面,许多标准化测验可以对一般智力因素进行测量,或者说起码是对很近似于一般智力因素的东西进行测量。温迪·约翰逊(Wendy Johnson)和同事发现,两个不同的智商测验所测得的一般智力因素几乎完全相关。13此外,如果我们对美国学术能力评估测试(SAT)和美国大学入学考试(ACT)的可靠性进行校正,这两个测试与一般智力因素的相关度高达0.91,而这两种测试之间几乎完全关联。14
近来,我与马修·雷诺兹(Matthew Reynolds)、刘鑫(Xin Liu,音译)、艾伦·考夫曼以及凯文·麦格鲁合作,探究智商测验得出的一般智力因素与标准学术测试得出的一般智力因素是否相同。15为了一探究竟,我研究了两个大型的、国家级的具代表性的数据集,参与者总数超过7 000人,此外还研究了两个独立的个体管理的成套测验集。通过使用CHC领域的智商测验组合,可以测量认知一般智力因素,而学术成绩的一般智力因素是通过标准化的读写和定量知识来测量的。我们发现,认知一般智力因素和学术成绩的一般智力因素并不相同(大量差异有待解释),但是两者间的关系十分紧密。这种相关性一般会随着年龄的增长而加强,各年龄段人群(4~19岁)的相关度系数范围是0.77~0.94,平均为0.83。
一般智力因素的影响还普遍存在于非学校科目内容的推理中。我曾和科林·德扬(Colin DeYoung)、戴德丽·科拉里克(Deidre Colarick)以及我的博士生导师杰里米·格雷(Jeremy Gray)探究一般智力因素在多元内容推理中的作用。16我们特地将演绎推理融入研究背景来进行探究,包括真实情况中的假定推理。我们研究了三种类型的问题:社会交换问题、预防性问题、武断问题。社会交换问题关心的是个体之间物品或服务的交换,并牵涉到检测一方是否会不劳而获,例如“如果你借了我的自行车,那么你就得帮我洗车”。预防性问题关心的是如何避免物理伤害,例如“如果你冲浪时水很凉,那么你必须穿上防寒泳衣”。最后,武断问题指的是融入现实场景的规则,但这种规则是武断的,例如“如果汽水是无糖的,那么它的包装一定是紫色的”。
我们发现预防性和社会交换推理问题解决起来比武断推理问题更快,也更普遍。这表明,融入背景的真实环境有助于推理。不过,在探究过演绎推理的个体差异之后我们发现,不管内容如何,70个问题都呈高度正相关,信度达0.88。此外,这种演绎推理的一般因素与著名的言语、空间和流体推理的一般智力因素也呈高度正相关,相关度达0.45。这表明,在这些形式的推理上,人与人之间存在的协变并非彼此独立,尽管这三种形式的推理融入了现实情境,并牵涉到内容不同的推理。
近来,有人提到了多元智能理论,一般智力因素在这种理论中是如何发展的呢?有没有理论罢黜一般智力因素呢?想想霍华德·加德纳的多元智能理论吧。加德纳详细地阐明了他的8种智能是彼此独立的。他认为学校易于过度重视逻辑数学智能和语言智能,从而忽略了空间智能、身体动觉智能、音乐智能、人际智能、内省智能和自然主义智能。
贝丝·维瑟(Beth Visser)、迈克尔·阿什顿(Michael Ashton)和菲利普·弗农(Philip Vernon)在论文《超越一般智力因素》(Beyond g)中,构建了一个测试来测量加德纳的8种智能,他们为每种智能选取了两个纸笔测试。17你看,一种正向复写出现了,因为所有的测试都是彼此呈正相关的。但是同样,每个测试与一般智力因素的相关度并不相同。语言、空间和逻辑数学的推理测试大多数与一般智力因素高度相关。不过,就连人际智能和自然主义智能(对自身所处环境进行分类的能力)都与一般智力因素呈中度相关。
但也有一些测试与一般智力因素的关联程度要小得多,如身体动觉智能、与音调和节奏相关的音乐智能以及自省准确度(认识自身)等,这几项是与一般智力因素相关度最小的。维瑟和同事指出,一些测试与一般智力因素相关度比较小,可能是因为测试的信度不高。他们还认为这些发现总体上是有意义的,因为他们认为这些测试本质上是“认知的”。
加德纳对此回应道:“虽然想法是值得表扬的,但这实际上恰恰重建了我原本试图推翻的条件。”18虽然加德纳承认“只要进行成套测试”,一般智力因素“就会周期性地出现”,但是他认为我们对于正向复写的本质依然知之甚少。19加德纳继续支持使用“智力公平测试”,通过纸笔测试以外的方法来评估他的多元智能理论,并尽可能消除语言或逻辑的成分。
加德纳举例以示如何通过观察人们在陌生地带寻找方向的方式来测量空间智能,或是如何通过研究现实生活中人们的谈判来测量人际智能。这些观点当然值得考虑,但是要进一步检验则会很麻烦。事实上,要建立起能够完全孤立一种认知过程并完全不使用逻辑或语言的任务是很困难的。同时,尽管加德纳没有提到,但卡罗尔确实发现了在陌生地带寻找方向的能力与一般智力因素高度相关。所以,加德纳提出,创造更迅速的测验,并使得人们能充分表达自己的思想这一建议虽然有价值,但是正向复写依旧存在。科学地说,正向复写为什么存在还有待解释。
其他试图超越一般智力因素的智力理论又如何呢?同样的故事又出现了。如果你仔细审视这些研究便会发现,斯滕伯格所谓的三种智力,即分析智力、创造智力和应用智力的测试彼此之间呈中度相关,三种智力与传统智力测量也呈中度相关。20情绪智力也一样。“情绪智力”有四个分支,即情绪知觉能力、情绪整合能力、情绪理解能力和情绪管理能力。这四个方面的测试彼此中度相关,与传统的智力测量也呈中度相关。21虽然公平地说,无论是斯滕伯格还是最初提出情绪智力的彼得·沙洛维(Peter Salovey)和约翰·迈耶(John Mayer),都不曾主张情绪智力是完全独立于一般智力因素的观点。只有加德纳强烈主张这一观点。
这些发现都不意味着试图超越一般智力因素的努力没有成果。相反,这些发现突出了人类智力的多元与丰富。每个新生的智力形式都值得认可,因为这预示着大于一般智力因素的重要的人生成果。22
关于认知能力的研究有成百上千项,这些研究都在实验室环境中采用了简洁可靠的测试对认知能力进行测量,但是很难找到一个完全脱离正向复写的测试。在有关认知能力的多种测试中,正向复写是一项十分有成效的发现,心理学家克里斯托弗·查布里斯称之为“一般智力法则”。23
毫无疑问,斯皮尔曼如果还在世,一定很欣喜自己的最初研究成果被奉为法则!100多年前斯皮尔曼提出,认知成套测试的具体组成并不重要,将之称为“指标的冷漠”(indifference of the indicator)。他认为,即便将认知测试彼此替换,成套测试依旧会呈正相关。斯皮尔曼认为,关键在于成套测试要有一定的多元性,从而消除任意测试的独特性。曾与斯皮尔曼共事过几个月的戴维·韦克斯勒就是这样在他的测验中建立了总体智商分数的概念(参见第2章)。尽管韦克斯勒创造了“言语”和“操作”分量表,但是他认为所有“分测验都是对智力的不同测量,而非对不同智力进行的测量”。24
但是,什么才是看似无处不在、却又难觅踪迹的一般智力因素的真面目呢?所谓的“一般智力”,它真的代表了人类变异的一种来源吗?加德纳说我们对于正向复写出现的原由依旧一无所知,他说对了吗?过去的100多年里,许多人试图推翻正向复写的存在,我们又将他们一一推翻,而现在是弄清一般智力因素真相的时候了。
工作记忆:破解一般智力因素的重要一环
在《人的误测》中,古尔德准确地指出了相关性的局限。在高度相关的两个测验中,例如心理旋转和词汇,测试的并不一定是相同的心理过程。对于正向复写,有着很多各异的解释。一方面,词汇量大的人可能善于心理旋转,不是因为这两种测验测试了相同的心理过程,而仅仅是因为我们所处的社会环境推动了词汇和空间能力的发展(学校里开设英语课和地理课)。
另一方面,同为英国人的戈弗雷·汤姆森(Godfrey Thomson)在1916年向斯皮尔曼指出了另一种可能。25靠着精密的数学证明,汤姆森表示,从理论上来说,一般智力因素是通过基本心理过程之间的大量“联结”发生的。我们假设人的心智由500个基本心理过程组成,如果两项任务各自取决于其中250个心理过程,那么很可能有一半,也就是125个心理过程,会与两者都发生联系,所产生的相关度达0.50,是比较高的。据此,所有测验中所共有的单个心理过程并非产生一般智力因素的必要条件,所需要的不过是不同测验中共同采用的部分心理过程。
天赋实验
例如一个修建房子的任务。在这个任务中,造一张床、一面墙、一间花园棚屋等都是不同的任务,但是都要用到量尺,其中有两项要用到榔头。所以,要孤立地研究一项认知过程(“榔头”)几乎是不可能的,因为无论你进行什么样的任务(例如造一间棚屋)都要用到其他任务所共需的某些能力(例如手要稳),尽管这些任务的目的各不相同。
汤姆森的观点还是站得住脚的。2009年,戴维·巴塞洛缪(David Bartholomew)、伊恩·迪尔瑞和马丁·朗(Martin Lawn)在一篇论文中表示,没有一种统计方法可以确定斯皮尔曼和汤姆森孰是孰非。26那么我们如何才能获晓真相呢?为了解开这一谜团,我们将从多层次的分析来研究,包括行为、生物和文化三个层次。
要弄明白一般智力因素十分困难,先得研究与一般智力因素相关度最高的认知测试的特点,并且弄明白这些测试共同的任务要求是什么。想象一系列认知测试呈圆形分布。测试越靠近圆心,其对一般智力因素的测量就越准确。测试越靠近圆周,与一般智力因素的关联就越小。图10-1是一项研究中这种方法的体现。27
图10-1 认知测试的圆形分布
注:“W”代表韦氏成人智力量表的子测验。
资料来源:R.E.Snow and D.F.Lohman,“Implications of Cognitive Psyc-hology for Educational Measurement”,in Educational Measurement, ed.R.Linn,3rd ed.,263-332(New York:American Council on Edncation/Macmillan,1987).经许可使用。
我们从中获得了什么发现呢?我们发现关于加工速度的测试都位于圆周上。在一般智力因素的框架中,如果想要理解一般智力因素,单靠基础信息加工速度是没有用的。28仔细看,圆心四周的各种测试都是不同的,每个测试的内容都不一样:言语的、定量的和空间的。有的涉及图形旋转的想象,有的涉及头脑数学运算,还有一些涉及概念推理。还可以看到,有不少测试涉及不同内容的类比推理,如数字、字词、几何图形等。这些看似差异很大的测试所拥有的唯一共同点似乎在于:它们本身都是智商测验而已!
我们将这个圆放大,观察它的中心,去探索一般智力因素的核心。在圆心我们发现了瑞文推理测验(Raven’s Progressive Matrices Test)。瑞文推理测验的每个问题里,都有一个三阶矩阵,被试必须填充空缺的部分来使整个矩阵完整,如图10-2所示。
图10-2 瑞文推理测验
这种测验考察了何种能力呢?事实证明,解决这种测验里的难题所需要的方法并不多。有的问题很简单,只需使用一种方法就可以,比如加上或减去一个标志(如横线)。但是有的问题比较难,需要将几种方法组合,使用多种标志(如形状、大小和颜色)的加减。这种测验的难点在于被试必须将相关的标志和不相关的标志区分开来,同时还得考虑该使用哪些方法。一种方法走不通时,你要懂得放弃并从头开始。这种测验要求被试有能力发现新鲜事物的抽象关系,所以适合对非言语流体推理能力进行测量。
请注意我说的是流体推理,而不是流体智力。近几年,温迪·约翰逊和托马斯·布沙尔表示,“流体”和“晶体”智力之间的传统区别受到了误导。经过严格的统计测试,他们发现能力认知测试易于共变,且取决于测试形式是言语的还是非言语的,[33]而不是取决于受文化影响的程度。29正如第4章所提到的,这对测量天赋具有重要的启示意义。如果认为采用了非言语流体推理就能以“最纯粹”的形式测量智力,可以脱离经验和文化的影响,那就错了。同样的,一项测试如果测量的是词汇或者常识,也并不意味着对流体推理能力没有要求。词汇测试通常考查低频词汇的正确义项,这其中涉及一定的推理和演绎。认知能力的言语测试和非言语测试都涉及流体推理,而流体推理技巧反过来又受到基因和文化的影响。30
然而,并非所有的推理都是流体推理,具有条理清晰的知识库的任务对流体推理的要求比较小。流体推理需要用在最小量证据的基础上推断出基本模式。这需要专心、会计划、将任务分割成数个小任务并在工作记忆中管理这些问题解决的目标。31
人类的工作记忆容量平均为4个组块。在任意时间,人能够将4个有意义的零碎信息保存在意识中。人们的工作记忆容量有差异,但是通常在2~6个组块之间。32即便在这样一个有限的范围里,工作记忆的变化与流体推理表现的变化也是呈高度相关的。有一个广泛使用的工作记忆测试叫做阅读广度测试,该测试如下:
说明:下面5个句子将依次出现。阅读每句话并记住每句话的最后一个词。当你看到“回忆”两个字出现时,你要回想所有句子的最后一个字。
(1)猎人追赶骑马的人。
(2)过了片刻,记者四下望了望。
(3)孩子们用勺子吃蛋糕。
(4)海伦觉得明天会不好过。
(5)飞船发出一声巨响,飞入了太空。
回忆
答案:人、望、糕、过、空
大多数人做了5句就开始头疼了。达纳曼(Daneman)和卡彭特(Carpenter)发现这项任务和SAT言语分数的相关度高达0.50,与阅读理解测试的相关度更高。33他们还发现流体推理与仅要求记忆词语的测试相关度要低得多。
因为在理解整个句子的同时还要记住句子的最后一个字,所以这个测试才算得上是工作记忆测试。普鲁斯特有段精彩的文字,能够很好地说明这一点。
离开圣卢后打第一个电话的时候,我根据德诺波斯先生的要求付了德维尔帕里西夫人钱,我发现她在一个挂着黄色丝绸的画室里,画室里的长靠椅和精致的扶手椅都铺上了博韦的织锦,其颜色犹如成熟了的覆盆子的紫红色……德维尔帕里西夫人戴着旧式黑蕾丝软帽(她留下这顶软帽是因为一个布列塔尼地区的掌柜有精明的直觉,能察觉到当地和历史的色彩,无论他的顾客是多么的巴黎化,他总认为更巧妙的做法是让女侍们戴头巾,穿宽袖子的衣服),坐在一个小桌前,桌上有她的画笔和画板以及一幅未完成的水彩花卉画,这些花有的插在玻璃花瓶里,有的搁在浅碟里,有的插在杯子里,其中有百叶蔷薇、百日草、铁线蕨,因为有大量的访客到来,她停止了作画,因而这些花看上去像是以18世纪金属版印刷法制作出来的一样。34
要是读完了这段话你的脑袋还没有短路,请试着回答关于这段话的几个问题:为什么德维尔帕里西夫人要戴黑色的帽子?为什么旅馆掌柜让女服务员戴头巾并穿宽袖子的衣服?为什么德维尔帕里西夫人停止作画?
这段文字一共只有两句话。阅读这一类复杂的文章是相当困难的,因为在读到新句子的同时还得记住前一句话的要点,然后还得把整个句子的意思进行整合,从而构成一个连贯的叙述。要读的句子越多、越长,工作记忆的负担就越重。同时,还要抛却和任务无关的信息,比如散热器的响声、想到周六有个盛大的聚会之类的。
因为这一点,心理学家将短时记忆与工作记忆进行了重要的区分。35一些研究者称工作记忆与流体推理彼此高度相关的理由是它们都涉及对注意力的控制。[34]现在已有广泛的证据表明,尽管工作记忆和流体推理不是一回事,但工作记忆确实是破解一般智力因素之谜的重要环节,这一看法获得了智力科学家的普遍认可。36
神经科学的助力解读
认知心理学家通过行为测试取得了进展,但是一旦有了新的神经科学技术,他们便会期待与认知表现相关的是何种脑功能区。当然,任何人的智商分数都是多种认知过程的结果。人类大脑是高度互结的,有许多特殊区域共同参与完成某个单项的认知任务,即便是最简单的任务,比如将字母和标志配对,也需要多个大脑区域的协作,包括负责注意力、视觉、感觉运动技能和提取语义等的区域。关键问题在于,哪些大脑区域与多元认知测试中的差异表现保持着一贯的联系呢?
最早有一项关于一般智力因素的神经科学研究,约翰·邓肯(John Duncan)及其同事发现,空间、言语以及感知运动等与一般智力因素高度相关的任务都发挥了外侧前额叶(位于额头后部,为大脑的最外缘部分)的作用,而在与一般智力因素相关度较低的任务中,外侧前额叶发挥的作用要小得多。37这项研究意义重大,因为这是最早将前额叶(尤其是外侧区)与流体推理相联系的研究之一。
当然,单靠外侧前额叶是不能实现流体推理的。这一大脑区域与左右脑其他皮层和皮层下结构紧密相连,而且根据任务内容的不同(言语、空间等)和任务要求(维数、干扰项的数量)来使用这些大脑区域。不过,对人类和猴子的进一步研究显示,外侧前额叶皮层细胞对保持工作记忆中的不同内容起到了关键作用。38
天赋实验
看看杰里米·格雷、克里斯托弗·查布里斯和托德·布拉韦尔(Todd Braver)的一项研究。39他们让48名大学生参加了瑞文测验,同时这也是一种工作记忆的测量,叫作n-back范式工作记忆测试。n-back范式任务要求被试观看每2.36秒出现一次的一组项目,并判断间隔几组的两个项目是否相同。在1-back测试中,你需要做的只是判断当下的项目与相邻的前一个项目是否相同,很简单,但是很快就会变得难了。3-back测试便要求回想3个项目,这样听起来似乎还是很容易的,但是这种测试真的很难,做这种测试要在记忆中进行迅速持续的更新。
格雷和同事在两个独立的3-back任务中使用了单词和人脸。他们甚至加入了“诱惑物”来增加测试的难度,也就是与最近展示的刺激相同的刺激,但这些刺激并非是向前数3个所出现的刺激,即并非3-back那一组出现的。这些“诱惑物”可能是2-back、4-back、5-back时出现的。这种起干扰作用的“诱惑物”对注意机制的要求更高。图10-3是3-back任务的不同测试,采用了人脸作为刺激。
他们发现在瑞文推理测验中得分最高的被试在工作记忆任务中表现更佳,在外侧前额叶和顶叶区域(位于头部后上方)有更多的神经活动,而这两个区域和感觉统合相关。此外,引诱试验中,这些区域的大脑活动差异最为显著,因为引诱试验中干扰很大,注意力是尤为重要的。这份研究表明流体推理任务使用外侧前额叶和顶叶区域来保持对一件事物的专注,并排除干扰,使流体推理能够快速更新工作记忆中的内容。[35]
图10-3 n-back范式工作记忆测试
到2007年,已经有了许多关于认知能力的神经科学研究。雷克斯·荣格(Rex Jung)和理查德·海尔(Richard Haier)回顾了当时可获得的37个神经影像研究,采用了一系列方法(功能代谢显像、功能性磁共振成像、磁共振波谱成像、结构磁共振成像),并推断大脑区域的一个特殊网络结构对不同内容的认知测试表现起关键作用。40根据他们的顶-额综合理论(Parieto-Fronatal Integration Theory of Intelligence,简称P-FIT),在信息加工的不同阶段,发挥作用的大脑区域各不相同。
在最初几个阶段,大脑颞叶区(位于双耳后方)和枕叶区(位于头后部)加工基本感觉信息,而顶叶皮层对信息进行整合。接下来的“假设检验”阶段涉及更高程度的抽象化,而且需要额叶与顶叶之间有高效率的信息流,同时白质可靠地帮助信息在额叶顶叶网络中传递。(白质由轴突组成,轴突周围包裹着厚厚的髓磷脂,这种髓磷脂有助于不同的灰质区域之间进行交流。前额叶皮层和顶叶皮层都是灰质。)一旦确定最佳解决方法,前扣带回就会启动适当的回应并抑制其他回应。
也不乏批评顶-额综合理论的声音。一种批评意见认为,荣格和海尔将他们的理论建立在个体差异之上,并含有多层次的分析,包括大脑结构、功能、任务比较(如低一般智力因素和高一般智力因素任务之间的差异)。尽管这些问题都很有趣,但是这些问题并不相同,而且一个层次的结果不一定对另一个层次也适用。41还有一种批评意见是关于大脑区域的一致性问题:只有部分大脑区域显示出超过50%的研究所发现的活化作用。42问题之一是,被回顾的研究项目在认知测试上彼此相异。要知道,斯皮尔曼说过,要正确地测试一般智力因素,必须实施大范围的认知任务,否则测试的很可能还是专业领域技能。
虽然这些批评有根有据,但是自荣格和海尔2007年的论文发表以来,无数研究一致表明外侧前额叶和顶叶靠后区域之间的沟通与多元任务的认知测试表现差异有关。43最令人震惊的发现来自于日渐增多的关于大规模病变的研究,这些研究暗指顶叶是流体推理的关键。44
天赋实验
阿伦·巴比(Aron Barbey)和同事在一份大规模脑损伤研究中获得了182名越南老兵的样本,这些老兵因为遭受穿透性头部伤害,都患有高度局部脑损伤。45他们的发现与顶-额综合理论相一致,外侧前额叶和顶叶区域的伤害损害了整个大脑神经系统分布模式的控制与整合。他们发现,一般智力因素的测试以及前额叶和顶叶区域的伤害影响最大的执行功能牵涉言语理解、工作记忆、心理灵活性以及注意力控制。研究者认为,前额叶顶叶网络结构(prefrontal parietal network)是大脑中一个支持目标导向行为的“理想区域”,因为该区域与知觉与运动表现有着紧密的联系和广泛的接入。
他们发现前额叶顶叶网络结构中的一个重要因素是位于双眼上方的额极。大脑区域存在着进化意义,与其他物种相比,人类的大脑不是最大的,抹香鲸和大象的大脑都大过人类大脑。然而与恒河猴和类人猿相比,人类有着更大的额极和下顶叶。46有意思的是,最近一份关于阿尔伯特·爱因斯坦的大脑的分析显示,尽管他的大脑总体形状和大小没有什么异常,但是他的前额叶和顶叶不同寻常(其他区域也有异常之处),额极居然位于前额叶皮层之内。47
那么额极的功能是什么呢?搞清这个问题,我们也许就能更好地理解大脑负责人类智力特殊区域的一些问题。但是事情没有这么简单。根据认知神经科学家保罗·伯吉斯(Paul Burgess)和同事的看法,额极功能的研究是“向认知神经科学提出了极其困难的问题”。48额极与多种认知过程相关,包括流体推理、关系复杂性(工作记忆中必须同时处理的独立项目的数量)、类比推理中的抽象整合、创造性类比推理中的语义远程定位、创造性想法的演变、记忆获取、道德决定、“真实监控”(判断事物是想象的还是真实发生的能力)和元认知(对自己的认知进行思考的能力)。49
因为一般智力因素、真实监控和元认知至少是造成人类差异的部分原因,因而额极的功能不仅仅是流体推理。50那么额极的普通理论是什么?哪怕只有一个这样的理论。越来越多的研究表明前额叶皮层中有一个层级结构监控意识中当下的内容,以确保维持优先目标,并且帮助整合认知过程中的优先阶段,而额极处在这一层级结构的最顶端。51大脑的这一方面十分有趣,当然还需要更多的研究,但是越来越清晰的是,额极在前额叶顶叶网络结构中起着关键作用。
巴比和同事在脑损伤研究结果及对一般智力因素和执行功能进行测试的基础上,提出了一个一般智力和执行功能的综合结构,该结构对陌生目标导向问题的解决十分关键。与荣格及海尔提出的顶-额综合理论相一致,这一结构牵涉到外侧前额叶与后顶叶特殊区域之间的密切沟通。图10-4展示了这一神经结构所牵涉到的大脑关键区域,并将这些区域联结成一个相互协调的白质纤维束。[36]注意,虽然这些区域分布在前额叶顶叶网络结构中,但是其分布并非无处不在。正如研究者们所言:“尽管有分布特性,但一般智力因素和执行功能的神经基质是高度受限的,主要集中在白质的中心并形成了一个狭窄的亚单位。”52
图10-4[37] 一般智力和执行功能的综合结构
资料来源:A.K.Barbey, R.Colom, J.Solomon, F.Krueger, C.Forbes, and J.Grafman,“An Integrative Architecture for General Intelligence and Executive Function Revealed by Lesion Mapping,”Brain 135(2012):1154-1164.经许可使用。
这一点很重要。一方面,一般智力因素不应该与整个前额叶皮层等同起来。前额叶包括数十亿个彼此相连的神经细胞,联结神经细胞的突触以万亿计。前额叶皮层的所有区域都彼此紧密联结(也与大脑许多其他区域相联结),但是一般智力因素似乎主要与外侧前额叶区域的活动有关,而外侧前额叶位于大脑的最外沿。巴比及其同事没有测量情绪的自律、有奖励价值的学习、空想、即兴创作、情绪智力或是社会推理。如果他们测量了这些内容,那么很可能会发现前额叶区(位于大脑中心)的中部区域发挥着更大的作用,而且会发现负责情绪功能的大脑皮层下区域之间有更多的联系(见第12章)。53
同样,一般智力因素与各项执行功能之间的关系不是同等的。人类的执行功能多种多样,包括工作记忆、心理灵活性以及抑制等方面。尽管这些执行功能彼此高度相关,但它们在功能上有很大差异。54在分析的发展水平上可以找到有力证明,内奥米·弗里德曼(Naomi Friedman)和同事发现,在人类行为控制发展变得更佳的4个阶段(14个月、20个月、24个月和36个月),心理灵活性却下降了。55在整个执行功能中,一般智力因素似乎与和工作记忆有关的功能最为相关。56
不过,前额叶顶叶网络结构的发现让我们得以观察对陌生目标导向问题的解决十分关键的信息加工过程。巴比及其同事认为,前额叶顶叶网络结构的一个重要功能就是神经活动分布模式的操纵、整合和控制,这种活动遍及整个大脑,包括低层次感官和运动模块。我们已经讨论过一部分前额叶顶叶网络结构功能(如目标维护、注意力控制、工作记忆信息更新、忽略干扰、关系复杂度),但是我认为前额叶顶叶网络结构最重要的功能之一——理解一般智力因素却常常被忽略。
认知策略也在发挥作用
丹尼尔·博尔(Daniel Bor)最近写了一本书——《贪婪的大脑》(The Ravenous Brain),书中提出,意识是信息加工的一种形式。57博尔特别表示,意识加工的信息都是有用的,与具体目标有关并且捕捉到了一些世界的模式。为了让自己的观点令人信服,博尔将前额叶顶叶网络结构、相关的工作记忆以及注意力控制功能与意识相连。尽管注意力和意识不是一回事,但是博尔认为,作为一种选择内容和参与刺激的方法,注意力是意识所必需的一个方面。
博尔的探索还在继续。他引用了许多研究,这些研究表明意元集组强烈地活化了前额叶顶叶网络结构,有时候作用大于工作记忆。58
天赋实验
看看博尔和阿德里安·欧文(Adrian Owen)所做的一项精彩研究。59他们要求被试记住一些非言语的双位数字序列。关键在于,这些信息不是随机安排的。例如,“57、68、79、90”这组数字是有意安排的,因为相邻的两个数字都相差11,但是“31、24、89、65”就不是有意安排的数字序列了,因为这样做你便不能使用意元集组轻松地记住这个序列。他们还有一个帮助记忆的条件,在这个条件下,被试可以使用早些时候记下来的电话分机号码。研究结果是什么呢?
果不其然,加工经过安排的信息时,被试的成绩要比加工随机信息时更好,因为被试可以将信息分割成更容易记忆的形式。同时,与之前的研究相一致,在经过安排的以及可使用助记条件的状况下,前额叶顶叶网络结构(主要以背外侧前额叶皮层和后顶叶之间的交流组成)比起完全随机不能使用意元集组时要更加活跃。[38]最有趣的是,与处理完全随机及使用助记条件的数字序列相比,处理经过安排的数列时,前额叶顶叶网络结构总是最活跃的。
这很有趣,因为比起经过设计的测验,未经安排的序列更难记忆,而且对工作记忆的要求更高。博尔认为,这些发现表明“前额叶顶叶网络结构会因为许多复杂任务而激活,但是当主体积极搜索并完全处于寻找新模式的状态下时,它会进入最为兴奋的状态”。60
博尔提出了一种非常有趣的可能,即意元集组是前额叶顶叶网络结构的大部分中心功能之一,而且也许是为复杂陌生问题提供创新性解决方案而进化出来的。
即便博尔没有细致地阐述其中的联系,我也认为他的理论能帮助我们更好地理解一般智力因素。或许,那些在一般智力因素测试上获得高分的人的基本特征之一便是:当有一个具体目标的时候,他们能够迅速专注于任务相关的方面,忽略不相关的方面并找到有效途径来组织工作记忆里的信息,以便将更多的资源用于流体推理。斯皮尔曼假设认为,测试一般智力因素的最好方法需要测量到领会事物间的关系、推断规则、锁定相似点和不同点,以及脱离复杂模式中的相互关系。流体推理任务看起来确实是在测量这些技巧,但是流体推理对工作记忆造成了较大的压力,因为你必须不借助于外部的帮助完全在头脑中进行推理,而时间往往是很紧迫的。有些人具有更好的认知策略,从而可以减少认知负担,他们在测试环境下有着显著的认知优势。如果这是真的,我认为这些研究会使一般智力因素的科学研究(强调认知效率)和专业技能表现框架(强调高效的意元集组策略)之间结合得更为紧密。
我在做自己的博士论文研究时,首先注意到了认知策略的重要性。61为了测量一般智力因素,我做了三个高度相关的认知能力测试:瑞文推理测验、言语类比推理以及心理旋转。我发现,工作记忆、加工速度以及有复杂联系的刻意学习都各自独立地与一般智力因素高度相关。在这个实验结尾的采访中,一些被试告诉我,他们努力使用记忆术策略来记住联想测试中的单词。我只是把这当作一个有趣的现象记住了。
最近,我偶然发现了一项研究,研究者是其基鲁提加·南达戈帕尔、罗伊·罗林(Roy Roring)、安德斯·埃里克松(K.Anders Ericsson)和珍妮特·泰勒(Jeanette Taylor)。在测试时,他们让一些双胞胎边想边说。这些测试包括联想学习、工作记忆以及加工速度,这些也是我的研究中所测试的技能。62他们发现,这三项认知测试都受到策略的严重影响。最具说服力的是,联想学习任务(这种任务最经得起策略使用的考验)中策略使用的不同,解释了测试表现中大量的基因影响。这项研究结果首次证明了认知测试中所呈现的遗传性部分是因为具体认知策略的使用。
提升测试表现的策略的使用与将一般智力因素与神经效率相联系的研究保持了一致。认知消耗了大脑中的大量葡萄糖,随着任务变得越来越自动化,我们所需要的认知资源也就越来越少。大量研究表明,智商测验分数高的人能够更快地将正确的大脑资源运用到正确的任务上。
天赋实验
来看一下海尔及其同事早期使用PET进行的一项研究。他们让8名参与者玩了50天的俄罗斯方块。63研究开始时,俄罗斯方块刚刚被引进美国,所以参与者对这款游戏并不熟悉。研究者们发现,瑞文推理测验得分最高的参与者在玩这款游戏时大脑活动下降最多,前额叶和扣带皮层区域的活动减少尤为明显。
最近,使用功能性磁共振成像的新研究一般支持这样一个观点:在认知测试中成绩优秀的人解决陌生且复杂的问题时所消耗的大脑资源比较少。[39]尽管这些发现一般被说成是“聪明的人”拥有更多的“有效才智”,但我认为更精确的表述应该是“善于流体推理”的人“能够更快速地通过有效认知策略的使用,以挪出更多宝贵的大脑资源”。我承认这种定义很拗口,但是我觉得这么说才更准确。
重要的是,不同的人可以使用不同的策略来解决同一个问题。64比如说,一些人可能更依赖他们的言语能力来解决言语和空间问题,而其他人可能会全盘地使用空间策略。有证据表明,事实就是如此。在一项言语加工速度测试中,埃里克·赖希勒(Erik Reichle)和同事发现,言语策略的使用在与语言有关的大脑皮层区域(如布洛卡区)会带来更多的脑部活动,而视觉-空间策略的使用则在视觉-空间区域(如顶叶皮层区域)带来更多的活动。65
拥有更优秀的言语工作记忆技巧的人使用言语策略时,在语言相关区域显示的活动比较少,而拥有更优秀的心理旋转技巧的人在使用视觉-空间策略时,在大脑视觉-空间区域显示的活动比较少。于是,研究者得出结论:认知策略之所以有用,是因为认知策略能够将认知负担最小化。
如果人们可以使用不同的大脑区域来解决相同的陌生且复杂的问题,也许“一般智力因素在大脑中的什么地方”这样的问题就失去意义了。66罗吉尔·基维特(Rogier Kievit)和同事最近的一项研究体现了这个观点。67他们进行测试的项目包括言语理解、知觉组织、工作记忆以及加工速度。他们还对参与者做了磁共振成像扫描并估计了他们的白质水平、灰质密度和8个大脑兴趣区的容量。之前的研究显示,这8个大脑兴趣区与一般智力因素相关。他们发现,即便被试的神经构成很不相同,他们依旧可以拥有相近的一般智力因素得分。这些发现十分重要,因为它们表明这些测试掩盖了一个事实,即通过不同的神经途径,每个人都可以获得一样的一般智力因素得分。68
此外,基维特和同事还发现,大脑结构的个体差异决定了一般智力因素的个体差异。换句话说,一般智力因素与意识一样,是大脑自然发生的属性,而不是一种单一的特征。这一发现与近期的一些研究相一致,这些研究发现,正向复写在很大程度上是多种专门大脑区域重叠的自然发生的结果。69正如克里斯蒂娜·拉巴利亚(Christina Rabaglia,目前正在与加里·马库斯和肖恩·莱恩[Sean Lane]合作,就这个课题展开研究)对我所说:“个体认知任务都需要从大脑的共有资源中(这种共有资源可在各种任务中重复使用)获得一套特定的独特的神经资源。同样,这些任务中所表现出的个体差异也是相关的,即便特定的神经资源也有其规定的功能。”
尽管这些发现并没有否定正向复写(从数据上看,智商测验优秀的人更可能在其他项目上发挥优秀)的存在,但是这些发现表明,如果要测试一般智力因素,最好测试多元的认知技巧,而不是观察任何个体的大脑并试图估计其一般智力因素等级(或是智商测验的得分)。
这些发现都与安·范德马斯(Han van der Maas)和同事最近的一项研究相一致。70根据他们的智力动态模型,一般智力因素是多个独立心理过程自然发展的属性,这些心理过程在整个发展过程中有益互动并相互增强。这一研究振奋人心,因为它把我们的认识层次从对个体差异的理解转移到对个体终身智力技能发展的差异上来了。
不要忽略大脑的可塑性
在儿童时期和青春期,大脑的成熟很容易受到可塑性和变化的影响。与成人时期相比,儿童时期大脑的体积和智商的关系更小,而智商与大脑发展的关系很复杂。一项研究跟踪调查了300名儿童直至成年,717岁时,智商更高(IQ>120)的儿童的大脑皮层厚度较薄,然而很快,高智商儿童的皮层厚度迅速增加,超过其他儿童并在11~12岁达到顶峰,然后再慢慢下降到一般水平。
研究者们得出结论:“任何年龄的‘聪明’儿童都并非是仅仅凭借灰质的多或少而变得聪明的。而应该说,智力与大脑皮层成熟的动态属性有关。”
毫无疑问,基因在很大程度上影响了大脑结构的发展,72但是基因和大脑皮层成熟之间的联系并不一定是直接的。由于前额叶顶叶的大脑连接,高智商的儿童可能会有不一样的表现,并且会引起别人的不同反应,这些反应反过来又塑造了他们的大脑。多种领域的许多项研究表明,大脑中灰质和白质结构都很重要。73
天赋实验
一些人学习杂耍长达3个月,他们大脑中与视觉运动协调、抓取动作相关的区域的灰质量就明显增多。74事实上,学习杂耍7天就可以观察到学习者大脑灰质变得更加可塑。学习杂耍3个月,就可以观察到其潜在的白质路径组织发生变化。同样,对专职驾驶员的研究发现,这些驾驶员有着更大、更靠后的海马区,这块区域对于空间导航十分关键,而且据研究,正念冥想训练也能改变向内的注意力的皮层代表区。75
研究表明,从事音乐的人的大脑具有很强的可塑性。76专业音乐家拥有更多的灰质,他们的听觉、躯体感觉以及运动皮层的厚度也更大,这些是多年从事音乐工作产生的结果。另外,早期能力也发挥着重要的作用。有研究表明,在熟练的弦乐器演奏者的大脑中,代表左手的皮层显示出更多的神经差异,而这些差异与他们初次演奏这种乐器的年龄高度相关。77这种年龄产生的作用似乎可以很具体:萨拉·本特松(Sara Bengtsson)、弗雷德里克·乌伦(Fredrik Ullen)和同事确定了一些大脑区域,在这些区域,白质与青少年特定时期的钢琴练习量直接相关。78与此类似,克里斯塔·海德(Krista Hyde)及其同事发现,连续一年每周进行半小时的键盘打字练习,5~6岁儿童的大脑结构发生了许多变化。79
近来的研究还发现了与认知能力相联系的大脑可塑性。光竹内(Hikaru Takeuchi)及其同事发现,工作记忆训练能导致大脑结构性连接出现可测的变化。而这种结构性连接对工作记忆的表现十分关键,出现这种变化的区域包括顶叶区域和胼胝体主体的前部。80在最近的一项研究中,阿利森·麦基(Allyson Mackey)、克里斯蒂·惠特克(Kristie Whitaker)和西尔维娅·邦奇(Silvia Bunge)对一些参加法学院入学考试课程的参与者进行了推理训练,仅过了3个月,他们便发现参与者的大脑额叶和顶叶结构的白质具有了可塑性。81
除了大脑的变化,工作记忆训练也能使行为发生变化。多项研究表明,工作记忆训练项目会使工作记忆能力产生可靠的短期提高,而且越来越多的证据表明,流体推理训练可以短期提高流体推理技能。最强有力的证据来自Cogmed电脑训练和互动游戏。82
然而,迁移效果似乎是有限的。训练儿童的工作记忆能力会提升其他工作记忆任务的表现,但是否能够提升流体推理,证据还不清楚。[40]83反之亦然,有证据表明流体推理训练可以提升尚未经过训练的流体推理表现,但是似乎无法提升工作记忆或加工速度。同样,意料之中的是,考虑到一般智力因素反映了多种认知技能,几乎没有证据表明工作记忆训练能够改变人们一般智力因素的等级。84
很明显,目前的情况是一团糟,所以我们将不得不等待更多的研究来弄明白这些问题。同时,我有几点建议,或许能帮助人们找到问题所在。我认为要记住一点,工作记忆可通过多种形式(言语、非言语、心理旋转等)服务于流体推理的领域无关功能,但是肯定不会是情绪无关的。正如贯穿本书始终的,压力、焦虑、典型威胁都会在很大程度上影响工作记忆,并且会导致人们的前额叶顶叶网络结构瘫痪(见第7章)。这或许能部分地解释为什么同时考验人们多个方面的训练方法能给大脑训练带来最大的收益,这些训练方法包括传统武术训练和丰富的学校课程。85
一个相关的思考是训练效果的个体差异。最近一项研究发现,多巴胺转移编码的基因变异与进行训练的学龄前儿童的工作记忆和流体推理的提升有关。86尽管研究结果需要重复(样本规模小,多重比较进行校正之后,效果并不显著),但结果确实显示多巴胺在认知表现和大脑可塑性上起到了重要作用。(要了解动机和认知的作用见第6章和第12章)。
另一项近期的研究发现了人格对认知训练的作用。87认真的参与者在工作记忆训练上更加优秀,但是他们在工作记忆上的提升并没有迁移到流体推理的测量上。神经过敏(焦虑的代名词)指数高的参与者在另一项困难的工作记忆任务上得分下降,但是在比较容易的任务上得分更高。似乎在比较容易的任务中,更高水平的情绪可能是一种优势,使得参与者得以保持专注、警觉,然而在更困难的任务中,参与者们便束手无策了。因此,在思考认知训练时应当考虑到人格特质。
还有一点要注意,最需要训练的人也是最有可能受益的人。88最近,我与神经学家西尔维娅·邦奇进行了一些讨论,她表示大多数推理测验的完成只需要在工作记忆中保持和操纵少量信息的能力。所以,对已经达到了解决任务所需最低工作记忆要求的人来说,训练工作记忆不会提高他们的推理表现。工作记忆水平低,难以记住一些事项,综合、比较或排序有困难的人更可能通过训练来获得提高,因为对他们来说,工作记忆是一个瓶颈。这就是为什么一定要让人们意识到运用策略来减轻大脑负担的重要性。
菲利普·约翰逊-莱尔德(Philip Johnson-Laird)和同事认为,通过构建心理模型可以解决三段论(一种演绎推理),心理模型是前提的内在表现。89你的心理模型中的多个任务给你的工作记忆带来了很大负担,所以,你必须明智地选择你的心理模型。例如,约翰逊-莱尔德和马克·斯蒂德曼(Mark Steedman)要求参与者用以下的三段论来形容他们的心理模型:90
所有的艺术家都是养蜂人。
部分养蜂人是聪明的。
艺术家都聪明吗?
一个参与者说:“我想到屋子里都是……艺术家,而且想象他们都戴着帽子。”91你所依赖的心理模型可能完全不同。然而,你描述这个问题的方式在很大程度上决定了你是否能很好地使用信息来进行推理。如果你开始的描述不准确,你的工作记忆可能因此超载,得出的结果也就不准确,不管你进行三段论推理的水平有多高。
人们可以通过学会使用图标来描绘问题,提高推理能力。92盲人都可以创造出空间心理模型。93肯尼思·吉尔胡利(Kenneth Gilhooley)和同事曾口头描绘了一个三段论,这对工作记忆提出的要求更高了,因为参与者必须将前提记在脑子里。94但是当用投影仪展示前提时,参与者的表现更好了,因为这样他们可以从工作记忆里将前提释放出去,从而解放有限的资源来构建有效的心理模型。
在过去的10年中,约翰·斯威勒(John Sweller)和同事设计了一些指导性的方法用来减缓学生工作记忆的负担,以此激励学习、激发兴趣。95借助专业知识和工作记忆文献,他们把学习环境的复杂性与学习者进行配对,试图减少不必要的工作记忆负担,这种多余的记忆负担可能会干扰推理和学习。这样一来,认知过程便最大程度上与学习联系了起来。
最后,要考虑训练的时长。最近,在《纽约时报》登出了一篇题为《智商分数低价销售》(IQ Scores For Sale, Cheap)的文章。作者戴维·哈姆布里克(David Z.Hambrick)表达了他的怀疑,他怀疑几个小时的工作记忆训练能否让智商得到永久性且有意义的提升,96他认为没有实质的资源投入,要实现这种提高是不太可能的。哈姆布里克指出,一些幼儿园在课后培训有实质性的扩展和辅导,但是并没有带来儿童智商得分的提高,就算有了提高也不能持久。97
如果决定智商测验能力的发展原则与其他能力一样,我们为什么还要指望通过那些时长不会超过60小时的扩展训练来大幅提高这种能力呢?更何况那些只有数小时的工作记忆训练?
正如迈克尔·豪(Michael Howe)在他的《成问题的智力》(Intelligence In Question)一书中所说:“如果我们一开始假定决定智商得分的技能是平常的且是可习得的,而且获得这些技巧的过程与获得其他专长近似,那么对获得那些需要通过学习才能获得的技能要花多少时间的探索就是有意义的。”98
豪表示,训练要花费的时间不会少于在其他领域获得高层次能力所花费的时间,如音乐、国际象棋和运动等。毕竟,智商测验是以多种形式的专业知识为样本的。因此,要想建立起高水平的心理专业知识以获得智商测验的高分,需要花费的时间将达数千小时。
这并不意味着没有生物方面的因素促成认知专业知识的获得(见第11章)。一些很小的孩子,由于他们的前额叶顶叶大脑连接,在流体推理中获得了更大的奖励,所以更加有动力进行考验智力的活动,而所有这些连续不断的智力活动会积少成多。近年来,一些心理学家,包括罗伯特·斯滕伯格和戴维·洛曼,开始在任何时间点上将智商测验分数看作是一种发展专业知识或能力的措施。99
以这种观点来看,干预终止以后智商的提高不能持久没有什么可惊讶的。我们当然不指望从事音乐、下国际象棋或讲西班牙语的人在停止接触这些东西以后还能永远保持原有的水平。重复练习以及挑战才是至关重要的。100
但是智商测验分数的提高并非“干预”带来的最具现实意义的结果。正如我们在第8章里看到的,成功的干预提高了自律能力的许多方面,这些方面的技能对人们今后目标的达成更为重要。
不过,对一般智力因素的概念认识从“心理能量”转变为认知专长的多种形式,满足了一种现实意义的目的。因为这种转变,人们不再关注人们为什么在考验工作记忆的测试中有差异,而是专注于机会成熟时人们能够取得怎样的成就。对此,我们这一代还没有找到一个真正有力的证明。
费林效应:智商分数随时间的显著提高
20世纪见证了智商得分的显著提高,平均每10年提高3个百分点。这种现象被叫做“费林效应”(The Flynn effect)。101然而并非所有的智商测验得分都有同样的提高。正如我们之前所看到的,所有对认知能力的测试都会牵涉流体推理和已有的知识,但是有一些测试是更为理想的流体推理测试。21世纪,对流体推理要求最高的测试的得分提高最显著,词汇测试、短时记忆测试以及一般知识测试的提高则小得多。到底是什么导致了这些测验分数的提高呢?
在《智力是什么——超越费林效应》(What Is Intelligence?Beyond Flynn Effect)这本书中,詹姆斯·费林(James Flynn)对流体推理的提升提出了令人信服的解释。102
费林认为,我们的祖先看待世界的方式与我们十分不同。由于工业革命,科学抽象思维方式变得突出,但在那之前的人们不可能获得我们今天所接受的科学指导。工业革命带来了一套不同的要求,抽象思维充斥于所有课程,而且普通人也变得更倾向于假设性思维,做抽象概括。
今天,接受科学思维教育的机会越来越多,更多的人有机会很好地发展抽象推理能力。费林认为,许多人已经变得聪明了,而且很可能可以回答出需要运用抽象概括能力的智商测试题,但是以往的人可能会觉得这些智商题很陌生、很荒谬,所以他们会以一种习惯性的思维去对待,从而得不到高分。
天赋实验
以20世纪早期的一个真实的智商测验为例。
智商测试官:总是有雪的地方,所有的熊都是白的;新地岛总是有雪;新地岛的熊是什么颜色的?
苏联农民:我只见过黑熊,没见过的我就不知道了。
智商测试官:但是,从我说的话里可以推测出什么?
苏联农民:要是一个没去过那地方的人说的,听了这些话我也还是什么都不知道。如果有个阅历丰富的老人见过白熊而且把这事告诉了我,我才相信他的话。
这位农民来自苏联的偏远地区,接受了亚历山大·卢里亚(Alexander Luria)的采访。这位农民的思维方式在当时是很普遍的。这种思维方式牵涉基于个人经验的推理和对外物有根据的、功能性的参考。正如费林所说:“你不应该纠结于我们怎么使用某种东西或是拥有了这种东西会有怎样的好处。”103
最近,有一篇论文支持这样一种观点,即抽象推理在生长于科技发达国家中的人身上会更自然地出现。马克·福克斯(Mark Fox)和安斯利·米彻姆(Ainsley Mitchum)对瑞文推理测验中不同类型的被试解决问题的方式做了分析。104正如之前所看到的,瑞文推理测验的表现牵涉高水平的联系抽象能力。这个测验重要的一面不在于数字本身,而在于这些数字彼此之间有着怎样的联系。要确认这种模式,必须将数字的多种属性整合到工作记忆中去。
福克斯和米彻姆按照联系抽象的数量对瑞文推理测验的项目进行了分类,发现1961年的被试与2006年的相比,以高水平的联系抽象对目标进行映射的可能性比较小。并非1961年的被试没有能力解决这些问题,只是他们不习惯这样的思维方式。他们只关注图片的表面,而没有想到使用更多的抽象策略。研究者们认为,今天的被试有一种本质上不同的策略来应对测试内容:当起初的理解不能让他们自动采取这种策略时,他们知道如何在信息之间寻找类比联系。
费林效应引起了许多重大的议题。其中一个就是,费林效应支持行为和生物层面一般智力因素的发现,即一般智力因素包括多元的、互动的、认知的机制。费林效应清楚地显示出构成一般智力因素的多种认知能力能够跨越几代人“分化”。
费林效应还强调,文化对特殊形式认知专长的发展具有重要影响,例如体育运动。有证据表明,当今世界的运动记录比一个世纪以前的记录高出了至少50%。105在马拉松和游泳比赛的成绩大幅提高的今天,早期奥运会的游泳冠军只能勉强挤进高中游泳校队。1061908年,官员禁止在跳水比赛中空翻两周,因为他们觉得这么做太危险。但今天,空翻三周是优秀跳水运动员的标准技能之一!但是,如果你在同代人的高中体操队中去测量队员在多种体质测试中的表现,很可能会发现某一个一般的体质因素。107
同样的,在一代人中,一种认知能力测试成绩好的人在其他需要发挥一般智力因素的测试中也会取得好成绩。但是跨越几代后,对流体推理要求高的测试提升最为显著,因为文化更强调这种思维方式,相对于短时记忆、词汇和一般知识测试而言,这些测试跨越几代后的提升远不及流体推理测试的提升。
费林认为,今天的我们必须面对先人不曾遇到过的问题。现在我们认为这是理所当然的,但并不一定意味着我们比前人更聪明。
费林对费林效应的解释只是众多解释流体推理提升的“社会乘数”(social multiplier)之一。迪肯斯(Dickens)和费林认为,社会乘数是一种可以跨越几代人增加并产生巨大影响的社会因素。108除了越来越多的科学进步,其他因素无疑也发挥了作用,包括更好的营养、更高的识字率、更高的测试熟悉度、视频游戏、电视节目和电影情节的复杂程度、现代化、更少的传染病和寄生虫等。109
漫长探索之后
我们攻克一般智力因素了吗?虽然很多问题没有解决并且需要进一步的研究,但我认为我们至少可以从这个方面充实一下我们的大脑。在汤姆森时代,他们甚至没有讨论认知过程的术语。这就是为什么汤姆森不得不依赖于他抽象理论上的概念“关系”(bonds)。但是现代认知科学认为,真相介于斯皮尔曼和汤姆森的极端观点之间。在任何认知任务中似乎都有数量可控的可使用的认知过程,每一个认知测试都有一个不同的但是又部分重叠的人类认知的子集。这些过程彼此相关,也都与一般智力因素相关,但是没有理由证明它们是相同的心理“能量”。
这些发现的一个重大意义是,尽管一般智力因素是一个真实的统计现象,当我们对大量被试进行大范围认知能力测试的成绩进行审视时,都会发现一般智力因素的存在,但是任何个体身上都没有一般智力因素。智商测验得分最好还是看作对有限但是重要的专业知识认知形式的一个总结,牵涉流体推理、抽象整合、工作记忆、短时记忆、认知策略、心理旋转、言语理解、词汇和加工速度。当然,要对这些技能的哪一个子集进行测量取决于智商成套测验(参见第3章和第4章)。
重要的是,并非所有测试项目都能够平等地测量一般智力因素。多方研究表明,当进行一个足够大、足够多元的认知成套测验时,一般智力因素的最佳测量可能会牵涉到大量的现场操纵、整合以及工作记忆中认知过程的控制(尽管一般智力因素所有的指标都在某种程度上需要技能)。当任务对工作记忆的要求如此之高时,大脑前额叶顶叶区域会发挥重要的作用,来帮助我们找到有效的认知策略,把材料分成组块,从而减少心理负担。但是人们可以使用不同的策略来获得相同的一般智力得分,而且越来越多的证据显示,与一般智力因素最为相关的技能——工作记忆和流体推理能力,可以进行训练。尽管对于迁移的证据还不清晰,但我还是强调需要长期的认知训练干预,从而同时锁定多种认知机制以及社会和情绪功能。
尽管一般智力因素描绘了认知能力测试中个体的普遍差异,但它不能完全体现人类智力的丰富性。事实上,越来越多的证据表示,智商测验得分更高的人,正向复写开始出现问题,分散的认知描述变得更加突出。1925年,斯皮尔曼发表了一篇论文,将78个“正常的”儿童和22个“有缺陷的”儿童的12个认知成套测验成绩进行了比较。110他发现,“正常”儿童测验里的正相关度远高于“有缺陷”儿童的那一组。他把这一发现称作“效果递减法则”(the Law of Diminishing Returns)。现代科学家证实了斯皮尔曼的最初发现,但是将它称作人格分化假设(differentiation hypothesis),因为认知能力可能会随着一般智力因素的增加而更趋于差异化。111
在这一点上,我们最后可能会找到一些共同的根据。漫长探索的结尾,我想用两位智力科学家的观点来作结,这两位科学家所处年代相隔甚远,而且他们对于人类智力的看法不一,他们是查尔斯·斯皮尔曼和霍华德·加德纳。
首先,是斯皮尔曼在1925年的一篇论文中的观点:
在人类智力分布的两极之间,将会有一些表现体现出一个人天才的一面,但同时也体现出其愚蠢的一面。每个正常的男人、女人、儿童都在某些方面是天才,在另一些方面是蠢才。不管怎么说,关于天才还有什么有待发现的呢?
接下来是加德纳的话,摘自1995年他与丹尼尔·戈尔曼的谈话:
是时候开拓我们对各种才能的认识了。教育给孩子的发展带来的最大益处是帮助他向他的天赋才能适合的领域发展……我们应该少花时间给孩子们排名次,而应该多花时间帮助他们认识自己的先天才能和禀赋,并加以培养。成功的道路有许许多多条,我们赖以成功的能力也有很多很多种。112
也许他们二位的观点也没有那么不同。
