3.5 标准分数

    令人惊讶的是,所有这些知名的、利益攸关的考试,比如SAT、ACT以及智商测试,从来都不报告你的原始分数。相反,测试报告已经将那个无用的数字转换成了一个更有意义的分数,这个分数可用来和其他参加同样测试的人进行对比,从而知晓你的表现如何。一旦你理解了“标准”分,就能自己计算标准分,甚至创建自己的标准分。

    “给原始分数改头换面”[Hack #26]讨论了z分数的超能力。这些标准分数给无意义的原始分数添加了各种各样的信息。有一点非常好,那就是任何使用这本书的人都能解释z分数,并基于分数的解释信息作出决策。

    但是,当你想解读很多分数报告(比如你刚获得的SAT分数)时,却发现在任何地方都不会看到z分数,相反,你看到的是一些奇怪的自定义标准分。这种自定义的标准分只有报告分数的相应公司才使用,它有点像z分数但是和z分数有差异,这种差异足以让新手感到分数是无意义的。

    不要害怕。你可以利用下面的工具解释这些奇怪的标准分数,甚至创建自己的标准分数(当你向其他人报告你那奇怪的测试,而这项测试席卷全国时,你会像ACT先生或IQ小姐以及任何依靠测试赚钱的人一样富有)。

    3.5.1 z分数的问题

    可以确定的是,当向参加测试的人或他们的父母、大学和正考虑使用z分数的雇主汇报时,z分数存在某种缺陷阻碍了它的广泛使用。但另一方面,大多数测试公司在创建一个更有吸引力的标准分时,首先使用的是z分数,随后才报告更有吸引力的标准分。

    使用下面这个公式将原始分数转换成z分数:

    3.5 标准分数 - 图1

    正如“给原始分数改头换面”[Hack #26]里详细描述的一样,这个公式计算出的z分数往往在-3.00~+3.00,平均数是0.00,标准差是1。虽然z分数作为解释测试分数的工具非常有用,但人们看到它时,仍会由于一些原因不喜欢这些数字。

    • 它可以是负值。事实上,有一半的z分数是负值。你很难说服参加测试的人相信负分不是坏消息。
    • 0.00分是平均分!如果我无法向人们解释负分不一定是件坏事,想象一下,尝试说服父母说我们期望小比利在那个重大测试中得到0分,当他的确得了0分时我们很高兴(将会多么困难)。
    • 你能预期的最高分是3.00,并且在100个参加测试的人里只有1个人能得到那个分数。如此一来,即使在测试准备时付出相当大的努力,看起来也只是为了获得微不足道的3分!

    测量人员已经探索和发现了报告测试分数的其他标准尺度,这些标准尺度有着更令人满意的属性。诀窍是从计算z分数开始,然后将其转换到某个其他更友好的平均数和标准差的尺度上。

    3.5.2 创建和解释T分数

    z分数的一个问题是:平均数是0。把0分当做一件好事来报告,会使得一些教师、父母和学生因误解而不高兴。我们可以通过在字母表里把z移动到T的方法解决这个问题。

    T分数是对z分数的转换。转换后新分布的平均数是50,标准差是10。T分数方程式使用了后向转换方法。下面是T分数的计算公式:

    3.5 标准分数 - 图2

    所以,如果小比利在一项重大测试上的得分是平均分,那他得到了0.00的z分数,不要给他的父母报告这个吓人的分数,而是把它转换成T分数:

    3.5 标准分数 - 图3

    报告比利得到了50分。恭喜!为了使分数更有意义,一名好的教师或者学校顾问会解释说T分数得范围是20至80,其中50分是平均分。

    在一些测试报告中,相对z分数来说,T分数是个更好的备选方案。T分数不会是负值,平均数也是看起来比较可观的50分。

    3.5 标准分数 - 图4明尼苏达多项人格问卷Ⅱ(Multiphase Personality Inventory-II)是一项非常流行的、使用T分数分布报告分数结果的心理学测试,用以测量抑郁、精神分裂等。每个MMPI-Ⅱ子量表的平均分都是50,标准差是10。通过把每个子量表的分数放到同一个尺度上,你能够进行特质间的横向对比,并能建立一个分数概况(profile),从而更全面地了解参试人员。

    3.5.3 创建自定义的标准分数

    测试开发人员已经找到了其他报告标准分的方式。表3-4列出了很多知名的、利益攸关的测试,很多人参加过或将会参加这些测试。

    表3-4:常见的标准分数分布

    测试名称 典型分数范围 平均数 标准差
    z分数 -3.00~3.00 0 1
    T分数 20~80 50 10
    美国大学测试(ACT) 1~36 18 6
    SAT 200~800 500 100
    美国研究生入学考试(GRE) 200~800 500 100
    研究生管理科入学考试(GMAT) 200~800 500 100
    法学院入学考试(LAST) 120~180 150 10
    医学院入学考试(MCAT) 1~15 8 2.5
    韦氏智力量表(IQ测试) 55~145 100 15
    斯坦福比纳智力测试(IQ测试) 52~148 100 16

    因为测试分数是正态分布的,所以你可以把任意分数放在正态曲线上来解读,从而看出你的表现是否处于平均位置,是否出奇地低或高[Hack #23]。

    3.5.4 创建自己的标准分

    为了好玩,你可以按照自己的意愿,以任意平均数和标准差来创建自己的标准分。难道你不希望自己的SAT分数是350分?选择一个分布范围,然后进行分数转换吧。

    比如说,你偏爱这样一个分布:平均数是752 365,标准差是216 456。(谁不会?)我们把这个分布称作Frey分数分布。套用T分数规则,你能够把350分的SAT分数转换成Frey分数。记住,你必须首先将350分的SAT分数转化为z分数:

    3.5 标准分数 - 图5

    然后将它转换成Frey分数。

    3.5 标准分数 - 图6

    现在,427 681分是不是比350分听起来要好?因为你知道Frey分布的平均数,所以对两个分数的解释是相同的:它们依然在平均分之下,它们依然在平均数1.5个标准差下。实际上,你没有改变它,只是改变了用来描述它的数字。

    3.5.5 生效原理

    z分数的分布为:平均数是0,标准差是1。这是由我们使用的公式决定的。用一组值除以它们的标准差后,新分布的标准差是1。用分布中的每个分数减去平均数,生成的新值分布在平均数0的附近。

    如果我们希望使用的分数有我们自己选择的独特的平均数和标准差,可以对每个z分数进行反转处理,用任何我们偏好的值替代平均数0和标准差1。

    3.5.6 理解常模参照计分

    我们已经从统计学角度讨论了常模参照计分的内在特点和直观吸引力,但它不是产生有意义分数的唯一方法,也不总是最佳方法。

    正如“给原始分数改头换面”[Hack #26]中讨论的一样,当你设计计分系统并建构测试时,实际上有两种原理可供选择。

    • 常模参照计分

    驱动原理:为了更好地理解任务表现(比如参演一部电影或是参加ACT测试),应该对比某个人和其他人的表现水平。

    • 标准参照计分

    基于一系列标准来评估表现,比如知识库、一套技能、教育性目标和诊断特征。

    如果你认为常模参照方法是合理的,那么你就会想用这里介绍的工具来解释自己在这些常见标准测试上的表现。