3.4 给原始分数改头换面

    测试的原始分数意义不大甚至没有意义。但是,将可怜的原始分数转化成“z分数”后,你几乎难以相信有多少信息被塞进了这个小小的超级数字里。

    那个直接获得且显而易见的原始分数(比如高中测试分数),传达的信息量非常少,这令人震惊。比如下面的例子。如果我从学校回家告诉妈妈我今天在学校的一项重要测试中得了16分,她可能会说些什么,比如“你42岁了,为什么还住在我家里?”以及“不错,亲爱的。16分算好的吗?”

    当你只是告诉某人一个原始分数时,被分享的真实信息非常少。你不知道16是否算一个不错的成绩。你也不知道16是相对高还是相对低的分数。有很多人得到16分甚至更高的分数吗?还是很多人获得了低于16的分数?即便我们知道测试分数的分布范围和所有可能的分数等信息,也依然无法将这次测试的分数表现和过去测试或下次测试的分数表现进行对比,也不能和其他学科的分数对比。原始分数实际上是没有意义的。

    不要烦恼!你依然能够知道你以及其他人的表现。你依然能够作出选择,并透过人和测试进行表现比较。依然有希望!

    原始分数可以被转变成一个能做所有事情的新分数,那是97磅这种无能的原始分数永远都做不了的。原始分数能被转换成一个超级数字:z分数。不像原始分数,z分数会告诉你,你的表现是高于还是低于平均水平,并且会告诉你高于或低于平均水平的程度。z分数还能使你进行不同测试和事件的对比,甚至对比不同的人。

    3.4.1 计算z分数

    可以通过一种方式将原始分数转换为z分数,那么新的数字表示原始分数高于或低于平均数的程度。

    下面是公式:

    3.4 给原始分数改头换面 - 图1

    为了将原始分数转换成z分数,先用原始分数减去平均数,然后除以标准差。分布的标准差是每个分数和平均数距离的平均[Hack #2]。

    3.4.2 理解表现

    z分数的值通常介于-3至3之间。仔细检查方程式顶部,你也许会注意到以下内容:

    • 如果原始分数比平均数大,那么z分数为正;
    • 如果原始分数比平均数小,那么z分数为负;
    • 如果原始分数正好等于平均数,那么z分数为0。

    3.4 给原始分数改头换面 - 图2z分数的值往往介于-3至3之间,因为分数的正态分布通常刚好是6个标准差的宽度[Hack #23]。

    明智的测量专业人员在报告结果时会使用z分数技巧。你看到的全都是基于z分数的分数,通常称为标准分数[Hack #27],而不是原始分数。这些标准分数有已知的稳定特征。因此,如果你知道这些分数的特征(它们的平均数和标准差),就能将它们转换回z分数,知道和其他人相比你的表现如何。

    为了说明如何使用这个法则来揭示有关你表现的隐藏信息,我们以ACT测试为例。美国很多高中生都参加美国大学入学考试(The American College Test),很多大学也将其作为录取条件。ACT是一项成就和能力测试,被认为能够预测学生在大学的表现。

    测试的每部分的分数范围都是1至36。虽然在过去几十年里,实际的测试描述性统计发生了波动(因为分数有提高),但官方报告的ACT平均数总是为18,标准差为6。想象3个学生参加ACT测试,得到3个不同的分数。我们可以用ACT分数分布的平均数和标准差将这3个分数转换成z分数,如表3-3所示。

    表3-3:将原始分数转换成z分数

    学生 ACT分数 (原始分数-平均数)/标准差 z分数
    扎克 14 (14-18)/6=-4/6 -0.67
    泰勒 18 (18-18)/6=0/6 0.00
    艾萨克 24 (24-18)/6=6/6 1.00

    扎克的z分数是负的,所以我们知道他的得分低于平均水平。他的得分低于平均数大概2/3个标准差。泰勒的z分数是0.00,表示和过去这些年参加ACT的其他人相比,他的表现处于平均水平。艾萨克做得最好,得到高于平均数1个标准差的分数。

    3.4 给原始分数改头换面 - 图3每年举行测试的时候,实际的ACT平均数和标准差都会改变。过去几年真正的平均数和标准差大约是21和4.5。

    3.4.3 确认你表现的稀有性

    虽然知道和其他参加测试的人相比你的得分情况,比只知道一个原始分数更有用,但z分数真正的解释力来自于它和正态曲线的关系。图3-3是一张正态分布图,和“看万物的形状”[Hack #23]里展示的图相似。

    “看万物的形状”[Hack #23]里展示的图和这个图的差异在于:图3-3将这些值作为z分数展示,而不是展示每个标准差离平均数的距离。通过使用正态曲线下区域的知识,你甚至能从z分数中学到更多的知识。如果分数是正态分布的,那么你可以就分数在某个区间出现的概率这一话题侃侃而谈了。

    3.4 给原始分数改头换面 - 图4

    图3-3:z分数和正态曲线

    表3-3中展示的分数同样能被解释为相比这名学生,表现更好或更差的学生人数。泰勒的z分数为0.00,这意味着他的表现比50%的学生要好。同样能够将学生的分数表述成概率。如泰勒有50%的几率会得到0.00或更好的z分数。在任意测试中,学生只有16%的几率能得到1.00或更高的z分数,所以相比其他参加测试的人来说,艾萨克做得很好。

    3.4.4 生效原理

    将原始分数转换成z分数后,我们就能和其他人进行对比了,你可能觉得这是合理的,其实不止你一个人这样认为。在过去的关于教育测量领域的100年里,社会学家(以及任何必须评估人类表现的人)一直被常模参照(norm-referenced)解释的简洁性吸引。即使不确定测试分数的真正含义,我们至少能将你的分数和其他人的情况做对比。不管我们测量的是什么,我们至少能够知道你所拥有的比其他人更多还是更少。

    另一种用来解释教育和心理分数的方法是标准参照(criterion-referenced)。这种方法需要知道更多的有关我们已测量的特质或内容的信息,并且在事前就要确定需要多少信息量。标准参照测量使得每个人都能获得同样的分数,只要他们满足同样的标准。前一种方法(常模参照)以前是并且一直是最受欢迎的解释方法,而后一种方法(标准参照)才刚刚起步。