3.2 计算百分位
理解测试成绩的一个简单而有效的方法是使用百分等级。下面讲解如何获取几乎没有解释价值的原始分数,并将其转换得更具信息量和价值。
在学校里,教师(或是顾问,或是任何报告标准测试结果的人)或许向你报告过结果,但从未报告过你的分数。取而代之的是,你可能看到一个看起来像百分比的数字,这个数字用来描述和其他参加测试的人相比,你(或你的孩子)的表现如何。这种类型的分数称作百分等级。
如果你得到了一个代表自己测试表现的百分等级,那么只有在你知道其含义的情况下,这个百分等级才是有用的。另一方面,如果你必须向参加测试的人员解释其测试成绩,而你仅仅展示了一个原始分数,那么这种展示是没有意义的。建立或解释百分等级是一项对测试双方(参加测试的人和解释测试成绩的人)都非常有用的技能。
常模参照计分[Hack #26]是一种通过和其他分数进行对比,使测试分数更具信息量的一种方法。在现实世界里,你最常见到的常模参照分数是百分等级。百分等级被定义为“分布中低于给定分数的分数的百分比”。比如,在一项有20道题的小测试中,如果你答对了15道题,班里有一半的人答对的题数没你多,那你的百分等级就是50。
3.2.1 计算和报告百分等级
如果你是一名任课教师或人力资源经理,或任何必须向其他人报告测试结果的人,报告百分等级而非原始分数能够帮助参加测试的人员理解他们的表现,同样也能够帮助决策者理解设定不同表现标准的重要性。
- 整理你的数据
计算百分位首先要整理你所有的测试分数。对于小数据集合,建立一个频次表非常简单,这个频次表除了能提供百分等级,还能回答各种问题。 下面是一个课堂测试中30个分数的样本分布(由最低到最高排列),100分是最高分:
59、65、72、75、75、75、80、83、83、85、85、85、85、85、85、86、86、86、86、88、88、88、90、90、90、90、90、92、94、97
- 计算频次和百分位
为高效起见,可按表3-1展示这些数据,并计算每个分数的频次。
表3-1:课堂测试累计频次表
| 分数 | 频次 | 累计频次 | 百分比 | 累计百分比 |
|---|---|---|---|---|
| 59 | 1 | 1 | 3.33% | 3.33% |
| 65 | 1 | 2 | 3.33% | 6.67% |
| 72 | 1 | 3 | 3.33% | 10.00% |
| 75 | 3 | 6 | 10.00% | 20.00% |
| 80 | 1 | 7 | 3.33% | 23.33% |
| 83 | 2 | 9 | 6.67% | 30.00% |
| 85 | 6 | 15 | 20.00% | 50.00% |
| 86 | 4 | 19 | 13.33% | 63.33% |
| 88 | 3 | 22 | 10.00% | 73.33% |
| 90 | 5 | 27 | 16.67% | 90.00% |
| 92 | 1 | 28 | 3.33% | 93.33% |
| 94 | 1 | 29 | 3.33% | 96.67% |
| 97 | 1 | 30 | 3.33% | 100.00% |
表3-1展示了参加测试的人获得了哪些分数,有多少人获得了那个分数,获得给定分数的总人数,获得分数低于给定分数的总人数,获得某个分数的人数占所有人数的百分比,获得不高于给定分数的人数的总百分比。累计频次列总是报告出分布中的(在我们例子中是30人)总人数(或分数),以及人数总的百分比(总是100%)。
- 计算百分等级
为了计算分布中任意分数的百分等级,需要使用“累计百分比”一列。找到感兴趣的分数,查看其所在行的上一行对应的累计百分比。比如,对于94分来说,百分等级是93.33,大约是第93个百分位。86分的百分等级是50。
如果你查看一系列统计学或测量学教材,会发现,对于百分等级来说,实际上存在两种不同的、有争议的定义。我更喜欢“分布中小于感兴趣的给定分数的分数百分比”这个定义,但是有些书给出的定义是“分布中等于或小于感兴趣的给定分数的分数百分比”。两个定义都是合理的,且在这两种定义下都可以通过频次表来计算百分等级。在第一个定义下,不存在第100个百分位。在第二个定义下,不存在第0个百分位。选择并使用你偏爱的定义,但记住,在呈现结果时要和大家分享你的定义。
3.2.2 解释百分等级
想象一下你对面坐着你的指导顾问,你被告知自己的百分等级是93。那么,这代表什么意思?好吧,最直接的解释是:在所有参加测试的人中,有93%的人得到的分数比你低。这么说同样也是正确的:有7%的人分数和你一样或高于你。我们同样能够把百分等级看做分数偏离常态的距离。平均百分等级总是在第50个百分位附近,如果分数是正态分布,那么平均百分等级正好就是第50个百分位。所以,我们同样可以说第93个百分位远远高于平均百分等级。
不要犯很多精明的统计黑客有时也会犯的错误。本Hack前半部分,我们使用了一个测试分数的例子,你在一项有20道题的小测试上答对了15道题,班里有一半的人答对的题数没你多。在这个例子中,你的百分等级是50。注意,此例中,你答题的正确率是75%(15/20),但是百分等级是50。不要把这两个概念搞混了!你的百分等级无法说明你究竟答对了多少道题。
3.2.3 不适用领域
记住,只有在你寻求常模参照解释时,百分等级才是有用的。如果你想知道自己是否掌握了一系列关键技能,那么知道有多少百分比的人已经掌握了多于或少于这些的技能是毫无帮助的。为了知道和某套标准相比你所处的位置,而不是和其他人相比你所处的位置,你需要一个标准参照分数[Hack #26]。在这种情况下,正确率这一类型的分数比百分等级更有意义。
3.2.4 参阅
如果假定你的分数是正态分布的,或者说至少来自于正态分布的总体,你刚好能利用正态曲线下方区域的信息将标准分数直接转换成百分等级[Hack #25]。
