3.6　正确提问

3.6　正确提问

如果你是一名任课教师、一位面试官，或处于任何想要测量他人理解力的情境下，那么你有多种提问方法。下面是一些测量学工具，能让你以正确的方式提出恰当的问题。

一百多年来，课堂一直是充满问题和答案的地方。除了学校，测试在工作和招聘中也越来越常见。甚至业余时间当我在聚会上遇见他人时，如果不回答我是“友好”还是“冷漠”的关系小测试，我都无法举起一杯Cosmo鸡尾酒。（我是冷漠的，想用它做点什么吗？）

很多教授必须提出好的问题或编写出好的测试：

教师在授课或一对一教学中会对学生提问，以此评估学生的理解程度；
培训师编写问题来评估研讨会的效果；
人事部主任开发标准问题来测量应聘者的技能。

评估他人的学识时，几乎所有人都会面临这样的困境：问哪种类型的问题能真正切中要害。当编写测试或设计问题来测量知识或理解程度时，会遇到两个最常见的问题，而本Hack提供了解决方案。

如何构建一个好问题？
应该问什么？

3.6.1　构建一个好问题

为了快速且高效地测量知识，很难避免把选择题作为一种问题形式。

多选题（Multiple-choice question）是一种给回答者提供问题或指导语（叫做题干），然后让他们选出正确答案或是从一系列答案选项中作出选择的题目。这种类型的题目要求人们选择（select）答案，所以有时候也被称作选项（selection item）。

为了更规范准确地编写好的选择题项，我们使用下面的例子快速入门。

这是一个选择题的例子：

谁写了《了不起的盖茨比》	选项
A. 福克纳	干扰项 1
B. 菲茨杰拉德	正确答案（参考答案） 2
C. 海明威	干扰项 3
D. 斯坦贝克	干扰项 4

1Faulkner，1897—1962，美国小说家，曾获1949年诺贝尔文学奖。——译者注

2Francis Scott Key Fitzgerald，1896—1940，美国小说家。——译者注

3Ernest Hemingway，1899—1961，美国小说家，曾获1954年诺贝尔文学奖。——译者注

4John Ernest Steinbeck，1902—1968，美国作家，曾获1962年诺贝尔文学奖。——译者注

如你所见，这个问题的每个选项都有一个名字。正确的答案称作正确答案（那怎么能算科学术语呢），错误的答案称作干扰项。

对选择题项的特征以及如何编好题项的研究并不是很多，但有一些实证研究。为了编写出好的选择题项，要遵循下面这些通过研究得出的关键项目编写指导原则。

包含3~5个选项

题目应该有足够量的答案选项，这样使猜测答案变得困难。但选项不能太多，否则会使干扰项看起来不可信或占用太多答题时间。

不要将“以上所有选项”作为选项

有些人会猜测此种选项为正确答案，并将其作为应试策略的一部分。而其他人会避免这种策略。不管哪种方式，作为一个干扰项，这样操作都是不合理的。而且，评估“以上所有选项”是否为正确答案需要应试者的分析能力，而不同应试者的此种分析能力也是各异的。此外，测量这种特殊的分析能力可能并不是测试的目标。

不要将“以上选项都不是”作为选项

这个指导原则的存在原因和上一个指导原则一样。此外，出于某个原因，教师们的确往往把“以上选项都不是”作为最可能是正确答案的选项来设置，有些学生知道这一点。

使所有选项可信

如果一个选项看起来和其他选项都不相关，而且明显可以看出它不是正确答案，那么这个选项或许来自测试未覆盖的内容，或许是教师出于幽默原因而将其加入，这样的选项不能作为干扰项。学生不会考虑这个干扰项，所以有4个选项的问题其实只有3个选项可供选择，这样猜中答案就变得更容易了。

对选项进行逻辑排序或随机排序

有些教师有这样一种倾向：编写题项的时候让某个答案选项（比如B或C）是正确答案。学生可能会在特定的教师那学到这点。此外，一些用于提高选择题测试成绩的培训课程建议将这一点作为一种应试策略。教师可以通过把选项基于某个规则（比如，从最短到最长、按字母、按时间先后排列）进行排列的方法来控制自己的倾向。

排序问题的另外一个解决方案是：教师在他们的文字处理器上滚动测试的初稿，尝试对选项随机化处理。当然，对于商业标准化测试开发人员来说，计算机随机化也是一个解决方案。

使题干长于选项

如果阅读主体在题干，随后紧跟简短的选项，那么答题速度会变得更快。

长题干后跟着短选项，使参加测试的人员处理起来更加容易，一个好的选择题项看起来应该是这样的： ======================================= ====================== ====================== ====================== ======================

不要使用否定词

有些学生比其他学生读得更仔细或在文字处理上更准确，但“不是”（not）这个词还是很容易被忽视。即使这个词被强调到每个人都不会忽视它，但教育内容往往不应该作为非事实或错误陈述集来习得，而应该作为积极的措辞真相来存储。

让选项和题干语法一致

比如，如果题干中使用的语法很清楚地表明正确答案是女性或是复数，那确保所有的选项都是女性或复数。

使用整句表述题干

如果一个题干是完整的以问号结束的问题，或是一个完整的以句号结尾的指导语，那学生能在检验选项之前就开始识别答案。如果题干是以空白或冒号结尾，或者说它只是一个不完整的句子，那么学生需要花费更多的精力来处理此题目。而更多的处理提高了错误的几率。

3.6.2　在正确水平上提问

创建测试时必须要克服的第二个主要问题是：确认所问问题的正确水平。有些问题是简单的，它们只评估某个人的信息再认能力，这种能力代表非常低的知识水平。其他问题更难一点，需要答题者结合现有知识或是将其应用到新问题或情境中。因为不同水平的问题测量不同水平的理解力，如果想从企业获得有用的东西，就必须在正确的水平上提出正确的问题。

有一个聪明的教育研究人员，名叫本杰明·布鲁姆（Benjamin Bloom），他在20世纪50年代提出了一种思考问题的方法，以及正确回答问题所需的理解水平。他的分类体系后来发展成有名的“布鲁姆分类法”（Bloom's Taxonomy），是一种基于达成某种成就或掌握某种技能所需理解水平的教育目标分类体系。布鲁姆和他的同事给出了学习过程中6种不同的认知阶段。按顺序由低到高排列，分别是：

1.知识

词汇、事实和概念的回忆能力；

2.理解

理解话题和交流话题的能力；

3.应用

使用广义知识解决不熟悉问题的能力；

4.分析

将观点分解并理解它们之间关系的能力；

5.综合

从已有知识创建一个新模式或观念的能力；

6.评估

对新观念的价值作出有根据的判断的能力。

选择正确的认知水平

我们以教师为例，说明如何分析你想问的问题的水平。教师为课堂目标选择合适的认知水平，质量评估的目的是衡量这些课堂目标的达成程度。教师编写的大多数项目，以及那些课本、教材自带的预先编好的测试，都处于知识水平。大多数研究人员认为这是不成功的，因为课堂目标的认知水平应该（总是）高于简单记忆信息所需的认知水平。

当新教材被引进时（从学前到高级专业训练的任何阶段），至少要评估是否从中学到了基本的新知识。当教师决定不仅仅测量知识水平时，对项目合适水平的选择取决于学生的发展水平。学生的认知水平，尤其是抽象思考和理解的能力，以及他们使用多个步骤解决问题的能力，决定了课堂目标的最佳水平，因此，也决定了测试项目的最佳水平。研究人员认为，教师应该以他们教课的方式，来测试他们所教授的内容。

所以，任何时候，只要你发现你想评估藏在某人脑袋中的知识，就想想你希望评估的理解力水平。基本的记忆性知识足够吗？如果足够的话，那么知识水平就是问题的合适水平。你想知道应聘者是否能够使用他的知识来解决他从未遇到过的问题吗？那就在应用水平上进行提问，他不得不证明他是否具有那种能力。

在不同认知水平设计问题

遵循表3-5的指导原则，在布鲁姆分类法的每个水平创建项目或任务。

表3-5：不同认知水平的问题

布鲁姆水平	问题特征	问题或任务示例
知识	只需要死记硬背能力，例如回忆、再认和复述技能	谁写了《了不起的盖茨比》； A. 福克纳；B. 菲茨杰拉德；C.海明威；D. 斯坦贝克
理解	需要释义、归纳和解释等技能	什么是卷尾
应用	需要运算和解决问题等技能，包含使用、计算和产生的词语	如果一个农民原来有40英亩地，又买了16英亩地，那么现在他有多少英亩地
分析	需要列提纲、听、逻辑和观察等技能，包含确认和分解的词语	画出你邻里的地图并确认每一家
综合	需要组织和设计的技能，包含对比和比较的词语	基于你对人物角色的理解，描述《献给阿杰尔农的花》（ Flowers for Algernon）的续集会是怎样
评估	需要批判和形成观点等技能，包含支持和解释的词语	哪位音乐电影表演家可能是最佳运动员？解释你的答案

布鲁姆分类法的适用范围

布鲁姆分类法暗含一个等级关系：知识代表认知的最简单水平，评估代表认知的最高和最复杂水平。任何通过编写问题来评估知识的人能够在任意给定水平上编写项目。教师能够确认所选课堂的目标水平，创建和此水平匹配的评估。利用客观计分的项目形式，非常容易达到布鲁姆分类法的低级水平，在更高水平上进行测量会难一些，但也并非不可能。

你不必对布鲁姆定义的6个水平之间的细微差别有太多担心。比如，理解和应用通常被看作同义词，因为应用是指应用所学知识的能力，而这种能力也意味着理解。现如今，大多数测试理论家和任课教师都非常关注知识水平和其他水平之间的差别。大多数教师，除了在全新领域的引入阶段，都更偏爱于教授和测量高于知识水平的目标。

3.6.3　参阅

这是我和其他同事合写的学术论文： Frey, B.B., Petersen, S.E., Edwards, L.M., Pedrotti, J.T., and Peyton, V. (2005). “Item-writing rules: Collective wisdom.” Teaching and Teacher Education, 21, 357-364（中文书名《教学与教师教育》）。
项目编写规则回顾，可参阅： Haladyna, T.M., Downing, S.M., and Rodriguez, M.C. (2002). “A review of multiple-choice item-writing guidelines for classroom assessment.” Applied Measurement in Education, 15(3), 309-334。
具有影响力的布鲁姆分类法介绍： B.S. (Ed.). (1956). Taxonomy of educational objectives: The classification of educational goals. Handbook 1. Cognitive domain. New York: McKay。
Bloom, B.S., Hastings, J.T., and Madaus, G.F. (1971). Handbook on formative and summative evaluation of student learning. New York: McGraw-Hill。
Phye, G.D.(1997). Handbook of classroom assessment: Learning, adjustment, and achievement. San Diego, CA: Academic Press。

3.6 正确提问