2.12 避开邪恶坐标轴
图形是表现数量、相关和研究结果的有力工具。但是,如果落入坏人手中,图形可能被用于欺骗目的。选择你的命运,年轻的卢克(或者年轻的阿纳金——如果你还不满25岁的话)3,切勿堕入黑暗面。
3天行者卢克和天行者阿纳金是美国科幻电影《星球大战》中的两位正面人物。——译者注
曾几何时,除了科学家、工程师和数学家以外没有人会关注图表。然而随着越来越多的新闻媒体瞄准大众市场,对数字信息的可视化呈现变得日益普遍。就拿昨天出版的《今日美国》(USA Today)杂志来说吧,其中至少包含了一打图表。
在商业会议上,也经常用图表来交流信息和论证所取得的成功(或失败)。如果创建图表时不够仔细,那么,一些看似随意的选择就会影响对信息的解释。你无需改变数据,就能改变数据的含义。
所以,在创建图表时,如果你想避免操纵受众,或者只想指出某个带有误导性的图表(不管这种误导有意还是无意的),那么不妨使用此项Hack来帮助你有效创建和解释图表。
2.12.1 选择可靠的图表
为了理解正确的和错误的绘图选项,首先需要介绍一些绘图的基础知识。图表中有各种各样的元素,通过操纵这些元素,可以正确地引导他人,也能造成误导。
典型的图表有两个坐标轴,因为它们描述了两个不同的变量。沿着底部的坐标轴称作X轴,而沿着侧边的轴叫做Y轴。
可以这么记:垂直的那个坐标轴叫做Y轴,因为这个可爱的小字母Y仿佛向上伸展着小手,垂直地指向天空。明白了吗?(欢迎来到充满创意的统计学教育领域。)
哪种图表适合(真实地)展示你测量的变量,取决于变量的测量标准[Hack #7]。你可以从三种常见的图表类型中做出选择,其中只有一种适用于你所测量的变量。
- 条形图
在图2-8中,X轴表示类别或组别,比如男性和女性。Y轴是连续变量:条形高度越高,变量Y的分值就越高。

图2-8:条形图
- 柱状图
在图2-9中,X轴表示连续的值。柱状图总是运用于以下情况:X轴表示反映内在连续变量的普通类别,比如一年中的月份,或者其他可进行有意义排序的差异性分组。它和条形图看起来相似,只不过那些条形被挤到一起,相互间没有留下空间。

图2-9:柱状图
- 折线图
在图2-10中,X轴和Y轴都是连续变量,在这个例子中,它们分别表示时间和价值。线上的点位置越高,它在Y轴上的数量就越大。

图2-10:折线图
为了选择正确的图表(即其样式具有最小欺骗性和最大直观性的图表),需要正确认定你在使用哪种类型的X变量(注意,Y在所有的样式中都是连续变量)。
- 如果X代表不同类别,而Y代表连续变量,使用条形图。
- 如果X可被看作分类变量,但是其次序仍有一定的意义,而Y是连续变量,使用柱状图。
- 如果X和Y都是连续变量,使用折线图。
2.12.2 图形暴力
绘图中的一个常见错误,通常与X轴的尺度设置有关,这也许是有意的,也许是无心之失。接下来,让我告诉你这个问题的原因,以及如何避免它。
包含两个变量的图表引入了对比——它们或者是变量之间的对比,或者是时间跨度的对比,或者是一个变量上不同值的对比。一图胜千言,就像人们常说的那样,图表是非常具有说服力的证据。无论何时,当你使用折线图或是条形图来对比数值时,只有当线的高度或条形的长度是依据某个标准的最小值来得出判断,对比结果才是准确的。这一最小值通常是零。如果图表没有依据某些合理的基准值加以校准,那么实际上极其细微的差异在图中就会显得很大。
例如,对比图2-11中的两张图。它们所表示的数据完全一样,但是你对二者的解释可能差异极大。左上角的柱状图反映了美国股票市场在过去5天的表现。注意在第5天出现了一个看上去非常恐怖的下跌。毫无疑问,惊天动地的消息在第4天末就出现了。你也许同样注意到Y轴(道琼斯指数)的起点不是零,而是9900,一个低到足以包含所有5个条形顶部的值,但那样是没有意义的。

图2-11:Y轴的威力
让我们更仔细地看看图2-11中下方的第二张图。两张图展示的数据是一样的,但是第二张图的起点是0。这张图里展示的数据可解读为,股市在过去5天出现了小幅波动,第5天的可怕下跌只是暂时性的小问题。
这两张图哪个展示了正确的情形?二者都反映了从第4天到第5天股票市场有2.8%的下跌。究竟选择哪一种,实际上有赖于图表构建者的意图及其目标受众是谁。当涉及数字或是金钱时,通常并没有一个最有意义和最公平的起点。很多报纸提供的每日股票信息采用第一张柱状图的格式。他们认为读者对细微的变动感兴趣,所以将Y轴的起点值设置得尽可能高,以能够包含在X轴上的所有数据为底线。
但是,在一个经常改变投资组合,并且频繁买卖的贪婪的投资者看来,2.8%的下跌是很严重的事情。对于这一类读者而言,能够突出显示细微变动的图表设计也许最为有效。然而,如果一名投资者抱着“长期持有”的投资战略,那么相对微小的改变是没有意义的。
为了尽可能多地了解这类图表中包含的意义,需要经常检查Y轴的起始值。这样,当你查看图中那些条柱的时候,就能感觉到X轴上的真正差异。如果你正在绘制这样的图表,不妨想一想用哪种方式展示信息最为可靠。因为你的目的是如实传递信息,而不是欺骗——应该是这样吧?
2.12.3 参阅
- 《统计数字会撒谎》(How to Lie With Statistics,作者达莱尔·哈夫,1954年纽约,Norton and Company),该书首次向公众指出了图表的骗人花招,尤其是广告里的图表。
