统计数据会说谎
上QQ阅读APP看书,第一时间看更新

引言

我的岳父从艾奥瓦州搬到加利福尼亚州没几天,就对我说:“这个地方的犯罪事件太多了!”他所读的报纸的确报道了许多犯罪事件。这份报纸从不放过报道当地的任何一起犯罪事件,而且以注重报道谋杀案闻名,其详尽程度超过了艾奥瓦州的任何一家大型报社。

我岳父的这一结论属于非正式统计。这个统计基于一个明显带有偏差的样本。与其他许多较为规范的统计一样,这个统计也存在虚假的成分。因为这个统计认为报纸上报道犯罪事件版面的大小是衡量犯罪率高低的标准。

几年前,十几位调查人员分别发表了一份关于抗组胺剂药物的报告。每份报告都表明,服用该药物后感冒会明显好转。紧接着就是各种各样的渲染,至少广告商是这么干的,于是这种药物被大量生产。造成这一结果的原因是人们一直对药物有着大量需求,也从未越过统计学去了解自己早已知道的事实。正如亨利·G·费尔森(Henry G. Felsen,他是一位幽默作家,但绝不是医学专家)很久以前所说的,适当的治疗可使感冒在七天之内痊愈,但如果任其自然发展,感冒则会持续一个星期。

那么,你读到和听到的事情大多也是如此。那些平均数、各种关系、趋势图以及图表并不总是一致。你所看见的未必是真实情况,事实上这些数据要么被过于夸大,要么被隐瞒。

在如今用事实说话的社会中,统计这种神秘的语言是如此诱人,但它却被人弄成了耸人听闻、华而不实、迷惑不清且过分简单的东西。在报道社会和经济趋势、商业状况、民意调查、普查时要用到大量数据,此时统计方法和术语就不可或缺。但是,如果作者们不能诚实报道甚至根本没有理解这些统计词汇,读者也就无法明白作者所说的内容,那么这些统计结果就只能是无稽之谈。

如今科普读物很受欢迎,但这些书籍往往滥用统计数据,这让人联想到这样一幅场景:灯光昏暗的实验室里,一个穿着白大褂的人忙得天昏地暗,还没有加班费,正如“加一点粉末,再加一点颜料”,这样的统计数据把许多重要的事实搞得面目全非。一个精心包装过的统计结果比希特勒的弥天大谎还要厉害,因为它虽然误导了你,但你还没法去指责它。

在教人如何用统计“行骗”的同类书籍中,这本书只能算是初级读本。它看起来像是一本“骗子指南”。也许我可以为这本书稍做辩解:这就好比一个洗手不干的窃贼出了一本回忆录,书中描述了如何能不出声地撬开门锁,其水平之高让研究生都佩服。既然“骗子”都已经熟练掌握了这些诡计,老实人又怎能不学来用于自卫呢?