第四章 数字

后真相时代  作者:赫克托·麦克唐纳

只要拷问数字,它们就会承认任何罪名。

——格雷格·伊斯特布鲁克(Gregg Easterbrook)

不祥的统计量

左撇子常常遇到麻烦。土豆削皮器和剪子是为右撇子设计的。拳击课程会被“南爪子”[指的是拳击手的站位姿势。一般来说,拳击手让自己较弱的一侧突前,有利于较强的另一侧用勾拳打击对方。右撇子的拳击运动员通常采取左脚左手在前的传统站位,左撇子拳击手则相反,采用右脚右手在前的站位,人们把这种姿势称为南爪子(southpaw)。——编者注]搞乱。在支票簿或活页簿上写字会成为一项艰难的任务。在拥挤的餐桌上用左手喝汤很容易引发事故。就连不起眼的裤子拉链也对右撇子有利。

不过,当两位著名心理学家1991年发布的研究报告指出左撇子比右撇子平均早死9年时,左撇子似乎遭受了更大的打击。

加利福尼亚州立大学圣布纳迪诺分校的黛安·F.哈尔彭博士(Dr Diane F. Halpern)和不列颠哥伦比亚大学的斯坦利·科伦博士(Dr Stanley Coren)研究了1 000名加州人的死亡时间,发现右撇子的平均死亡年龄是75岁,左撇子的平均死亡年龄是66岁。在《左撇子:生存适应性下降的标志》一文中,他们声称:“左利手的一些较大风险显然来自提升他们事故发生率的环境因素。”作者的逻辑是,工具和车辆是为右撇子设计的,所以左撇子容易发生汽车或电锯事故。《纽约时报》沮丧地指出:“在20多岁的人群中,左撇子的比例是13%,但在80多岁的人群中,左撇子只占1%。”看起来,左撇子和吸烟对于健康具有同等危害。

左撇子注定早死的观念迅速传播开来。到了2013年,英国广播公司认为他们有必要重新考虑这个问题:“左撇子真的会早死吗?”

答案是否定的。这完全是胡说八道。科伦和哈尔彭误解了他们在数字中发现的真相。他们成了误传者。

我成长于宽容的20世纪70年代,当时人们积极鼓励我接受自己是左撇子。之前的人就没有这么开明了。“不祥的”和“笨拙的”左撇子受到人们的怀疑,他们被认为受到了魔鬼的触摸。左撇子遭到了回避和歧视。因此,父母会尽量将孩子培养成右撇子。用左手吃饭或写字的婴儿会迅速被纠正过来。左撇子的自然比例是10%到12%,但在19世纪和20世纪早期,被视为左撇子的人口比例要小得多。直到最近,天生的左撇子才有可能以左撇子的身份成长。

因此,在1991年,左撇子群体的平均年龄低于右撇子群体。所以,左撇子的死亡年龄应该比同时期死亡的右撇子小。我可以通过类比说明这一点。已经去世的数字土著的平均死亡年龄小于非数字土著。这一定是真的,因为所有在互联网普及时代出生的人全都低于25岁。这并不意味着数字土著的身份对健康有害。

1991年去世的左撇子的确比右撇子年轻得多。不过,这个真相受到了广泛的误解,使世界各地的左撇子产生了不必要的恐慌。事实上,年龄相同的左撇子和右撇子具有几乎相同的寿命预期,这个竞争性真相应该可以使那些仍然在为寿命而焦虑的左撇子感到安慰。

数字是神奇的。它们可以提供语言常常无法提供的关于世界的清晰度。我们可以用数字来比较、评价事物,测量变化,总结出一个人物的一系列优秀品质。数字可以被任何文化中的任何人理解。它是一种世界语言。问题在于,我们许多人在很多时候对数字存在误解。即使是两个接受过统计学培训的科学家也看不出他们自己的数字说明了什么,难怪那么多人会对数字的含义感到困惑。

这不是数学能力问题。如今,我们很少有人需要口算乘除法。你可能不知道什么是二次方程,但这没有关系。对于管理家庭预算和为负责任的政府投票的人来说,重要的是理解某个具体数字意味着什么。

由于我们许多人在看到一个统计量、一所新学校的成本或者一个群体的规模时很难知道它的真正含义,误导者可以暗示他们所希望的含义,从而影响现实。数字本应是目前最透明的沟通形式,因此它本应最不容易被人误用。不过,我们却在生活中的各个领域看到了由数字支持的竞争性真相。

苹果、橘子和芝加哥谋杀

在谈论数字之前,我们需要考察数字究竟代表了什么。吹嘘雇佣记录的企业谈论的是全职员工、合同工、无薪实习生还是等效全职工?煽动者引用的数字是移民、非法移民、经济移民还是难民?接受救济的人是失业者还是仅仅有资格获得儿童或低收入支持的人?喜欢某产品的人是全体人民中的70%,还是最近被该产品的广告轰炸过的小镇上70%的受调查者?政府统计量指的是玉米种植量还是玉米销售量,是家庭还是个体,是纳税人还是居民?这些区别之中存在着大量的调整空间,这为竞争性真相提供了机会。

加拿大和澳大利亚拥有全世界最高的儿童劫持率。是的,这是真的。这不是因为它们比墨西哥和哥伦比亚更加危险,而是因为两国政府将儿童监护权争端包含在了劫持儿童的统计数据中。类似地,瑞典的强奸率据说排在全球第二位,每年每10万居民中有60起案件报告(印度的强奸率是十万分之二)。不过,这不仅说明瑞典性犯罪的报告率较高,而且体现了更加宽泛的强奸定义。

2001年,为了支持在北极国家野生动物保护区开采石油,美国副总统迪克·切尼(Dick Cheney)声称,只有2 000英亩土地将会受到影响,其面积相当于“杜勒斯机场的1/5”。事实上,他只统计了建造“生产和支持设施”的土地,这既不包括公路和相关基础设施占用的土地,也不包括靠近钻探地点,可能打扰野生动物或污染环境的土地。此外,在建设地上管道的地区,只有支撑管道的支柱被统计到了建设面积之中,管道其余部分下方的土地被排除在外。切尼的数字极具误导性,他的提案随后被参议院驳回。

数字策略 #1

选择有利单位

当特朗普总统2017年对国会说“9 400万美国人没有工作”时,这似乎意味着所有这些人都是被动失业者。实际上,这个来自劳工统计局的数字包括所有16岁以上的学生、退休人员以及那些选择不工作的人。真实的美国失业数字——想工作但是无法获得工作职位的人——在2017年年初约为760万,不到特朗普所说数字的1/10。

类似地,当特朗普宣称“像阿富汗这样的地方比我们一些城市的中心区还要安全”时,他要么记错了,要么有意曲解了芝加哥谋杀案和美国人在阿富汗死亡人数的对比。2001年到2006年,芝加哥有记录的被害人数为7 916人。同一时期,2 384人在阿富汗遇难。阿富汗的暴力死亡总人数要高得多(一位学者估计,2001年以来,超过10万人在阿富汗被害),相对较少的美国人在阿富汗的暴力死亡率明显高于芝加哥。特朗普的说法指的是在芝加哥被害的美国人比阿富汗要多,但是生活在芝加哥的美国人要多得多。根据这种逻辑,他完全可以说,在太阳上生活更加安全。

这个数字很大吗

一款沐浴露产品的市场宣传材料称:“原始薄荷茶树沐浴露浓缩了7 927片真实薄荷叶。”数字7 927以很大的字号印在瓶子上。7 927片薄荷叶很多吗?我不知道。制作几毫升精华油需要几千朵玫瑰,所以这个数字也许并不多。不过,这款产品显然暗示了这是一个很大的数字。

在塑造品牌这一轻松背景下,这并不十分重要。不过,下面的说法呢?

我们正在雇用1000名新护士。

我们的全新送货车辆每年可以节省100万加仑燃料。

这些数字很大吗?发表这些言论的人显然想营造这样的印象。不过,在了解背景之前,我们无法做出判断。在只有大约8 000个专业护士的爱沙尼亚,新增1 000名护士是一项了不起的成就。在护士群体大约有90万人的德国,这些新人几乎不会引起人们的注意。对于UPS这种拥有十几万辆送货车的公司,每年100万加仑燃料只是一个舍入误差而已。

现在的英国年轻人买房很困难,这在很大程度上是因为“可负担”住宅的短缺。在2017年10月的一次重要演讲中,首相特蕾莎·梅宣布:“我会在首相任期内专注于解决这个问题。”她还说:“今天,我可以宣布,我们将在可负担住宅上新增20亿英镑的投资。”首相想表述一个很大的数字,但媒体迅速戳破了她的泡沫:20亿英镑(26亿美元)可以多建造2.5万套住宅,这在120万家庭排队等待分发住房的国家无异于杯水车薪。

数字策略 #2

使数字看上去变大或变小

当某人试图说服你相信一个数字特别重要时,他所做的第一件事就是将其转换成包含相关背景的更具启发性的真相。百分率往往可以比数字本身提供更多信息。道达尔对太阳能电池板制造商日能公司投资14亿美元。你感到震惊吗?不要急于预测这家法国石油天然气巨头的可再生能源革命:这笔投资只占道达尔总资产的不到1%。2015年,怀俄明的公路死亡人数只有145人,得克萨斯则有3 516人死于车辆事故。不过,对于只有58.6万人口的怀俄明来说,每10万人的年公路死亡人数是24.7。在拥挤的得克萨斯,这个数字是12.8。

2010年,电子制造商富士康的18名员工企图自杀,其中14人死亡。这个故事成了西方报纸的头条新闻,因为富士康是苹果手机以及三星、戴尔、索尼等全球品牌一系列产品的制造商。富士康和苹果立即受到了虐待劳工和工作条件不佳的指控。这些自杀事件是一场悲剧,但它们是否意味着富士康真的存在问题?该公司2010年的员工接近100万人,年自杀率约为十万分之一点五。中国的平均自杀率为十万分之二十二。换句话说,富士康的自杀率不到全国平均水平的7%。14起备受关注的死亡事件混淆了一个更加积极的竞争性真相。

奥巴马曾说过,在美国,浴缸导致的死亡人数超过了恐怖袭击。这种说法受到了批评,但是奥巴马并没有说错。根据国家安全委员会的数据,2013年,464名美国人在浴缸中溺死,1 810名美国人在天然水域溺死,903人在床上意外窒息或者被勒死,超过3万人摔死。同年,只有3个美国人在波士顿马拉松期间死于恐怖袭击——还不到浴缸死亡人数的1/100。

不过,我们也会被相对数字引入歧途。想掩饰大数字的误导者可以将其描述成某个更大数字的很小的比例。我们很容易忽视只占某个事物很小比例的事物,尽管其绝对数字可能很大。

美国非营利组织计划生育协会在其网站上宣布:“堕胎服务占计划生育协会所有卫生服务的3%。”[这句话随后被删除,但它仍然存在于2014—2015年度报告中。]根据2014—2015年度报告,该协会的绝大多数服务与性传播感染检测和治疗(45%)以及节育(31%)有关。3%这个数字使堕胎听上去像是计划生育协会的边缘活动。不过,他们是怎样得到这个数字的呢?他们的2014—2015年度报告记录了9 455 582项“服务”。其中,近100万项服务涉及应急避孕套件的提供。超过100万项服务是怀孕测试。超过350万项服务是性传播感染测试。这些服务在成本、人工和个体影响上远远无法与堕胎相比。不过,这些例行活动的巨大数字使同一年所进行的323 999次堕胎程序显得不值一提。实际上,这些堕胎[假设每次“堕胎程序”导致一次堕胎。]服务占美国所有堕胎记录的将近50%。

英国政府将国民总收入的0.7%用于海外发展援助计划。这是联合国自1970年起为发达国家设置的目标,但是只有6个国家满足了这个目标,英国就是其中之一。英国纳税人应该对于这种慷慨感到自豪吗?或者,我们的支出是否太多了?作为一个很小的比例,0.7%的国民总收入似乎是一种无害的承诺。实际上,这相当于2016年的136亿英镑(180亿美元)。这的确是一个很大的数字。它比英国政府对于大学的投入还要多,也比政府对警察的投入还要多。

一个富国每年为其他国家非常重要的卫生、营养和基础设施需求提供136亿英镑也许是合适的,但是同国民总收入的比例相比,评论家似乎很少对于这个绝对金额给予太多的考虑。在2017年英国选举期间,保守党用免费学校早餐(预计成本:6 000万英镑)取代4~7岁儿童学校午餐(预计节省:6.5亿英镑)的计划受到了没完没了的争论,但是几乎没有人讨论比这多得多的136亿英镑海外援助支出。

政客、营销人员和新闻工作者似乎觉得基本数字给我们带来的麻烦还不够多,因此他们常常使数字看上去变得更大或更小。为了削弱政府支出给人带来的印象,政客们喜欢用每日成本代替每年成本,甚至使用每个纳税人或公民的成本。皇家《每日快报》的一则新闻标题是“多么划算!王室每年只会给你带来56镑成本”(纳税人这一年花费了3 570万英镑)。一份持支持立场的报纸称,某种癌症药物“每天只需花费每位患者43英镑”。显然,该报对于这种药物为国家带来的总成本不感兴趣。一位精通数学的社会活动家宣称:“如果让每个美国人免费读4年大学,纳税人每天只需要花费70美分。”要想让数字变大,只需把时间线拉长:“政府最近确认了对自行车和步行的支持,它将在本届国会期间为此投入超过3亿英镑资金。”这听上去比每年投资6 000万英镑更加慷慨。同“加拿大在11年间每年追加投资73.6亿美元”相比,“联邦政府宣布为基础设施追加810亿美元”似乎更加激动人心。

沟通者也可以将某件事物转化成护士或热饮等无关测量单位,使其看上去更加便宜或昂贵。一位医疗保健官员最近承诺:“你可以用每周不到一杯咖啡或一块蛋糕的成本获得我们的医院治疗保险。”或者,为什么不用医院本身作为你的测量单位呢?欧洲议会疑欧派议员丹尼尔·汉南(Daniel Hannan)称,欧盟2013年浪费的资金“足以建造10座最先进的英国医院”。

且不说蛋糕和医院价格的巨大波动性,如此具有创意的金融谈话足以危险地把水搅混。一件事物的成本是它的美元、欧元或英镑价格。对于这个成本的任何改写都是竞争性真相,很可能是为了服务于某个特殊目的。

脱欧事件中的数字

有一个数字决定了英国脱欧公投。这个数字是:“英国每周向欧盟提供3.5亿英镑。”英国脱欧倡导者鲍里斯·约翰逊(Boris Johnson)甚至开着一辆侧面印有这句话的“战斗巴士”环游了英国。这是一句十足的谎言。在这本关于真相的书中,我不想对此进行更多讨论。

不过,其他一些更加真实的数字得到了巧妙的使用,以便误导大众。财政大臣乔治·奥斯本(George Osborne)用一个极为惊人的数字支持了“留欧派”。财政部发布了一份预测报告,称如果脱离欧盟,英国2030年的国内生产总值将比留在欧盟低6%。奥斯本的新闻稿是这样写的:“如果英国投票退出欧盟,英国每个家庭每年将损失4 300英镑。”

这有什么问题呢?首先,奥斯本的新闻稿使人觉得英国将比目前更加糟糕。实际上,财政部的预测显示,不管是否脱离欧盟,英国2030年的国内生产总值都要比现在高得多。更加完整诚实的标题应该是这样的:“英国将比它本应面临的情况糟糕一些,但它仍然会好于现在。”

还有家庭的问题。新闻稿暗示,每个英国家庭的支出将会减少4 300英镑。虽然它没有这样说,但是解读这份新闻稿的报纸的确是这样说的。不过,财政部在分析中谈论的并不是家庭收入——国内生产总值是一个完全不同的怪物,因为它包括公司投资和政府支出等因素。英国2015年有2 700万家庭,国内生产总值为1.869万亿英镑,平均每个家庭的国内生产总值超过6.9万英镑。2014—2015年的家庭可支配收入中值只有这个数字的1/3多一点,为25 700英镑。显然,家庭平均国内生产总值这一概念本身毫无意义。乔治·奥斯本及其财政部团队完全清楚所有这些事情。他们的标题是真实的,但它却是一个故意误导大众的真相。

其他例子

2016年,英国儿童癌症协会发布了一份令人悲伤的新闻稿:“过去16年,儿童和年轻人的患癌病例上升了40%。”这使一向冷静的《电讯报》刊登出了极为疯狂的标题:“现代生活正在杀害我们的孩子”。《电讯报》显然不知道,过去10年,英国儿童癌症死亡率下降了惊人的24%。该报引用儿童癌症协会“科学顾问”的话语,对于从家庭用电到吹风机的各种事物提出了批评。

英国儿童癌症病例数量的确出现了上升。不过,有两件事可以很好地解释这一现象。英国儿童数量在同一时期出现了增长。更多的儿童当然意味着更多的病例。此外,诊断学出现了明显的进步,更多癌症病例得到了更早的诊断和治疗;过去,儿童癌症病例直到成年以后才会得到确认,或者被统计到健康数据中。儿童癌症协会知道这两个事实,因此他们的新闻标题显然具有误导性,尽管它是真实的。另一个慈善组织英国癌症研究协会做出了更加现实的估计,认为20世纪90年代初以来的儿童患癌率增长了11%。

我们最重要的一些真相来自重要数字随时间的变化情况。社会问题正在变好还是变坏?政府支出正在增加还是减少?公司正在增长还是衰退?这些数字应该可以给出直截了当的回答。不过,误导者可能会用某个与之相关的数字讲述不同的故事。被捕青少年是否正在增长?如果人口在增长,那么青少年被捕比例可能是下降的。16岁以下的人数呢?黑人青少年的比例?由于暴力犯罪被捕的青少年数量?某座城市的青少年被捕数量?青少年惯犯?上述某个指标一定会指向合适的方向。

对于相关问题选择不同的起始年份可能会改变相关现象的真相。2011年1月,美国企业可以庆祝股市两年间的增长,因为标普500自2009年1月起上升了36%。他们也可以哀叹股市3年间的下跌,因为标普500同2008年1月相比下降了10%。

工党政治顾问兰斯·普赖斯(Lance Price)在2000年1月20日的个人日记中承认:“本周的犯罪数字非常糟糕。”普赖斯是托尼·布莱尔唐宁街团队的重要成员。“我们提前举行了一次疯狂的会议。会上,有人建设性地指出,如果剔除犯罪率上升的区域,犯罪率就会下降!我想到,我们可以将同样的原则应用于医院候诊名单。”

两年后,一群研究人员考察了工党在《工党在你的选区做了什么》一文中发布的一组统计“指标”。这些指标衡量了教育、国家医疗服务、治安和经济等领域的进步。研究人员说,“我们注意到”,工党的数字使人觉得“每个地方的每件事情似乎都在变好”。没有哪个政府能够做到如此优秀,不是吗?研究人员详细考察了每个指标,以研究工党是如何让人们觉得一切都在变好的:

如果某个指标在一个时间段里没有改善,我们就会把这个选区的时间段改成情况有所改善的时间段。各指标还具有不同的空间尺度……例如,关于犯罪数字,一些选区的指标采用了整个英格兰和威尔士的平均值,因为这些选区所在警务区域的犯罪率出现了上升。因此,在工党的网站上,工党治下所有地区的犯罪率都在下降。

看起来,唐宁街这次“疯狂的会议”转化成了严肃的沟通政策。

数字策略 #3

隐藏或夸大趋势

在图表上,误导者可以改变图像的标度,或者使用不是从0开始的轴线,从而改变真相。当你在有利的轴线上描绘数据时,下降趋势可以显得很平坦,不明显的增长也可以显得很突出。如果你所在地区可用医院床位的数量从15 134增加到15 326,这种1%的平凡增长在纵轴始于15 000的图像上将会成为一项令人瞩目的成就。

在尴尬的投资人会议上,你可以用累计销售图像掩盖主打产品糟糕的销售数字——你可以展示产品的总销量,而不是今年的销量。对误导者来说,累计图像的好处在于,它不会下降。你今年的累计销量不可能低于去年,除非你执行了非常宽松的退货政策。苹果总裁蒂姆·库克(Tim Cook)2013年展示了“苹果手机累计销售”图表,从而隐藏了两个季度的销售下降。他在一个月后对平板电脑销量进行了同样的操作,因为平板电脑销量也下降了两个季度。石英商业新闻网站总结道:“苹果要么不善于设计图表,要么认为你不会注意到这种区别。”

石英网上有一张可爱的曲线图,描绘了1820年以来海盗人数的下降和全球平均温度的上升。这种关联很神秘:随着海盗人数的下降,世界变得更加温暖。显然,公海犯罪行为的减少推动了洲际贸易,导致全球变暖!

这个结论当然很可笑。傻瓜都能看出来,这个逻辑应该颠倒过来:温度上升导致船上的朗姆酒蒸发,削弱了海盗的士气,促使他们从事更加本分的行业。

上面这段可笑的分析告诉我们,两组数据表面上的关联并不意味着它们存在某种因果关系。有人注意到,海滨度假区销售的冰激凌越多,溺水的人似乎就越多。这并不意味着冰激凌会导致致命的痉挛。当天气暖和时,人们喜欢吃冰激凌。当天气较好时,人们还喜欢游泳。冰激凌消费和溺水事件的增长没有因果关系,二者都是由第三个因素导致的。

误传者很容易落入这个陷阱。最近一个令人担忧的现象是发达国家贫穷和肥胖表面上的联系。2013年,英国公共卫生大臣安娜·苏布里(Anna Soubry)表示:“你现在几乎可以根据一个人的体重判断他的背景。”英国最贫困的儿童肥胖的可能性是最富有儿童的近两倍。这是否意味着贫穷会导致肥胖,因而会对生命造成威胁?

一些政客提出了相同的观点,并且提到了垃圾食品低廉的成本。社会活动家利用这种关联为减少贫困的政策辩护。不过,这种因果关系并不明确。廉价食品不一定富含糖分和脂肪,肥胖可能主要是贫困地区的教育和文化因素导致的。单纯增加对贫困家庭的财务支持不一定能改善他们的饮食。这笔钱也许更应该花在公共意识宣传、体育设施或者学校营养餐上。缓解贫困的措施也许是必要的,但根据肥胖相关性为其辩护可能是对竞争性真相的误用。

谎言和该死的谎言

常言道:“世界上有三种谎言,谎言、该死的谎言、统计学。”在卫生、政治、投资、教育和其他许多领域,我们依靠统计量做出合适的选择。统计量不是谎言。不过,作为真相,它们比单纯的数字更容易受到操纵。

平均数是最有名的统计量之一。要估计一群人的平均身高,我们可以测量75个人的身高,然后取样本的平均数。你可能觉得像平均数这么简单的事物不可能存在竞争性真相——事实上,平均数不止一种。如果我们将样本中的所有身高加起来,然后除以75,我们得到的就是均值。如果我们将75个人按身高顺序排列,中间那个人的身高就是中位数。这两个平均数的值是不同的。[还有第三个不太常用的平均数,叫作众数,它是样本中出现频率最高的数值。]

面对不了解二者差异的听众,误导者可以在均值和中位数之间进行切换。2014—2015年,英国税前工资中位数是22 400英镑,同一年的工资均值是31 800英镑(两个数字只适用于纳税人)。较高的均值不应该使我们感到惊讶,因为一小部分英国人可以赚到几百万英镑,他们对中位数几乎没有影响,但他们巨大的薪酬使均值明显向上倾斜。

所以,在2015年,下面两种说法都是真实的:

28,000英镑的教师工资低于平均收入。

28,000英镑的教师工资高于平均收入。

大多数评论家不会具体指出他们使用的是哪种平均数。聪明的政客、工会领导和社会活动家会选择符合个人意图的平均数。

数字策略 #4

挑选统计量

均值还存在其他狡猾之处。许多父母关心孩子所在班级的规模,他们通常喜欢小班,因为老师有更多时间照顾每个孩子。所以,政客们热衷于证明班级的平均规模很小。不过,这并不意味着大多数孩子都在小班里。

为说明这一违反直觉的现象,想象你们镇上只有两个班级。一个班有10个孩子,另一个班有50个孩子。班级规模的均值是30,这听上去不错。不过,大多数孩子都在50人的班里。所以,平均而言,一个孩子很可能在50人的班里。更准确地说,每个孩子所在班级的人数均值是43多一点。

所以,当政客真实地谈论一个州或国家的平均班级规模时,这个数字低于一个孩子所在班级的平均人数。同样的技巧也适用于过度拥挤的监狱、火车、医院等。国家或州的均值总会低估普通人的经历。

考虑下面的谜题。当一个头发长度超过平均值的男人走进酒吧时,酒吧里的头发长度平均值却下降了。这是怎么回事?

这个谜题很简单,但它体现了一个被称为“辛普森悖论”的统计学问题。它的问题在于,同样的数字可以传达两个完全不同的真相。在回答谜题之前,让我们考虑现实中的一个例子。

2000年到2012年,调整通胀因素后的美国工资中位数上升了0.9%。这似乎是一个好消息。不过,在同一时期,高中辍学生的工资中位数下降了7.9%,高中毕业生的工资中位数下降了4.7%,大学生的工资中位数下降了7.6%,至少拥有一个学位的群体的工资中位数下降了1.2%。简单地说,美国每个经济群体的工资都下降了,但总体平均数却出现了上升。

这就是它被称为悖论的原因。

回到谜题上来。答案取决于“头发长度超过平均值”意味着什么。我们谈论的不是所有人口的“平均值”。我们是说,这个男人的头发长度超过了男性群体的平均值。当然,酒吧里有男有女,新来者的头发长度比不上女性平均值。酒吧里男性子群体的头发长度平均值增加了,女性子群体的平均值保持不变,总体平均值出现了下降。

辛普森悖论的关键是识别群体和子群体的差异。

再次考虑工资的下降。你是否认为这些子群体(高中辍学生、大学生等)在不同时期是固定的?我们知道,事实并非如此:如今,美国工人中大学毕业生的比例提高了。换句话说,同2000年相比,工资最高的子群体相对于工资最低的子群体变大了。所以,虽然大学毕业生的工资中位数出现了下降,但是他们人数的增长拉高了整体工资。

这很重要,因为群体和子群体层面的不同结论使美国政客同时得出了两个真相:工资上升了,工资下降了。大多数人从未听说过辛普森悖论,而且缺乏统计学培训,不知道两个如此矛盾的真相能够同时成立。因此,他们会相信他们听到的版本。如果他们同时听到两个版本,他们可能会完全失去对于统计量的信心。

工资上升了,下面是证明它的统计量!

工资下降了,下面是证明它的统计量!

两种说法都是正确的。

这就是人们充满怀疑的原因。

巨大的误导

在国家经济健康的理解上,没有比国内生产总值更加被人密切关注的指标了。在大众看来,这个数字捕捉到了由几十亿次交易和投资组成的经济体的规模和表现。国内生产总值衡量了一个经济体创造的扣除通胀因素后的价值。它被用于确定利率、主权信用等级、养老金支付、税率和政府支出。如果国内生产总值上升,我们认为普通人的生活水平也会上升。如果国内生产总值连续两个季度下降,我们会宣布经济衰退,并且削减重要支出。国内生产总值影响着我们所有人。

2015年,爱尔兰国内生产总值增长了26%。对于这个欧元区小国来说,你可能觉得这是一个惊人的成就。印度的国内生产总值增长率是7.6%,中国是6.9%。欧元区的平均增长率是微不足道的1.7%。爱尔兰是如何取得这个成绩的呢?

遗憾的是,国内生产总值的激增和爱尔兰人几乎没有关系。这不是他们创造的,他们也不会获得太大的利益。少数国外公司由于税收原因在全球赌桌上移动了一些筹码,一些宝贵的资产被转移到了爱尔兰。在那里,它们带来了大量收入。爱尔兰的公司税率只有12.5%。对于可以通过企业倒置和其他操作改变地址的全球企业来说,爱尔兰是一个极具吸引力的地区。目前,超过700家美国公司的官方总部设在爱尔兰。2015年,3 000亿欧元的生产资本流向了爱尔兰,包括荷兰埃尔凯普租赁公司价值350亿欧元的飞机以及苹果等科技巨头的各种知识财产。

所有这些新增资产和新增国民收入对于爱尔兰人意味着什么呢?它们似乎没有太大意义。2015年的官方出口数据从2 200亿欧元增长到了2 950亿欧元,但导致这种惊人增长的大多数商品和服务不是在爱尔兰生产的。将官方地址搬到爱尔兰的美国公司往往会将经营和管理留在美国。来自公司税的收入出现了增长,在一定程度上缓解了受到紧缩困扰的政府预算,但大多数爱尔兰公民的收入没有受到影响。根据爱尔兰中央统计局的数据,就业率没有发生太大变化。大多数爱尔兰人的财富和前景跟之前差不多。

那么,国内生产总值这个指标的意义是什么呢?如果一个国家可以在纸面上看到明显的增长,但是大多数国民都无法体验到物质上的改善,我们是否可以认为国内生产总值这个指标达到了目的呢?在爱尔兰的例子中,它可能会产生很大的误导。2016年初,有人兴高采烈地指出,该国债务与国内生产总值之比从2013年的超过125%下降到了不到100%。在国内生产总值人为注水的背景下,这个成就显得很空洞。爱尔兰仍然是世界上人均债务第二多的国家。

爱尔兰是国内生产总值失真的一个极端案例。不过,这个指标对于我们每个人来说都是有问题的。当科罗拉多的摩托车手摔断一条腿时,这对他是坏消息,但对国内生产总值却是好消息:他或他的保险商需要为救护车、医学治疗、医院床位、物理治疗甚至律师和新的摩托车付款。他的不幸意味着经济活动的增长,这将提高国内生产总值。类似地,如果非洲农村社区遭遇干旱歉收,不得不购买食物,他们的困难会直接导致国内生产总值的增长。如果原始雨林被砍伐并被制成木材,或者地震导致新的建设,国内生产总值也会增长。另一方面,如果汽车制造商发明了一款价格更低、更加高效的汽车,汽车和燃料支出可能都会下降,导致国内生产总值下降。所以,虽然国内生产总值被视作目前最好的国家经济健康指标,但是它的增长并不意味着快乐和幸福的增长。“国内生产总值上升”的真相可能会和“许多人健康和快乐水平下降”的竞争性真相同时存在。

当科技改变我们的活动和我们重视的事情时,国内生产总值和人类福祉的差异正在变得越来越重要。大多数发达国家的国内生产总值已经连续多年保持停滞。评论家认为,这意味着我们的生活水平也处于停滞状态。不过,在这段时间里,我们的机器、沟通和医学质量得到了显著提高,我们获得了几乎无穷无尽的知识、音乐、电视、书籍、网络和游戏资源。过去渴望拥有汽车或一柜衣服的年轻人现在更希望在脸谱网上添加好友或者在Instagram上传自拍照。我们在线听音乐,获取网络信息,玩多人游戏,寻找工作和伴侣,打造我们的人际网络,这给我们带来了巨大的价值。不过,由于所有这些事情不需要花一分钱,因此这些价值大部分被国内生产总值的统计数字忽略了。共享汽车或共享育儿经历的应用程序可能会极大地提高你的生活质量,但它也可能减少打车和聘请保育员的支出,从而降低国内生产总值。

考虑到这个问题,中国国家统计局副局长在2016年呼吁将免费服务纳入国内生产总值报告中。“数字经济催生了新的商业模式,创造出了许多非货币交易,”许宪春说,“它们的收入主要来自网络广告,而不是实际享受服务的用户。所以,消费者免费获得的最终服务的价值常常被低估或忽略”。英国国家统计局被要求研究如何将共享经济纳入国内生产总值的估计之中。WhatsApp消息、谷歌地图和 YouTube视频真正价值的量化问题仍然有待解决。

即使统计学家能够将我们这个时代的免费数字商品和共享经济服务纳入国内生产总值之中,当我们下次听到政客吹嘘该指标的微弱上升时,我们仍然应该认识到它的局限性。1968年,罗伯特·F.肯尼迪(Robert F. Kennedy)在谈到与之关系密切的国民生产总值时说:“它既不能测量我们的头脑,也不能测量我们的勇气;既不能测量我们的智慧,也不能测量我们的学问;既不能测量我们的热情,也不能测量我们对国家的热爱。简而言之,它什么都能测量,就是不能测量使生活有价值的事物。”

拼凑数字

研究人员对于工党2002年的业绩指标提出了批评,他们得出了下面的结论:

公平地说,从严格意义上讲,工党网站上的所有内容都是真实的。不过,整体而言,这些统计数据的组织方式——为呈现最好的政绩画面而将年份和区域混搭在一起——是不诚实的。

这种对于统计量的操纵似乎很常见,因此似乎合情合理。有人会说,如果你天真地相信某个党派组织公布的数字,那么你上当也是应该的。问题是,许多人对于数字很头疼,他们在看到数字时会停止批判性思考。如果政府部门的人拿出一组数字,我们谁会质疑它们呢?如果相互对立的智库向我们展示相互矛盾的数字,我们如何确定哪组数字代表了更大的真相呢?

我们对世界的理解取决于我们如何测量世界。我们的理解反过来又决定了我们的选票、行动和态度。数字很重要。我们一定不能失去对于数字的信任。不过,我们需要更好地解读数字,并在误导者用数字真相对我们说谎时要求他们承担责任。

如何应用于现实

深入挖掘,以理解辩论中的每个数字究竟代表什么。

确保你使用的是最贴切的单位,你所对比的事物处于同一级别。

将数字放在背景中,将它们与其他相关数字进行比较,以显示它们的真实大小。

当心……

试图使数字看上去更大或更小,或者使趋势变得更加明显的误导者。

认为两组相关数据存在因果关系的误传者。

挑选统计量或者不明确指出自己使用的是何种平均数的误导者。

上一章:第三章 下一章:第五章
网站所有作品均由网友搜集共同更新,仅供读者预览,如果喜欢请购买正版图书!如有侵犯版权,请来信告知,本站立即予以处理。
邮箱:yuedusg@foxmail.com
Copyright@2016-2026 文学吧