统计数据会说谎

chapter 1 内在有偏的样本。
有偏样本的极端例子:
案例:假设你发放一个问卷,包含这样一个问题:你乐意回答调查问卷吗?整理所有的答案,你可能看到下面的结论,大多数人选择了乐意——为了证明这个结论有说服力,你还可以详细列出比例。但你发现问题在哪里了吗?是的,所有不乐意的人,早已将调查问卷扔掉垃圾箱里去了。

当数据经过层层统计处理,最后简化为一个带小数点的平均数时,结论似乎闪耀着精确的光芒,但只要仔细留心整个抽样过程,这个光芒就会消逝。
为了确保结论有价值,根据抽样得出的结论一定要采用具有代表性的样本,这种样本才能排除各种误差。

案例:一位心理医生说:每个人都有点神经质。这句话对么?从样本来考虑,医生得出的这个结论显然是从他接触的病人而来,但实际上,心理健全的人,又怎么可能去看心理医生呢?

无形的误差与有形的误差一样容易破坏样本的可信度。也就是说,即使你找不到任何破坏性的误差来源,但只要有产生误差的可能性,你就有必要对结果保留一定的怀疑。

最基本的样本是随机样本,它是完全遵循随机原则从总体中选出的样本。总体即形成样本的母体。
——日常评估是也是要选择随机的样本,某个评估,最好的样本不应该是按站点输出的,而是站点乱序的。

随机样本的验证方法是:总体中的每个名字或每个事物是否具有相同的机率被选进样本?
纯随机样本是唯一有足够把握经受住统计理论审查的样本。但它也有不足之处,很多情况下,获得这种样本的难度很大并且十分昂贵,以至于单纯的考虑成本就会排除它。分层随机抽样是一个更经济的替代品,目前在民意调查和市场研究等领域中得到了广泛的应用。

由哪些组成调查人员会对结果产生有趣的影响。

要承认:所谓的民意调查都带有一定程度的误差。

chapter 2 精心挑选的平均数
算术平均数:将数据加总除以平均数。

中位数:位于中间的数
众数:出现最频繁的数

所以,当你被告知是某个数是平均数时,除非能说出它的具体种类——均值,中位数还是众数,否则你对它的具体涵义仍知之甚少。

在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有我们常说的正态分布的形态特征,在你用曲线绘制正态分布时,将看到一根钟形的曲线,均值、中位数和众数都落在相同的点上。

当你看到某个平均收入时,首先问问:是什么的平均?包括了哪些人?

chapter 3 没有披露的数据
采用严重有偏的样本几乎能够产生任何人需要的任何结果。

只有在进行了足够多次的实验之后,平均数定律才是一种有用的描述,并可用来预测。
那么,多少才算够呢?这又是一个棘手的问题。它取决于其他的因素,即你采用抽样方式所研究的总体容量有多大、变动程度有多大。值得一提的是,有时样本的规模与看上去的并不一致。

在这里,我们简单的介绍一个易于理解的显著性检验方法。简单的说,它是一种反映检验数据以多大的可能性代表实际的结论、而不是由于机遇产生的其他结论的方法。
——即显著性水平检验。
还有一类没有披露的数据,它的遗漏也同样具有破坏性。这类数据表明了事物的变动范围以及与给定平均数的偏离水平。通常情况下,单凭一个平均数来描述事物过于简单,起不到作用,不管这个平均数是均值还是中位数,也不管平均数的具体类型是否已知。

当遗漏了重要数据时,我们需要对平均数、图表或者趋势保留一些怀疑。

–这章强调的应该是说,当我们给别人展示一些数据的时候,我们要让别人知道,你这个数据是怎么来的,而不是单单的给一个数据。
这里有一个案例可以说明:
你拿到一个数据说某地某段时间的平均温度是20度——显然,单这么看的话,这个数据很好,但实际上,别人没告诉你的是,这个地区的温度波动范围是-10-30,那显然你拿到的这个30度的平均温度很可能就没有参考意义了。

chapter 4 毫无意义的工作
如果你的父亲笨得连IQ是什么都不知道,你的IQ很高又有什么意义呢?

案例:任何单纯的智力测验其实都是毫无价值的,因为这样的测验通常忽略了类似领导的才能、创造性想象力等十分重要的素质;也没有考虑到社交判断力以及音乐、艺术或者其它方面的才能;它也无法测试出诸如勤劳、情感平衡等重要的人格品质。而最主要的是,多数情况下学校进行的智力测验都是简单、低层次的类型,它们极大程度上依赖于阅读能力、测验者反应快慢等因素,不擅长阅读的人根本没有拿高分的希望。
智商值,最好是一个波动的范围。

我们可以定量地衡量你的样本以多大的精度代表总体,那就是:可能误差和标准误差。

只有当差别有意义时才能称之为差别。

chapter 5 一维图形的滥用
柱状图也具有欺骗性:在描述单一物体时,柱体改变宽度改变的同时,长度也发生变化;在描述三维物体时,物体的体积又不容易进行比较,以上任何一种情况都提醒我们应该对柱状图保留一些怀疑。

数字全是2:1,但视觉效果却是4:1,而在大多数时候视觉效果起着决定性作用。