统计数据会说谎第一章读后感(《统计数据会说谎》读书笔记)

发布时间: 2025-02-20 20:22:25 来源: 励志妙语 栏目: 读后感 点击: 76

《统计数据会说谎》读书笔记,wordrepss原文链接:,《统计数据会说谎》读书笔记,《统计数据会撒谎》,how,to,lie,wit...

统计数据会说谎第一章读后感(《统计数据会说谎》读书笔记)

《统计数据会说谎》读书笔记

wordrepss原文链接: 《统计数据会说谎》读书笔记

《统计数据会撒谎》

how to lie with statistics

一本极为简单的入门读物,用生活中的例子介绍最常见的一些统计陷阱,所谓知己知彼,了解别人怎么撒谎,才能避免自己被误导。

第一章“带有偏差的样本”强调数据的来源,即样本的完整性,从抽样调查的角度看,就是确保抽样的样本能代表整体。“幸存者偏见”就是源自我们只关注了部分样本,忽略了其他,比如只关注“返航的飞机”而忽视“被敌人击落的飞机”(只关注幸存者而忽视逝者),比如电视上的犯罪报道会让我们以为世界是黑暗的,这是源自“不完整的样本”得出的结论。

第二章“精挑细选的平均数”介绍平均值这种典型的统计数字,推销员会根据想要的效果选择不同的平均值(均值,中位数,众数)。所以看到含有统计数据的结论时,都应该学会判断 “统计数据的真正含义” ,看到真正的结论。

第三章 “没有透露的小小数据” 介绍了最常见的几种数据遗漏产生的统计陷阱,最主要的是只看平均值而忽略波动范围(置信区间或显著性水平)。

第四章“无事瞎忙” 介绍的还是误差范围的重要性,强调只有显著性差异才有意义,否则都是瞎折腾。

《统计数据会撒谎》的内容都可以在《看穿一切的统计学》一书中找到对应内容。比如《统计数据会撒谎》前四章的内容都能从以下三章找到对应的内容。比如抽样调查即收集数据过程,忽略误差范围就是没有遵循“分析数据的两个原则”。

关键词:抽样调查,偏差,随机抽样,分层随机抽样

主要内容: 看到一个统计结果,不要着急看它的结论,而是要留意样本是否能代表整体!!

现实中难以做到纯随机抽样,更多使用的是分层随机抽样。

精选案例:电话调查会忽略掉家里没有电话的家庭,学校毕业生信息调查也会忽略掉工作窘迫的学生,而上报自己工作的人也倾向于夸大自己的工资。

当我们拿到一个统计数据,如果数据看起来很精确,比如“耶鲁大学1924届毕业生的平均年收入是25111美元”,我们就更容易相信结果是正确的,而如果我们看到的是“平均年收入是25000美元”,我们更容易意识到是2.5万左右。 分析化学老师告诉我们,测量结果的最后一位是“估读位”,看来这也是一种直觉判断, 将之前的数字看成是准确结果。

我的补充说明: 在解决问题领域,不要着急解决问题,而是要先充分的定义和明确问题。 看到统计数据也要有类似的意识,先去回溯“数据是怎么调查而来的”。

关键词:平均数,均值,中位数,众数,

主要内容: 统计数据会撒谎,其中一个经典方法是,在不同的场景使用不同类型的平均数。

精选案例:卖房子时,为了引导消费者以为邻居都是富人,就是用均值;为了让居民意识到大家都很贫穷,就用均值。 对于收入这种差距很大的数据,三种平均值的差别很大,所以是一种常见的统计陷阱。 但是对身高、体重这种范围不大的数据, 三种平均值的差别就很小。

我的补充说明: 如果比尔盖茨和我们同住一个小区,小区居民的均值就会剧增成千上万倍(平均值被无限抬高),但是众数和中位数几乎不会有变化。

关键词:优先的样本,平均值,误差范围,小数定律

主要内容:

通过关注遗漏的数据,了解存在的统计陷阱。 本章举了几个例子, 最主要的例子是,只关注平均值而不关心误差范围。 误差范围就是显著性检验中的显著性水平(95%还是99%)或置信区间。

其次,有些统计结果是使用少量的样本调查而来,所以得到了非常有利的统计结果,然后就大肆宣传。 这就是 小树定律 的概念,如果使用少量的样本,得到极端结果承可能性就比较大;与之相对的是“大数定律”。 更有甚甚者,如果少量样本没有得到自己想要的结果,就抛弃重新实验,直到得到有利于自己的数据。

精选案例:厂家说自己的牙膏效果更好,可能是只用了极少的样本得到的统计结果。 家长看到 孩子身高和年龄的对应关系,就基于此判断自己的孩子发育正常还是缓慢,实际这种对应关系只是一个很粗略的关系,有很大的误差范围, 但我们 倾向于将具有很大误差范围的统计结果当作绝对结论来使用。

我的补充说明:这一章的两部分内容,一是有限的样本即“小数定律”,二是平均值和误差。 前者对应于抽样调查的次数和标准误差的关系,后者强调既要关注平均值又要关注误差范围。

关键词:误差范围,

主要内容:强调数据的比较需要关注误差范围,也就是上一章的内容。

精选案例: 一种智商测评,学生A得了99分,学生B得了101分,这能说明学生B比学生A聪明吗? 不能,因为测评的误差可能是+-5,所以结果之间没有显著性差异。

一个网站测试了市面上主流香烟的尼古丁等有毒物质含量,结果显示香烟之间没有显著性差异,但是某一个品牌发现自己的测试数据都比其他品牌低,因此大肆宣传“某某香烟在某某测评中证明毒性比其他香烟低”,但实际上却没有显著性差异,所以这个结论是毫无意义的。

我的补充说明:直接拿工作中的一个柔顺测试图片作为本章的例子:

2021.2.2 春节回家的高铁上,整理第二三四章的读书笔记并发表

统计案例统计数据会说谎?

在报道社会经济趋势、商业状况、民意调查时用到大量数据,此时统计方法和术语就不可或缺。统计学知识能够揭露真香,也可以漫天过海。

案例:某人说99%的患者被排查,涉及1059万人。用数字增加说服力,体现自己劳苦功高。这些数据都是统计下的结果,但是统计的真实性有待考察。

案例:薪酬调查报告。每年一些机构都会发布调研报告,包含城市平均薪酬、行业薪酬等。各大网友吐槽“又拖后腿了”、“被马云baba平均了”。下图一定程度上能说明行业薪资差异,但是并没有说明工作年限、职位、城市等因素,所以数据的水分很大。

那么统计数据说谎有哪些方式呢?本文从5个方面来讲述。

1、样本偏差

案例:某高校调查2021届毕业生平均年薪25W。

这些数据是如何得到的?样本多大?调查样本具有代表性吗?愿意参与调查可能只是问卷调查设计的20%。部分人虚荣心作祟,虚报薪水状况,导致所调查年薪偏高。

导致偏差的显性和隐性原因都有可能摧毁一个样本的可靠性。但是偏差总会存在,只能做到尽量减少偏差。比如上街做随机调查,就会因遗漏了宅男宅女而产生偏差;如果你挨家挨户做上门调查,就会遗漏大多数白天上班的人;如果你转而改为晚上做调查,还是会遗漏晚上在电影院和夜总会的人。

2、平均数

网友常调侃:“我和马云的平均年收入几个亿”,本质上也是平均数的应用。在没有重要数据的情况下,千万不要轻易相信一个平均数、一张图表或一条趋势线。也许你认为61华氏度(约16.11摄氏度)的年均气温非常舒适宜人,你选择了内陆荒漠或南方沿海的圣·尼古拉斯岛。但是你忽略了温差,因此你不是会被暴晒,就是会受冻。

圣·尼古拉斯岛的温差是47~87华氏度(约8~31摄氏度),而荒漠的温差是15~104华氏度(约–9~40摄氏度)。

3、没有透露的小数据

案例:某公司开发一款牙膏,宣称治疗龋齿效果明显,可以使蛀牙减少23%。

而事实上公司采用了12人的实验样本,如此小的实验样本误差肯定偏大,不能反馈真实情况。那么统计学揭露了事情真相,该牙膏的广告宣传有问题。

4、无事瞎忙

案例:眼花缭乱的智力检验。

很多人盲目崇拜着各种各样的智力测验,为了找出测验结果,做了很多测试题。假如检测结果小明智商为98,小华智商为102,智力测验的平均水平指数为100。那往往得出,小华比较聪明,她的智商高于平均水平,小明就不及平均水平。

所有类似结论是不靠谱的!首先要明确的是,无论智力测验都包含什么内容,它和我们所说的“智力”相去甚远。这种智力测验通常都忽略了诸如领导力和创造力等重要因素。它也从不考虑运动、艺术及其他天赋,更不必说勤奋上进和情感平衡等重要的个人素质。

学校里进行的测试通常都是快捷而省事的,测试结果主要取决于阅读能力,而阅读能力较弱的人就没有机会来证明自己聪明与否。

这些无事瞎忙的数据只会干扰自己的判断。

5、惊人的图形

5.1刻度扭曲

下方左右图的原始数据一样,但是右图的增长趋势喜人,事实上在作图时扭曲了Y轴刻度。

1938年,华盛顿的宣传广告有一张争议的图表——《政府支出剧增!》。它们表示的是政府支出从19500000美元增至20210000美元。从底部急剧攀升至顶部的曲线本应描述的是不到4%的增长,但此刻却看着比400%还多!

5.2一维图形

新闻资讯从文字时代走向图文、短视频时代,数据报告中充斥着各种扁平化图标。用卡通小人代表100万人,用一个硬币代表10亿美元,或用一头牛来代表牛肉供应量,这些都是形象图。这是一种非常实用的工具,但是它也能变成一种圆滑狡诈的欺骗手段。

案例:美国和罗坦迪亚(Rotundia)木匠的平均周工资。

左边柱形图展示两国差距,但是觉得不够影响,加入了一维图形。初看之下,美国木匠的工资明显高出罗坦迪亚木匠,已经到4倍的程度。原因在于第二个钱袋高度是第一个的2倍,连宽度也是2倍。这样一来,在第二个钱袋所占的面积就不是第一个的2倍,而是4倍。数据虽然是2∶1,但是视觉效果起了决定性的作用,误导读者以为是4∶1。

统计数据说谎的形式很多,如何应对日新月异的作弊手段。一方面需要具有一定的统计学基础,另一方面也需要养成独立思考的能力,看到数据多思考背后的来源、业务逻辑、统计口径,这样才能不被欺骗。

别对我说谎第一季第一集的读后感

  原谅我把书中最后的内容臵首,忽略谎言是正确的,判断说谎或是忽视谎言是否恰当的标准,会受到自身道德规范的影响。作者在书中的最后告诉我们作者的目的:是为了让我们更好的理解谎言、判断谎言的根源与说谎的表现。一些读者只选择掌握测试说谎的内容,一知半解比全然不知更可怕,若是读者没有注意到谎言也能解决问题这一事实,那这是很遗憾的,作者真心地希望我们也能理解忽视谎言也是一种有用的技巧。毋庸臵疑的是掌握说谎的技巧会令人感到不安,另外你如果得知别人对你说谎,有时是件非常痛苦和让自己受折磨的事情,任何睿智的人都知道谎言会造成一定的影响,包括人际关系、认知、价值观、世界观等。在婚姻与恋爱的关系中,双方建立并坚持说谎言的基本原则,能最大限度的维持彼此之间的关系。谎言是人类社会不可或缺的一部分,所以真正的理解谎言是非常有用的。具备识别谎言的能力会使你更好的体验人生。无论你是多么的优秀和强大,都要孜孜不倦的继续学习,保持一颗热忱的心。当你真正的知道什么时候接受谎言,何时该接受真话,那么你的人生将会更加丰富。“无论我们是多么的独立,这都是不正确的,因为我们显然是个喜欢社会交往与互相依赖的物种”,记住分享!
本文标题: 统计数据会说谎第一章读后感(《统计数据会说谎》读书笔记)
本文地址: http://www.lzmy123.com/duhougan/409966.html

如果认为本文对您有所帮助请赞助本站

支付宝扫一扫赞助微信扫一扫赞助

  • 支付宝扫一扫赞助
  • 微信扫一扫赞助
  • 支付宝先领红包再赞助
    声明:凡注明"本站原创"的所有文字图片等资料,版权均属励志妙语所有,欢迎转载,但务请注明出处。
    生命与教育读后感(《生命与教育》读后感650字)《半截蜡烛》读后感200字(半截蜡烛读后感400字)
    Top