




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计数字会撒谎 分享一本书 SDOUED胡劼 像 故事书 一样精彩的数据造假曝光宝典 作者 美达莱尔 哈夫 统计数字会撒谎 漫步华尔街 股市作手回忆录 并列为所有时代最伟大的25本投资经典之一 英国著名财经作家利奥 高夫 揭露了广告运营 统计人员 专家 有关部门常用的造假伎俩 告诉我们如何识破这些骗术 以便正确决策 1 精心挑选的平均数 我们为什么老是拖后腿 当一个家伙希望用数据影响公众观点 或者向其他人推销广告版面 平均数便是一个经常被使用的伎俩 所以 当你被告知某个数是平均数时 除非能说出它的具体种类 均值 中位数 还是众数 否则你对它的具体含义仍知之甚少 希望数值较大 算数平均数数值较小 中位数众数 序列中出现次数最多的数 1 精心挑选的平均数 我们为什么老是拖后腿 实际上 即使我们的工资都不涨 也有让平均工资涨的方法 假设盖茨和乔布斯搬来上海 我们的平均工资就会涨到10k啦 你也来上海啦 恩 魔都是个好地方 1 精心挑选的平均数 我们为什么老是拖后腿 你知道吗 咱拉高了上海人的平均收入呢 起码拉高一千咧 实际上 即使我们的工资都不涨 也有让平均工资涨的方法 假设盖茨和乔布斯搬来上海 我们的平均工资就会涨到10k啦 因此 当你看到某个平均收入时 首先问问 是什么的平均 包括了哪些人 这种说不清楚的平均数没有任何意义 1 精心挑选的平均数 我们为什么老是拖后腿 2 没有披露的数据 想要什么结果就有什么结果 某位统计专家曾经建议 在被告知某个调查的结果时 你需要做的就是反问一句 你调查了多少名被访者 采用严重有偏的样本几乎能够产生任何人需要的任何结果 高露洁广告 广告说啥我信啥 广告骗术中 怎样才能完全依靠机遇形成毫无指导性的结论呢 答案就是足够小的样本 2 没有披露的数据 想要什么结果就有什么结果 我们来抛下硬币 只经过少次数试验的话 你有可能得到合理但不能当结论的结果 但是很多人就拿这种结果当结论去忽悠人 只有经过足够多次的试验后 平均数定律才是一种有用的描述 并可用来预测 另外 当图表中有意或无意遗漏了左侧的波动范围 我们需要对平均数 图表或趋势保留一些怀疑 不只怀疑 这个图表一定在坑爹没跑了 2 没有披露的数据 想要什么结果就有什么结果 最简单的统计图形是直线类图形 在显示趋势时 直线图形非常有用 数据是相同的 所以图形也相同 除了图形给人留下的印象不同之外 没有进行任何的伪造 只需要稍微改变横轴与纵轴刻度的比例关系 将纵轴的每一个刻度缩减为原来的l 10即可 没有人规定不能这样做 而这会产生一条更完美的折线 绝对的视觉冲击 显然 图形比文字更有效 因为它不存在任何形容词和副词来破坏图形的客观性所形成的幻觉 而且谁也无法指责你 3 令人惊奇的图形 看我72变 形象化图形的前身是普通的柱状图 在比较两种成两种以上事物时 柱状图是一种描绘数量的便捷常用的方法 但柱状图也具有欺骗性 在描述单一物体时 柱体改变宽度的同时 长度也发生变化 在描述三维物体时 物体的体积又不容易进行比较 以上任何一种情况都提醒我们应该对柱状图保留一些怀疑 数字全是2 1 但视觉效果却是4 1 而在大多数时候视觉效果起着加工资的作用 4 一维图形的滥用 图形的魔术 不完全匹配的资料是一种保证你处在有利位置上的武器 而且屡试不爽 你不会知道杀死的是什么细菌 你也不会知道哪种细菌引起了感冒 你不会知道洗衣粉能洗掉的是怎样程度的污渍 也不知道能洗去多少污渍 5 不完全匹配的资料 数字炸弹 舒肤佳广告 奥妙洗衣粉 两个事物之间的关联关系并不能用于说明其中一个将引起另一个的变化 数据是真实的 然而唯一不妥的是依据这些数据和事实推断出一个未经证实的结论 相关显示了一种趋势 而这种趋势通常并不是那种一对一的理想关系 6 相关关系的误解 吃的多所以笨 对那些未加解释的平均数 我们根本不用太在意 神马平均工资 平均智商 人均GDP都是浮云 7 如何进行统计操纵 见证奇迹的时刻 为了使最声名狼藉的统计资料看上去更有分量 更精确 你应该使用小数 百分数也给误解提供了肥沃的土壤 和小数一样 它也能为不确切的事物蒙上精确的面纱 现在就购买你的圣诞礼物 你将节省100 听上去很有吸引力 但实际上混淆了比较的基础 相对于原来的价格 价格只缩减了50 虽然对于打折后的价格而言 减少量的确是100 但是听上去确实比干巴巴的5折有吸引力 平均睡眠时间约8小时平均睡眠时间为7 8小时 平均睡眠时间为7 831小时 哇好专业也 变换基数还能产生增加折扣的幻觉 7 如何进行统计操纵 见证奇迹的时刻 将一些看似能直接相加却不能这样操作的事情加在一起 会产生大量的欺骗和隐瞒 折上折 50 折扣再打20 折扣 70 60 一年只上一天班 8 如何反驳统计资料 真相只有一个 怎样凭双眼就能识破虚假的统计资料 并揭开它的老底 同样重要的是 如何在一大片充满欺骗性的数据海洋中找出可靠有用的资料 提出5个问题 问题一 谁说的 首先寻找的是偏差 出于学术 名誉或收入的考虑而需要证明某些结论的实验室 希望获得一篇好报道的报界等等 他们提供的数据都有可能产生偏差当某个权威人士被引用时 请弄清楚到底资料的内容是权威的 还是仅仅扯上了权威人士的大名 Eg xx砖家说 辐射没影响 有关部门说 油价上涨对百姓生活影响不大 8 如何反驳统计资料 真相只有一个 问题二 他是如何知道的 数值是否足够大 从而能解释问题 观察值是否足够多 从而保证结论的可靠性 对于许多报告中的内容 通过观察 你会发现由于缺乏足够多的观测值 报告的内容不足以说服任何人 前面的抛硬币的栗子 问题三 遗漏了什么 通常 你并不会被告知包含了多少观测值 这个数据的缺失 特别当信息来源于信息存在利害关系一方时 已足以使你对整件事情提出质疑 比如 当均值与中位数相差甚远时 需要注意那些没有标明类型的平均数 很多数据因为没有比较而变得缺乏意义 Longlongago x大学开始接收女学生时 一不赞成异性同校的人做了一个惊人的报道 x大学1 3的女生嫁给了大学老师 民风狠彪悍啊 然而原始数据更清楚的描绘了事实 总共只有3个女生被录取 其中1人嫁给了老师 8 如何反驳统计资料 真相只有一个 问题四 是否有人偷换了概念 在分析统计资料时 请留心从搜集原始资料 到形成结论时的整个过程中 是否存在着概念的偷换 比如 疾病案例的增多不等于发病率的提高 民意调查中的获胜并不等于竞选时的获胜 典型的偷换概念 美国某个州长说 监狱的犯人每人每天所花费的钱与住酒店的钱一样 8 如何反驳统计资料 真相只有一个 问题五 这个资料有意义吗 外推法是十分有用的 特别是当预测趋势时 但是 当看到利用外推法计算出来的数据和图表时 请记住 到目前为止的趋势都是事实 而未来的趋势只不过是受教育者的猜测 该方法暗含 其他所有条件都相同 以及 现有趋势将继续下去 的前提 但实际上 条件总在变化着 某个5年期间 美国家庭拥有的电视数量增加了近10000 按照该速率对下一个5年进行推测 你将发现电视机的总数将超过几千万 即每个家庭将拥有40台电视
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专业智商测试试题及答案
- 高职建筑专业试题及答案
- 酒店专业试题及答案
- 环保专业试题及答案
- 甲状腺专业试题及答案
- 沟通专业试题及答案
- 河北省承德市平泉市党坝中学2025-2026年学年九年级历史上学期9月月考试题(含答案)
- 宁波生态假山施工方案
- 路口半弧形护栏施工方案
- 楼顶景观水系施工方案
- 成人学士学位英语1000个高频必考词汇汇总
- GB/T 5271.29-2006信息技术词汇第29部分:人工智能语音识别与合成
- 全屋定制家居橱柜衣柜整装安装服务规范
- GB/T 28248-2012印制板用硬质合金钻头
- 沥青及沥青混合料试验作业指导书
- 省级自然保护区建设工程可行性研究报告
- 义务教育阶段学生艺术素质测评指标体系小学音乐
- 茶叶生产加工常用表格
- 妊娠合并HIV(医学PPT课件)
- Minitab(高级)
- 工学结合的课程开发与教学设计
评论
0/150
提交评论