




已阅读5页,还剩74页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
漫谈统计,课程要求,总评成绩=考试成绩*60%+平时成绩*40% 平时成绩:起评分:90 旷课:-5分 迟到:2次-5分 无任何旷课迟到:100分,2,为什么学习统计,大数据时代的来临 国务院印发大数据发展行动纲要 统计学依然是数据分析的核心 计算机的发展,3,什么是统计,Statistics is a collection of procedures and principle for gathering data and analyzing information in order to help people make decisions when faced with uncertainty. 统计学是一套收集数据和分析信息的方法和原则,以帮助人们在面对不确定性时制定决策。,4,什么地方统计用的上,任何领域,5,运用统计的领域包括,精算 农业 动物学 人类学 考古学 审计学 晶体学 人口统计学 牙医学 生态学 经济计量学 教育学 选举预测和策划 工程 流行病学,金融 水产渔业研究 遗传学 地理学 地质学 历史研究 人类遗传学 水文学 工业 法律 语言学 文学 劳动力计划 管理科学 市场营销学 医学诊断,气象学 军事科学 核材料安全管理 眼科学 制药学 物理学 政治学 心理学 心理物理学 质量控制 宗教研究 社会学 调查抽样 分类学 气象改善 搏采,等等.,6,你想过下面的问题吗?,当你买了一台电视时,被告知三年内可以免费保修。你想过厂家凭什么这样说吗?说多了,厂家会损失;说少了,会失去竞争,也是损失。到底这个保修期是怎样决定的呢? 在同一年级中,同样统计学的课程可能由一些不同教师讲授。教师讲课方式当然不一样,考试题目也不一定相同。那么如何比较不同班级的统计学成绩呢? 大学排名是一个非常敏感的问题。不同的机构得出不同的结果;各自都说自己是客观、公正和有道理的。到底如何理解这些不同的结果呢?,7,你想过下面的问题吗?,任何公司都有一个信用问题。当然,在这些公司试图得到贷款时并没有不还贷的不良记录。如何根据它们的财务和商业资料来判断一个公司的信用等级呢? 我国东部和西部的概念是一个比较笼统的概念。如何能够根据需要,选择一些指标来把各省,或各市县甚至村进行分类呢? 疾病传播时,如何能够通过感染者入院前后的各种因素得到一个疾病传染方式的模型呢?,8,你想过下面的问题吗?,如何通过大众调查来得到性别、年龄、职业、收入等各种因素与公众对某项事物(比如商品或政策)的态度的关系呢? 一个从来没有研究过红楼梦的统计学家如何根据比较写作习惯得出红楼梦从哪一段开始就不是曹雪芹的手笔了呢? 如何才能够客观地得到某个电视节目的收视率,以确定广告的价格是否合理呢?,9,你如何理解下面说法?,“明天降水概率为40” “我冬天去新加坡度假的概率为10” “该节目收视率是30%” “调查结果表明20%的观众喜欢某节目” “抽样调查结果的误差为3%” “支持率的95置信区间为(25%,30%)” “某学校排名第一” “某县是贫困县”,10,你如何理解下面说法?,“某国的综合竞争力排名第43位” “该国家属于发展中国家” “该药品疗效99%” “该国贫富差距大” “这个县收入比那个县高” “该结果统计显著” “消费价格指数为120%” “他的血压已经正常了”,11,12,最早的英文原版打败庄家,13,稻盛和夫的故事,2010 年 1 月 19 日,日本航空公司申请破产保护。日航有 58 年历史,一度被视作日本战后经济繁荣的骄傲象征。 2010 年 2 月 1 日,受日本首相邀请,稻盛和夫答应出日航董事长,一年之后,日航扭亏为盈,利润是对手全日空的三倍。仅仅用了一年时间,日航做到了三个第一,一个是利润世界第一,一个是准点率世界第一,一个是服务水平世界第一。 在日航重新上市之后,稻盛和夫分享了他挽救日航的秘密。这里面涉及的内容很多,其中有很重要的一条,就是稻盛和夫非常重视日航具体的运营数据,他花了很大的力气来优化数据的获取,从而能够对日航的现状进行判断。 稻盛和夫是这样说的: 我担任董事长后,最为吃惊的是,公司的各项统计数据不仅不全,而且统计时间很长很慢,往往需要 3 个月之后才能搞全数据,以至于经营者无法迅速掌握公司的运营情况。所以,在对企业内部进行改革时,我特别关注统计工作。经过改革,现在各个部门的数据做到即有即报,公司详尽的经营报告,做到了一个月内完成。,14,林彪的一个故事,1948 年辽沈战役开始之后,在东北野战军前线指挥所里面,每天深夜都要进行例常的“每日军情汇报”:由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。 那几乎是重复着千篇一律的枯燥无味的数据:每支部队歼敌多少、俘虏多少;缴获的火炮、车辆多少、枪支、物资多少。 司令员林彪的要求很细,俘虏要分清军官和士兵,缴获的枪支,要统计出机枪、长枪、短枪;击毁和缴获尚能使用的汽车,也要分出大小和类别。 经过一天紧张的战斗指挥工作,人们都非常疲劳。整个作战室里面估计只有定下这个规矩的司令员林彪本人、还有那个读电报的倒霉参谋在用心留意。 1948 年 10 月 14 日,东北野战军以迅雷不及掩耳之势,仅用了 30 小时就攻克了对手原以为可以长期坚守的锦州之后,不顾疲劳,挥师北上与从沈阳出援的敌精锐廖耀湘基团二十余万在辽西相遇,一时间形成了混战。战局瞬息万变,谁胜谁负实难预料。,15,在大战紧急中,林彪无论有多忙,仍然坚持每晚必作的“功课”。一天深夜,值班参谋正在读着下面某师上报的其下属部队的战报。说他们下面的部队碰到了一个不大的遭遇战,歼敌部分、其余逃走。与其它之前所读的战报看上去并无明显异样,值班参谋就这样读着读着,林彪突然叫了一声“停!”他的眼里闪出了光芒,问:“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?” 大家带着睡意的脸上出现了茫然,因为如此战斗每天都有几十起,不都是差不多一模一样的枯燥数字吗?林彪扫视一周,见无人回答,便接连问了三句: “为什么那里缴获的短枪与长枪的比例比其它战斗略高”?“为什么那里缴获和击毁的小车与大车的比例比其它战斗略高”?“为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高”? 人们还没有来得及思索,等不及的林彪司令员大步走向挂满军用地图的墙壁,指着地图上的那个点说:“我猜想,不,我断定!敌人的指挥所就在这里!” 随后林彪口授命令,追击从胡家窝棚逃走的那部分敌人,并坚决把他们打掉。各部队要采取分割包围的办法,把失去指挥中枢后会变得混乱的几十万敌军切成小块,逐一歼灭。 廖耀湘对自己静心隐蔽的精悍野战司令部那么快就被发现、打掉,觉得实在不可思议,认为那是一个偶然事件,输得不甘心。当他得知林彪是如何得出判断之后说,“我服了,败在他手下,不丢人。”,16,谁是马路杀手,成都女司机事件 谁是马路杀手? 女司机真的天生是马路杀手吗?让数据说话吧。昨日,记者从东莞市交警支队了解到,目前东莞驾驶员数量男女比例约为7:3,但是去年发生的4214宗交通事故中,女司机仅发生事故447宗,仅占事故总量的10.6%,即九成事故是男司机造成的;发生死亡的462宗交通事故中,女司机全年仅20宗,不到男司机的1/22。,17,二战前期德国势头很猛,英国从敦刻尔克撤回到本岛,德国每天不定期的对英国狂轰乱炸,后来英国空军发展起来,双方空战不断。 为了能够提高飞机的防护能力,英国的飞机设计师们决定给飞机增加护甲,但是设计师们并不清楚应该在什么地方增加护甲,于是请来了统计学家。统计学家将每架中弹之后仍然安全返航的飞机的中弹部位描绘在一张图上,然后将所有中弹飞机的图都叠放在一起,这样就形成了浓密不同的弹孔分布。工作完成了,然后统计学家说没有弹孔的地方就是应该增加护甲的地方,因为这个部位中弹的飞机都没能幸免于难。,18,关于德国坦克,我们知道德国的坦克战在二战前期占了很多便宜,直到后来,苏联的坦克才能和德国坦克一拼高下,坦克作为德军的主要战力是盟军非常希望获得的重要情报,有很多盟军特务的任务就是窃取德军坦克总量情报,然而根据战后所获得的数据,真正对可靠的情报不是来源于盟军特务,而是统计学家。,统计学家做了什么事情呢?这和德军制造坦克的 惯例有关,德军坦克在出厂之后按生产的先后顺序编号,1,2.N,正式因为这个传统德军送给了盟军统计学家需要的数据。盟军在战争中缴获了德军的一些坦克并且获取了这些坦克的编号,现在统计学家需要在这些编号的基础上估计N,也就是德军的坦克总量。这其实均匀分布边界的估计,好吧公式是 (1+1/缴获德军坦克的总量)*所有缴获坦克中的最大编号。,19,养猴人心中暗笑:“朝四暮三和朝三暮四,不是都等于七吗?这畜牲就是不如人聪明。”猴子们窃窃私语:“朝四暮三和朝三暮四,虽然吃到肚子里都等于七,但朝四暮三更符合早吃饱、晚吃少的科学道理,不信去问问费雪。人虽然比我们聪明,但没学过统计的人,智商还真不如我们高”。 新编齐物论,20,20 世纪20年代后期的一个夏日午后,一群风度翩翩的学者偕漂亮的夫人及女友,正在英国剑桥的户外餐桌旁,悠闲地品茶论道。席间,一位美丽的女士说道:午茶的调制顺序对味道有很大影响,把茶加进牛奶里和把牛奶加进茶里,喝起来风味完全不同。出于对女性的尊重,那些学者们面带绅士的微笑,内心却不以为然,甚至是藐视,依据他们的科学头脑分析,茶和牛奶两种物质混合后的化学成份不会因为调制顺序不同而不同,怎么会喝起来不一样呢?在他们看来,这个命题的假定前提是不论调制顺序如何,牛奶和茶的比例是固定的或是基本不变的。美丽女士提出的问题有点类似朝四暮三和朝三暮四的关系。,21,1899 年,英国统计学家戈塞特(William Seely Gosset,1876-1937)在都柏林找到了一个令笔者垂涎的职业:到一家酿酒公司担任酿造化学技师,从事统计和实验分析工作,可以边喝啤酒边搞科研。但戈塞特首先碰到的困难,是供应实验用的麦子数量有限,无法采用当时通行的大样本观察和推断理论,而且每批进厂原料的质量都有所波动,对温度的变化也很敏感。万般无奈,戈塞特着手从小样本开始分析实验数据。小样本数据存在两个问题:一是误差怎样解决,二是如何从中尽可能得到较为可靠的结果。酒是个好东西,李白斗酒诗百篇,戈塞特的酒也没白喝。他经过反复研究实验,确立了小样本理论。1908年戈塞特以“学生”(student)为笔名,在生物计量学杂志上发表了“平均数的概率误差”。由于这篇文章确立了“学生t 检验”的基础,因而许多统计学家把1908 年看作统计推断理论发展史上的里程碑,将戈塞特称为小样本理论的创立者和实验分析的先驱。费雪称他为“统计学史中的法拉第”。,22,“死”也躲不开的统计,准确的统计数据能帮助我们对纷繁复杂的社会现象进行定量分析,从而为我们在作预测时提供参考。正因为如此,统计已经进入了人类社会生活的方方面面 比如,我国每10年会进行一次全国人口普查,像男女比例、各年龄段人口比率、就业率、出生率和和死亡率等,这可都是关系到国计民生的大事。,23,企业也需要这些信息指导自己的长期经营。比如,保险公司知道了人口的死亡率才可以计算出应该收多少保险费。 企业经营也需要进行统计。没准什么时候你在家里会突然接到一个电话,原来是电视台打来的,他们在统计节目的收视率。收视率超高,他们的广告就卖得越贵。 我们的生活也离不开统计。每个月家里大概会花多少钱,妈妈也许并没有认真计算过,但她心里一定有本帐,24,“投机取巧”的抽样调查,抽样调查就是一个常见的统计调查方法。我们先来看看电视台是如何进行收视率统计的。,25,假设有一家电视台,总共有7位用户(好可怜的电视台,选择比较小的数字是为了方便读者能够自己组合出正确的答案)。现在他们推出了一台新节目,想了解收视率是多少。这7位用户中有2户收看的是这台节目,因此节目收视率为28.57%,可是电视台并不知道,他们需要进行电话调查。假设电话费很昂贵,一家一户地去调查电视台开支太大,因此他们最多只能选择其中的4户进行随机抽样调查。 可是电视台并不需要很精确的收视率数据,只要它在合理的范围内就行了。,26,但是, 如果调查的结果偏偏为0%,那意味着什么?这种情况是概率最小的事情。如果最不可能的事情真的发生了,那电视台也只有相信它是真的,节目收视率确实为0%,这个节目就该被撤换掉了。,27,可见,在进行调查的时候,只要把允许的误差范围充分放大,就能有足够的把握说,我们的调查结果是正确的。前面我们列举的用户和调查数字都太小了,所以要把误差范围放大才会有足够的把握。在这个例子中,只要把几个数字稍微调大一点,误差范围就会大大缩小,而把握反而会提高。但其真正的电视台用户一般都在数十万以上,只要调查30个以上的用户一般可以有99%甚至更高的把握把调查误差控制在足够精确的范围内。我们完全可以相信调查的结果,而用不着给所有的用户打电话。,28,这种只对一部分客户进行的调查叫抽样调查。抽样调查非常有用,要知道大片的森林里有多少棵树,只需选择几个小块的区域进行调查,算出平均密度再乘上总面积,而不用去摸遍每一个山头;要知道灯泡的平均使用寿命,只要拿少量灯泡进行试验,而不用把所有的灯都用到坏;要知道一个大型养鸡场里明天有多少母鸡会下蛋,也只用挑选几十只验一验就够了,而不用去摸每只鸡的屁股。抽样调查能给我们的生活带来很大的方便。保险公司也不必去统计每个人的真实寿命,它只要抽样调查,一样可以获得满意的数据。看上去,抽样调查真是个投机取巧的好方法。,29,我们还需要统计指数,抽样调查的目的也是为了了解整个群体,实际上统计的目的就是为了了解整体的状况,那我们用什么来衡量这些状况呢?有些用平均数,如平均年龄、平均价格;有的用总数,如人口总数、总价值等。但是这些都是表示某一时刻的数值,不能反映它们随时间变化的情况。为了反映总体状况的变化,我们还需要“指数”。,30,我们经常能听到“指数”这个词: 股市里有股票指数,像国内的上证综合指数、美国的纳斯达克指数。看指数就知道股市的涨落; 国家和地方政府每年要发布物价指数,代表那年的物价水平。,31,我们生活用品的价格每天都可能发生变化。几年前价值8000元的电脑配置现在可能只值3000元;昨天大白菜还是5毛钱一斤,今天就会听到妈妈在和邻居大妈议论,下雪了,所有的青菜都涨到了1元以上。不同的东西价格有升有降,但是我们的支出整体上是上升了还是下降了呢?这就需要物价指数来衡量。 电脑好几千元一台,但是我们好几年都不会更换它。肉呀、菜呀虽然只有几元钱一斤,但是我们哪一天也少不了它们。因此,在编制物价指数时,我们要按物品对我们生活的影响给不同的物品在物价指数中以不同的比率。,32,真实的物价指数需要了解许许多多物品的价格变化,但是现在,让我们先用电脑价格和肉价来编一个简单的物价指数。,33,同样的电脑去年5000元/台,今年3000元/台,按电脑价格对生活的影响,在物价指数中占0.1%,而肉去年5元/斤,今年8元/斤,在物价指数中占了剩下的99.9%,现在让我们看看物价整体是涨了还是降了 去年平均物价50000.1%599.9%=9.99元, 今年的是30000.1% 899.9%=10.99元, 今年平均物价是去年的110%(10.999.99100%)。 如果以去年的物价为基础,今年的物价指数就是110%。,34,尽管电脑价格下降了2000元,而肉价只涨了区区3元钱,可我们总体的生活支出依然上涨了10%。,35,物价指数按用途不同又有商品零售物价指数、消费品物价指数,这些与我们的日常支出息息相关。 另外的像工业品价格指数、生产资料价格指数,会直接影响工业,对我们的生活只会有间接影响。,36,统计数字告诉了我们很多信息,然而如果我们对统计数字不加分析,或者错误地分析了统计数字,我们就会被它误导被它欺骗。的确,统计是淘金的工具。不过,并非每个握着淘金筛的人都能淘到金子。要从统计数字中淘到真金,我们需要一双正确分析统计数字的火眼金睛。,37,你相信统计结果吗?,数据可以有误或作假 统计方法(有意或无意)使用不当可以误导。有低级误导和高级误导。 常识判断和直觉是重要的,38,统计陷阱,实际上,在统计应用中有许多陷阱,他们可能使统计推断的结果不可靠、不可信、甚至导致灾难性后果 世界上有三种谎言:谎言、该死的谎言,还有统计数据。 本杰明.迪斯累里(Benjamin Disraelis) 首先要掌握事实,然后你可以随意歪曲他们。 马克.吐温,39,导致破产的预言,抽样调查的结果不是绝对的正确的,即使有99.9%的把握,仍然有0.1%的意外会超出误差允许的范围,那是不可避免的,是可以允许的正常错误。然而,有些抽样调查却会产生非正常的错误。,40,1936年美国总统选举开始了,大部分人认为现任总统罗斯福民主党的候选人将会胜利。但是有个杂志文学文摘却不以为然,因为他们邮寄出1000万份调查问卷,收回了其中的240万份,调查结果显示,共和党人兰登将会以绝对优势胜出。,41,1000万的调查样本,这么大规模的问卷调查足以让人相信罗斯福的总统政治生涯结束了。但结果却出乎杂志社的预料,罗斯福顺利当选美国总统,后来成为二次大战时领导世界人民抗击法西斯的三巨头之一。由于错误的预测,读者对这本杂志产生了严重的信任危机,大选结束仅仅几个月文学文摘就破产了。,42,文学文摘的问题出在哪里呢?原来,他们是按电话簿上的地址寄出的调查问卷。虽然今天电话早已经进入了千家万户,但在20世纪30年代的美国刚刚经历过一场巨大的经济危机,失业人数高达900万(而那时美国总人口还不足1亿),大部分人的工资只有危机以前的1/3的水平,只有一部分相对富裕的家庭用得起电话这种“高科技产品”。电话只有富人才有,富人大多支持共和党人兰登,这就是文学文摘调查结果的来历。而当时美国穷人大多支持罗斯福。在人数上,穷人比富人多得多,由于在选举上每个公民都有1票,庞大的穷人数量造成了这次抽样调查结果的巨大偏差。,43,这是历史上非常有名的抽样统计失败的案例。它说明抽样调查的成败有时不在于调查数据量的多少,而在于是否能做到完全随机地抽取样本。还是那次总统选举,另外有一个人叫盖洛普,他只是在大街上随机找了2万人进行调查就获得了正确的结果罗斯福将获胜。,44,所以,即使是抽样检查,也不能抓起电话就做,还是要首先考虑一下,获取的样本必须是一个全面的群体。,45,轻率的结论,统计资料表明:大多数汽车事故出在中等速 度的行驶中,极少的事故是出在大于150 公里/小时的行驶速度上的。这是否就意 味着高速行驶比较安全? 统计资料表明: 76%的交通事故是由没有饮酒的驾驶者造成的,这是否意味着酒后驾车也没有关系。,统计资料表明:在亚利桑那州死于肺结核的 人比其他州的人多。这是否就意味着亚 利桑那州的气候容易生肺病?,46,常常听说,汽车事故多数发生在离家不远的地方,这是否就意味着在离家很远的公路上行车要比在城里安全些呢?,不是,统计只不过反映了人们往往是在离家不远的地方开车,而很少在远处的公路上开车。,47,有一项研究表明其一个国家的人民,喝 牛奶和死于癌症的比例都很高。这是否说明 是牛奶引起癌症呢?,不!这个国家老年人的比例也很高。由 于癌症通常是年龄大的人易得,正是这个因 素提高了这个国家癌症死亡者的比例。,48,一项研究表明在某个城市心力衰竭而死亡的人数和啤酒的消耗量都急剧升高。这是否表示喝啤酒会引起心脏病发作?,不!两种情况的增加是人口迅速增加的 结果。若按同样的理由,心脏病发作还可见 归咎于上百个其他因素,如咖啡消耗量增 加,嚼口香糖的人增多,玩桥牌更加盛行, 更多的人看电视,等等。,49,一项研究显示出,欧洲某个城市的人口大量增加,同时鹳鸟窝也大量增加。这是否就支持了鹳鸟送来婴儿这一信念?(欧洲有一种说法,称婴儿是鹳鸟送来的,常用鹳鸟来临表示婴儿降生)。,不!它反映的事实是这个城市内的房屋 增多,鹳鸟就有更多地盘来筑窝了。,50,诡诈的曲线-数据图形化的欺诈,某企业10年销售额飞速增长:,当一个人在他的头脑里只有数字和图形的时候,他就不能找到踪迹间的因果关系。 叔本华,51,无所不能的调整,52,标致发动机惊人的省油,53,非凡的牛市,54,各种腰斩图1,55,各种腰斩图2,56,貌似精确的百分数,第二次世界大战中一位负责雷达业务的军官非常紧张的状态,这位军官长时间徒劳地一再向上级机关请求加强7名技术人员组成的雷达小组的力量,可是一直没有结果。但当其中一名成员的神经崩溃时,这位军官只是非常言简意赅地报告:“14%的人员由于过重的负担而变得精神恍惚,甚至出现神经错乱的现象”。,一个农场主,在他所饲养的全部家畜中,57%是牛,14%是猪,其余的畜类占29%。但是,有谁能够想到,这位骄傲的农场主实际上只养着4头牛、2只羊和1头猪?这就是他的全部家畜。,“在我们的全部议员中,女性议员的比例已经提高了50%!”在联邦德国自由民主党(FDP)的党主席选举后,新闻媒体这样报道。联邦德国议会中的全体自由民主党成员异常兴奋,并为之鼓掌喝采。“嗯,是这样的”,其中一个议员轻声地说:“以前我们有4个女性议员,而现在增加到6个”。,57,每两个人中就会有一个独居,“近100年,人们的生活方式发生了剧烈的变动,”南德意志报写道。“20世纪初,大家庭成员之间彼此共同生活在一起是非常正常的现象。几乎有一半的居民是生活在拥有5个人或者更多人的家庭中。而今天的德国与以前完全不同:2/3的居民独居或者是两个人一起生活。”证据是:66%的家庭人口小于3个人 在美茵河畔的法兰克福,甚至有77.5%的家庭人口小于3个人,其中49.2%的家庭只有1个人。因此得出结论:半数的人在独居!,58,两个灼眼的百分数,增长率的增长率: 人们利用百分数很容易在和风细雨的现象中制造出一种狂风暴雨的幻象。现在假设一个公司的销售额如下: 100 101 102.5 从上面的数据可以得出结论:销售额先增长了1%,然后又增长了1.49%(1.5/101)。客观地说,这两个增长率数字非常小,也可以说,后一个增长率几乎贴在前一个数据之上,原则上我们不能用“具有活力”这个词来描述这个公司的销售情形。 相反,如果我们不从增长率这个初始数据出发,而改用增长率的增长率来表示,那么,情况就会发生根本性的改变。如果销售额在第1年增长了1%,第2年比第1年又增长了1.49%,那么,第2年的销售额比第1年的销售额拥有令人骄傲的成绩:增长了49%,小样本的百分数: 百分数也给误解提供了肥沃的土壤。和小数一样,它也能为不确切的事物蒙上精确的面纱。美国劳工部(The United States Department of Labor)的每月劳动回顾(Monthly LabarReview)曾经指出,在华盛顿,某个特定月份中支付交通费用的兼职家庭帮工中,4.9的人周收入是18 美元。实际上,4.9的兼职家庭帮工仅指2个帮工。也就是说,以上结果仅含有41 个被调查对象。任何建立在小样本容量上的百分数都可能产生误导,直接给出具体数值的大小将更有价值。如果再将百分数表示成小数点后几位的小数形式,你可能正将天平从愚蠢的一端移向欺诈。,59,骗人的“平均数”,吉斯莫先生有一个小工厂,生产超级小玩意儿,60,管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。,61,现在吉斯莫先生正在接见萨姆,谈工作问题,吉斯莫:我们这里报酬不错。平均薪金是每周300元。 你在学徒期间每周得75元,不过很快就可以加 工资。,62,萨姆工作了几天之后,要求见厂长,萨姆:你欺骗我!我已经找其他工人核对过了,没有一个人 的工资超过每周100元。平均工资怎么可能是一周300 元呢?,63,吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向 你证明这一点。,64,吉斯莫:这是我每周付出的酬金。我得2400元,我 弟弟得1000元,我的六个亲戚每人得250 元,五个领工每人得200元,10个工人每人 100元。总共是每周6900元,付给23个人, 对吧?,65,萨姆:对,对,对!你是对的,平均工资是每 周300元。可你还是蒙骗了我。,66,吉斯莫;我不同意!你实在是不明白。我已经把 工资列了个表,并告诉了你,工资的中 位数是200元,可这不是平均工资,而是 中等工资。,67,萨姆:每周100元又是怎么回事呢?,吉斯莫:那称为众数,是大多数人挣的工资。,68,吉斯莫:老弟,你的问题是出在你不懂平均 数、中位数和众数之间的区别。,萨姆:好,现在我可懂了。我我辞职!,69,统计学的解说可能是极富逆论性的,常常被完全误解。关于吉斯莫工厂的故事揭示出,误解产生的一个共同根源是不了解平均数、中位数(中值)和众数之间的差别。 “平均”这个词往往是“算术平均值”的简称。这是一个很有用的统计学的度量指标。然而,如果有少数几个很大的数,如吉斯莫的工厂中少数高薪者,“平均”工资就会给人错误的印象。,70,受人操纵的平均数,71,示之以弱?示之以强?,篮球比赛的应对策略
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数据驱动的教育变革智慧教育的探索与实践
- 提升学生自我效能感教育心理学的实践路径
- 提升学习体验教育游戏化激励机制的多元应用
- 技术与课程整合的教学策略研究
- 2025年中国4-氯间苯二酚数据监测研究报告
- 探索教育技术在商业人才培养中的价值
- 抖音商户编导脚本审核流程制度
- 全球铀矿资源市场潜力与2025年核能产业安全与环保研究报告
- C12-DG-PEG-MW-2000-1-2-Didodecanoyl-rac-glycero-3-methoxypolyethylene-glycol-MW-2000-生命科学试剂-MCE
- 亳州学院《食品营养与健康》2023-2024学年第一学期期末试卷
- 物流分拣中心劳务承揽服务方案(投标方案)
- 配产配注方法培训
- 发动机缸径测量实训课件
- 八五普法考试答案
- 国家电网考试历年真题(含解析)
- 部编版九年级语文上册教案
- 2023-2024学年黑龙江省宁安市初中语文七年级下册期末高分通关试卷
- GB/T 6075.3-2011机械振动在非旋转部件上测量评价机器的振动第3部分:额定功率大于15 kW额定转速在120 r/min至15 000 r/min之间的在现场测量的工业机器
- GB/T 5594.4-2015电子元器件结构陶瓷材料性能测试方法第4部分:介电常数和介质损耗角正切值测试方法
- 预防保健科护理质量控制考核标准
- 林州重机710采煤机电控箱装配流程
评论
0/150
提交评论