




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 统计,2.2.2 用样本的数字特征估计总体的数字特征(1),(一) 众数、中位数、平均数,1. 众数、中位数、平均数的概念,(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数,(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.,(3)平均数: 一组数据的算术平均数,即,在初中我们学过众数、中位数和平均数的有关知识,这 些数据都是反映样本信息的数字特征,它们又是如何定义的?,在一次中学生田径运动会上,参加男子跳高的17名运动员 的成绩如表所示:,这组数据的平均数是: (1.5021.6031.901)1.69(m).,答:17名运动员成绩的众数、中位数、平均数依次为1.75m,1.70 m,1.69 m.,分别求这些运动员成绩的众数、中位数与平均数,解:由表中数据可知:1.75出现了4次,出现的次数最多,所以这组数据的众数是1.75.,上表数据可看成是按从小到大的顺序排列的,其中最中间 和数据为1.70,所以这组数据的中位数是1.70;,众数应该在面积最大的矩形内,所以猜测众数2 2.5范围之内,一般地,取最高矩形下端中点的横坐标2.25作为众数.,在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?,众数:最高矩形下端中点的横坐标,图中矩形的面积代表什么?中位数两边的图形面积有什么联系?如何用频率分布直方图估计中位数?,中位数两边的面积是相等的,都是0.5,从左至右各矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四组之和为0.49,中位数在第五组。,中位数:2+0.5(0.01/0.25)=2.02,中位数:直方图面积平分线与横轴交点的横坐标,用频率分布直方图,你能估算样本的平均数吗?,0.250.04+0.750.08+1.250.15+1.750.22+2.250.25+2.750.14+3.250.06+3.750.04+4.250.02=2.02(t).,平均数等于各矩形面积与矩形底边中点的横坐标积的和。,平均数:每个小矩形的面积与小矩形 底边中点的横坐标的乘积之和,从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?,答:频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关.,注: 在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.,求众数、中位数、平均数有哪些不同的方法?,2.众数、中位数、平均数的方法:,(1)用样本数据计算;(2)用频率分布直方图估算。,根据众数、中位数、平均数各自的特点,你能分析它们对 反映总体存在的不足之处吗?,答:(1)众数体现了样本数据的最大集中点,但它对其它数据 信息的忽视使得无法客观地反映总体特征;,(2)中位数是样本数据所占频率的等分线,它不受少数几个极 端值的影响,这在某些情况下是优点,但它对极端值的不敏 感有时也会成为缺点;,(3)由于平均数与每一个样本的数据有关,所以任何一个样本数 据的改变都会引起平均数的改变,这是众数、中位数都不具有 的性质.也正因如此,与众数、中位数比较起来,平均数可以反映 出更多的关于样本数据全体的信息,但平均数受数据中的极端 值的影响较大,使平均数在估计时可靠性降低.,注:使用者常根据自己的利益选择众数、中位数、平均数来描述数据的中心位置,从而产后一些误导。,假设你是一名交通部门的工作人员。你打算向市长报告国家对本市26条公路项目投资的平均资金数额,其中一条新公路的建设投资为2 200万元人民币,另外25个项目的投资在20万与100万中位数是25万,平均数是100万,众数是20万元。你会选择哪一种数字特征来表示每一个项目的国家投资?你选择这种数字特征的缺点是什么?(课本第74练习),答:选择平均数更好。因为,此时的众数20万比中位数25万还小,所以众数代表的是局部的数。中位数代表的虽然是大多数公路投资的数额,但由于其不受极端值的影响,不能代表全体,因而此时成了它的缺点。选择平均数较好,能比较好的代表整体水平,但缺点是仍不能显示出具体的数字特征,以往的招生统计数据显示,某所大学录取的新生高考总分的中位数基本上稳定在550分你的一位校友在今年的高考中得了520分,你是立即劝阻他报考这所大学,还是先查阅一下这所大学招生的其他信息?解释一下你的选择。,答:应立即劝这位同学查阅一下这所大学招生的其它信息。查看一下这所大学近几年招生的平均数,如果平均数低于550分,说明这所大学每年的招生中,存在只招入少数高分学生的现象,大部分学生都是低于中位数录取的,可以报报看,否则不能报。如果能查到该校每年录取的最低分数线那是最好的,(课本第81页习题2.2A组 3),某公司的33名职工的月工资(单位:元)如下表:,(1)求该公司职工月工资的平均数、中位数、众数 (2)若董事长、副董事长的工资分别从5 500元、5 000元提升到30 000元、20 000元,那么公司职工新的平均数、中位数和众数又是什么? (3)你认为哪个统计量更能反映这个公司员工的工资水平?,解 :(1)公司职工月工资的平均数为,若把所有数据从大到小排序,则得到:中位数是1 500元, 众数是1 500元,(2)若董事长、副董事长的工资提升后,职工月工资的平均数为,中位数是1 500元,众数是1 500元,(3)在这个问题中,中位数和众数都能反映出这个公司员工的 工资水平,因为公司少数人的工资额与大多数人的工资额差 别较大,这样导致平均数与中位数偏差较大,所以平均数不 能反映这个公司员工的工资水平,小结:样本的众数、中位数和平均数常用来表示样本数据的 “中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大,某工厂人员及工资构
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论