已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,2.2.2 用样本的数字特征估计总体的数字特征,众数、中位数、平均数 2. 标准差,2,众数、中位数、平均数,3,一 众数、中位数、平均数的概念,中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,众数:在一组数据中,出现次数最多的数据叫做这组数据的众数,众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.,4,平均数:是统计中最常用的数据代表值,比较可靠和稳定,因为它与每一个数据都有关,反映出来的信息最充分。平均数既可以描述一组数据本身的整体平均情况,也可以用来作为不同组数据比较的一个标准。因此,它在生活中应用最广泛,比如我们经常所说的平均成绩、平均身高、平均体重等,受极端值的影响。 中位数:作为一组数据的代表,可靠性比较差,因为它只利用了部分数据。但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适。 众数:作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数据。在一组数据中,如果个别数据有很大的变动,且某个数据出现的次数最多,此时用该数据(即众数)表示这组数据的“集中趋势”就比较适合。,5,练习: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:,分别求这些运动员成绩的众数,中位数与平均数,解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75 上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;,6,这组数据的平均数是,答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米).,7,例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示:,二 、 众数、中位数、平均数与频率分布直方图的关系,1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,8,2、在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.03t.,9,说明: 2.03这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.,10,下图显示了居民月均用水量的平均数:,11,三 三种数字特征的优缺点,1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.,12,2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。,13,3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。,14,四 众数、中位数、平均数的简单应用,例 某工厂人员及工资构成如下:,(1)指出这个问题中周工资的众数、中位数、平均数,(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?,解:众数为200,中位数为220,平均数为300。 因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。,15,标准差,16,平均数向我们提供了样本数据的重要信息,但是平均有时也会使我们作出对总体的片面判断因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的因此,只有平均数还难以概括样本数据的实际状态,如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:,甲: ,乙: ,如果你是教练,你应当如何对这次射击作出评价?,如果看两人本次射击的平均成绩,由于,两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?,17,(甲),4,5,6,7,8,9,10,环数,频率,0.1,0.2,0.3,频率,(乙),直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中(如上图所示). 因此,我们还需要从另外的角度来考察这两组数据.例如:在作统计图表时提到过的极差.,18,甲的环数极差=10-4=6 乙的环数极差=9-5=4. 它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.,考察样本数据的分散程度的大小,最常用的统计量是标准差 标准差是样本平均数的一种平均距离,一般用s表示,所谓“平均距离”,其含义可作如下理解:,19,由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差,一个样本中的个体与平均数之间的距离关系可用下图表示:,考虑一个容量为2的样本:,20,显然,标准差越大,则a越大,数据的离散程度越大;标准差越小,数据的离散程度越小.,用计算器可算出甲,乙两人的的成绩的标准差,由 可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.,上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来.,21,例题1:画出下列四组样本数据的直方图,说明它们的异同点.,解:四组样本数据的直方图是:,22,23,四组数据的平均数都是5.0,标准差分别是0.00,0.82,1.49,2.83. 虽然它们有相同的平均数,但是它们有不同的标准差,说明数据的分散程度是不一样的.,标准差还可以用于对样本数据的另外一种解释.例如: 在关于居民月均用水量的例子中,平均数 标准差s=0.868,所以,24,例2 甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm),甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39,乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48,从生产的零件内径的尺寸看,谁生产的质量较高?,25,分析:每一个工人生产的所有零件的内径尺寸组成一个总体, 由于零件的生产标准已经给出(内径25.40mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.00mm的差异在时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样比较两人的生产质量只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样体数据,然后比较这两个样本的平均数,标准差,以此作为两个总体之间的估计值.,解:用计算器计算可得:,26,从样本平均数看,甲生产的零件内径比乙生产的更接近内径标准(25.40mm),但是差异很小;从样本标准差看,由于,从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与我们抽取的内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本(为什么?).这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数,标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023年八年级物理上册期末考试卷(及参考答案)
- 2022年部编人教版四年级道德与法治上册期末考试题及答案【完整】
- 七年级数学(上册)期末达标试题及答案
- 九年级物理上册期末测试卷及答案【一套】
- 部编人教版六年级数学(上册)期末试卷(附答案)
- 2022-2023年部编版九年级数学下册期中试卷及答案1套
- 2022-2023年部编版九年级数学下册期中试卷(各版本)
- 新人教版六年级数学上册期末考试卷(学生专用)
- 医院医药价格公示实施方案
- 2022年北师大版九年级物理上册期末测试卷(必考题)
- 夯实基础,有效备考-地理备考经验
- 初中生数学应用意识的培养策略研究
- 重庆市民办幼儿园设置标准
- 绿色工厂建设中长期规划及实施方案
- LY/T 2779-2016薇甘菊检疫技术规程
- 装修基础知识课件
- 选矿设计-:工艺流程和工艺设备的选择和计算课件
- 汉字书写评分标准
- 民营公司刑法律风险及防范课件
- 牛津初中英语7A-9B分册词汇表
- 狱政管理(课堂)课件
评论
0/150
提交评论