用样本的数字特征估计总体的数字特征.ppt_第1页
用样本的数字特征估计总体的数字特征.ppt_第2页
用样本的数字特征估计总体的数字特征.ppt_第3页
用样本的数字特征估计总体的数字特征.ppt_第4页
用样本的数字特征估计总体的数字特征.ppt_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用样本的数字特征 估计总体的数字特征,一、复习,中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,众数:在一组数据中,出现次数最多的数据叫做这组数据 的众数,众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.,平均数: 一组数据的算术平均数,即,二、在频率分布直方图中读取众数,中位数,平均数,1、众数在样本数据的频率分布直方图中, 众数就是最高矩形 的中点的横坐标,例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示:,图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02t.,2、在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,因此,在频率分布直方图中, 中位数左边和右边的直方图的面积应该相等,说明: 2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.,3、平均数是频率分布直方图的“重心”.是直方图的平衡点,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,居民月均用水量的平均数: 2.02,三种数字特征的优缺点,1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.,2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。,3、平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。,思考:左是某校学生日睡眠 时间的抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间。,问题就是求各组: 中值与对应频率之积的和, 6.250.05+6.750.17+ 7.250.33+7.750.37+ 8.250.06 +8.750.02 =7.39(h) 估计该校学生的日平均睡眠 时间约为7.39h,某医院的记录表明,以往到急诊中心就诊的病人需等待的时间的频率分布如下:,9.5min,思考:,应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大。,应用思考:,1、在一次人才招牌会上,有一家公司的招聘员告诉你:“我们的 公司收入水平很高,去年,在50名员工中,最高年收入达到100万 元,他们年收入的平均数是3.5万元”如果你希望获得年薪2.5万元。 (1) 你是否能够判断自己成为此公司的一名高收入者? (2) 如果招聘员继续告诉你“员工收入的变化范围是从0.5万元 到100万元,这个信息是否足以使你作出自己是否受聘的决定? (3) 如果招聘员继续告诉你如下的信息:员工收入的中间50% (即去掉最少的25%和最多的25%后所剩下的)的变化范围是 1万到3万,你又如何使用这条信息来作出自己是否受聘的决定? (4) 你能估计收入的中位数是多少吗?为什么均值比估计出的 中位数高很多?,三种数字特征的优缺点,1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.,2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。,3、平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。,平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的因此,只有平均数还难以概括样本数据的实际状态,如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:,甲: ,乙: ,如果你是教练,你应当如何对这次射击作出评价?,如果看两人本次射击的平均成绩,由于,两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?,直观上看,还是有差异的. 如: 甲成绩比较分散, 乙成绩相对集中,频率分布条形图,茎叶图,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39,(2)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39,甲,乙,0 1 2 3 4 5,2 5 5 4 1 6 1 6 7 9 4 9 0,8 4 6 3 6 8 3 8 9 1,直观上看, 还是有差异: 甲成绩比较分散, 乙成绩相对集中,标准差,方差,(数据的标准差越大, 数据的离散程度越大; 标准差越小,数据的离散程度越小.),考察样本数据的分散程度的大小, 最常用的统计量是标准差一般用s表示,所谓“平均距离”,其含义可作如下理解:,(标准差是样本平均数的一种平均距离),由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差,标准差越大,数据的离散程度越大; 标准差越小,数据的离散程度越小.,用计算器可算出甲,乙两人的的成绩的标准差,回顾上题:两人射击 的平均成绩是一样的.那么两个人的水平就没有 什么差异吗?,标准差:,由 可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.,标准差,方差,(数据的标准差越大, 数据的离散程度越大; 标准差越小,数据的离散程度越小.),例题1:画出下列四组样本数据的频率分布条形图,说明它们的异同点.,解:四组样本数据的直方图是:,(1),(2),(3),(4),例2 甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm),甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39,乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48,从生产的零件内径的尺寸看,谁生产的质量较高?,解:用计算器计算可得:,例3.计算数据89,93,88,91,94,90,88,87的方差和标准差。(标准差结果精确到0.1),解:,.,所以这组数据的方差为5.5,标准差为2.3 .,例4. 从甲、乙两名学生中选拔一人乘积射击比赛,对他们的射击水平进行测试,两人在相同的条件下各射击10次,命中环数如下 甲7,8,6,8,6,5,8,10,7,4; 乙9,5,7,8,7,6,8,6,7,7. (1)计算甲、乙两人射击命中环数的平均数和标准差; (2)比较两人的成绩,然后决定选择哪一人参赛.,解:(1)计算得x甲=7,x乙=7; s甲=1.73,s乙=1.10.,(2)由(1)知,甲、乙两人平均成绩相等,但s乙s甲,这表明乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,可以选乙参赛。,练习1甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定。,解:甲品种的样本平均数为10,样本方差为 (9.810)2 +(9.910)2+(10.110)2+ (1010)2+(10.210)25=0.02.,乙品种的样本平均数也为10,样本方差为 (9.410)2+ (10.310)2+(10.810)2+ (9.710)2+(9.810)25=0.24. 因为0.240.02, 所以,由这组数据可以认为甲种水稻的产量比较稳定。,练习l为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换。已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差。,解:各组中值分别为165,195,225,285,315,345,375,由此算得平均数约为,1651%+19511%+22518%+25520%+28525%+31516%+3457%+3752%=267.9268(天),这些组中值的方差为,1(165268)2+11(19

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论