




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.2.1用样本的频率分布估计总体分布,1、用样本去估计总体,是研究统计问题的一个基本思想,2、前面我们学过的抽样方法有:简单随机抽样、系统抽样、分层抽样。要注意这几种抽样方法的联系与区别。,3、初中时我们学习过样本的频率分布,包括频数、频率的概念,频数分布表和频数分布直方图的制作。,1用样本估计总体的两种情况(1)用样本的_估计总体的分布(2)用样本的_估计总体的数字特征,频率分布,数字特征,填一填知识要点、记下疑难点,本讲栏目开关,2数据分析的基本方法(1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中_信息,二是利用图形_信息(2)借助于表格分析数据的另一方法是用紧凑的_改变数据的排列方式,此法是通过改变数据的_,为我们提供解释数据的新方式,提取,传递,表格,构成形式,本讲栏目开关,填一填知识要点、记下疑难点,抛掷硬币的大量重复试验的结果:,样本容量为72088,频率分布条形图,频率分布表:,注意:各长方形长条的宽度要相同。,相邻长条的间距要适当。,结论:当试验次数无限增大时,两种试验结果的频率大致相等。,长方形长条的高度表示取各值的频率。,归纳1:当总体中的个体所取的不同数值较少时,其随机变量是离散型。则样本的频率分布表示形式有:,(2)频率分布条形图,(1)样本频率分布表,例1.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件(1)列出样本的频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计此种产品为二级品或三级品的概率约是多少,(3)此种产品为二级品或三级品的概率约为0.270.430.7,知识探究(一):频率分布表,【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):,3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2,显然:这个例子与前面抛掷硬币的问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有:频率分布表和频率分布直方图,1.极差:样本数据中的最大值和最小值的差称为极差,2.确定组距,组数:.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?,0.24.3,(4.3-0.2)0.5=8.2,3将数据分组,决定分点:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?,4画频率分布表:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?,0,0.5),0.5,1),1,1.5),4,4.5.,分组频数累计频数频率0,0.5)40.040.5,1)正80.081,1.5)正正正150.151.5,2)正正正正220.222,2.5)正正正正正250.252.5,3)正正140.143,3.5)正一60.063.5,4)40.044,4.520.02合计1001.00,知识探究(二):频率分布直方图,5画频率分布直方图为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距.频率分布直方图中各小长方形的宽度和高度在数量上有何特点?,宽度:组距,2图形的意义,图形的意义:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?,各小长方形的面积=频率,各小长方形的面积之和=1,宽度:组距,3分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,思考:1.对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?,与分组数(或组距)及坐标系的单位长度有关.,研一研问题探究、课堂更高效,本讲栏目开关,1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.1,2、决定组距与组数(将数据分组),3、将数据分组(8.2取整,分为9组),画频率分布直方图的步骤,4、列出频率分布表.(填写频率/组距一栏),5、画出频率分布直方图。,组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。,小结,频率分布的条形图和频率分布直方图的区别,两者是不同的概念;,横轴:两者表示内容相同,思考:频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?,纵轴:两者表示的内容不相同,频率分布条形图的纵轴(长方形的高)表示频率,频率分布直方图的纵轴(长方形的高)表示频率与组距的比值,,其相应组距上的频率等于该组距上长方形的面积。,理论迁移,例某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在3252岁的知识分子所占的比例约是多少.,(1)极差为67-28=39,取组距为5,分为8组.,分组频数频率27,32)30.0632,37)30.0637,42)90.1842,47)160.3247,52)70.1452,57)50.1057,62)40.0862,67)30.06合计501.00,样本频率分布表:,(2)样本频率分布直方图:,(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在3252岁的知识分子约占70%.,例2:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第二小组的频率是多少?样本容量是多少?若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?,频率分布直方图如下:,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,利用样本频分布对总体分布进行相应估计,(2)样本容量越大,这种估计越精确。,(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,总体密度曲线,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。,当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线总体密度曲线,总体密度曲线,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,总体密度曲线,本讲栏目开关,研一研问题探究、课堂更高效,本讲栏目开关,研一研问题探究、课堂更高效,研一研问题探究、课堂更高效,本讲栏目开关,本讲栏目开关,研一研问题探究、课堂更高效,A,本讲栏目开关,研一研问题探究、课堂更高效,A甲运动员的成绩好于乙运动员B乙运动员的成绩好于甲运动员C甲、乙两名运动员的成绩没有明显的差异D甲运动员的最低得分为0分,本讲栏目开关,研一研问题探究、课堂更高效,研一研问题探究、课堂更高效,第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;第三步,将各个数据的叶按大小次序写在茎右(左)侧,本讲栏目开关,答,Ax甲x乙;乙比甲成绩稳定Bx甲x乙;甲比乙成绩稳定Cx甲x乙;乙比甲成绩稳定Dx甲x乙;甲比乙成绩稳定,C,本讲栏目开关,研一研问题探究、课堂更高效,本讲栏目开关,研一研问题探究、课堂更高效,A.5B4C3D2,D,本讲栏目开关,研一研问题探究、课堂更高效,C,1如图是总体密度曲线,下列说法正确的是()A组距越大,频率分布折线图越接近于它B样本容量越小,频率分布折线图越接近于它C阴影部分的面积代表总体在(a,b)内取值的百分比D阴影部分的平均高度代表总体在(a,b)内取值的百分比,本讲栏目开关,练一练当堂检测、目标达成落实处,2若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是(),A.91.5和91.5B91.5和92C91和91.5D92和92,A,本讲栏目开关,练一练当堂检测、目标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 在岗乡村医生能力提升理论考试题(附答案)
- 2025-2030中国熟食行业需求前景规模与经营效益可行性报告
- 2025-2030中国烹饪技术行业经营效益及投资潜力分析报告
- 液化气从业人员考试题及答案解析
- 2025年博物馆讲解员招聘考试笔试试题(附答案)
- 物流设施与设备期末重点
- 2025年山东钢铁集团有限公司校园招聘模拟试题附带答案详解及完整答案详解
- 红医堂眼袋话术
- 员工满意度调查问
- 附录:安全双述岗位范例
- 常见意外伤害的救治与护理
- 景区演艺演员管理制度
- 肺保护通气策略
- 2024年甘肃省张家川回族自治县教育局公开招聘试题含答案分析
- 亲子活动热狗活动方案
- 2025年黑龙江、吉林、辽宁、内蒙古高考生物真题试卷(解析版)
- 库房卫生打扫管理制度
- 河南省郑州市2023-2024学年高一下学期6月期末物理试题(解析版)
- 2024年中级统计师《统计基础理论及相关知识》真题及答案解析
- 智能制造虚拟仿真实训基地建设目标
- 《慢性乙肝治疗策略》课件
评论
0/150
提交评论