版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.2用样本估计总体,第二章统 计,统计的基本思想方法:,用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.,统计的核心问题:,如何根据样本的情况对总体的情况作出一种推断. 这里包括两类问题:,一类是如何从总体中抽取样本?,另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断.,用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。,整体介绍:,将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。 每组数
2、据的个数除以全体数据个数的商叫做该组的频率。,复习,频数与频率,根据随机抽取样本的大小,分别计算某 一事件出现的频率,频率的分布规律 (取值状况),就叫做样本的频率分布。,频率分布,思考:样本频率分布与总体频率分 布有什么关系?,通过样本的频数分布、频率分布可 以估计总体的频率分布.,频率分布,样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。,频率分布的表示形式有:样本频率分布表 样本频率分布图 样本频率分布直方图 样本频率分布折线图,所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。,知识探究(一):频率分布表,【问题】 我国是世界上严重缺水的国家之一,城市缺水
3、问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民的月均用水量如下表(单位:t):,3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5
4、 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2,如果希望大部分居民的日常生活不受影响,那么标准 a 定为多少比较合理呢? 为了较合理地确定这个标准,你认为需要做哪些工作?,显然:这里的总体可以在一个实数区间取值,称为连续型
5、总体。样本的频率分布表示形式有: 频率分布表和频率分布直方图,画频率分布表和频率分布直方图其一般步骤为: (1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图,1.极差:样本数据中的最大值和最小值的差称为极差,2.确定组距,组数:.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?,0.24.3,(4.3-0.2)0.5=8.2,8.2取过剩整数值,分为9组,3 将数据分组,决定分点:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?,4 画频率分布表:如何统计上述1
6、00个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?,0,0.5),0.5,1),1,1.5), ,4,4.5.,分 组 频数累计 频数 频率 0,0.5) 4 0.04 0.5,1) 正 8 0.08 1,1.5) 正 正 正 15 0.15 1.5,2) 正 正 正 正 22 0.22 2,2.5) 正 正 正 正 正 25 0.25 2.5,3) 正 正 14 0.14 3,3.5) 正 一 6 0.06 3.5,4) 4 0.04 4,4.5 2 0.02 合计 100 1.00,知识探究(二):频率分布直方图,5 画频率分布直方图 为了直观反映样
7、本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的宽度和高度在数量上有何特点?,宽度:组距,2 图形的意义,频率分布直方图,各个小长方形的面积=?,频率,小长方形的面积总和=?,频率分布直方图,1,月均用水量最多的在哪几个区间?,频率分布直方图,3 分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,(1)居民月均用水量的
8、分布是“山峰”状的,而且是“单峰”的;,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,探要点、究所然,20,优质课堂,探要点、究所然,21,优质课堂,探要点、究所然,22,优质课堂,探要点、究所然,23,优质课堂,探要点、究所然,24,优质课堂,频率分布直方图如下:,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,利用样本频率分布对总体分布进行相应估计,(2)样本容量越大,这种估计越精确。,(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢
9、?,总体密度曲线,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比)。,当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线总体密度曲线,总体密度曲线,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,总体密度曲线,1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地
10、画出来?,思考,实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。,由于样本是随机的,不同的样本得到的频率分布折线图不同;即使是同一样本,不同的分组得到的频率分布折线图也不同。,也就是说:频率分布折线图是随着样本的容量和分组情况的变化而变化的,因此不能由样本的频率分布折线图得到准确的总体密度曲线。,2.图中阴影部分的面积表示什么?,2.总体在范围(a,b)内取值的百分比,NBA某赛季甲、乙两名篮球运动员每场比赛的得分的原始纪录如下:甲运动员得分:13,51,23,8,26,38,16,
11、33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.问题一:请用适当的方法表示上述数据,并对两名运动员的得分能力进行比较.,引例,33,优质课堂,问题二:用上次课所学的制作样本的频率分布直方图来分析好吗?甲:13,51,23,8,26,38,16,33,14,28,39;乙:49,24,12,31,50,31,44,36,15,37,25,36,39.,当数据比较少时,应用列分布直方图反而不方便,简化制图格式和步骤,得到新的统计制图方法:,甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39;乙运动员得分
12、:49,24,12,31,50,31,44, 36,15,37,25,36,39.,茎叶图 (一种被用来表示数据的图),当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图,注:中间的数字表示得分的十位数字。 旁边的数字分别表示两个人得分的个位数。,茎叶图,乙:得分基本上是对称的,叶的分布是“单峰”的,有10/13的叶是分布在茎2、3、4上,中位数是36. 甲:得分除一个特殊得分(51分)外,也大致对称,分布也是“单峰”的,有9/11的叶主要集中在茎1、2、
13、3上,中位数是26.,从上述中位数的大小就可以看得出,乙运动员的成绩更好.另外,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.,请用适当的方法表示上述数据,并对两名 运动员的得分能力进行比较,茎叶图特点:,茎叶图不仅能保留原始数据,而且能够展示数据 的分布情况 。当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有的信息,而且 可以随时记录,给数据的记录和表示都方便。,探要点、究所然,41,优质课堂,探要点、究所然,42,优质课堂,探要点、究所然,43,优质课堂,探要点、究所然,A,44,优质课堂,探要点、究所然,C,45,优质课堂,探要点、究所然,D,46,优质课堂,当堂测、查疑缺,C,当堂测、查疑缺,A,48,优质课堂,当堂测、查疑缺,乙,49,优质课堂,课堂小结,表示样本分布的方法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 停车场系统维修外包合同
- 冻结法隧道施工工艺及施工方法
- 公园物业管理外包合同
- 2026年职业健康培训考试试题及答案
- 公司让离职签给外包合同
- 腔镜手术基本操作及相关知识试题与答案
- 雨期基坑施工工艺
- 旅馆从业在线考试题及答案解析
- 麻醉科主治医师考试(疼痛诊疗学及危重病医学)试题及答案
- 口唇破溃护理
- JJG 1078-2026医用数字摄影系统(DR)X射线辐射源检定规程
- 印刷工艺与质量标准手册
- 2026广东惠州市交通投资集团有限公司社会招聘22人备考题库及答案详解(考点梳理)
- 2026年二级建造师《建设工程施工管理》必刷200题及完整答案详解【各地真题】
- 市政管网工程应急预案
- 煤矿排矸场、矸石山生态环境治理工程施工组织设计
- 呼吸科光动力治疗应用
- 2026年道路交通事故受伤人员临床诊疗指南
- 业务外包结算管理制度
- 《CHT 3019-2018 125 000 150 000光学遥感测绘卫星影像产品生产技术规范》专题研究报告
- 2026年春人教版(新教材)初中生物八年级下册(全册)教学设计附目录P125
评论
0/150
提交评论