用样本的频率分布估计总体分布(VI).ppt_第1页
用样本的频率分布估计总体分布(VI).ppt_第2页
用样本的频率分布估计总体分布(VI).ppt_第3页
用样本的频率分布估计总体分布(VI).ppt_第4页
用样本的频率分布估计总体分布(VI).ppt_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.2 用样本估计总体,调查时: 1.通过抽样来收集数据 2.数据被收集后,必须分析数据,找出数据规律,从中寻找所包含的信息,对总体作出相应的估计。 估计一般分成两种: 1.用样本的频率分布估计总体的分布 2.用样本的数据特征(如平均数,标准差等)估计总体的数字特征.,2.2.1 用样本的频率分布估计 总体的分布,用样本的频率分布估计总体的分布,探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标

2、准a定为多少比较合理呢?你认为,为了较为合理的确定出这个标准,需要做那些工作?,2000年全国主要城市中缺水情况排在前10位的城市,某市100名居民的月均用水量(单位:t),将一批数据按要求分为若干组,各组内的数据的个数,叫做 该组数据的频数,各个小组数据在样本容量中所占的比例的大小, 叫做该组数据的频率。,为了解数据分布的规律,可利用频率分布表和频率分布图来分析, 具体做法如下:,1.求极差(即一组数据中最大值和最小值的差),例如, 4.3-0.2=4.1, 这说明这些数据的变化范围大小是4.1t。,2.决定组距和组数,例如,若取组距为0.5,则,故可将数据分成9组。,注:一般样本容量越大,

3、所分组数就越多,当样本容量不超过100时,按照数据的多少,常分成512组。,4.列频率分布表:,3.将数据分组(通常对组内数值所在区间,取左闭右开区间 , 最后一组取闭区间),以组距0.5将数据分组如下: 0,0.5), 0.5,1),4,4.5 .,5.画频率分布直方图,用横轴表示月均用水量,纵轴表示频率与组距的比值,以 每个组距为底,以频率除以组距的商为高,分别画出矩形,这 样得到的直方图就是频率分布直方图。,思考:小矩形的面积与哪些量有关?如何表示?,小长方形的面积=组距*(频率/组距)=频率 各小长方形的面积总和等于1,分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们

4、能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1,2、决定组距与组数(将数据分组),3、 将数据分组(8.2取整,分为9组),4、列出频率分布表.(填写频率/组距一栏),5、画出频率分布直方图。,组距:指每个小组的两个端点的距

5、离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。,画一组数据的频率分布直方图的步骤:,高考题型:,13,频率分布折线图,连接频率分布直方图中各个小长方形上端的中点,频率分布折线图,思考:什么情况下频率折线图才会接近于一条光滑的曲线?,总体密度曲线,阴影部分的面积表示总体在区间(a,b)内取值的百分比.,随着样本容量的增加,作图时所分的组数也会增加,相应的频率折线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的曲线为总体密度曲线,它反映了总体在各个范围内取值的百分比.,对于同一样本,如果组距不同,横轴、纵轴的单位不同,得到频率分布直方图和折线图也会不同。不同的

6、形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图。,茎叶图,甲乙两名篮球运动员每场比赛得分的原始记录如下: 甲得分:13,51,23,8,26,38,16,33,14,28,39 乙得分:49,24,12,31,50,31,44,36,15,37,25,36,39,0 1 2 3 4 5,甲,乙,3,4,6,8,3,6,9,3,8,8,1,2,5,5,4,1,6,1,6,7,9,4,9,0,茎叶图的特征:,(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方

7、便记录与表示;(2)茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;(3)茎叶图对重复出现的数据要重复记录,不能遗漏,已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9, 11,12,9,10,11,11, 那么频率为0.2范围的是( ),A. 5.57.5 B. 7.59.5 C. 9.511.5 D. 11.513.5,D,练习1:,课本 P71 练习1,1.求极差(即一组数据中最大值与最小值的差) 364.41362.51=1.90说

8、明样本数据的变化范围大小是1.90cm) 2.决定组距与组数 取组距为0.4cm,那么组数=极差组距=1.900.4=4.75因此可以将数据分成5组,即组距为0.4,组数为5 3.将数据分组 362.51,362.91), 362.91,363.31), 363.31,363.71), 363.71,364.11), 364.11,364.51,5.画频率分布直方图,4.列频率分布表,连接频率分布直方图中各个小长方形上端的中点,频率分布折线图,随着样本容量的增加,作图时所分的组数也会增加,相应的频率折线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的曲线为总体密度曲线,0.06,0.16,0.18,0.20,0.22,0.18,0.10,黄色部分取值的百分比为0.20+0.22=0.42,总体密度曲线反映了总体在各个范围内的百分比,课堂小结,表示样本分布的方法: (1)频率分布表 (2)频率分布图(包括直方图和条形图) (3)频率分布折线图 (4)茎叶图,1.总体分布指的是总体取值的频率分布规律,由于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论