高一数学必修3221-用样本的频率分布估计总体分布-公开课11-19课件_第1页
高一数学必修3221-用样本的频率分布估计总体分布-公开课11-19课件_第2页
高一数学必修3221-用样本的频率分布估计总体分布-公开课11-19课件_第3页
高一数学必修3221-用样本的频率分布估计总体分布-公开课11-19课件_第4页
高一数学必修3221-用样本的频率分布估计总体分布-公开课11-19课件_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2用样本估计总体2.2.1用样本的频率分布估计总体分布

数据根据样本的情况对总体的相应情况作出估计和推断3.随机抽样的三种常用方法简单随机抽样、系统抽样、分层抽样2.统计学研究问题的步骤三步骤:收集数据、整理数据、统计推断。即通过抽样方法收集数据的目的是从中寻找所包含的信息,用样本去估计总体。统计学的核心思想是复习旧知我国是世界上严重缺水的国家之一,城市缺水问题较为突出.情境引入2000年全国主要城市中缺水情况排在前10位的城市

成都市市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费.(1)如果希望大部分居民的日常生活不受影响,那

么标准a定为多少比较合理呢?(2)为了较合理地确定这个标准,你认为需要做哪些工作?3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2

这些数字告诉我们什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:

很容易发现的是一个居民月平均用水量的最小值时0.2t,最大值是4.3t,其他在0.2t~4.3t之间.

分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式.一幅图胜过千字(一)从数据中提取信息,(二)利用图形传递信息。初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.

下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布情况.频率分布相关概念

频率:样本中某个组的频数和样本容量的比,叫做该数据的频率。频率分布的表示形式有:①样本频率分布表②样本频率分布直方图③样本频率分布折线图

所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。

频数:在统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数第一步:求极差(一组数据中的最大值与最小值的差).知识探究(一):样本频率分布表思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?0.2~4.3思考2:分成多少组合适呢?第二步:决定组距与组数:组距:指每个小组的两个端点的距离;组数:k=极差÷组距,若k为整数,则组数=k,否则,组数=[k]+1.将数据分组,当数据在100个以内时,按数据多少常分5-12组。(4.3-0.2)÷0.5=8.2.将8.2取整故,可取组距=0.5,组数=9如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?第四步:列频率分布表.

计算各小组的频率,作出下面的频率分布表.第三步:确定分点,将数据分组.以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5].知识探究(一):频率分布表思考3:各组数据的取值范围可以如何设定?各组均为左闭右开区间,最后一组是闭区间思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?列频率分布表:分组频数累计频数频率[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计48152225146420.040.080.150.220.250.140.060.041001.000.02频率/组距0.080.160.300.440.500.280.120.080.04频率分布表一般分五列1、“分组”,2、“频数累计(可省),3、“频数”,4、“频率”,5、“频率/组距”最后一行是合计知识探究(一):频率分布表频数的合计为样本容量频率合计为1为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234知识探究(二):频率分布直方图

第一步:画平面直角坐标系.第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步:以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.y轴:频率/组距x轴:数据单位月均用水量/t频率/组距0.50.40.30.20.10.511.522.533.544.5O各组的频率在图中哪里显示出来?各小长方体的面积之和是否为定值?各小长方形的面积之和为1.宽度:组距高度:频率组距知识探究(二):频率分布直方图

小长方形的面积=组距频率=组距×频率月均用水量/t0.50.40.30.20.10.511.522.533.544.5O你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?频率/组距知识探究(二):频率分布直方图

(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O

同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,下面给出以0.1和1为组距重新作出的频率分布直方图。

如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?

问题:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O0.150.250.020.220.080.140.040.040.06若将标准a定为2.5,则74%的居民在2.5t以下若将标准a定为3,则88%的居民在3t以下,标准可定为3t.频率分布直方图如下:月均用水量/t0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图.o频率/组距利用样本频率分布对总体分布进行相应估计:(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?(2)样本容量越大,这种估计越精确.(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线.总体密度曲线月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比).o频率/组距理论迁移

例某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:

42,38,29,36,41,43,54,43,34,44,

40,59,39,42,44,50,37,44,45,29,

48,45,53,48,37,28,46,50,37,44,

42,39,51,52,62,47,59,46,45,67,

53,49,65,47,54,63,57,43,46,58.

(1)列出样本频率分布表;

(2)画出频率分布直方图以及频率分布折线图;

(3)估计年龄在32~52岁的知识分子所占的比例约是多少.

(1)极差为67-28=39,取组距为5,分为8组.

分组频数频率频率/组距

[27,32)

[32,37)

[37,42)

[42,47)

[47,52)

[52,57)

[57,62)

[62,67]

合计

样本频率分布表:

3

3

50

9

16

3

0.18

0.06

4

5

7

0.06

0.06

0.32

0.14

0.08

0.10

1.00

0.036

0.012

0.012

0.012

0.064

0.028

0.016

0.020

0.200

(2)样本频率分布直方图:年龄0.0600.0500.0400.0300.0200.010273237424752576267O(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32岁~52岁的知识分子约占70%.频率/组距0.060.180.140.32一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组距=极差/组数三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表频率分布直方图步骤:五、画出频率分布直方图(纵轴表示频率/组距)

小结:频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.约翰·托奇(JohnTukey)约翰·托奇(1915年6月16日-2000年7月26日)是美国数学家,统计学家.最出名的是FFT算法的发展和箱线图.bit来自binarydigit(二进制数字),由数学家JohnTukey提出(可能是1946年提出,但有资料称1943年就提出了)这个术语第一次被正式使用,是在香农著名的论文《通信的数学理论》第1页中.甲乙0123452554161679490846368389

1茎叶图探究:描绘茎叶图?茎叶图(Stem-and-Leafdisplay),由统计学家约翰托奇设计(JohnTukey)思路:是将数组中的数按位数进行比较具体化:将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。分析:认真研读数据,你看到了什么?(1)上面数组有多少个数据?(2)最大值和最小值?(3)中位数?(4)对于12和15,分析其"个位"与"十位",哪个位置数变化大?对于24和25你又有什么想法呢?......能否尝试利用茎叶图完整(原滋原味)表示上述数据?探究:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50

如何分析该运动员的整体水平及发挥稳定程度?

实践是检验真理唯一标准画茎叶图的方法:1.将每个数据分为茎和叶两部分,在此例中,茎为十位上的数字,叶为个位上的数字;2.将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;3.将各个数据的叶按大小次序写在其茎右(左)侧.定茎叶写茎写叶小结:1234525

45

116

6

7

904

9茎叶图制作注意:在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是“叶”部分;同一数据出现几次,就要在图中体现几次.这行,怎么理解?从这个图可以直观的看出:该运动员中位数、众数都在20和40之间,且呈"单峰"状且分布较对称,集中程度高,说明其发挥比较稳定.1234552

54976

6110941234525

45

116

6

7

904

91234552

54976

6110941234525

45116

679049除了上述茎叶图外,还能画出其他茎叶图吗?......对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,用茎叶图如何表示?变式1:012348050571153思考:茎叶图可用作分析单组数据,那么对于两组数据,你能分析吗?例1:

甲、乙两篮球运动员上赛季每场比赛的得分如下,

甲:8,13,14,16,23,26,28,33,38,

39,51

乙:12,15,24,25,31,31,36,36,37,

39,44,49,50

试用茎叶图将这些数据列出来,观察数据的分布情况,比较这两位运动员的得分水平.

解:画出茎叶图甲

8643863983

10123455451166

79490从这个茎叶图可以看出:甲运动员的得分除一个51外,大致对称,且呈"单峰"状,中位数都是26分;乙运动员的得分也大致对称,中位数、众数都是30多分;因此乙运动员发挥比较稳定,总体得分情况比甲好.练习:

右面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()甲012345

乙824719936250328754219441AA.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分通过探究和例1,我们发现用茎叶图可以表示单组数据和两组数据的分布情况,

是一种好的方法,你认为茎叶图有哪些优缺点?1234525

45

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论