




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
问题提出1.随机抽样有哪几种基本的抽样方法?2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.简单随机抽样、系统抽样、分层抽样.
3.高一某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下:
82,75,61,93,62,
55,70,68,85,78.
如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布.第一页第二页,共37页。频数:频率:样本的频率分布:总体分布:【复习回顾】各组内数据的个数。每组数据的个数除以全体数据个数的商。样本的频率分布规律总体取值的概率分布规律。第二页第三页,共37页。2000年全国主要城市中缺水情况排在前10位的城市探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出。知识探究(一):频率分布表
第三页第四页,共37页。
某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那
么标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?第四页第五页,共37页。
思考:由上表,大家可以得到什么信息?
通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:根据这些数据你能得出用水量其他信息吗?第五页第六页,共37页。1、样本数据的变化范围是什么?2、样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?
0.2~4.3(4.3-0.2)÷0.5=8.23、以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?4、如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].【思考】第六页第七页,共37页。【频率分布表】100位居民月平均用水量的频率分布表第七页第八页,共37页。1、上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?
用样本的频率分布估计总体分布.2、如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?88%的居民月用水量在3t以下,可建议取a=3.3、在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?
分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的.【思考】第八页第九页,共37页。4、一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?第一步,求极差.(极差=样本数据中最大值与最小值的差)第二步,确定组距与组数.(设k=极差÷组距,若k为整数,则组数=k,否则,组数=[k]+1)第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格.
(频数=样本数据落在各小组内的个数,频率=频数÷样本容量)第九页第十页,共37页。请大家思考直方图有那些优点和缺点?小长方形的面积总和=?频率/组距月平均用水量/t0.500.400.300.200.100
0.511.522.533.544.5
小长方形的面积=?月均用水量最多的在哪个区间?知识探究(二):频率分布直方图
为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:
频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.第十页第十一页,共37页。
你能根据频率分布直方图指出居民月均用水量的一些数据特点吗?频率/组距月平均用水量/t0.500.400.300.200.100
0.511.522.533.544.5
(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.第十一页第十二页,共37页。【思考】
样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?
第一步,画平面直角坐标系.第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.第十二页第十三页,共37页。探究:
同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。
第十三页第十四页,共37页。
将直方图各块顶端中点连线你会发现什么呢?:年龄0.060.050.040.030.020.01273237424752576267频率组距O思考:若组距取得越小,则频率折线的光滑程度会怎样?越光滑频率分布折线图第十四页第十五页,共37页。
如果样本容量足够大,分组的组距取得足够小,则频率折线图将趋于一条光滑的曲线:年龄0.060.050.040.030.020.01273237424752576267频率组距O总体密度曲线第十五页第十六页,共37页。
例2
甲乙两篮球运动员在上赛季每场比赛的得分如下,试比较两位运动员的水平。甲:12,15,24,25,31,31,36,36,37,
39,44,49,50;乙:8,13,14,16,23,26,28,33,38,
39,51.解决这个实际问题还用频率分布表或者频率分布直方图来做吗?知识探究(三):频率分布茎叶图
此时可以考虑:频率分布茎叶图第十六页第十七页,共37页。
一般地,当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上的叶子,因此通常将此图成为茎叶图012345834636838915254976611940甲乙通过此图即可看出甲运动员的得分大致对称,发挥比较稳定!第十七页第十八页,共37页。第一步,将每个数据分为茎(十位数)和叶(个位数);第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在中间;第三步,将各个数据的叶按大小次序写在其茎右(左)侧.
一般地,列出一组样本数据的频率分布茎叶图可以分哪几个步骤进行?第十八页第十九页,共37页。1.已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为0.2范围的是
()A.5.5~7.5B.7.5~9.5C.9.5~11.5D.11.5~13.5
分组
频数
频率
频数累计5.5~7.520.127.5~9.560.389.5~11.580.41611.5~13.540.220
合计201.0D第十九页第二十页,共37页。2.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.分组
频数
频率
频率累计[12,15)6[15,18)0.08[18,21)0.30[21,24)21[24,27)0.69[27,30)16[30,33)0.10[33,36]1.00合计1001.000.0680.140.16160.210.440.25250.160.850.100.950.0550.06第二十页第二十一页,共37页。3.已知一个样本,填写下面的频率分布表
7.06.66.87.07.27.47.07.37.57.4
7.37.17.06.96.77.17.27.06.97.1分组频数累计频数频率6.55~6.75
6.75~6.95
6.95~7.15
7.15~7.35
7.35~7.55合计2384320251317200.100.150.200.400.151.00第二十一页第二十二页,共37页。0.081500.88第二十二页第二十三页,共37页。(2011·湖北高考)有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为()(A)18(B)36(C)54(D)72实战演练B第二十三页第二十四页,共37页。例题1.有一个容量为50的样本数据的分组的频数如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?第二十四页第二十五页,共37页。解:组距为3
分组频数频率频率/组距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027第二十五页第二十六页,共37页。频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.070第二十六页第二十七页,共37页。例2、为了了解一大片经济林的生长情况,随机测量其中的100株的底部周长,得到如下数据表(长度单位:cm):135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108
(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少。第二十七页第二十八页,共37页。解:(1)从表中可以看出:这组数据的最大值为135,最小值为80,故极差为55,可将其分为11组,组距为5。从第1组[80,85)开始,将各组的频数、频率和频率/组距填入表中第二十八页第二十九页,共37页。第二十九页第三十页,共37页。80859095135110115120125130100105第三十页第三十一页,共37页。课堂练习:1、为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.
(1)列出样本的频率分布表;
(2)根据上述结果,估计此种产品为二级品或三级品的概率约是多少.
解:(1)样本的频率分布表为:
0.134次品0.4313三级品0.278二级品0.175一级品频率频数产品(2)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.第三十一页第三十二页,共37页。2.有一个容量为50的样本,数据的分组及其频数如下所示,请将其制成频率直方图.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民法魏振瀛课件
- 民法总则干部普法课件
- 初中课外读物考试题及答案
- 博弈论期末考试及答案
- 方舱医护与公众人物
- 安全生产红线意识教育讲解
- 民族进步条例课件
- 民族花园课件
- 新质生产力的核心领域与构成
- 因地制宜发展新质生产力路径
- 抢救工作制度培训课件
- 无人机航空摄影测量数据获取与处理PPT完整全套教学课件
- 肺部感染性疾病-课件
- 电气试验(第二版)11-057职业技能鉴定指导书职业标准试题库(仅高级工)
- 把未来点亮歌词打印版
- 全国211大学名单和985高校名单(表格+文档)
- 浴场委托管理合同
- PFEP培训资料 -让物料流动起来-为每个零件制定计划和创建一个物流系统
- 《高级财务管理(第三版)》配套教学课件
- QGDW 11162-2014-变电站监控系统图形界面规范
- 平均站间距计算方法
评论
0/150
提交评论