高三数学第一轮复习:统计(一)(理)人教实验版(B)_第1页
高三数学第一轮复习:统计(一)(理)人教实验版(B)_第2页
高三数学第一轮复习:统计(一)(理)人教实验版(B)_第3页
高三数学第一轮复习:统计(一)(理)人教实验版(B)_第4页
高三数学第一轮复习:统计(一)(理)人教实验版(B)_第5页
已阅读5页,还剩4页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高三数学第一轮复习:统计(一)(理)人教实验版(B)【本讲教育信息】一. 教学内容:高三复习专题:统计(一)二. 考纲要求(1)随机抽样:理解随机抽样的必要性和重要性会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法(2)总体估计了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点理解样本数据标准差的意义和作用,会计算数据标准差能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想会用随机抽样的基本方法和样本估计总体的思

2、想,解决一些简单的实际问题三. 知识分析【知识梳理】(一)随机抽样1、一种最简单、最基本的抽样方法是简单随机抽样。简单随机抽样有两种选取个体的方法:放回和不放回。我们在抽样调查中用的是不放回抽样,也就是每次从总体中抽取元素后不再将这个元素放回总体。2、一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时,总体中的各个个体都有相同的可能性被抽到,这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。常用的简单随机抽样方法有抽签法和随机数表法。3、抽签法的优点是简单易行,缺点是当总体容量较大时,费时、费力又不方便。况且,如果标号的纸片或小球搅拌得不均匀,可能导致抽样

3、的不公平。4、随机数表是由0,1,2,9这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同。通过随机数生成器,例如使用计算器或计算机的应用程序生成随机数的功能,可以生成一张随机数表。通常根据实际需要和方便使用的原则,将几个组合成一组,如5个数一组,然后通过随机数表抽取样本。5、当总体元素个数很大时,样本容量就不宜太小,采用简单随机抽样,就显得费事这时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样6、系统抽样与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样。7、当总体元素个

4、数较少时,常采用简单随机抽样,当总体中元素个数较多时,常采用系统抽样。8、分层抽样的概念:将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样9、当总体是由差异明显的几部分组成时,往往选用分层抽样的方法分层抽样的优点是使样本具有较强的代表性;而且在各层抽样时,又可灵活地选用不同的抽样法。(二)用样本估计总体1、通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布。另一种是用样本的数字特征估计总体的数字特征。2、分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列

5、方式作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息表格则是通过改变数据的构成形式,为我们提供解释数据的新方式。3、在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1. 4、连结频率分布直方图中各小长方形上端的中点,就得到频率分布折线图,随着样本容量的增加,作图时所分的组数不断增加,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它能够更加精细地反映总体在各个范围内取值的百分比。5、当样本数据较少时,用茎叶图表示数据的效果较好它不但可以保留所有信息,而且可以随时记录,对数据的记录和表示都带来方便。6

6、、在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。7、平均数、众数、中位数描述数据的集中趋势,方差、极差和标准差描述数据波动的大小也可以说方差、标准差和极差反映各个数据与其平均数的离散程度8、标准差,其中是样本数据,n是样本容量,是样本平均数。9、总体方差是反映总体波动大小的特征数,样本方差是样本中数据与样本平均数的差的平方的特征通常用样本方差估计总体方差,当样本容量很大时,样本方差很接近总体方差【要点解析】(一)随机抽样 1、抽样方法是在用样本研究总体时,为了保证获取样本的公平性和合理性产生的一些方法,所以任何一种抽样方法都保证了获取样本的科学性2、系统抽样,又称等距抽样,号码序

7、列一确定,样本即确定了,但要求总体中不能含有一定的周期性,否则样本的代表性是不可靠的,甚至会导致明显的偏差,如打扑克不洗牌就起牌,抽样就失去了公平性3、抽样方法经常交叉起来使用,比如:分层抽样,若每层中个体数量仍很大,则可辅之以系统抽样,系统中的每一均衡的部分,又可采用简单随机抽样4、要合理选择抽样方法,并遵循各种抽样方法的步骤逐步进行5、三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的机会均等从总体中逐个抽取总体中的个体数较少系统抽样将总体均匀分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成

8、几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成(二)用样本估计总体1、在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.2、众数、中位数与平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量(2)由于平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变这是中位数、众数都不具有的性质(3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题(4)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响中位数可

9、能出现在所给数据中,也可能不在所给数据中当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势(5)实际问题中求得的平均数、众数和中位数应带上单位3、一组数据中的众数可能不止一个,众数是一组数据中出现次数最多的数据,而不是该数据出现的次数,如果两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数4、一组数据的中位数是惟一的,求中位数时,必须先将这组数据按从小到大(或从大到小)的顺序排列,如果数据的个数为奇数,那么,最中间的一个数据是这组数据的中位数,如果数据的个数为偶数,那么,最中间两个数据的平均数是这组数据的中位数【典型例题】【例1】某校有学生1200人

10、,为了调查某种情况,打算抽取一个容量为50的样本,问此样本若采用简单随机抽样将如何获得?解析:首先,把该校学生都编上号码:0001,0002,0003,1200。如用抽签法,则做1200个形状、大小相同的号签(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取50次,就得到一个容量为50的样本【例2】某工厂有1003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施解析:(1)由0001至1003,将每个人编一个号。(2)利用随机数表法找到3个号将这3名工人排除。(3)将剩余的1000名工人重新编号为0001至1000

11、。(4)分段,取间隔,将总体均分为10组,每组含100个工人(5)从第一段,即为0001号到0100号中随机抽取一个号l。(6)按编号将l,100l,200l,900l共10个号选出,这10个号所对应的工人组成样本.【例3】一个单位有职工160人,其中有业务人员112人,管理人员16人,后勤服务人员32人,为了了解职工的某种情况,要从中抽取一个容量为20的样本,用分层抽样的方法抽取样本,并写出过程解析:三部分所含个体数为1121632 = 712,设三部分各抽个体数为7x,x,2x,则由7x + x + 2x = 20得x = 2。故业务人员、管理人员、后勤服务人员抽取的个体数分别为14,2和

12、4。对112名业务人员按系统抽样分成14个部分,其中每个部分包含8个个体,对每个部分利用简单随机抽样抽取个体若将160名人员依次编号为1,2,3,160.那么在1112名业务人员中第一部分的个体编号为18。从中随机取一个号码,如它是4号,那么可以从第4号起,按系统抽样法每隔8个抽取1个号码,这样得到112名业务人员被抽出的14个号码依次为4,12,20,28,36,44,52,60,68,76,84,92,100,l08同样可抽出的管理人员和后勤服务人员的号码分别为116,124和132,140,148,156。将以上各层抽出的个体合并起来,就得到容量为20的样本另解:由16020 = 8,所

13、以可在各层中人员按81的比例抽取,又因为168 = 2,1128 = 14,328 = 4所以管理人员2人,后勤服务人员4人,业务人员14人以下同解法一。【例4】为了考察某校的教学水平,将抽查这个学校高三年级部分学生的本学年考试成绩为了全面地反映实际情况,采取以下三种方式进行(已知该校高三年级共有14个教学班,并且每个班内的学生都已经按随机方式编好了学号,假定该校每班人数都相同)从全年级14个班中任意抽取一个班,再从该班中任意抽取14人,考察他们的学习成绩;每个班都抽取1人,共计14人,考察这14个学生的成绩;把学校高三年级的学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行考察

14、(已知若按成绩分,该校高三学生中优秀学生有105名,良好学生有420名,普通学生有175名)根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式各自采用何种抽取样本的方法?(3)试分别写出上面三种抽取方式各自抽取样本的步骤解析:(1)这三种抽取方式中,其总体都是指该校高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩其中第一种抽取方式中样本为所抽取的14名学生本年度的考试成绩,样本容量为14;第二种抽取方式中样本为所抽取的14名学生本年度的考试成绩,样本容量为14;

15、第三种抽取方式中样本为所抽取的100名学生本年度的考试成绩,样本容量为100.(2)上面三种抽取方式中,第一种方式采用的方法是简单随机抽样法;第二种方式采用的方法是系统抽样法和简单随机抽样法;第三种方式采用的方法是分层抽样法和简单随机抽样法(3)第一种方式抽样的步骤如下:首先在这14个班中用抽签法任意抽取一个班,然后从这个班中按学号用随机数表法或抽签法抽取14名学生,考察其考试成绩第二种方式抽样的步骤如下:首先在第一个班中,用简单随机抽样法任意抽取某一学生,记其学号为x,然后在其余的13个班中,选取学号为x的学生,共计14人第三种方式抽样的步骤如下:首先分层,因为若按成绩分,其中优秀生共105

16、人,良好生共420人,普通生共175人,所以在抽取样本中,应该把全体学生分成三个层次,然后确定各个层次抽取的人数,因为样本容量与总体的个数比为10070017,所以在每个层次抽取的个体数依次为,即15,60,25再按层次分别抽取,在优秀生中用简单随机抽样法抽取15人,在良好生中用简单随机抽样法抽取60人,在普通生中用简单随机抽样法抽取25人点评:本题关键是灵活运用统计初步中的一些基本概念和基本方法,对照简单随机抽样、系统抽样、分层抽样的概念得出抽样过程由于分层抽样充分利用总体的一些信息,从而具有较好的代表性,在实践中有着广泛的应用设计抽样方法时,一方面要使样本具有好的代表性,就要将总体“搅拌均

17、匀”,使每个个体有同样的机会被抽中,另一方面应当努力使抽样过程简便易行。【例5】为了解某校初中毕业男生的体能状况,从该校初中毕业班学生中抽取若干名男生进行铅球测试,把所得数据(精确到0.1米)进行整理后,分成6组画出频率分布直方图的一部分(如下图),已知从左到右前5个小组的频率分别为0.04,0. 10,0. 14,0.28,0.30,第6小组的频数是7(1)请将频率分布直方图补充完整;(2)该校参加这次铅球测试的男生有多少人?(3)若成绩在8.0米以上(含8.0米)的为合格,试求这次铅球测试的成绩的合格率;(4)在这次测试中,你能确定该校参加测试的男生铅球成绩的众数和中位数各落在哪个小组内吗

18、?解析:(1)由频率分布直方图的意义可知,各小组频率之和为1,故第6小组的频率为:1(0.04 + 0.10 + 0.14 + 0.28 + 0.30)= 0.14 ,易知第6小组与第3小组的频率相等,故两个小长方形等高,图略(2)由(1)知,第6小组的频率是0.14。又因为第6小组的频数是7,现设参加这次测试的男生有x人,根据频率定义,得,即(人)(3)由图可知,第4、5、6小组成绩在8.0米以上,其频率之和为:0.280.30十0.140.72,故合格率为72%(4)能确定中位数落在第4小组,而众数落在第5小组 点评:解决该类问题时应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的

19、关键频率分布指的是一个样本数据在各个小范围内所占的比例的大小一般用频率分布直方图反映样本的频率分布其中, 频率分布直方图中纵轴表示,;频率分布直方图中,各小长方形的面积之和为1,因此在频率分布直方图中,组距是一个固定值,所以长方形高的比也就是频率之比;频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观;众数为最高矩形的中点;中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标【例6】对某电子元件进行寿命追踪调查,情况如下:寿命(h)100200200300300400400500500600个数2030804030(1)列出频率分布表;(2)画出频率分布直

20、方图;(3)估计电子元件寿命在100h400h以内的概率;(4)估计电子元件寿命在400h以上的概率。解析:(1)样本频率分布表如下:寿命(h)频数频率100200200.1020030030040400500400.20500600300.15合计2001(2)频率分布直方图:(3)由频率分布表可以看出,寿命在100h400h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100h400h的概率为0.65.(4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.150.35,故我们估计电子元件寿命在400h以上的概率为0.35.【例7

21、】从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):甲:25 41 40 37 22 14 19 39 21 42乙:27 16 44 27 44 16 40 40 16 40问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解析:(1)所以,即乙种玉米的苗长得高。(2),。【模拟试题】1. 某大学数学系共有本科生5000人,其中一、二、三、四年级的学生比为4321,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生为( )人A. 80 B. 40C. 60 D. 20 2. 在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形

22、的面积等于其他10个小长方形面积和的,且样本容量为160,则中间一组的频数为A. 32B. 0.2C. 40D. 0.25 3. 如图是150辆汽车通过某路段时速度(整数)的频率分布直方图,则速度在的汽车大约有A. 30辆B. 40辆C. 50辆D. 60辆 4. 若样本数据1,的平均数是10,方差是2,那么对于样本数据,有A. 平均数为10,方差为2B. 平均数为11,方差为3C. 平均数为11,方差为2D. 平均数为14,方差为4 5. 有一笔统计资料,共有11个数据如下(不完全依大小排列)2,4,4,5,5,6,7,8,9,11,x,已知这组数据平均数为6,则这组数据的方差为A. 6B.

23、 C. D. 6.5 6. 某班有50名学生,某次数学考试的成绩经计算得到平均分数是70分,标准差是s,后来发现记录有误,某甲得70分却误记为40分,某乙得50分却误记为80分,更正后重新计算得标准差为,则与之间的大小关系是A. B. C. D. 不能确定 7. 从M个产品中抽取含N个个体的样本进行合格检验,则每个产品被抽到的概率为_。 8. 一个高中研究性学习小组对本地区2004年至2006年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量平均数情况的条形图(如下图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭_万盒。 9. 甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲乙两人中只有一个人入选,则入选的应是_10. 某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取10的工人进行调查,如何采用系统抽样方法完成这一抽样? 11. 有一容量为50的样本,数据的分组及各组的频数如下:,4;,5;,10;,11;,9;,8;,3。(1)列出样本的频率分布表;(2)画出频率分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论