高考数学第十一章统计与概率第一节抽样方法、用样本估计总体教案文苏教版.docx_第1页
高考数学第十一章统计与概率第一节抽样方法、用样本估计总体教案文苏教版.docx_第2页
高考数学第十一章统计与概率第一节抽样方法、用样本估计总体教案文苏教版.docx_第3页
高考数学第十一章统计与概率第一节抽样方法、用样本估计总体教案文苏教版.docx_第4页
高考数学第十一章统计与概率第一节抽样方法、用样本估计总体教案文苏教版.docx_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节 抽样方法、用样本估计总体1简单随机抽样(1)抽取方式:逐个不放回抽取;(2)特点:每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数表法2分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样3系统抽样的步骤(1)采用随机的方式将总体中的N个个体编号;(2)将编号按间隔k分段,当是整数时,取k;当不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N能被n整除,这时取k,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号l;(4)按照一定的规则抽取样本,通常将编号为l,lk,l2k,l(n1)k的个体抽出4作频率分布直方图的步骤(1)求全距;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图5茎叶图的优点茎叶图的优点是不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便提醒茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数6样本的数字特征(1)众数、中位数、平均数数字特征概念优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数但显然它对其他数据信息的忽视使它无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,xn,那么这n个数的平均数平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低(2)标准差、方差标准差:样本数据到平均数的一种平均距离,一般用s表示,s .方差:标准差的平方s2s2(x1)2(x2)2(xn)2,其中xi(i1,2,3,n)是样本数据,n是样本容量,是样本平均数小题体验1为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本其中大一年级抽取200人,大二年级抽取100人若其他年级共有学生3 000人,则该校学生总人数是_解析:设该校学生总人数为n,则1,解得n7 500.答案: 7 5002某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为35,40),40,45),45,50),50,55),55,60,由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有_人解析:由频率分布直方图可知45岁以下的教师的频率为5(0.0400.080)0.6,所以共有800.648(人)答案:483已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_解析:5个数的平均数5.1,所以它们的方差s2(4.75.1)2(4.85.1)2(5.15.1)2(5.45.1)2(5.55.1)20.1.答案:0.11简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等2系统抽样中,易忽视抽取的样本数也就是分段的段数,当不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列3在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义小题纠偏1已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第六十一组抽出的号码为_解析:每组袋数:d20,由题意知这些号码是以11为首项,20为公差的等差数列a611160201 211.答案:1 2112如图是甲、乙两名篮球运动员在五场比赛中所得分数的茎叶图,则在这五场比赛中得分较为稳定(方差较小)的那名运动员得分的方差为_解析:由茎叶图知,得分较为稳定的那名运动员是乙,他在五场比赛中得分分别为8,9,10,13,15,所以乙11,s(811)2(911)2(1011)2(1311)2(1511)26.8. 答案:6.8题组练透1总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为_.7816657208026314070243699728019832049234493582003623486969387481解析:由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.答案:012采用系统抽样方法从1 000人中抽取50人做问卷调查,将他们随机编号1,2,1 000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间1,400的人做问卷A,编号落入区间401,750的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为_解析:根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公差d20的等差数列an,所以通项公式an820(n1)20n12,令75120n121 000,得n,又因为nN*,所以39n50,所以做问卷C的共有12人答案:123(2019南京调研)某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生为了解学生的就业倾向,用分层抽样的方法从该校这四个专业中抽取40名学生进行调查,则应从丙专业抽取的学生人数为_解析:由题意得,应从丙专业抽取的学生人数为4016.答案:164某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:产品类别ABC产品数量(件)1 300样本容量(件)130由于不小心,表格中A、C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是_件解析:设样本容量为x,则1 300130,所以x300.所以A产品和C产品在样本中共有300130170(件)设C产品的样本容量为y,则yy10170,所以y80.所以C产品的数量为80800(件)答案:800谨记通法三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样均为不放回抽样,且抽样过程中每个个体被抽取的机会相等从总体中逐个抽取是后两种方法的基础总体中的个数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分中抽取在起始部分抽样时采用简单随机抽样元素个数很多且均衡的总体抽样分层抽样将总体分成几层,分层按比例进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成典例引领1(2019启东模拟)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则xy的值为_解析:由茎叶图知,甲组的中位数为65,当乙组的中位数也为65时,y5,此时乙组的平均数为66,所以x665(5665627470)3,所以 xy8.答案:82(2018海安质量测试)某校高一年级共有800名学生,根据他们参加某项体育测试的成绩得到了如图所示的频率分布直方图,则成绩不低于80分的学生人数为_解析:由题设中提供的频率分布直方图可以看出:不低于80分的学生人数为(0.020.01)10800240.答案:2403(2018苏州测试)为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,其频率分布直方图如图所示,已知图中从左到右的前3个小组的频率之比为123,第2小组的频数为12,则报考飞行员的学生人数为_解析:设报考飞行员的学生人数为x,则(10.03750.0135),解得x48,即报考飞行员的学生人数为48.答案:48由题悟法1茎叶图中的3个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一(2)重复出现的数据要重复记录,不能遗漏(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小2由频率分布直方图进行相关计算时,需掌握的2个关系式(1)组距频率(2)频率,此关系式的变形为样本容量,样本容量频率频数即时应用1.(2018苏北四市期末)某次比赛甲得分的茎叶图如图所示,若去掉一个最高分,去掉一个最低分,则剩下4个分数的方差为_解析:剩下的4个分数是42,44,46,52,则其平均数是46,故方差为(164036)14.答案:142随着社会的发展,食品安全问题渐渐成为社会关注的热点,为了提高学生的食品安全意识,某学校组织全校学生参加食品安全知识竞赛,成绩的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100,若该校的学生总人数为3 000,则成绩不超过60分的学生人数大约为_解析:由频率分布直方图知,成绩不超过60分的学生的频率为(0.0050.01)200.3,所以成绩不超过60分的学生人数大约为0.33 000900.答案:900锁定考向样本的数字特征常与频率分布直方图、茎叶图等知识交汇命题常见的命题角度有:(1)样本的数字特征与直方图交汇;(2)样本的数字特征与茎叶图交汇;(3)样本的数字特征与优化决策问题 题点全练角度一:样本的数字特征与直方图交汇1(2019苏州调研) 样本容量为100的频率分布直方图如图所示,根据样本频率分布直方图估计平均数为_ .解析:平均数为(6102012401424161018)14.24.答案:14.24角度二:样本的数字特征与茎叶图交汇2将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示.则7个剩余分数的方差为_解析:根据茎叶图,去掉1个最低分87,1个最高分99,则8794909190(90x)9191,所以x4.所以s2(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)2.答案:角度三:样本的数字特征与优化决策问题3甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是_解析:因为甲乙9,s(910)2(98)2(99)2(99)2(99)2,s(910)2(910)2(97)2(99)2(99)2s,故甲更稳定答案:甲通法在握1利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和(3)众数:最高的矩形的中点的横坐标2利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征演练冲关1.(2019常州调研)用茎叶图记录甲、乙两名同学高三前5次数学测试的成绩,如图他们在分析对比成绩变化时,发现乙同学成绩的一个数字看不清楚了若已知乙的平均成绩低于甲的平均成绩,则看不清楚的数字为_解析:甲的平均成绩为(99100101102103)101,设看不清楚的数字为x,则由题意得(939497110110x)101,解得x1.因为x0,xN,所以x0,即看不清楚的数字为0. 答案:02为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为_解析:不妨设样本数据为x1,x2,x3,x4,x5,且x1x2x3x4x5,则由样本方差为4,知(x17)2(x27)2(x37)2(x47)2(x57)220.若5个整数的平方和为20,则这5个整数的平方只能在0,1,4,9,16中选取(每个数最多出现2次),当这5个整数的平方中最大的数为16时,分析可知,总不满足和为20;当这5个整数的平方中最大的数为9时,0,1,1,9,9这组数满足要求,此时对应的样本数据为x14,x26,x37,x48,x510;当这5个整数的平方中最大的数不超过4时,总不满足要求,因此不存在满足条件的另一组数据答案:10一抓基础,多练小题做到眼疾手快1(2019南通中学高三学情调研)一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车A轿车B轿车C舒适型100150z标准型300450600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆,则z的值为_解析:由题意知,解得z400.答案:4002(2018泰州调研)某校在高三年级的1 000名学生中随机抽出100名学生的数学成绩作为样本进行分析,得到样本频率分布直方图如图所示,则估计该校高三学生中数学成绩在110,140)之间的人数为_解析:由样本频率分布直方图知该校高三学生中数学成绩在110,140)之间的频率为(0.020.0260.02)100.66,所以估计该校高三学生中数学成绩在110,140)之间的人数为 1 0000.66660.答案:660 3某校高三年级500名学生中,血型为O型的有200人,A型的有125人,B型的有125人,AB型的有50人为研究血型与色弱之间的关系,现用分层抽样的方法从这500名学生中抽取一个容量为60的样本,则应抽取_名血型为AB的学生解析:在整个抽样过程中,每个个体被抽到的概率为,所以血型为AB的学生应抽取的人数为506.答案:64已知一组数据:87,x,90,89,93的平均数为90,则该组数据的方差为_解析:由题意知(87x908993)90,解得x91,所以方差s2(8790)2(9190)2(9090)2(8990)2(9390)24.答案:45(2019启东第一中学月考)某厂共有1 000名员工,准备选择50人参加技术评估,现将这1 000名员工编号为1到1 000,准备用系统抽样的方法抽取已知随机抽取到的员工最小的编号是15,那么抽取到的员工最大的编号是_解析:样本间隔为1 0005020,随机抽取到的最小的编号是15,在抽取到的员工中最大的编号是154920995.答案:9956(2018苏州期末)若一组样本数据9,8,x,10,11的平均数为10,则该组样本数据的方差为_解析:由10,得x12,故方差s22.答案:2二保高考,全练题型做到高考达标1(2018通州期末)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,则x的值为_答案:72(2019如皋检测)从编号为01,02,50的50个产品中用系统抽样的方法抽取一个样本,已知样本中的前两个编号分别为03,08(编号按从小到大的顺序排列),则样本中最大的编号是_解析:由题意知,抽样间隔是5,样本中最大的编号是35948.答案:483(2018南京学情调研)为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间40,80中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间40,60)内的汽车有_辆解析:根据频率分布直方图得,时速在区间40,60)内的频率为(0.010.03)100.4,故时速在区间40,60)内的汽车有0.420080(辆)答案:804用分层抽样的方法从某高中学生中抽取一个容量为45的样本,其中高一年级抽20人,高三年级抽10人,已知该校高二年级共有学生300人,则该校学生的总人数为_解析:样本中高二年级抽45201015(人),设该校学生的总人数为n,则,所以n900. 答案:9005(2018扬州期末)某学校从高三年级共800名男生中随机抽取50名测量身高根据测量结果可知被测学生身高全部介于155 cm和195 cm之间,将测量结果按如下方式分成八组:第一组155,160),第二组160,165),第八组190,195按上述分组方式得到的频率分布直方图的一部分如图所示,估计这所学校高三年级全体男生身高在180 cm以上(含180 cm)的人数为_解析:这所学校高三年级全体男生身高在180 cm以上(含180 cm)的频率为1(0.0080.0160.040.040.06)510.820.18,所以全体男生身高在180 cm以上(含180 cm)的人数为0.18800144.答案:1446(2019海门中学检测)已知数据x1,x2,x10的均值为2,标准差为s,又知数据3x12,3x22,3x102的方差为27,则s_.解析:数据x1,x2,x10的均值为2,标准差为s,数据3x12,3x22,3x102的方差为27,9s227,解得s.答案:7已知x是1,2,3,x,5,6,7这七个数据的中位数且1,2,x2,y这四个数据的平均数为1,则y的最小值为_解析:由题意12x2y4,所以yx21.由中位数定义知,3x5,所以yx21.当x3,5时,函数yx21与y均为增函数,所以yx21在3,5上为增函数,所以min8.答案:8.(2018南通调研)为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在16,30)内的人数为_解析:由茎叶图可知,在20名教师中,上学期使用多媒体进行教学的次数在16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在16,30)内的人数为400160.答案:1609某初级中学共有学生2 000名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373xy男生377370z已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?解:(1)因为0.19,所以x380.(2)初三年级人数为yz2 000(373377380370)500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:50012(名)10某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是50,60),60,70),70,80),80,90),90,100(1)求图中a的值(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在50,90)之外的人数.分数段50,60)60,70)70,80)80,90)xy11213445解:(1)由频率分布直方图知(0.040.030.022a)101,因此a0.005.(2)估计这次成绩的平均分550.05650.4750.3850.2950.0573.所以这100名学生语文成绩的平均分为73分(3)分别求出语文成绩在分数段50,60),60,70),70,80),80,90)的人数依次为0.051005,0.410040,0.310030,0.210020.所以数学成绩分数段在50,60),60,70),70,80),80,90)的人数依次为5,20,40,25.所以数学成绩在50,9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论