高考数学总复习第八章计数原理、概率与统计第51讲抽样方法、用样本估计总体及正态分布练习理新人教A版.docx_第1页
高考数学总复习第八章计数原理、概率与统计第51讲抽样方法、用样本估计总体及正态分布练习理新人教A版.docx_第2页
高考数学总复习第八章计数原理、概率与统计第51讲抽样方法、用样本估计总体及正态分布练习理新人教A版.docx_第3页
高考数学总复习第八章计数原理、概率与统计第51讲抽样方法、用样本估计总体及正态分布练习理新人教A版.docx_第4页
高考数学总复习第八章计数原理、概率与统计第51讲抽样方法、用样本估计总体及正态分布练习理新人教A版.docx_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第51讲抽样方法、用样本估计总体及正态分布夯实基础【p111】【学习目标】1理解随机抽样的必要性和重要性2会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法;搞清三种抽样的联系与区别3了解分布的意义与作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点4能从样本数据中提取基本的数字特征(如平均数、标准差)5会用样本的频率分布估计总体分布,会用样本的基本数字特征,理解用样本估计总体的思想6会用随机抽样的基本方法和样本估计总体的思想解决一些简单实际问题7利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义【基础检测】1某小学共有学生2 000人,其中一至六年级的学生人数分别为400,400,400,300,300,200.为做好小学放学后“快乐30分”活动,现采用分层抽样的方法从中抽取容量为200的样本进行调查,那么应抽取一年级学生的人数为()A120 B40 C30 D20【解析】假设抽取一年级学生人数为n.一年级学生400人,抽取一个容量为200的样本,用分层抽样法抽取的一年级学生人数为,n40,即应抽取一年级学生的人数为40.【答案】B2用系统抽样法从160名学生中抽取容量为20的样本,将160名学生从1160编号按编号顺序平均分成20组(18号,916号,153160号),若第15组中抽出的号码为118,则第一组中按此抽签方法确定的号码是()A7 B6 C5 D4【解析】因为从160名学生中抽取容量为20的样本,所以系统抽样的组数为20,间隔为8,设第一组抽出的号码为x,则由系统抽样的法则可知第n组抽出的号码应为x8(n1),第15组应抽出号码为x8(151)118,得x6.【答案】B3某校对高三年级的学生进行体检,现将高三男生体重(单位:kg)的数据进行整理后分为五组,并绘制出频率分布直方图(如图所示)根据一般标准,高三男生的体重超过65 kg属于偏胖,低于55 kg属于偏瘦已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25,0.20,0.10,0.05,第二小组的频数为400,则该校高三年级男生的总数和体重正常的频率分别为()A1 000,0.50 B800,0.50C800,0.60 D1 000,0.60【解析】由题易知第二组的频率为1(0.250.200.100.05)0.40,故高三年级男生的总数为1 000,体重在55 kg和65 kg之间的频率为0.400.200.60.【答案】D4某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图如图所示,已知甲得分的极差为32,乙得分的平均值为24,则下列结论错误的是()Ax8B甲得分的方差是736C乙得分的中位数和众数都为26D乙得分的方差小于甲得分的方差【解析】根据题意,依次分析选项:对于A,甲得分的极差为32,30x632,解得:x8,A正确;对于B,甲得分的平均值为24,其方差为,B错误;对于C,乙的数据为:12、25、26、26、31,其中位数、众数都是26,C正确;对于D,乙得分比较集中,则乙得分的方差小于甲得分的方差,D正确【答案】B5设随机变量服从正态分布N(0,1),则下列结论正确的是()P(|a)P(a)P(a)(a0);P(|a)2P(a)1(a0);P(|a)12P(a)(a0);P(|a)1P(|a)(a0)ABCD【解析】因为P(|a)P(aa),所以不正确;因为P(|a)P(aa)P(a)P(a)P(a)P(a)P(a)(1P(a)2P(a)1,所以正确,不正确;因为P(|a)P(|a)1,所以P(|a)1P(|a)(a0),所以正确【答案】D【知识要点】1简单随机抽样(1)定义:设一个总体含有N个个体,从中_逐个不放回地_抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都_相等_,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:_抽签法_和_随机数法_2系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本(1)编号:先将总体的N个个体_编号_(2)分段:确定_分段间隔k_,对编号进行_分段_,当(n是样本容量)是整数时,取k.(3)确定首个个体:在第1段用_简单随机抽样_确定第一个个体编号l(lk)(4)获取样本:按照一定规则抽取样本,通常是将l加上间隔k得到第2个个体编号_lk_,再加k得到第3个个体编号_(l2k)_,依次进行下去,抽取样本l(n1)k,直到获取整个样本3分层抽样(1)定义:在抽样时,将总体分成_互不交叉_的层,然后按照_一定的比例_从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样(2)分层抽样的应用范围:当总体是由_差异明显的几个部分组成_时,往往选用分层抽样4分层抽样的步骤(1)分层:将总体按某种特征分成若干部分(2)确定比例:计算各层的个体数与总体的个体数的比(3)确定各层应抽取的样本容量(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本5用样本的数字特征估计总体的数字特征(1)众数、中位数在一组数据中出现次数_最多_的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在_中间位置_上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数(2)平均数与方差如果这n个数据是x1,x2,xn,那么_xxi_,叫做这n个数据的平均数;如果这n个数据是x1,x2,xn,那么_s2_(xix)2_,叫做这n个数据的方差;同时s,叫做这n个数据的标准差6频率分布直方图(1)通常我们对总体作出的估计一般分成两种:一种是用_样本的频率分布估计总体的分布_;另一种是用_样本的数字特征(如平均数、标准差等)估计总体数字特征_(2)作频率分布直方图的步骤求极差(即一组数据中最大值与最小值的差)决定_组距_与_组数_将数据分组列频率分布表画频率分布直方图(3)在频率分布直方图中,纵轴表示_,数据落在各个小组内的频率用_各小长方形面积_表示各小长方形的面积总和等于1.7频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的_中点_,就得到频率分布折线图(2)总体密度曲线:随着样本容量的增加_组距_减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线8茎叶图的优点(1)统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到(2)茎叶图中的数据可以随时记录,随时添加,方便记录与表示9正态分布(1)函数,(x)_e_,xR的图象称为正态分布密度曲线,简称正态曲线对于任何实数ab,随机变量X满足P(aXb)_,(x)dx_,则称X的分布为正态分布,正态分布完全由参数_和_确定因此正态分布常记作_N(,2)_,如果X服从正态分布,则记为_XN(,2)_(2)正态分布的特点:曲线_位于x轴上方与x轴不相交_;曲线关于直线_x_对称;曲线在x时_达到峰值_;曲线与x轴之间的面积为1;当一定时,曲线的位置由确定,曲线随着的变化而沿x轴平移;当一定时,曲线的形状由确定,越大,曲线越“矮胖”,表示总体的分布越_分散_;越小,曲线越“高瘦”,表示总体的分布越_集中_(3)原则x(,),P(x)0.682 6;x(2,2),P(x)0.954 4;x(3,3),P(x)0.997 4.典例剖析【p113】考点1抽样方法及应用(1)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:采用简单随机抽样法,将零件编号为00,01,02,99,抽出20个;采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个若用这三种抽样方式抽样,每个零件被抽到的概率分别是p1,p2,p3,则p1,p2,p3的值分别是_【解析】由抽样方法的性质知,抽样过程中每个个体被抽到的概率都相等,这个比例只与样本容量和总体有关,即不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是.【答案】p1p2p3(2)某学校高二年级为了表彰第一次月考成绩优异者,需要5件不同的奖品,这些奖品要从由1200编号的200件不同奖品中随机抽取确定,用系统抽样的方法确定其中一件奖品编号为6,则其他四件奖品编号为_【解析】根据系统抽样可知,样本容量为5,所以分5组,分组间隔为k40,再根据系统抽样编号为l,lk,l2k,l(n1)k可知,若一件编号为6,则其余四件编号依次为:46,86,126,166.【答案】46,86,126,166【点评】分层抽样、系统抽样的基础知识的考纲要求是“了解”和“会”,因此复习时重点在基础知识的了解与简单应用考点2频率分布直方图及应用某网络营销部门随机抽查了某市200名网友在2018年11月11日的网购金额,所得数据如下表:网购金额(单位:千元)人数频率(0,1160.08(1,2240.12(2,3xp(3,4yq(4,5160.08(5,6140.07合计2001.00已知网购金额不超过3千元与超过3千元的人数比恰为32.(1)试确定x,y,p,q的值,并补全频率分布直方图(如图);(2)该营销部门为了了解该市网友的购物体验,从这200名网友中,用分层抽样的方法从网购金额在(1,2和(4,5的两个群体中确定5人进行问卷调查,若需从这5人中随机选取2人继续访谈,则此2人来自不同群体的概率是多少?【解析】(1)根据题意有解得p0.4,q0.25.补全频率分布直方图如图所示,(2)根据题意,网购金额在(1,2内的人数为53(人),记为a,b,c.网购金额在(4,5内的人数为52(人),记为A,B.则从这5人中随机选取2人的选法有:(a,b),(a,c),(a,A),(a,B),(b,c),(b,A),(b,B),(c,A),(c,B),(A,B)共10种记2人来自不同群体的事件为M,则M中含有(a,A),(a,B),(b,A),(b,B),(c,A),(c,B)共6种P(M).【点评】1绘制频率分布直方图时的2个注意点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是,而不是频率2由频率分布直方图进行相关计算时,需掌握的2个关系式(1)组距频率(2)频率,此关系式的变形为样本容量,样本容量频率频数考点3茎叶图及应用“日行一万步,健康你一生”的养生观念已经深入人心,由于研究性学习的需要,某大学生收集了手机“微信运动”团队中特定甲、乙两个班级n名成员一天行走的步数,然后采用分层抽样的方法按照20,30),30,40),40,50),50,60)分层抽取了20名成员的步数,并绘制了如下尚不完整的茎叶图(单位:千步);已知甲、乙两班行走步数的平均值都是44千步(1)求x,y的值;(2)若估计该团队中一天行走步数少于40千步的人数比处于40,50)千步的人数少12人,求n的值【解析】(1)因为甲、乙两班行走步数的平均值都为44,所以x甲(26324240x454648505253)44,解得x6.所以x乙(263430y41424650525758)44,解得y4.(2)该团队中一天行走步数少于40千步的频率为,处于40,50)千步的频率为,则估计该团队中一天行走步数少于40千步的人数比处于40,50)千步的人数的频率之差为.又因为该团队中一天行走步数少于40千步的人数比处于40,50)千步的人数少12人,所以n12,解得n80.考点4样本的数字特征甲、乙两名同学8次数学测验成绩如茎叶图所示,x1,x2分别表示甲、乙两名同学8次数学测验成绩的平均数,s1,s2分别表示甲、乙两名同学8次数学测验成绩的标准差,则有()Ax1x2,s1s2 Bx1x2,s1s2Cx1x2,s1s2 Dx1s2【解析】由茎叶图可知,甲的成绩分别为:78,79,84,85,85,86,91,92.乙的成绩分别为:77,78,83,85,85,87,92,93.x1(7879848585869192)85,s(7885)2(7985)2(8485)200(8685)2(9185)2(9285)2;x2(7778838585879293)85,s(7785)2(7885)2(8385)200(8785)2(9285)2(9385)2,x1x2,s1s2.【答案】B某食品公司研发生产一种新的零售食品,从产品中抽取100件作为样本,测量这些产品的一项质量指标值,由测量结果得到如下频率分布直方图:(1)求直方图中a的值;(2)根据频率分布直方图估计样本数据的众数、中位数各是多少(结果保留整数);(3)由频率分布直方图可以认为,这种产品的质量指标值Z服从正态分布N(200,12.22),试计算数据落在(187.8,212.2)上的概率(参考数据:若ZN(,2),则P(Z)0.682 7,P(2Z2)0.954 5)【解析】(1)由已知得(0.0020.0090.022a0.0240.0080.002)101,解得a0.033.(2)众数200;由前三组频率之和0.020.090.220.330.50,故中位数位于第四组195,205)内,中位数估计为195200.(3)因为ZN(200,12.22),从而P(187.8Z212.2)P(20012.2Z20012.2)0.682 7.【点评】利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和(3)众数:最高的矩形的中点的横坐标考点5正态分布及应用(1)设随机变量服从标准正态分布N(0,1),已知P(1.96)0.025,则P(|1.96)等于()A0.025 B0.950 C0.050 D0.975【解析】本题考查变量服从标准正态分布的概率计算由题意P(|1.96)P(1.961.96)12P(1.96)120.0250.950.【答案】B(2)已知服从正态分布N(,2)的随机变量在区间(,),(2,2)和(3,3)内取值的概率分别为68.3%,95.4%和99.7%.某校为高一年级1 000名新生每人定制一套校服,经统计,学生的身高(单位:cm)服从正态分布(165,52),则适合身高在155175 cm范围内的校服大约要定制()A683套 B954套 C972套 D997套【解析】P(155x175)P(2x2)95.4%,要定制1 00095.4%954套【答案】B(3)在如图所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C为正态分布N(0,1)的密度曲线)的点的个数的估计值为()附:若XN(,2),则P(X)0.682 6,P(2X2)0.954 4.A2 386 B2 718 C3 413 D4 772【解析】利用阴影部分的面积所占正方形的比例,估计落入阴影部分的点的个数由P(1X1)0.682 6,得P(0X1)0.341 3,则阴影部分的面积为0.341 3,故落入阴影部分的点的个数为10 0003 413.【答案】C【点评】正态分布的概率计算关键是利用数形结合思想和对称性转化方法总结【p115】1设计抽样方案时,必须保证其满足简单随机抽样的四个特点2用抽签法抽样关键是将号签搅拌均匀当总体容量较大时,样本容量也较大,可用系统抽样法抽样,在抽样前有的要先随机剔除一部分个体,多余个体的剔除不影响抽样的公平性3进行分层抽样的关键是根据每一层所占的比例确定出每一层应抽取的个体数4要注意理解频率分布直方图纵坐标的含义,并搞清其与频率分布条形图的异同5对于每个个体所取不同数值较少的总体,常用条形图表示其样本分布,而对于每个个体所取不同数值较多或可以在实数区间内取值的总体,常用频率分布直方图表示其分布6在用样本的频率分布估计总体分布时,要清楚以下概念:频率分布折线图,总体密度曲线,茎叶图用样本的数字特征估计总体的数字特征,要理解以下概念:众数,中位数,平均数,标准差7正态分布是一种非常常见的分布,应理解正态分布的有关概念,掌握正态曲线的有关性质并会求有关的概率走进高考【p115】1(2017全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在7,8月D各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平衡【解析】根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A错误【答案】A2(2016山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A56 B60 C120 D140【解析】自习时间不少于22.5小时为后三组,其频率和为(0.160.080.04)2.50.7,故人数为2000.7140人【答案】D3(2017全国卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm)根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(,2)(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(3,3)之外的零件数,求P(X1)及X的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(3,3)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查(i)试说明上述监控生产过程方法的合理性;(ii)下面是检验员在一天内抽取的16个零件的尺寸;99510.129.969.9610.019.929.9810.0410269.9110.1310.029.2210.0410.059.95经计算得xxi9.97,s0.212,其中xi为抽取的第i个零件的尺寸,i1,2,16.用样本平均数x作为的估计值,用样本标准差s作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(3,3)之外的数据,用剩下的数据估计和(精确到0.01)附:若随机变量Z服从正态分布N(,2),则P(3Zbc BbcaCcab Dcba【解析】依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此aba.【答案】D3设随机变量服从正态分布N(3,4),若P(a2),则a的值为()A. B. C5 D3【解析】正态曲线关于x3对轴,2a3a26,得a.【答案】A4如图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A84,4.84 B84,1.6 C85,1.6 D85,4【解析】依题意,所剩数据的平均数是80(4367)85,所剩数据的方差是3(8485)2(8685)2(8785)21.6.【答案】C5我市开展的“魅力教师”学生原创网文大赛,各校上传文章的时间为3月1日至30日,评委会把各校上传的文章数按5天一组分组统计,绘制了频率分布直方图(如图)已知从左至右各长方形的高的比为234641,第二组的频数为180.那么本次活动收到的文章数是_【解析】由题设中提供的直方图可得本次活动收到的文章数n1 200.【答案】1 2006总体由编号为01,02,19,20的20个个体组成利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为_7816657208026314070243699728019832049234493582003623486969387481【解析】由题意得,根据选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的数字分别为08,02,14,07,01,04,所以选出来的第5个个体的编号为01.【答案】017在某项测量中,测量结果服从正态分布N(4,2)(0),若在(0,4)内取值的概率为0.4,则在(0,)内取值的概率为_【解析】服从正态分布N(4,2)(0),曲线的对称轴是直线x4,在(4,)内取值的概率为0.5.在(0,4)内取值的概率为0.4,在(0,)内取值的概率为0.50.40.9.【答案】0.98为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h)试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:061.22.71.52.81.82.22.33.23.5252.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:321.71.90.80.92.41.22.61.31.4160.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?【解析】(1)设A药观测数据的平均数为x,B药观测数据的平均数为y.由观测结果可得x(0.61.21.21.51.51.82.22.32.32.42.52.62.72.72.82.93.03.13.23.5)2.3,y(0.50.50.60.80.91.11.21.21.31.41.61.71.81.92.12.42.52.62.73.2)1.6.由以上计算结果可得xy,因此可看出A药的疗效更好(2)由观测结果可绘制茎叶图如图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.”,“3.”上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论