2019高考数学二轮复习第一篇微型专题5概率与统计知识整合学案理.docx_第1页
2019高考数学二轮复习第一篇微型专题5概率与统计知识整合学案理.docx_第2页
2019高考数学二轮复习第一篇微型专题5概率与统计知识整合学案理.docx_第3页
2019高考数学二轮复习第一篇微型专题5概率与统计知识整合学案理.docx_第4页
2019高考数学二轮复习第一篇微型专题5概率与统计知识整合学案理.docx_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题5概率与统计一、计数原理1.分类加法计数原理和分步乘法计数原理的区别是什么?分类加法计数原理针对“分类”问题,其中各种方法相互独立,用其中任何一种方法都可以做完这件事;分步乘法计数原理针对“分步”问题,各个步骤相互依存,只有各个步骤都完成了才算完成这件事.2.排列数、组合数的公式及性质是什么?公式(1)Anm=n(n-1)(n-2)(n-m+1)=n!(n-m)!(2)Cnm=AnmAmm=n(n-1)(n-2)(n-m+1)m!=n!m!(n-m)!(n,mN+,且mn)特别地,Cn0=1性质(1)0!=1;Ann=n!(2)Cnm=Cnn-m;Cn+1m=Cnm+Cnm-13.二项式系数的性质是什么?性质性质描述对称性与首末两端“等距离”的两个二项式系数相等,即Cnk=Cnn-k增减性二项式系数Cnk当kn+12(nN+)时,二项式系数是递减的二项式系数的最大值当n为偶数时,中间的一项Cnn2取得最大值当n为奇数时,中间的两项Cnn-12与Cnn+12取得最大值并且相等4.各二项式系数的和是什么?(1)(a+b)n展开式的各项二项式系数的和为Cn0+Cn1+Cn2+Cnn=2n.(2)偶数项的二项式系数的和等于奇数项的二项式系数的和,即Cn0+Cn2+Cn4+=Cn1+Cn3+Cn5+=2n-1.二、概率1.互斥事件与对立事件有什么区别与联系?互斥与对立都是两个事件的关系,互斥事件是不可能同时发生的两个事件,而对立事件除要求这两个事件不同时发生外,还要求二者之一必须有一个发生.因此,对立事件是互斥事件的特殊情况,而互斥事件不一定是对立事件.2.基本事件的三个特点是什么?(1)每一个基本事件发生的可能性都是相等的;(2)任何两个基本事件都是互斥的;(3)任何事件(除不可能事件)都可以表示成基本事件的和.3.古典概型、几何概型的概率公式分别是什么?古典概型的概率公式:P(A)=事件A包含的基本事件的个数(m)基本事件的总数(n).几何概型的概率公式:P(A)=构成事件A的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积).三、统计初步与统计案例1.分层抽样的适用范围是什么?当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.2.如何作频率分布直方图?(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.3.频率分布直方图的特点是什么?(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距频率组距.(2)在频率分布直方图中,各小长方形的面积总和等于1.因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.4.如何进行回归分析?(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中(x-,y-)称为样本点的中心.(3)相关系数当r0时,表明两个变量正相关;当r0,-+.(2)正态曲线的性质曲线位于x轴上方,与x轴不相交,与x轴之间的面积为1;曲线是单峰的,它关于直线x=对称;曲线在x=处达到峰值12;当一定时,曲线的形状由确定,越小,曲线越“瘦高”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散.(3)正态总体在三个特殊区间内取值的概率值P(-X+)=0.6826;P(-2X+2)=0.9544;P(-3P2B.P1100,D正确.故选C.答案C13.(2017全国卷理T3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是().A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析对于选项A,由图易知,月接待游客量每年7,8月份明显高于12月份,故A错误;对于选项B,观察折线图的变化趋势可知,年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.答案A(八)考查离散型随机变量分布列、超几何分布、条件概率、正态分布、数学期望与方差,求离散型随机变量的数学期望是全国卷高考重点考查的内容,在选择题、填空题中有时会出现.主要考查离散型随机变量的分布列、数学期望、正态分布等.14.(2018全国卷理T8改编)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立,设X为该群体的10位成员中使用移动支付的人数,D(X)=2.1,P(X=4)P(X=6),则p=().A.0.7B.0.6C.0.4D.0.3解析因为XB(n,p),所以D(X)=np(1-p)=2.1,所以p=0.3或p=0.7.因为P(X=4)=C104p4(1-p)6P(X=6)=C106p6(1-p)4,所以(1-p)20.5.故p=0.7.答案A15.(2017全国卷理T13改编)一批产品的二等品率为0.08,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则D(X)=.解析有放回地抽取,是一个二项分布模型,其中p=0.08,n=100,则D(X)=np(1-p)=1000.080.92=7.36.答案7.36二、解答题的命题特点概率与统计综合试题的题干阅读量大,容易造成考生在数学模型转化过程中失误,得分率不高.这些试题主要考查古典概型,用样本估计总体,利用回归方程进行预测,独立性检验的应用,离散型随机变量的分布列和数学期望,正态分布等.概率、随机变量的数学期望交汇命题,高考对此类题目的要求是能根据给出的或通过统计图表给出的相关数据求线性回归方程.1.(2018全国卷理T18)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:y=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:y=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解析(1)利用模型,从2000年开始算起,2018年即t=19,所以该地区2018年的环境基础设施投资额的预测值为y=-30.4+13.519=226.1(亿元).利用模型,从2010年开始算起,2018年即t=9,所以该地区2018年的环境基础设施投资额的预测值为y=99+17.59=256.5(亿元).(2)利用模型得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.2.(2018全国卷,理T20)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0p1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X).(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?解析(1)由题意可知,独立重复试验符合二项分布,20件产品中恰有2件不合格品的概率为f(p)C=202p2(1-p)18=190p2(1-p)18,对上式求导得f(p)=190p2(1-p)18=1902p(1-p)18-18p2(1-p)17=190p(1-p)172(1-p)-18p=380p(1-p)17(1-10p).当f(p)=0时,有p(1-p)17(1-10p)=0,由0p0,f(p)单调递增;当p110,1时,f(p)400,所以需要对这箱余下的所有产品作检验.3.(2018全国卷理T18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k0)0.0500.0100.001k03.8416.63510.828解析(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知,用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟,因此第二种生产方式的效率更高.(ii)由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟,因此第二种生产方式的效率更高.(iii)由茎叶图可知,用第一种生产方式的工人完成生产任务平均所需时间高于80分钟,用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.(2)由茎叶图知m=79+812=80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)因为K2的观测值k=40(1515-55)220202020=106.635,所以有99%的把握认为两种生产方式的效率有差异.4.(2017全国卷理T19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(,2).(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(-3,+3)之外的零件数,求P(X1)及X的数学期望.(2)一天内抽检零件中,如果出现了尺寸在(-3,+3)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)试说明上述监控生产过程方法的合理性.(ii)下面是检验员在一天内抽取的16个零件的尺寸:9.9510.129.969.9610.019.929.9810.0410.269.9110.1310.029.2210.0410.059.95经计算得x-=116i=116xi=9.97,s=116i=116(xi-x-)2=116(i=116xi2-16x-2)0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,16.用样本平均数x-作为的估计值,用样本标准差s作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计和(精确到0.01).附:若随机变量Z服从正态分布N(,2),则P(-3Z+3)=0.9974,0.9974160.9592,0.0080.09.解析(1)由题可知抽取的一个零件的尺寸落在(-3,+3)之内的概率为0.9974,从而零件的尺寸落在(-3,+3)之外的概率为0.0026,故XB(16,0.0026).因此P(X1)=1-P(X=0)=1-0.9974161-0.9592=0.0408,X的数学期望E(X)=160.0026=0.0416.(2)(i)如果生产状态正常,一个零件尺寸在(-3,+3)之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(-3,+3)之外的零件的概率只有0.0408,发生的概率很小,因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.(ii)由x-=9.97,s0.212,得的估计值为=9.97,的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.剔除(-3,+3)之外的数据9.22,剩下数据的平均数为115(169.97-9.22)=10.02,因此的估计值为10.02.i=116xi2=160.2122+169.9721591.134,剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为115(1591.134-9.222-1510.022)0.008,因此的估计值为0.0080.09.1.样本数据(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.(3)茎叶图、频率分布表和频率分布直方图都是用图表直观描述样本数据的分布规律的.2.频率分布直方图(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.频率分布表在数量表示上比较准确,频率分布直方图比较直观.(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以所有小长方形的面积的和等于1;平均数是频率分布直方图各个小矩形的面积底边中点的横坐标之和.3.排列与组合(1)解决“在”与“不在”的有限制条件的排列问题,既可以从元素入手,也可以从位置入手,原则是谁“特殊”谁优先.不管是从元素考虑还是从位置考虑,都要贯彻到底,不能既考虑元素又考虑位置.解决相邻问题的方法是“捆

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论