(全国通用版)2019版高考数学大一轮复习 高考必考题突破讲座(六)概率与统计优选学案.doc_第1页
(全国通用版)2019版高考数学大一轮复习 高考必考题突破讲座(六)概率与统计优选学案.doc_第2页
(全国通用版)2019版高考数学大一轮复习 高考必考题突破讲座(六)概率与统计优选学案.doc_第3页
(全国通用版)2019版高考数学大一轮复习 高考必考题突破讲座(六)概率与统计优选学案.doc_第4页
(全国通用版)2019版高考数学大一轮复习 高考必考题突破讲座(六)概率与统计优选学案.doc_第5页
免费预览已结束,剩余12页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高考必考题突破讲座(六) 概率与统计题型特点考情分析命题趋势1.有关统计、统计案例的计算问题2概率与统计、统计案例的综合应用问题2017全国卷,192017全国卷,192017全国卷,181.以统计图表或文字叙述的实际问题为载体,考查频率分布表、频率分布直方图、茎叶图、用样本的数字特征估计总体的数字特征,回归方程的求法与应用,独立性检验及运用数学知识解决实际问题的能力2以统计、统计案例中的计算与概率计算为主要内容,考查对数据的处理能力与运算能力及应用意识分值:12分1以实际背景为载体考查古典概型从近几年的高考命题来看,高考对概率的考查,一般以实际生活题材为背景,以应用题的形式出现概率应用题侧重于古典概型,主要考查随机事件、等可能事件、互斥事件、对立事件的概率解决简单的古典概型试题可用直接法(定义法),对于较为复杂的事件的概率,可以利用所求事件的性质将其转化为互斥事件或其对立事件的概率求解解决古典概型问题的关键在于确定基本事件2线性回归分析线性回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义,根据回归方程进行预报,仅是一个预报值,而不是真实发生的值,由于考题提供的数据较复杂,因此要注意以下两点:(1)正确理解计算,的公式和准确的计算是求线性回归方程的关键(2)回归直线方程x必过样本点中心(,)3独立性检验(1)22列联表是反映两个分类变量的频数表,通过特殊的计算,能说明两个变量之间关系的强弱如果两个变量没有关系,则应满足adbc0.|adbc|越小,说明两个变量之间关系越弱;|adbc|越大,说明两个变量之间关系越强(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论独立性检验的一般步骤:根据样本数据制成22列联表;根据公式k2计算k2的观测值k0;比较k0与临界值的大小关系,作统计推断【例1】 (2017全国卷)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完根据往年销售经验,每天需求量与当天最高气温(单位:)有关如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表.最高气温10,15)15,20)20,25)25,30)30,35)35,40)天数216362574以最高气温位于各区间的频率估计最高气温位于该区间的概率(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为y(单位:元)当六月份这种酸奶一天的进货量为450瓶时,写出y的所有可能值,并估计y大于零的概率解析(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为0.6,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则y64504450900;若最高气温位于区间20,25),则y63002(450300)4450300;若最高气温低于20,则y62002(450200)4450100.所以y的所有可能值为900,300,100.当y大于零时,最高气温不低于20,由表格数据知,最高气温不低于20的频率为0.8,因此y大于零的概率的估计值为0.8.【例2】 (2017全国卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的16个零件的尺寸.抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得i9.97,s0.212,18.439,(xi)(i8.5)2.78,其中xi为抽取的第i个零件的尺寸,i1,2,16.(1)求(xi,i)(i1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(3s,3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查从这一天抽检的结果看,是否需对当天的生产过程进行检查?在(3s,3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到0.01)附:0.09,样本(xi,yi)(i1,2,3,4,n)的相关系数r.解析(1)由样本数据得(xi,i)(i1,2,16)的相关系数为r0.18.由于|r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(2)由于9.97,s0.212,由样本数据可以看出抽取的第13个零件的尺寸在(3s,3s)以外,因此需对当天的生产过程进行检查剔除离群值,即第13个数据,剩下数据的平均值为(169.979.22)10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02,160.2122169.9721 591.134,剔除第13个数据,剩下数据的样本方差为(1 591.1349.2221510.022)0.008,这条生产线当天生产的零件尺寸的标准差的估计值为0.09.【例3】 (2017全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下(1)记a表示事件“旧养殖法的箱产量低于50 kg”,估计a的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较附:p(k2k)0.0500.0100.001k3.8416.63510.828k2.解析(1)旧养殖法的箱产量低于50 kg的概率为(0.0120.0140.0240.0340.040)50.62.因此事件a的概率估计值为0.62.(2)根据箱产量的频率分布直方图得到列联表如下.箱产量6.635.故有99%的把握认为箱产量与养殖方法有关(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法1某事业单位随机从甲部门抽取3人(2男1女),从乙部门抽取4人(2男2女),然后从这7人中随机抽取2人代表单位去参加市里的相关会议(1)求这2人全部来自甲部门的概率;(2)求这2人中至少有1人是男生的概率解析将甲部门的2名男生分别记为a,b,1名女生记为a,乙部门的2名男生分别记为c,d,2名女生分别记为b,c,从这7人中任选2人的所有基本事件为(a,b),(a,a),(a,c),(a,d),(a,b),(a,c),(b,a),(b,c),(b,d),(b,b),(b,c),(a,c),(a,d),(a,b),(a,c),(c,d),(c,b),(c,c),(d,b),(d,c),(b,c),共21个,且这些基本事件出现的可能性相等(1)记“这2人全部来自甲部门”为事件m,则事件m包含的基本事件有(a,b),(a,a),(b,a),共3个,故p(m).(2)记“这2人中至少有1人是男生”为事件n,则事件n包含的基本事件有(a,b),(a,a),(a,c),(a,d),(a,b),(a,c),(b,a),(b,c),(b,d),(b,b),(b,c),(a,c),(a,d),(c,d),(c,b),(c,c),(d,b),(d,c),共18个,故p(n).2为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下实验数据.天数t/天34567繁殖个数y/千个2.5344.56(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,预测t8时,细菌繁殖个数附:回归直线的斜率和截距的最小二乘法估计公式分别为, .解析(1)由表中数据计算得,5,4,(ti)(yi)8.5,(ti)210,0.85, 40.8550.25.所以回归方程为0.85t0.25.(2)将t8代入(1)的回归方程中得0.8580.256.55.故预测t8时,细菌繁殖个数为6.55千个3近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表.患三高疾病不患三高疾病总计男630女总计36(1)请将列联表补充完整,若用分层抽样的方法在患三高疾病的人群中抽9人,其中女生抽多少人?(2)为了研究三高疾病是否与性别有关,请计算出统计量k2的观测值k0,并说明是否可以在犯错误的概率不超过0.005的前提下认为三高疾病与性别有关下面的临界值表供参考:p(k2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解析(1)完善补充列联表如下.患三高疾病不患三高疾病总计男24630女121830总计362460在患三高疾病人群中抽9人,则抽取比例为,所以女性应该抽取123(人)(2)根据22列联表,则k2的观测值k0107.879.所以可以在犯错误的概率不超过0.005的前提下认为患三高疾病与性别有关课时达标讲座(六)解密考纲概率与统计是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量该类问题以应用题为载体,注重考查学生的应用意识及阅读理解能力、数据分析能力概率问题的核心是概率计算,其中事件的互斥、对立是概率计算的核心统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征统计与概率内容相互渗透,背景新颖1某保险公司有一款保险产品的历史收益率(收益率利润保费收入)的频率分布直方图如图所示(1)试估计这款保险产品的收益率的平均值;(2)设每份保单的保费在20元的基础上每增加x元,对应的销量为y(单位:万份)从历史销售记录中抽样得到如下5组x与y的对应数据.x/元2530384552y/万份7.57.16.05.64.8由上表知x与y有较强的线性相关关系,且据此计算出的回归方程为10x.求参数的值;若把回归方程10x当作y与x的线性关系,用(1)中求出的收益率的平均值作为此产品的收益率,试问每份保单的保费定为多少元时此产品可获得最大利润,并求出最大利润(注:保险产品的保费收入每份保单的保费销量)解析(1)收益率的平均值为0.050.10.150.20.250.250.350.30.450.10.550.050.275.(2)38,6.2.由10,得10386.2,解得0.1.设每份保单的保费为(20x)元,则销量为y100.1x.则这款保险产品的保费收入为f(x)(20x)(100.1x)万元所以f(x)2008x0.1x23600.1(x40)2.所以当x40,即每份保单的保费为60元时,保费收入最大为360万元预计这款保险产品的最大利润为3600.27599(万元)2(2018广东佛山质检)某网络广告a公司计划从甲、乙两个网站选择一个网站拓展广告业务,为此a公司随机抽取了甲、乙两个网站某月中10天的日访问量n(单位:万次),整理后得到如下茎叶图,已知a公司要从网站日访问量的平均值和稳定性两方面进行考察选择(1)请说明a公司应选择哪个网站;(2)现将抽取的样本分布近似看作总体分布,a公司根据所选网站的日访问量n进行付费,其付费标准如下表.选定网站的日访问量n(单位:万次)a公司的付费标准(单位:元/日)n2550025n35700n351 000求a公司每月(按30天计)应付给选定网站的费用s.解析(1)由茎叶图可知甲(15242825303630323545)1030,s(1530)2(2430)2(2830)2(2530)2(3030)2(3630)2(3030)2(3230)2(3530)2(4530)258,乙(18252224323830363540)1030,s(1830)2(2530)2(2230)2(2430)2(3230)2(3830)2(3030)2(3630)2(3530)2(4030)249.8,因为甲乙,ss,a公司应选择乙网站(2)由(1)得a公司应选择乙网站,由题意可得乙网站日访问量n35的概率为0.3,a公司每月应付给乙网站的费用s30(5000.37000.41 0000.3)21 900(元)3柴静穹顶之下的播出,让大家对雾霾天气的危害有了更进一步的认识,对于雾霾天气的研究也渐渐活跃起来,某研究机构对春节燃放烟花爆竹的天数x与雾霾天数y进行统计分析,得出下表数据.x4578y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(3)试根据(2)求出的线性回归方程,预测燃放烟花爆竹的天数为9的雾霾天数解析(1)散点图如图所示(2)iyi42537586106,6,4,42527282154,则1,462,故线性回归方程为x2.(3)由线性回归方程可以预测,燃放烟花爆竹的天数为9的雾霾天数为7.4(2016北京卷)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w3时,估计该市居民该月的人均水费解析(1)由用水量的频率分布直方图知,该市居民该月用水量在区间0.5,1,(1,1.5,(1.5,2,(2,2.5,(2.5,3内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表.组号12345678分组2,4(4,6(6,8(8,10(10,12(12,17(17,22(22,27频率0.10.150.20.250.150.050.050.05根据题意,该市居民该月的人均水费估计为40.160.1580.2100.25120.15170.05220.05270.0510.5(元)5(2018河南郑州模拟)某小学为迎接校运动会的到来,在三年级招募了16名男志愿者和14名女志愿者调查发现,男、女志愿者中分别各有10人和6人喜欢运动,其余人员不喜欢运动(1)根据以上数据完成22列联表;喜欢运动不喜欢运动总计男女总计(2)是否有95%的把握认为性别与喜欢运动有关,并说明理由;(3)如果喜欢运动的女志愿者中恰有4人懂得医疗救护,现从喜欢运动的女志愿者中抽取2名负责处理应急事件,求抽出的2名志愿者都懂得医疗救护的概率附:k2p(k2k0)0.0500.0250.0100.001k03.8415.0246.63510.828解析(1)依题意,22列联表如下.喜欢运动不喜欢运动总计男10616女6814总计161430(2)由已知数据可得,k21.157 53.841,因此没有95%的把握认为是否喜欢运动与性别有关(3)喜欢运动的女志愿者有6人,设分别为a,b,c,d,e,f,其中a,b,c,d懂得医疗救护,则从这6人中任取2人的情况有(a,b),(a,c),(a,d),(a,e),(a,f),(b,c),(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f),共15种,其中两人都懂得医疗救护的情况有(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),共6种,设“抽出的2名志愿者都懂得医疗救护”为事件m,则p(m).6(2016全国卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量附注:参考数据:i9.32,iyi40.17,0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为,.解析(1)由折线图中数据和附注中参考数据得4,(ti)228,0.55,(ti)(yi)iyii40.1749.322.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系(2)由1.331及(1)得0.103,1.3310.10340.92.所以y关于t的回归方程为0.920.10t.将2016年对应的t9代入回归方程得0.920.1091.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨7某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为0,2,(2,4,(4,6,(6,8,(8,10,(10,12估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”附:k2p(k2k0)0.100.050.0100.005k02.7063.8416.6357.879解析(1)30090,所以应收集90位女生的样本数据(2)由频率分布直方图得12(0.1000.025)0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有3000.75225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时又因为样本数据中有210份是关于男生的,90份是关于女生的所以每周平均体育运动时间与性别列联表如下.男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得k24.7623.841.所以有95%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论