2019届高考数学二轮复习专题四概率与统计第1讲统计与统计案例学案理.docx_第1页
2019届高考数学二轮复习专题四概率与统计第1讲统计与统计案例学案理.docx_第2页
2019届高考数学二轮复习专题四概率与统计第1讲统计与统计案例学案理.docx_第3页
2019届高考数学二轮复习专题四概率与统计第1讲统计与统计案例学案理.docx_第4页
2019届高考数学二轮复习专题四概率与统计第1讲统计与统计案例学案理.docx_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1讲统计与统计案例高考定位1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点,2016年,2017年和2018年在解答题中均有考查.真 题 感 悟 1.(2018全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.故选A.答案A2.(2018全国卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_.解析因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.答案分层抽样3.(2018全国卷)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解(1)利用模型,该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元).利用模型,该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元).(2)利用模型得到的预测值更可靠.理由如下:从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.考 点 整 合 1.抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.2.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即(x1x2xn).(4)方差与标准差.s2(x1)2(x2)2(xn)2,s.3.直方图的两个结论(1)小长方形的面积组距频率.(2)各小长方形的面积之和等于1.4.回归分析与独立性检验(1)回归直线x经过样本点的中心点(,),若x取某一个值代入回归直线方程x中,可求出y的估计值.(2)独立性检验对于取值分别是x1,x2和y1,y2的分类变量X和Y,其样本频数列联表是:y1y2总计x1ababx2cdcd总计acbdn则K2(其中nabcd为样本容量).热点一抽样方法【例1】 (1)(2018合肥模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n()A.860 B.720C.1 020 D.1 040(2)(2018长沙雅礼中学质检)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是_.解析(1)依题意,分层抽样比为.81(1 0001 200n),解得n1 040.(2)依题意,可将编号为135号的35个数据分成7组,每组有5个数据.在区间139,151上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人.答案(1)D(2)4探究提高1.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值.2.在系统抽样的过程中,要注意分段间隔,需要抽取n个个体,样本就需要分成n个组,则分段间隔即为(n为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.【训练1】 (1)(2018郑州模拟)为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是()A.13 B.19C.20 D.51(2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取_件.解析(1)由系统抽样的原理知,抽样的间隔为52413,故抽取的样本的编号分别为7,713,7132,7133,即7号,20号,33号,46号.样本中还有一位同学的编号为20号.(2)因为样本容量n60,总体容量N2004003001001 000,所以抽取比例为.因此应从丙种型号的产品中抽取30018(件).答案(1)C(2)18热点二用样本估计总体考法1数字特征与茎叶图的应用【例21】 (2018北京东城区质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:假设每名同学最近一周平均每天的锻炼时间是互相独立的.男生每天锻炼的时间差别小,女生每天锻炼的时间差别大;从平均值分析,男生每天锻炼的时间比女生多;男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.其中符合茎叶图所给数据的结论是()A. B. C. D.解析由茎叶图知,男生每天锻炼时间差别小,女生差别大,正确.男生平均每天锻炼时间超过65分钟的概率P1,女生平均每天锻炼时间超过65分钟的概率P2,P1P2,因此正确.设男生、女生两组数据的平均数分别为甲,乙,标准差分别为s甲,s乙.易求甲65.2,乙61.8,知甲乙,正确.又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,s甲0.5.又前4组的频率之和为0.040.080.150.210.480.5.所以2x0时,表明两个变量正相关;当r0.75时,认为两个变量具有较强的线性相关.【训练3】 (2016全国卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码17分别对应年份20082014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:yi9.32,tiyi40.17,0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为:, .解(1)由折线图中数据和附注中参考数据得4, (ti)228,0.55. (ti)(yi)tiyiyi40.1749.322.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)由1.331及(1)得0.103, 1.3310.10340.92.所以y关于t的回归方程为0.920.10t.将2016年对应的t9代入回归方程得0.920.1091.82.所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.热点四独立性检验【例4】 (2018全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2,P(K2k0)0.0500.0100.001k03.8416.63510.828解(1)第一种生产方式时间集中在区间80,90,且平均工作时间184.第二种生产方式的时间集中在区间70,80),且平均工作时间274.7.12,所以第一种生产方式完成任务的平均时间大于第二种,第二种生产方式的效率更高.(2)由茎叶图数据得到m80.由此填写列联表如下:超过m不超过m总计第一种生产方式15520第二种生产方式51520总计202040(3)根据(2)中的列联表计算.K2106.635,所以有99%的把握认为两种生产方式的效率有差异.探究提高1.独立性检验的一般步骤(1)根据样本数据制成22列联表;(2)根据公式K2计算K2的值;(3)查表比较K2与临界值的大小关系,作统计判断.2.K2的观测值k越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.【训练4】 微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2,(2,4,(4,6,(6,8,(8,10分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成22的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”?解(1)女性平均使用微信的时间为:0.1610.2430.2850.270.1294.76(小时).(2)由已知得:2(0.04a0.1420.12)1,解得a0.08.由题设条件得列联表微信控非微信控总计男性381250女性302050总计6832100K22.9412.706.所以有90%的把握认为“微信控”与“性别”有关.1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.3.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律.在频率分布直方图中,可分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小.注意:频率分布直方图的纵轴刻度是,而不是频率,每个小直方图的面积才是相应区间的频率.4.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.一、选择题1.(2017全国卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,xn的平均数 B.x1,x2,xn的标准差C.x1,x2,xn的最大值 D.x1,x2,xn的中位数解析刻画评估这种农作物亩产量稳定程度的指标是标准差.答案B2.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7 B.9 C.10 D.15解析抽取号码的间隔为30,从而区间451,750包含的段数为10,则编号落入区间451,750的人数为10人,即做问卷B的人数为10.答案C3.(2017全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析由题图可知,2014年8月到9月的月接待游客量在减少,则A选项错误.答案A4.(2018北京燕博园质检)某超市从2017年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10,(10,20,(20,30,(30,40,(40,50分组,得到频率分布直方图如下:记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s,s,则频率分布直方图(甲)中的a的值及s与s的大小关系分别是()A.a0.015,ssC.a0.015,ss D.a0.15,ss.答案C5.某省二线城市地铁正式开工建设,地铁时代的到来能否缓解该市的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:男性市民女性市民认为能缓解交通拥堵4830认为不能缓解交通拥堵1220则下列结论正确的是()附:K2P(K2k0)0.050.0100.0050.001k03.8416.6357.87910.828A.有95%的把握认为“对能否缓解交通拥堵的认识与性别有关”B.有95%的把握认为“对能否缓解交通拥堵的认识与性别无关”C.有99%的把握认为“对能否缓解交通拥堵的认识与性别有关”D.有99%的把握认为“对能否缓解交通拥堵的认识与性别无关”解析由22列联表,可求K2的观测值,k5.2883.841.由统计表P(K23.841)0.05,有95%的把握认为“能否缓解交通拥堵的认识与性别有关”.答案A二、填空题6.(2018泉州模拟)某厂在生产甲产品的过程中,产量x(吨)与生产能耗y(吨)的对应数据如表:x30405060y25354045根据最小二乘法求得回归方程为0.65x,当产量为80吨时,预计需要生产能耗为_吨.解析由题意,45,36.25,代入0.65x,可得7,当产量为80吨时,预计需要生产能耗为0.6580759.答案597.(2018邯郸模拟)空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,050为优;51100为良;101150为轻度污染;151200为中度污染;201300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为_(该年为365天).解析该样本中AQI大于100的频数是4,频率为,由此估计该地全年AQI大于100的频率为,估计此地该年AQI大于100的天数约为365146.答案1468.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30.根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是_.解析设所求的人数为n,由频率分布直方图,自习时间不少于22.5小时的频率为(0.040.080.16)2.50.7,n0.7200140.答案140三、解答题9.(2018全国卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)频数151310165(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35(m3)的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表).解(1)所求的频率分布直方图如下:(2)由题可知用水量在0.3,0.4的频数为10,所以可估计在0.3,0.35)的频数为5,故用水量小于0.35(m3)的频数为1513524,其概率为P0.48.(3)该家庭未使用节水龙头50天的日用水量的平均数为1(0.0510.1530.2520.3540.4590.55260.655)0.48.该家庭使用了节水龙头后50天的日用水量的平均数为2(0.0510.1550.25130.35100.45160.555)0.35.估计使用节水龙头后,一年可节省水(0.480.35)36547.45(m3).10.某市春节期间7家超市的广告费支出xi(万元)和销售额yi(万元)数据如下:超市ABCDEFG广告费支出xi1246111319销售额yi19324044525354(1)若用线性回归模型拟合y与x的关系,求y关于x的线性回归方程;(2)用对数回归模型拟合y与x的关系,可得回归方程12ln x22,经计算得出线性回归模型和对数模型的R2分别约为0.75和0.97,请用R2说明选择哪个回归模型更合适,并用此模型预测A超市广告费支出为8万元时的销售额.参数数据及公式:8,42,xiyi2 794,x708,ln 20.7.解(1)8,42,xiyi2 794,x708.1.7,因此421.7828.4.所以,y关于x的线性回归方程是1.7x28.4.(2)0.750.97,对数回归模型更合适.当x8时,12ln 82236ln 222360.72247.2(万元).广告

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论