2019届高考数学复习专题七概率与统计第2讲统计案例教案.docx_第1页
2019届高考数学复习专题七概率与统计第2讲统计案例教案.docx_第2页
2019届高考数学复习专题七概率与统计第2讲统计案例教案.docx_第3页
2019届高考数学复习专题七概率与统计第2讲统计案例教案.docx_第4页
2019届高考数学复习专题七概率与统计第2讲统计案例教案.docx_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2讲统计案例1.(2018全国卷,文18)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解:(1)利用模型,可得该地区2018年的环境基础设施投资额的预测值为=-30.4+13.519=226.1(亿元).利用模型,可得该地区2018年的环境基础设施投资额的预测值为=99+17.59=256.5(亿元).(2)利用模型得到的预测值更可靠.理由如下(写出一种,合理即可):(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.2.(2017全国卷,文19)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P(K2k)0.0500.0100.001k3.8416.63510.828K2=解:(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.(2016全国卷,文18)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码17分别对应年份20082014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:yi=9.32,tiyi=40.17,=0.55,2.646.参考公式:相关系数r=,回归方程=+t中斜率和截距的最小二乘估计公式分别为=,=-.解:(1)由折线图中数据和附注中参考数据得=4,(ti-)2=28,=0.55,(ti-)(yi-)=tiyi-yi=40.17-49.32=2.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)由=1.331及(1)得=0.103,=-1.331-0.10340.92.所以,y关于t的回归方程为=0.92+0.10t.将2016年对应的t=9代入回归方程得=0.92+0.109=1.82.所以预测2016年我国生活垃圾无害化处理量为1.82亿吨.4.(2015全国卷,文19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(xi-)246.65636.8289.8(wi-)2(xi-)(yi-)(wi-)(yi-)1.61 469108.8表中wi=,=wi.(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:年宣传费x=49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别为=,=-.解:(1)由题目散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=,先建立y关于w的线性回归方程.由于=68.=-=563-686.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.(3)由(2)知,当x=49时,年销售量y的预报值=100.6+68=576.6,年利润z的预报值=576.60.2-49=66.32.根据(2)的结果知,年利润z的预报值=0.2(100.6+68)-x=-x+13.6+20.12.所以当=6.8,即x=46.24时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.1.考查角度常以贴近考生、贴近生活的实际问题为背景,以统计图、表为依据,考查独立性检验、线性回归方程并由回归方程估计预测,有时还需将非线性回归模型转化为线性回归模型解决.2.题型及难易度解答题,难度中低档.(对应学生用书第5255页) 线性回归分析考向1线性回归方程【例1】 (2018湖南省湘东五校联考)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1月份至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下数据:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x/1011131286就诊人数y/个222529261612该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月份与6月份的两组数据,请根据2月份至5月份的数据,求出y关于x的线性回归方程=x+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?参考公式:=,=-.参考数据:1125+1329+1226+816=1 092,112+132+122+82=498.解:(1)设选到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,且每种情况都是等可能的,其中,选到相邻两个月的数据的情况有5种,所以P(A)=.(2)由表中2月份至5月份的数据可得=11,=24,xiyi=1 092,=498,所以=,则=-=-,所以y关于x的线性回归方程为=x-.(3)当x=10时,=,-222;当x=6时,=,-120.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:周光照量X/小时30X70光照控制仪运行台数321对商家来说,若某台光照控制仪运行,则该台光照控制仪产生的周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元.若商家安装了3台光照控制仪,求商家在过去50周的周总利润的平均值.相关系数公式:r=,参考数据:0.55,0.95.解:(1)由已知数据可得=5,=4.因为(xi-)(yi-)=(-3)(-1)+0+0+0+31=6,=2,=,所以相关系数r=0.95.因为|r|0.75,所以可用线性回归模型拟合y与x的关系.(2)由条件可得在过去50周里,当X70时,共有10周,此时只有1台光照控制仪运行,每周的周总利润为13 000-21 000=1 000(元).当50X70时,共有35周,此时有2台光照控制仪运行,每周的周总利润为23 000-11 000=5 000(元).当30X0时,表明两个变量正相关;当r0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.热点训练1:(2018广西三市第二次调研)某地区积极发展电商,通过近些年工作的开展在新农村建设和扶贫过程中起到了非常重要的作用,促进了农民生活富裕.为了更好地了解本地区某一特色产品的宣传费x(千元)对销量y(千件)的影响,统计了近六年的数据如下:年份代号123456宣传费(千元)2456810销量(千件)3040605070y利润(千元)407011090160205(1)若近6年的宣传费x与销量y呈线性分布,由前5年数据求线性回归直线方程,并写出y的预测值;(2)若利润与宣传费的比值不低于20的年份称为“吉祥年”,在这6个年份中任意选2个年份,求这2个年份均为“吉祥年”的概率.附:回归方程=x+的斜率与截距的最小二乘法估计分别为=,=-,其中,为xi,yi的平均数.解:(1)由前5年数据可得=5,=50,xiyi=230+440+560+650+870=1 380,=4+16+25+36+64=145,5 =1 250,5=125,所以=6.5,=-=50-6.55=17.5,所以回归直线方程为=6.5x+17.5,把x=10代入得=65+17.5=82.5,所以y的预测值为82.5.(2)从6个年份中任取2个年份的情况为(2,40),(4,70),(2,40),(5,110),(2,40),(6,90),(2,40),(8,160),(2,40),(10,205),(4,70),(5,110),(4,70),(6,90),(4,70),(8,160),(4,70),(10,205),(5,110),(6,90),(5,110),(8,160),(5,110),(10,205),(6,90),(8,160),(6,90),(10,205),(8,160),(10,205),共15种.2个年份均为“吉祥年”的情况有(2,40),(5,110),(2,40),(8,160),(2,40),(10,205),(5,110),(8,160),(5,110),(10,205),(8,160),(10,205),共6种.所以6个年份中任意选2个年份均为“吉祥年”的概率为=.独立性检验【例3】 (2018江西九校联考)进入高三,同学们的学习越来越紧张,学生休息和锻炼的时间也减少了.学校为了提高学生的学习效率,鼓励学生加强体育锻炼.某中学高三(3)班有学生50人.现调查该班学生每周平均体育锻炼时间的情况,得到如下频率分布直方图.其中数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.(1)求学生周平均体育锻炼时间的中位数(保留3位有效数字);(2)从每周平均体育锻炼时间在0,4的学生中,随机抽取2人进行调查,求此2人的每周平均体育锻炼时间都超过2小时的概率;(3)现全班学生中有40%是女生,其中3个女生的每周平均体育锻炼时间不超过4小时.若每周平均体育锻炼时间超过4小时称为经常锻炼,问:有没有90%的把握说明,是否经常锻炼与性别有关?附:K2=P(K2k0)0.1000.0500.0100.001k02.7063.8416.63510.828解:(1)设中位数为a,因为前三组的频率和为(0.02+0.03+0.11)2=0.320.5,第四组的频率为0.142=0.28,所以(a-6)0.14=0.5-0.32,所以a=7.29.所以学生周平均体育锻炼时间的中位数是7.29.(2)由已知,锻炼时间在0,2和(2,4中的人数分别是500.022=2人,500.032=3人,分别记在0,2的2人为a1,a2,(2,4的3人为b1,b2,b3,则随机抽取2人调查的所有基本事件列举为(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a2,b1),(a2,b2),(a2,b3),(b1,b2),(b1,b3),(b2,b3)共10个基本事件,其中体育锻炼时间都超过2小时包含3个基本事件,所以p=.(3)由已知可知,不超过4小时的人数为500.052=5人,其中女生有3人,所以男生有2人,因此经常锻炼的女生有5040%-3=17人,男生有30-2=28人,所以22列联表为男生女生小计经常锻炼281745不经常锻炼235小计302050所以K2=10 000男12476女03962若某人一天行走的步数超过8 000,则其被评定为“积极型”,否则被评定为“懈怠型”.(1)利用样本估计总体的思想,试估计小明的微信好友每日行走的步数超过10 000的概率;(2)根据题意完成下面的22列联表,并据此判断能否有90%的把握认为“评定类型”与“性别”有关.积极型懈怠型总计男女总计附:K2=,n=a+b+c+d.P(K2k0)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828解:(1)根据表中数据可知,40位好友中每日行走的步数超过10 000的有8人,所以利用样本估计总体的思想,估计小明的微信好友每日行走的步数超过10 000的概率P=0.2.(2)22列联表如下:积极型懈怠型总计男13720女81220总计211940所以K2=2.5062.706,所以没有90%的把握认为“评定类型”与“性别”有关.可线性化的非线性回归分析【例4】 某品牌汽车旗下的4S店以“四位一体”(整车销售、零配件销售、售后服务、信息反馈)为核心的模式经营,4S店为了了解该品牌的A,B,C三种车型的质量问题,从出售时间5年以上的该三种车型的汽车中各随机抽取100辆进行跟踪调查,发现各车型在一年内需要维修的车辆如表(1)所示.(1)该4S店从所有的跟踪服务的A,B,C三种车型的汽车中用分层抽样的方法抽取10个样本做进一步调查,求分别抽取的A,B,C三种车型的汽车辆数;(2)该品牌汽车研发中心针对A,B,C三种车型在维修中反映的主要问题研发了一种辅助产品,4S店需要对研发中心研发的辅助产品进行合理定价,该产品在试营时的数据如散点图和表(2)所示.根据散点图判断,y与x和z与x哪一对具有的线性相关性较强(给出判断即可,不必说明理由)?并根据你的判断结果及数据,求y关于x的回归方程(方程中的系数均保留两位小数).表(1)车型ABC维修频数204040表(2)定价x/(百元/件)102030405060年销量y/件1 15064342426216586z=2ln y14.112.912.111.110.28.9参考数据:(xi-)(yi-)=-34 580,(xi-)(zi-)=-175.5,(yi-)2=776 840,(yi-)(zi-)=3 465.2.参考公式:对于一组数据(x1,y1),(x2,y2),(x3,y3),(xn,yn),其回归方程=x+的斜率和截距的最小二乘估计分别为=,=-.解:(1)抽取的A车型的汽车辆数为10=2,抽取的B车型的汽车辆数为10=4,抽取的C车型的汽车辆数为10=4,故抽取的A,B,C三种车型的汽车辆数分别为2,4,4.(2)由散点图可知,z与x具有的线性相关性较强.由题设知=35,=11.55,=-0.10,所以=-15.05,所以=x+=15.05-0.10x.又z=2ln y,所以y关于x的回归方程为=.解非线性回归分析问题,首先观察散点图,挑出与散点图拟合得最好的函数,然后采用适当的变量置换把问题转化为线性回归分析问题.热点训练3:(2018广州综合测试)某地110岁男童年龄xi(单位:岁)与身高的中位数yi(单位:cm)(i=1,2,10)如表:x/岁12345y/cm76.588.596.8104.1111.3x/岁678910y/cm117.7124.0130.0135.4140.2对上表的数据作初步处理,得到下面的散点图及一些统计量的值.(xi-)2(yi-)2(xi-)(yi-)5.5112.4582.503 947.71566.85(1)求y关于x的线性回归方程(回归方程系数精确到0.01);(2)某同学认为,y=px2+qx+r更适宜作为y关于x的回归方程模型,他求得的回归方程是=-0.30x2+10.17x+68.07.经调查,该地11岁男童身高的中位数为145.3 cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?附:回归方程=+x中的斜率和截距的最小二乘估计分别为=,=-.解:(1)=6.87,=-=112.45-6.875.574.67,所以y关于x的线性回归方程为=6.87x+74.67,(2)若回归方程为=6.87x+74.67,则当x=11时,=150.24.若回归方程为=-0.30x2+10.17x+68.07,则当x=11时,=143.64.|143.64-145.3|=1.662),那么在消费者对该产品的心理价的范围内,销售单价定为多少时,网店才能获得最大利润?(注:利润=销售收入-成本)参考数据:xiyi=392,=502.5.参考公式:回归方程=x+,其中=,=-.解:(1)因为=(9+9.5+10+10.5+11)=10,=(11+10+8+6+5)=8,所以=-3.2,则=8-(-3.2)10=40.所以y关于x的回归方程为=-3.2x+40.(2)由已知得利润L=(x-a)(-3.2x+40)=-3.2x2+(40+3.2a)x-40a,x7,9,该二次函数图象的对称轴方程为x=.因为a2,所以.当9,即a时,函数在区间7,9上单调递增,所以当x=9时,L取得最大值;当9,即2时,该产品的销售单价为9元时,网店能获得最大利润;当26.635,所以有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.(2)根据题中图和表可知,设备改造后产品的合格率约为=,设备改造前产品的合格率约为=,即设备改造后产品的合格率更高,因此,设备改造后性能更好.(3)用频率估计概率,1 000件产品中大约有960件合格品,40件不合格品,则180960-10040=168 800,所以该企业大约获利168 800元.【例3】 (2017黑龙江齐齐哈尔二模)2015年7月9日21时15分,台风“莲花”在我国广东省陆丰市甲东镇沿海登陆,造成165.17万人受灾,5.6万人紧急转移安置,288间房屋倒塌,46.5千公顷农田受灾,直接经济损失 12.99 亿元,距离陆丰市222千米的梅州也受到了台风的影响,适逢暑假,小明调查了梅州某小区的50户居民由于台风造成的经济损失,将收集的数据制成如下频率分布直方图:(1)试根据频率分布直方图估计小区平均每户居民的平均损失;(同一组中的数据用该组区间的中点值作代表);(2)小明向班级同学发出倡议,为该小区居民捐款,现从损失超过6 000元的居民中随机抽出2户进行捐款援助,求抽出的2户居民损失均超过8 000元的概率;(3)台风后区委会号召该小区居民为台风重灾区捐款,小明调查的50户居民捐款情况如下22列联表,在表格空白处填写正确数字,并说明是否有95%以上的把握认为捐款数额超过或不超过500元和自身经济损失是否超过4 000 元有关?经济损失不超过4 000元经济损失超过4 000元合计捐款超过500元30捐款不超过500元6合计附:临界值参考公式:K2=,n=a+b+c+d.P(K2k)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解:(1)记每户居民的平均损失为元,则=(1 0000.000 15+3 0000.000 20+5 0000.000 09+7 0000.000 03+9 0000.000 03)2 000=3 360;所以估计小区平均每户居民的平均损失3 360元.(2)损失超过6 000元的居民共有500.000 0322 000=6(户),其中损失超过8 000元的居民有3户,现从这6户中随机抽出2户,则抽出的2户居民损失均超过8 000元的概率为P=.(3)根据题意填写列联表,如图所示:经济损失不超过4 000元经济损失超过4 000元合计捐款超过500元30939捐款不超过500元5611合计351550计算K2=4.0463.841,所以有95%以上的把握认为捐款数额超过或不超过 500元和自身经济损失是否超过4 000元有关.(对应学生用书第5556页) 【典例】 (2018全国卷,文18)(12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图,(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论