2019届高考数学复习统计与统计案例11.3变量间的相关关系统计案例学案.docx_第1页
2019届高考数学复习统计与统计案例11.3变量间的相关关系统计案例学案.docx_第2页
2019届高考数学复习统计与统计案例11.3变量间的相关关系统计案例学案.docx_第3页
2019届高考数学复习统计与统计案例11.3变量间的相关关系统计案例学案.docx_第4页
2019届高考数学复习统计与统计案例11.3变量间的相关关系统计案例学案.docx_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11.3变量间的相关关系、统计案例最新考纲考情考向分析1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3.了解独立性检验的基本思想、方法及其初步应用4.了解回归分析的基本思想、方法及简单应用.回归分析,独立性检验是全国卷高考重点考查的内容,必考一个解答题,选择、填空题中也会出现主要考查回归方程,相关系数,利用回归方程进行预测,独立性检验的应用等.1两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线2回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法(2)回归方程方程 x 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中 , 是待定参数3回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中(,)称为样本点的中心(3)相关系数当r0时,表明两个变量正相关;当rR;x,y之间不能建立线性回归方程答案解析在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故正确;由散点图知用y拟合比用 x 拟合效果要好,则RR,故正确;x,y之间可以建立线性回归方程,但拟合效果不好,故错误思维升华 判定两个变量正,负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关(2)相关系数:r0时,正相关;r0时,正相关; 0时,负相关题型二线性回归分析典例 (2016全国)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20082014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量附注:参考数据:i9.32,iyi40.17, 0.55,2.646.参考公式:相关系数r,回归方程 t中斜率和截距的最小二乘估计公式分别为: , .解(1)由折线图中数据和附注中参考数据得4,(ti)228, 0.55.(ti)(yi)iyii40.1749.322.89,所以r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系(2)由1.331及(1)得 0.103, 1.3310.10340.92.所以y关于t的回归方程为 0.920.10t.将2016年对应的t9代入回归方程得 0.920.1091.82.所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨思维升华 线性回归分析问题的类型及解题方法(1)求线性回归方程利用公式,求出回归系数,.待定系数法:利用回归直线过样本点的中心求系数(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数.(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强跟踪训练 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值(xi)2(wi)2(xi)(yi)(wi)(yi)46.65636.8289.81.61 469108.8表中wi,i.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线 u的斜率和截距的最小二乘估计分别为 , .解(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程,由于 68, 563686.8100.6,所以y关于w的线性回归方程为 100.668w,因此y关于x的回归方程为 100.668.(3)由(2)知,当x49时,年销售量y的预报值 100.668576.6,年利润z的预报值 576.60.24966.32.根据(2)的结果知,年利润z的预报值 0.2(100.668)xx13.620.12.所以当6.8,即x46.24时, 取得最大值故年宣传费为46.24千元时,年利润的预报值最大题型三独立性检验典例 (2017全国)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)附:P(K2k0)0.0500.0100.001k03.8416.63510.828K2.解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”由题意知,P(A)P(BC)P(B)P(C)旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.0680.0460.0100.008)50.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.620.660.409 2.(2)根据箱产量的频率分布直方图得列联表如下:箱产量6.635,故有99%的把握认为箱产量与养殖方法有关(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.0040.0200.044)50.340.5,故新养殖法箱产量的中位数的估计值为5052.35 (kg)思维升华 (1)比较几个分类变量有关联的可能性大小的方法通过计算K2的大小判断:K2越大,两变量有关联的可能性越大通过计算|adbc|的大小判断:|adbc|越大,两变量有关联的可能性越大(2)独立性检验的一般步骤根据样本数据制成22列联表根据公式K2计算K2的观测值k.比较k与临界值的大小关系,作统计推断跟踪训练 (2017石家庄质检)微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中有是青年人(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22列联表:青年人中年人合计经常使用微信不经常使用微信合计(2)根据22列表中的数据利用独立性检验的方法判断是否有99.9%的把握认为“经常使用微信与年龄有关”?附:K2.P(K2k0)0.0100.001k06.63510.828解(1)由已知可得,该公司员工中使用微信的有20090%180(人)经常使用微信的有18060120(人),其中青年人有12080(人),使用微信的人中青年人有18075%135(人),故22列联表如下:青年人中年人合计经常使用微信8040120不经常使用微信55560合计13545180(2)将列联表中数据代入公式可得:K213.333,由于13.33310.828,所以有99.9%的把握认为“经常使用微信与年龄有关”求线性回归方程的方法技巧典例 (12分)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20062008201020122014需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的线性回归方程x;(2)利用(1)中所求出的线性回归方程预测该地2018年的粮食需求量思想方法指导 回归分析是处理变量相关关系的一种数学方法主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程规范解答解(1)由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表年份201042024需求257211101929对处理的数据,容易算得0,3.2,4分6.5, 3.2.6分由上述计算结果,知所求线性回归方程为2576.5(x2010)3.2,即6.5(x2010)260.2.8分(2)利用所求得的线性回归方程,可预测2018年的粮食需求量大约为6.5(20182010)260.26.58260.2312.2(万吨)12分1根据如下样本数据:x345678y4.02.50.50.50.40.1得到的线性回归方程为 x ,则()A. 0, 0 B. 0, 0C. 0 D. 0, 0答案B解析根据给出的数据可发现:整体上y与x呈现负相关,所以 0,故选B.2(2017江西南城一中、高安中学等九校联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表非一线一线总计愿生452065不愿生132235总计5842100由K2,得K29.616.参照下表,P(K2k0)0.0500.0100.001k03.8416.63510.828正确的结论是()A在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C有99%以上的把握认为“生育意愿与城市级别有关”D有99%以上的把握认为“生育意愿与城市级别无关”答案C解析K29.6166.635,有99%以上的把握认为“生育意愿与城市级别有关”,故选C.3对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i1,2,8),其线性回归方程是 x ,且x1x2x3x82(y1y2y3y8)6,则实数 的值是()A. B. C. D.答案B解析依题意可知样本点的中心为,则 ,解得 .4(2017山东)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其线性回归方程为x.已知xi225,yi1 600,4.该班某学生的脚长为24,据此估计其身高为()A160 B163 C166 D170答案C解析xi225,xi22.5.yi1 600,yi160.又 4, 160422.570.线性回归方程为 4x70.将x24代入上式,得 42470166.故选C.5(2018湖南永州模拟)已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得的线性回归方程为 x .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()A. b, a B. b, aC. a D. b, a答案C解析由两组数据(1,0)和(2,2)可求得直线方程为y2x2,b2,a2.而利用线性回归方程的公式与已知表格中的数据,可求得 , ,所以 a.6某地2009年至2015年中,每年的人口总数y(单位:万)的数据如下表:年份2009201020112012201320142015年份代号t0123456人口总数y888991011若t与y之间具有线性相关关系,则其回归直线 t 一定过点()A(3,9) B(9,3)C(6,14) D(4,11)答案A解析(0123456)3,(888991011)9,所以回归直线 t 一定过点(3,9)7(2017遵义联考)某公司为确定明年投入某产品的广告支出,对近5年的年广告支出m与年销售额t(单位:百万元)进行了初步统计,得到下列表格中的数据:年广告支出m24568年销售额t3040p5070经测算,年广告支出m与年销售额t满足线性回归方程 6.5m17.5,则p_.答案60解析由于回归直线过样本点的中心,5,代入 6.5m17.5,解得p60.8以下四个命题,其中正确的序号是_从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1;在线性回归方程 0.2x12中,当解释变量x每增加一个单位时,预报变量 平均增加0.2个单位;对分类变量X与Y的统计量K2来说,K2越小,“X与Y有关系”的把握程度越大答案解析是系统抽样;对于,统计量K2越小,说明两个相关变量有关系的把握程度越小9为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示22列联表:理科文科总计男131023女72027总计203050已知P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到K2的观测值k4.844,则有_的把握认为选修文科与性别有关答案95%解析由题意,K24.844,因为5.0244.8443.841,所以有95%的把握认为选修文科与性别有关10(2017武邑模拟)对具有线性相关关系的变量x,y有10组观测数据(xi,yi)(i1,2,10),其线性回归方程为 32x,若xi17,则yi_.答案4解析依题意1.7,而直线 32x一定经过(,),32321.70.4,yi0.4104.11某地区2009年至2015年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2009201020112012201320142015年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的线性回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:,.解(1)由所给数据计算得(1234567)4,(2.93.33.64.44.85.25.9)4.3,(ti)2941014928,(ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,0.5,4.30.542.3,所求线性回归方程为0.5t2.3.(2)由(1)知, 0.50,故2009年至2015年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元将2018年的年份代号t10代入(1)中的线性回归方程,得 0.5102.37.3,故预测该地区2018年农村居民家庭人均纯收入为7.3千元12(2017西安质检)某省会城市地铁将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:月收入(单位:百元)15,25)25,35)35,45)45,55)55,65)65,75赞成定价者人数123534认为价格偏高者人数4812521(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差异是多少(结果保留2位小数);(2)由以上统计数据填下面22列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”月收入不低于55百元的人数月收入低于55百元的人数总计认为价格偏高者赞成定价者总计附:K2.P(K2k0)0.050.01k03.8416.635解(1)“赞成定价者”的月平均收入为x150.56.“认为价格偏高者”的月平均收入为x238.75,“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1x250.5638.7511.81(百元)(2)根据条件可得22列联表如下:月收入不低于55百元的人数月收入低于55百元的人数总计认为价格偏高者32932赞成定价者71118总计104050K26.2723.841,所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异(2)从不支持“延迟退休年龄政策”的人中抽取8人,则45岁以下的应抽6人,45岁及45岁以上的应抽2人则8人中随机抽2人共有C28种抽法,至少有1人是45岁及

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论