2019版高考数学第11章统计与统计案例3第3讲变量间的相关关系统计案例教案.docx_第1页
2019版高考数学第11章统计与统计案例3第3讲变量间的相关关系统计案例教案.docx_第2页
2019版高考数学第11章统计与统计案例3第3讲变量间的相关关系统计案例教案.docx_第3页
2019版高考数学第11章统计与统计案例3第3讲变量间的相关关系统计案例教案.docx_第4页
2019版高考数学第11章统计与统计案例3第3讲变量间的相关关系统计案例教案.docx_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3讲变量间的相关关系、统计案例1变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系2两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关(3)回归方程为x,其中,(4)相关系数当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性3独立性检验(1)22列联表:假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称22列联表)为:y1y2总计x1ababx2cdcd总计acbdabcd(2)K2统计量K2(其中nabcd为样本容量) 判断正误(正确的打“”,错误的打“”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系()(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值()(4)事件X,Y的关系越密切,由观测数据计算得到的K2的观测值越大()(5)通过回归方程x可以估计和观测变量的取值和变化趋势()答案:(1)(2)(3)(4)(5) 某商品销售量y(件)与销售价格x(元/件)负相关,则其回归直线方程可能是()A.10x200 B.10x200C.10x200 D.10x200解析:选A.因为商品销售量y(件)与销售价格x(元/件)负相关,所以0,所以应选A. 某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用22列联表进行独立性检验,经计算K27.069,则所得到的统计学结论是:有多少的把握认为“学生性别与支持该活动有关系”()附:P(K2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828A.0.1% B1%C99% D99.9%解析:选C.因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有10.0100.9999%的把握认为“学生性别与支持该活动有关系” 下面是一个22列联表y1y2总计x1a2173x222527总计b46则表中a、b处的值分别为_解析:因为a2173,所以a52.又因为a2b,所以b54.答案:52、54 已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为0.95x,则_x0134y2.24.34.86.7解析:由已知得2,4.5,因为回归方程经过点(,),所以4.50.9522.6.答案:2.6相关关系的判断 典例引领 已知变量x和y满足关系y0.1x1,变量y与z正相关下列结论中正确的是()Ax与y正相关,x与z负相关 Bx与y正相关,x与z正相关Cx与y负相关,x与z负相关 Dx与y负相关,x与z正相关【解析】因为y0.1x1的斜率小于0,故x与y负相关因为y与z正相关,可设zy,0,则zy0.1x,故x与z负相关【答案】C判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关(2)相关系数:r0时,正相关;r0时,正相关;0时,负相关 通关练习1对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图如图,对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图如图.由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关解析:选C.由散点图可得两组数据均线性相关,且图的线性回归方程斜率为负,图的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关2某公司在2017年上半年的收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:月份1月份2月份3月份4月份5月份6月份收入x12.314.515.017.019.820.6支出y5.635.755.825.896.116.18根据统计资料,则()A月收入的中位数是15,x与y有正线性相关关系B月收入的中位数是17,x与y有负线性相关关系C月收入的中位数是16,x与y有正线性相关关系D月收入的中位数是16,x与y有负线性相关关系解析:选C.月收入的中位数是16,收入增加,支出增加,故x与y有正线性相关关系线性回归方程及其应用(高频考点)线性回归问题是高考中的热点问题,考查形式可以是小题,也可以是解答题高考中对线性回归问题的考查主要有以下三个命题角度:(1)由回归直线方程求参数值;(2)求回归直线方程;(3)利用回归方程进行预测 典例引领 角度一由回归直线方程求参数值 (2017高考山东卷)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为x.已知xi225 y i1 600,4.该班某学生的脚长为24,据此估计其身高为() A160 B163C166 D170【解析】由题意可知4x,又22.5,160,因此16022.54,所以70,因此4x70.当x24时,424709670166.【答案】C 角度二、三求回归直线方程并进行预测 (2016高考全国卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20082014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量附注:参考数据:yi9.32,tiyi40.17, 0.55,2.646.参考公式:相关系数r回归方程t中斜率和截距的最小二乘估计公式分别为:【解】(1)由折线图中数据和附注中参考数据得2.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系(2)由1.331及(1)得0.103,t1.3310.10340.92.所以,y关于t的回归方程为0.920.10t.将2016年对应的t9代入回归方程得0.920.1091.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨求回归直线方程的步骤提醒利用回归直线方程进行预测是对总体的估计,此估计值不是准确值 (2018石家庄市教学质量检测(二)为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:x12345y7.06.55.53.82.2(1)求y关于x的线性回归方程x;(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z取到最大值?(保留两位小数)参考公式:,.解:(1) 3,5,xiyi62.7,x55,解得1.23,8.69,所以8.691.23x.(2)年利润zx(8.691.23x)2x1.23x26.69x,所以当x2.72时,年利润z最大独立性检验 典例引领 (2017高考全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg, 新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)附:P(K2k)0.0500.0100.001k3.8416.63510.828K2.【解】(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”由题意知P(A)P(BC)P(B)P(C)旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.0680.0460.0100.008)50.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.620.660.409 2.(2)根据箱产量的频率分布直方图得列联表箱产量6.635,故有99%的把握认为箱产量与养殖方法有关(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.0040.0200.044)50.340.5,故新养殖法箱产量的中位数的估计值为5052.35(kg)(1)独立性检验的一般步骤根据样本数据制成22列联表;根据公式K2计算K2的值;查表比较K2与临界值的大小关系,作出统计判断(2)解独立性检验的应用问题的关注点两个明确:()明确两类主体;()明确研究的两个问题两个准确:()准确画出22列联表;()准确理解K2. (2018惠州市第三次调研考试)在某校举行的航天知识竞赛中,参与竞赛的文科生与理科生人数之比为13,且成绩分布在40,100,分数在80以上(含80)的同学获奖按文、理科用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图如图所示(1)求a的值,并计算所抽取样本的平均值x(同一组中的数据用该组区间的中点值作代表);(2)填写下面的22列联表,并判断能否有超过95%的把握认为“获奖与学生的文、理科有关”?文科生理科生总计获奖5不获奖总计200附表及公式:K2P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解:(1)a1(0.010.0150.030.0150.005)10100.025,450.1550.15650.25750.3850.15950.0569.(2)22列联表如下:文科生理科生总计获奖53540不获奖45115160总计50150200因为K24.1673.841,所以有超过95%的把握认为“获奖与学生的文、理科有关” 求回归方程,关键在于正确求出系数,由于,的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误 回归分析是处理变量相关关系的一种数学方法主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程 易错防范(1)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x,y)点,可能所有的样本数据点都不在直线上(2)利用回归方程分析问题时,所得的数据易误认为是准确值,而实质上是预测值(期望值)(3)独立性检验中统计量K2的观测值k的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错 1(2018南昌市第一次模拟测试)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5)根据收集到的数据可知x1x2x3x4x5150,由最小二乘法求得回归直线方程为0.67x54.9,则y1y2y3y4y5的值为()A75 B155.4C375 D466.2解析:选C.由x1x2x3x4x5150,得30,代入回归直线方程0.67x54.9,得75,则y1y2y3y4y5375.2通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2,算得K27.8.附表:P(K2k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C有99%以上的把握认为“爱好该项运动与性别有关”D有99%以上的把握认为“爱好该项运动与性别无关”解析:选C.根据独立性检验的定义,由K27.86.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.3(2018赣州摸底考试)在一组样本数据(x1,y1),(x2,y2),(x6,y6)的散点图中,若所有样本点(xi,yi)(i1,2,6)都在曲线ybx2附近波动经计算xi11,yi13,x21,则实数b的值为_解析:令tx2,则曲线的回归方程变为线性的回归方程,即ybt,此时t,y,代入ybt,得b,解得b.答案:4有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表:优秀不优秀总计甲班103545乙班73845总计177390利用列联表的独立性检验估计,则成绩与班级_(填“有关”或“无关”)解析:成绩与班级有无关系,就是看随机变量的值与临界值2.706的大小关系由公式得K2的观测值k0.6532.706,所以成绩与班级无关答案:无关5(2018广东省六校联考)某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为.优秀非优秀总计甲班10乙班30总计110(1)请完成上面的列联表;(2)根据列联表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”参考公式与临界值表:K2.P(K2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828解:(1)列联表如下:优秀非优秀总计甲班105060乙班203050总计3080110(2)根据列联表中的数据,得到K27.48610.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”6(2018成都市第二次诊断性检测)某项科研活动共进行了5次试验,其数据如下表所示:次数特征量第1次第2次第3次第4次第5次x555559551563552y601605597599598(1)从特征量y的5次试验数据中随机地抽取两个数据,求至少有一个大于600的概率;(2)求特征量y关于x的线性回归方程x,并预测当特征量x为570时特征量y的值分别为解:(1)记“至少有一个大于600”为事件A,则P(A)1.(2)由题中表格可知,556,600.所以0.3,6000.3556433.2,所以线性回归方程为0.3x433.2.当x570时,0.3570433.2604.2故特征量x为570时,特征量y的估计值为604.2.1(2018张掖市第一次诊断考试)中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研人社部从网上年龄在1565岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:年龄15,25)25,35)35,45)45,55)55,65支持“延迟退休”的人数155152817(1)由以上统计数据填22列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;45岁以下45岁以上总计支持不支持总计(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动现从这8人中随机抽2人()抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率()记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望参考数据:P(K2k0)0.1000.0500.0100.001k02.7063.8416.63510.828K2解:(1)列联表如下:45岁以下45岁以上总计支持354580不支持15520总计5050100因为K26.253.841,所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异(2)()抽到1人是45岁以下的概率为,抽到1人是45岁以下且另一人是45岁以上的概率为.故所求概率为.()从不支持“延迟退休”的人中抽取8人,则45岁以下的应抽6人,45岁以上的应抽2人则X0,1,2.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论