




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3讲变量间的相关关系与统计案例考纲解读1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系;根据最小二乘法求出回归直线方程(重点)2.了解独立性检验(只要求22列联表)的基本思想、方法及其初步应用考向预测从近三年高考情况来看,本讲是高考中的一个热点考查内容预测2020年将会考查:回归直线方程的判断、求解及相关系数的意义,并用其解决实际问题;独立性检验思想在实际问题中的应用试题以解答题的形式呈现,难度为中等此外,也可能出现在客观题中,此时试题难度不大,属中、低档题型.1相关关系与回归方程(1)相关关系的分类正相关:从散点图上看,点散布在从左下角到右上角的区域内,如图1;负相关:从散点图上看,点散布在从左上角到右下角的区域内,如图2.(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线(3)回归方程最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法回归方程:两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn),其回归方程为x,则,.其中,是回归方程的斜率,是在y轴上的截距,xi,yi,(,)称为样本点的中心说明:回归直线x必过样本点的中心(,),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据(4)样本相关系数r,用它来衡量两个变量间的线性相关关系当r0时,表明两个变量正相关;当r0.75时,认为两个变量有很强的线性相关关系2独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量(2)列联表:列出两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为22列联表构造一个随机变量K2,其中nabcd为样本容量(3)独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验1概念辨析(1)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示()(2)通过回归方程x可以估计和观测变量的取值和变化趋势()(3)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大()(4)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀()答案(1)(2)(3)(4) 2小题热身(1)设回归方程为35x,则变量x增加一个单位时()Ay平均增加3个单位 By平均减少5个单位Cy平均增加5个单位 Dy平均减少3个单位答案B解析因为5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位故选B.(2)在下列各图中,两个变量具有相关关系的图是()A B C D答案D解析为函数关系;显然成正相关;显然成负相关;没有明显相关性(3)下面是一个22列联表则表中a,b处的值分别为_答案52,54解析因为a2173,所以a52.又因为a2b,所以b54.(4)已知x,y的取值如下表,从散点图可以看出y与x具有线性相关关系,且回归方程为0.95x,则_.答案2.6解析回归直线必过样本点的中心(,),又2,4.5,代入回归方程,得2.6.题型 相关关系的判断1下列两变量中不存在相关关系的是()人的身高与视力;曲线上的点与该点的坐标之间的关系;某农田的水稻产量与施肥量;某同学考试成绩与复习时间的投入量;匀速行驶的汽车的行驶距离与时间;商品的销售额与广告费A B C D答案A解析根据相关关系的定义知,中两个变量不存在相关关系2四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()A B C D答案D解析由回归方程x知当0时,y与x正相关,当0时,y与x负相关,一定错误3对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()Ar2r40r3r1 Br4r20r1r3Cr4r20r3r1 Dr2r40r1r3答案A解析易知题中图与图是正相关,图与图是负相关,且图与图中的样本点集中分布在一条直线附近,则r2r40r30时,正相关;r0时,正相关;r;x,y之间不能建立线性回归方程答案解析显然正确;散点图趋向于曲线而非直线,所以用yc1ec2x拟合的效果比用x拟合的效果要好,故正确;x,y之间能建立线性回归方程,只不过预报精度不高,故不正确题型 回归分析角度1线性回归方程及应用1(2018福州四校联考)某汽车的使用年数x与所支出的维修总费用y的统计数据如表:使用年数x/年12345维修总费用y/万元0.51.22.23.34.5根据上表可得y关于x的线性回归方程x0.69,若该汽车维修总费用超过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1年计算)()A8年 B9年 C10年 D11年答案D解析由y关于x的线性回归直线x0.69过样本点的中心(3,2.34),得1.01,即线性回归方程为1.01x0.69,由1.01x0.6910得x10.6,所以预测该汽车最多可使用11年故选D.2某兴趣小组欲研究昼夜温差与患感冒人数之间的关系,他们分别到气象局与某医院抄录了1月份至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下数据:该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月份与6月份的两组数据,请根据2月份至5月份的数据,求出y关于x的线性回归方程x;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?参考公式:,.参考数据:1125132912268161092,11213212282498.解(1)设选到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,且每种情况都是等可能的,其中,选到相邻两个月的数据的情况有5种,所以P(A).(2)由表中2月份至5月份的数据可得11,24,xiyi1092,498,所以,则,所以y关于x的线性回归方程为x.(3)当x10时,2;当x6时,2.所以,该小组所得线性回归方程是理想的角度2非线性回归模型的应用3(2015全国卷)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值表中wi,wi.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为, .解(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程由于68,563686.8100.6,所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668.(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.60.24966.32.根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.所以当6.8,即x46.24时,取得最大值故年宣传费为46.24千元时,年利润的预报值最大1利用线性回归方程时的关注点(1)正确理解计算,的公式和准确的计算是求线性回归方程的关键(2)回归直线方程x必过样本点中心(,)(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测2非线性回归方程的求法(1)根据原始数据(x,y)作出散点图(2)根据散点图选择恰当的拟合函数(3)作恰当的变换,将其转化成线性函数,求线性回归方程(4)在(3)的基础上通过相应变换,即可得非线性回归方程 1据某市地产数据研究显示,2018年该市新建住宅销售均价走势如图所示,3月至7月房价上涨过快,为抑制房价过快上涨,政府从8月开始采用宏观调控措施,10月份开始房价得到很好的控制(1)地产数据研究发现,3月至7月的各月均价y(万元/平方米)与月份x之间具有较强的线性相关关系,试建立y关于x的回归方程;(2)若政府不调控,依此相关关系预测12月份该市新建住宅销售均价参考数据及公式:xi25,yi5.36, (xi)(yi)0.64,回归方程x中斜率和截距的最小二乘估计公式分别为,.解(1)5,1.072, (xi)210,所以0.064,1.0720.06450.752.所以从3月份至7月份y关于x的线性回归方程为0.064x0.752.(2)将x12代入回归方程得0.064120.7521.52,所以预测12月份该市新建住宅的销售均价为1.52万元/平方米2对某地区儿童的身高与体重的一组数据,我们用两种模型ybxa,ycedx拟合,得到回归方程分别为(1)0.24x8.81,(2)1.70e0.022x,作残差分析,如下表:(1)求表中空格内的值;(2)根据残差比较模型的拟合效果,决定选择哪个模型;(3)若残差大于1 kg的样本点被认为是异常数据,应剔除,剔除后对(2)所选择的模型重新建立回归方程(结果保留到小数点后两位)附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线x的斜率和截距的最小二乘估计分别为,.解(1)根据残差分析,把x80代入(1)0.24x8.81中,得(1)10.39.1010.390.39,表中空格内的值为0.39.(2)模型残差的绝对值的和为0.410.010.391.210.190.412.62,模型残差的绝对值的和为0.360.070.121.690.341.123.7.2.626.635,所以有99%的把握认为两种生产方式的效率有差异独立性检验的一般步骤(1)根据样本数据列出22列联表;(2)计算随机变量K2的观测值k,查表确定临界值k0;(3)如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2k0);否则,就认为在犯错误的概率不超过P(K2k0)的前提下不能推断“X与Y有关系” 1(2018河南洛阳模拟)学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:根据表中数据,通过计算统计量K2,并参考以下临界数据:若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过()A0.10 B0.05 C0.025 D0.01答案A解析由题意可得K23.0302.706,由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”出错的概率不超过0.10.故选A.2某校拟在高一年级开设英语口语选修课,该年级男生600人,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公共政策在国际关系中的影响试题及答案
- 网络工程师定期复习试题及答案
- 深入分析西方政治制度中存在的矛盾试题及答案
- 机电工程企业文化建设试题及答案
- 考前复习阶段的知识回顾与巩固试题及答案
- 安全法培训试题及答案
- 通过机电工程实践提升动手能力与试题及答案
- 安全大培训试题及答案
- 公共政策评估与改进建议试题及答案
- 英语四级考试卷子及答案
- 防恐防暴安全班会课件
- 《人工智能:AIGC基础与应用》高职全套教学课件
- 2024年贵州省贵阳市观山湖区中考二模物理试题(含答案)
- 工匠精神概述课件
- 国家安全教育大学生读本课件高教2024年8月版课件-第七章坚持以军事、科技、文化、社会安全为保障
- 《SDN技术及应用》课件-第2章
- 2025届四川省德阳市第一中学重点达标名校中考冲刺卷生物试题含解析
- 2025年春新北师大版数学一年级下册课件 第六单元 第1课时 认识图形
- 小学语文阅读答题技巧课件
- 《心肺复苏及电除颤》课件
- 福建省厦门市湖里2024-2025学年区中考物理质检检测试题(三模)含答案
评论
0/150
提交评论