版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第63讲变量间的相关关系、统计案例思维导图知识梳理1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).(3)通过求eq\a\vs4\al(Q=\i\su(i=1,n,)yi-bxi-a2)的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)2×2列联表设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)独立性检验利用随机变量K2(也可表示为χ2)的观测值k=eq\f(nad-bc2,a+bc+da+cb+d)(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.题型归纳题型1相关关系的判断【例11】对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【解析】选C由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.【例12】(2019·郑州市第一次质量预测)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率(%)根据表中数据,下列说法正确的是()A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系【解析】选A画出利润率与人均销售额的散点图,如图.由图可知利润率与人均销售额成正相关关系,故选A.【跟踪训练11】已知变量x和y满足关系yx+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关【解析】选C因为yx+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=eq\o(b,\s\up6(^))y+eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))>0,则z=eq\o(b,\s\up6(^))y+eq\o(a,\s\up6(^))eq\o(b,\s\up6(^))x+eq\o(b,\s\up6(^))+eq\o(a,\s\up6(^)),故x与z负相关.【跟踪训练12】在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0C.eq\f(1,2) 【解析】选D所有样本点均在同一条斜率为正数的直线上,则样本相关系数最大,为1,故选D.【跟踪训练13】变量X与Y相应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2<r1<0 B.0<r2<r1C.r2<0<r1 D.r2=r1【解析】选C对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,故选C.【名师指导】判断相关关系的2种方法(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.题型2回归分析【例21】(2019·四省八校双教研联考)越接近高考学生焦虑程度越强,四个高三学生中大约有一个有焦虑症,经有关机构调查,得出距离高考周数与焦虑程度对应的正常值变化情况如下表:周数x654321正常值y556372809099(1)作出散点图;(2)根据上表数据用最小二乘法求出y关于x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))(精确到0.01);(3)根据经验观测值为正常值的0.85~1.06为正常,若1.06~1.12为轻度焦虑,1.12~1.20为中度焦虑,1.20及其以上为重度焦虑,若为中度焦虑及其以上,则要进行心理疏导,若一个学生在距高考第二周时观测值为103,则该学生是否需要进行心理疏导?其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\i\su(i=1,6,x)iyi=1452,eq\i\su(i=1,6,x)eq\o\al(2,i)=91,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).【解】(1)(2)eq\x\to(x)=eq\f(1,6)×(6+5+4+3+2+1)=3.5,eq\x\to(y)=eq\f(1,6)×(55+63+72+80+90+99)=76.5,eq\x\to(x)eq\x\to(y)=267.75,eq\o(b,\s\up6(^))=eq\f(1452-6×,91-6×2)≈-8.83,eq\o(a,\s\up6(^))×≈107.41,∴线性回归方程为eq\o(y,\s\up6(^))x+107.41.(3)eq\f(103,90)≈1.14>1.12,∴该学生需要进行心理疏导.【例22】(2019·合肥市第二次质量检测)为了了解A地区足球特色学校的发展状况,某调查机构统计得到如下数据:年份x20142015201620172018足球特色学校数y/百个(1)根据表中数据,计算y与x的相关系数r,并说明y与x≤|r|≤1,则认为y与x≤|r|<0.75,则认为y与x线性相关性一般;|r|≤0.25,则认为y与x线性相关性较弱);(2)求y关于x的线性回归方程,并预测A地区2019年足球特色学校的个数(精确到个).参考公式及数据:r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2)),eq\i\su(i=1,5,)(xi-eq\x\to(x))2=10,eq\i\su(i=1,5,)(yi-eq\x\to(y))2=1.3,eq\r(13)≈3.6056,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).【解】(1)eq\x\to(x)=2016,eq\x\to(y)=1,r=eq\f(\i\su(i=1,5,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,5,)xi-\x\to(x)2)\r(\i\su(i=1,5,)yi-\x\to(y)2))=eq\f(-2×+-1×+1×0.4+2×,\r(10)×\r(1.3))=eq\,3.6056)>0.75,∴y与x线性相关性很强.(2)eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,5,)xi-\x\to(x)2)=eq\,10)=0.36,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)×2016=-724.76,∴y关于x的线性回归方程是eq\o(y,\s\up6(^))x-724.76.当x=2019时,eq\o(y,\s\up6(^))×2019-724.76=2.08,即A地区2019年足球特色学校约有208个.【跟踪训练21】(2019·长春市质量监测)某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),图1为选取的15名志愿者身高与臂展的折线图,图2为身高与臂展所对应的散点图,并求得其回归方程为eq\o(y,\s\up6(^))x-30.75,以下结论中不正确的为()A.15名志愿者身高的极差小于臂展的极差B.15名志愿者身高和臂展成正相关关系【解析】选D对于选项A,15名志愿者臂展的最大值大于身高,而最小值小于身高,所以身高的极差小于臂展的极差,故A正确;对于选项B,由左下到右上,为正相关,正确;选项C就是把x=190代入回归方程得到预估值189.65,正确;而对于选项D,相关关系不是确定的函数关系,所以选项D说法不正确,故选D.【跟踪训练22】(2019·贵阳市第一学期监测)互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下简称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:1日2日3日4日5日外卖甲日接单x/百单529811外卖乙日接单y/百单2310515(1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况;(2)据统计表明,y与x之间具有线性关系.①请用相关系数r对y与x之间的相关性强弱进行判断(若|r|>0.75,则可认为y与x有较强的线性相关关系(r值精确到0.001));②经计算求得y与x之间的回归方程为eq\o(y,\s\up6(^))x-2.674,假定每单外卖业务,企业平均能获取纯利润3元,试预测当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润的大致范围(x值精确到0.01).相关公式:r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2)).参考数据:eq\i\su(i=1,5,)(xi-eq\x\to(x))(yi-eq\x\to(y))=66,eq\r(\i\su(i=1,5,)xi-\x\to(x)2)eq\r(\i\su(i=1,5,)yi-\x\to(y)2)≈77.【解】(1)由题可知eq\x\to(x)=eq\f(5+2+9+8+11,5)=7(百单),eq\x\to(y)=eq\f(2+3+10+5+15,5)=7(百单).外卖甲的日接单量的方差seq\o\al(2,甲)=10,外卖乙的日接单量的方差seq\o\al(2,乙)=23.6,因为eq\x\to(x)=eq\x\to(y),seq\o\al(2,甲)<seq\o\al(2,乙),即外卖甲平均日接单量与外卖乙相同,且外卖甲日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.(2)①计算可得,相关系数r≈eq\f(66,77)≈0.857>0.75,所以可认为y与x之间有较强的线性相关关系.②令y≥x≥25,解得x≥20.02,×100×3=6006,所以当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润大约不低于6006元.【名师指导】一、线性回归分析问题的类型及解题方法1.求线性回归方程(1)利用公式,求出回归系数eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^)).(2)待定系数法:利用回归直线过样本点的中心求系数.2.利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.3.利用回归直线判断正、负相关,决定正相关还是负相关的是系数eq\o(b,\s\up6(^)).二、模型拟合效果的判断(1)残差平方和越小,模型的拟合效果越好.(2)相关指数R2越大,模型的拟合效果越好.(3)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.题型3独立性检验【例31】(2019·福州市质量检测)中国房地产业协会主办的中国房价行情网调查的一份数据显示,2018年7月,大部分一线城市的房租租金同比涨幅都在10%以上.某部门研究成果认为,房租支出超过月收入eq\f(1,3)的租户“幸福指数”低,房租支出不超过月收入eq\f(1,3)的租户“幸福指数”高.为了了解甲、乙两小区租户的幸福指数高低,随机抽取甲、乙两小区的租户各100户进行调查.甲小区租户的月收入以[0,3),[3,6),[6,9),[9,12),[12,15](单位:千元)分组的频率分布直方图如图所示.乙小区租户的月收入(单位:千元)的频数分布表如下:月收入[0,3)[3,6)[6,9)[9,12)[12,15]户数38272492(1)设甲、乙两小区租户的月收入相互独立,记M表示事件“甲小区租户的月收入低于6千元,乙小区租户的月收入不低于6千元”,把频率视为概率,求M的概率;(2)利用频率分布直方图,求所抽取的甲小区100户租户的月收入的中位数;(3)若甲、乙两小区每户的月租费分别为2千元、1千元.请根据条件完成下面的2ד幸福指数与租住的小区”有关.幸福指数低幸福指数高总计甲小区租户乙小区租户总计附:临界值表P(K2≥k)k参考公式:K2=eq\f(nad-bc2,a+bc+da+cb+d).【解】(1)记A表示事件“甲小区租户的月收入低于6千元”,记B表示事件“乙小区租户的月收入不低于6千元”,甲小区租户的月收入低于6千元的频率为(0.060+0.160)×3=0.66,故P(A)的估计值为0.66.乙小区租户的月收入不低于6千元的频率为eq\f(24+9+2,100)=0.35,故P(B)的估计值为0.35.因为甲、乙两小区租户的月收入相互独立,事件M的概率的估计值为P(M)=P(A)P(B×0.35=0.231.(2)设甲小区所抽取的100户的月收入的中位数为t,×3+(t-3)×0.160=0.5,解得t=5.(3)设H0:幸福指数与租住的小区无关,幸福指数低幸福指数高总计甲小区租户6634100乙小区租户3862100总计10496200根据2×2列联表中的数据,得到K2的观测值k=eq\f(200×66×62-34×382,100×100×104×96)≈15.705>10.828,“幸福指数与租住的小区”有关.【跟踪训练31】(2020·沧州模拟)某班主任对全班50名学生进行了作业量的调查,数据如表:认为作业量大认为作业量不大总计男生18927女生81523总计262450已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025,P(K2≥6.635)≈0.010.则________(填“有”或“没有”)97.5%的把握认为“学生的性别与认为作业量大有关”.【解析】因为K2=eq\f(50×18×15-8×92,26×24×27×23)≈5.059>5.024,所以有97.5%的把握认为“学生的性别与认为作业量大有关”.【答案】有【跟踪训练32】(2019·郑州市第二次质量预测)为推动更多人去阅读和写作,联合国教科文组织确定每年的4月23日为“世界读书日”,其设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,这
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中生物教师教学画像构建与生物教育资源精准投放策略研究教学研究课题报告
- 2026年高端装备制造行业创新报告及智能制造技术报告
- 自动离职申请书
- 2026春浙美版(新教材)小学美术二年级下册第五单元 环保小卫士《14.我为垃圾分类》教学设计
- 26年老年酒精中毒案例分析课件
- 26年基础护理服务低保老人保障工程课件
- 2024年市场营销经理劳动合同
- 多联机空调系统安装实操指南
- 肾性骨病患者血清生化学指标变化的深度剖析与临床意义探究
- 肺部肿瘤微波消融术后气胸风险因素的多维度剖析与精准防控策略研究
- 2026年软考高级系统架构设计师真题及答案解析
- 2026重庆新华书店有限公司招聘工作人员47名备考题库及参考答案详解一套
- 2025年软考《数据库系统工程师》考试试题及答案
- 服装系毕业设计
- 2026年银行金融基础知识复习通关试题库带答案详解(完整版)
- 2026年湖北省黄冈市八年级地理生物会考真题试卷(+答案)
- 2026年部编版新教材语文一年级下册第四单元检测题(有答案)
- 江西省省宜春市袁州区重点名校2026届中考数学模拟预测题含解析
- 舞蹈类创新创业
- 部编版(2024)七年级下册 第六单元 单元测试题(含答案)
- 2026年中煤科工(西安)智能成套装备科技有限公司招聘备考题库及完整答案详解1套
评论
0/150
提交评论