版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
成对数据的线性相关性第七统计案例章变量间相关关系的类型从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,则称两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.线性相关非线性相关(曲线相关)观察如下散点图:问题能判断出图①与图②对应的成对数据线性相关吗?能否判断出哪个图相关性更强?问题导思提示:可以判断出图①与图②对应的成对数据线性相关,但图①是负相关,图②是正相关;图①与图②对应的成对数据的线性相关性哪个更强,从散点图难以区别.1.样本(线性)相关系数r的计算公式一般地,设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),记r=________________称r为随机变量X和Y的样本(线性)相关系数.新知构建样本相关系数的性质
相关系数r的正负和绝对值的大小可以反映成对样本数据的变化特征:①当r>0时,成对样本数据正相关;
当r<0时,成对样本数据负相关;
当r=0时,两个随机变量线性不相关.
②r的范围:[-1,1]即|r|≤1;③当|r|越接近1时,成对数据的线性相关程度越强;
当|r|越接近0时,成对数据的线性相关程度越弱;
特别地,当|r|=0时,成对数据的没有线性相关关系;
但不排除它们有其他相关关系当|r|=1时,成对数据都落在一条直线上.提示:利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若|r|>0.75,则线性相关较为显著,否则不显著.1.变量X,Y的散点图如图所示,那么X,Y之间的样本相关系数r最接近的值为A.1 B.-0.5C.0 D.0.5根据变量X,Y的散点图,得X,Y之间的线性相关关系非常不明显,所以样本相关系数r最接近的值应为0.故选C.√对点练2.两个变量x,y的样本相关系数r1=0.7859,两个变量u,v的样本相关系数r2=-0.9568,则下列判断正确的是A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强√由样本相关系数r1=0.7859>0知x与y正相关,由样本相关系数r2=-0.9568<0知u,v负相关.又|r1|<|r2|,所以变量u与v的线性相关性比x与y的线性相关性强.故选C.(链教材P236例1)假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:例1x23456y2.23.85.56.57.0所以y与x之间具有正相关关系.规律方法样本相关系数的计算步骤第三步:代入公式计算得结果.注意:(1)散点图可以直观地判断两变量是否具有线性关系.(2)样本相关系数的计算运算量较大,注意运算的准确性.
对点练1.某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量x(件)与相应的生产总成本y(万元)的五组对照数据:试求y与x的样本相关系数r.(结果保留两位小数)产量x(件)12345生产总成本y(万元)3781012返回
近年来,随着互联网的发展,网约车服务在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在M省的发展情况,M省某调查机构从该省抽取了5个城市,分别收集和分析了网约车的A,B两项指标数xi,yi(i=1,2,3,4,5),数据如下表所示:例2
城市1城市2城市3城市4城市5A指标数x24568B指标数y34445试求y与x之间的样本相关系数r,并利用r说明y与x是否具有较强的线性相关关系.附:样本相关系数公式因为r≈0.95,所以可以推断y与x线性正相关,且具有较强的线性相关关系.规律方法判断线性相关强弱的基本方法1.散点图:散点图只是粗略作出判断,其图象越接近直线,相关性越强.2.样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越接近于1,相关性越强.
成对数据的线性相关性的实际应用
为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:例3抽取次序x12345678零件尺寸y9.9510.129.969.9610.019.929.9810.04抽取次序x910111213141516零件尺寸y10.269.9110.1310.029.2210.0410.059.95(1)求y与x的样本相关系数r,并回答是否可以认为这一天生产的零件的尺寸不随生产过程的进行而系统地变大或变小(若
<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);由于
<0.25,因此可以认为这一天生产的零件的尺寸不随生产过程的进行而系统地变大或变小.(2)一天内抽检的零件中,如果出现了尺寸在()之外的零件,就认为这条生产线在这一天的生产过程中可能出现了异常情况,需对当天生产的所有零件进行检查,从这一天抽检的结果看,是否需对当天生产的所有零件进行检查?因此需对当天生产的所有零件进行检查.规律方法1.当相关系数|r|越接近1时,两个变量的相关关系越强,当相关系数|r|越接近0时,两个变量的相关关系越弱.2.样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系.
对点练3.为分析肥胖程度对总胆固醇与空腹血糖的影响,
在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmoI/L)、空腹血糖GLU指标值(单位:mmoI/L)如下表所示:(1)用变量y与x,z与x的相关系数,
分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度;人员编号12345678BMI值x2527303233354042TC指标值y5.35.45.55.65.76.56.97.1GLU指标值z6.77.27.38.08.18.69.09.1可以看出TC指标值与BMI值、GLU指标值与BMI值都是高度正相关.(2)求y与x的线性回归方程,
已知TC指标值超过5.2为总胆固醇偏高,
据此模型分析当BMI值达到多大时,
需要注意监控总胆固醇偏高情况的出现(上述数据均要精确到0.01).由0.12x+2.04≥5.2,可得x≥26.33,据此模型分析BMI值达到26.33时,需要注意监控总胆固醇偏高情况出现.返回课堂小结知识1.样本相关系数的计算.2.线性相关关系程度的判定方法数形结合、公式法易错误区样本相关系数的大小与变量间线性相关程度的对应关系混淆新知构建1.样本相关系数:2.相关系数的性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校出纳工作总结
- 哔哩哔哩纪录片《深夜宠物急诊室》招商方案
- 板式换热器橡胶垫片硬度及压缩永久变形检测报告
- 家庭桑拿房木桶清洗与保养指南
- 针灸体位考试题及答案
- 2026年河北省沧州市南皮四中等校中考英语一模试卷(含详细答案解析)
- 2026年湖南省长沙县石常中学等八校中考道德与法治模拟试卷(含答案)
- 2025-2026学年天津市红桥区八年级(下)期中历史试卷(含答案)
- 2026年教师资格证考试试题及答案
- 一级建造师考试(机电工程管理与实务)题库含答案(2025年海南临高县)
- 2026江苏省铁路集团有限公司春季校园招聘笔试备考题库及答案解析
- 2026年新版卫生法律法规考试题及答案
- 2026年四川省绵阳市中考化学模拟预测试卷
- 江西生物科技职业学院《公共经济学》2025-2026学年期末试卷
- 普通高考监考人员参考试题
- 2026广东东莞市松山湖社区卫生服务中心招聘纳入岗位管理编制外人员4人笔试备考试题及答案解析
- 2026西藏阿里地区普兰县审计局招聘审计协助人员的2人备考题库有答案详解
- 2026河南科高产业集团有限责任公司高级管理人员招聘7人笔试备考试题及答案解析
- 浙江省金华市2026年中考一模 科学卷
- 2026年山西省教师职称考试(教育管理)真题
- 2026年广东省高三语文4月二模联考试卷附答案解析
评论
0/150
提交评论