




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.1.2样本相关系数8.1成对数据的统计相关性
通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等,散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.样本相关系数引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析。r=————————————
=————————————
-----我们称r
为变量x和变量y的样本相关系数.|r|刻画了样本点集中于某条直线的程度。样本相关系数r样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征:r的正负:当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.r的绝对值的大小:(r的取值范围为[-1,1])当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.提示:利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若|r|>0.75,则线性相关较为显著,否则不显著.一般来说,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好。
练习:某统计部门对四组数据进行统计分析后,获得如图8-1-2所示的散点图,关于样本相关系数的比较,其中正确的是(
)
A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3A
C导学案P119、例3变式样本的相关系数的实际应用例题1在对人体脂肪含量和年龄的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如下表,表中每个编号下的年龄和脂肪含量数据都是对同一个个体的观测结果,它们构成了成对数据.编号1234567891011121314年龄/岁2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6参考数据:
由样本相关系数r≈0.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.脂肪含量与年龄变化趋势相同.解:将参考数据代入相关系数公式计算第n年12345678910居民年收入/亿元32.231.132.935.837.138394344.646A商品销售额/万元25.030.034.037.039.041.042.044.048.051.0计算样本相关系数,并推断居民年收入与A商品销售额的相关程度和变化趋势的异同.例题2有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.参考数据:由样本数据计算得样本相关系数r≈0.95,由此推断,A商品销售额与居民年收入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强。解:将参考数据代入相关系数公式计算例题3在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如图所示.编号身高/cm体重/kg臂展/cm身高/cm体重/kg臂展/cm身高/cm体重/kg臂展/cm11735516917754176184861892179711701775917016958164317552172178671741825417041796217717456170171581645182821741666616117761173617363166176611661735816571805517417649165173511698170811691756017391695416616948162体重与身高、臂展与身高分别具有怎样的相关性?解:根据样本数据画出体重与身高、臂展与身高的散点图,分别如图(1)和图(2)所示图(1)图(2)通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关。其中,臂展与身高的相关程度更高。判断变量的相关程度通常有两种方式:一是散点图;二是样本相关系数𝑟.前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关程度的强弱。有时候可以直接计算样本相关系数r即可。巩固练习:近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统计,我市一家新能源企业近5个月的产值(亿元)如表:根据上表数据,计算y与x的样本相关系数r,并说明y与x的线性相关程度的强弱(0.75≤|r|≤1,则认为y与x线性相关程度较强;|r|<0.75,则认为y与x线性相关程度较弱).月份5月6月7月8月9月月份代码x12345产值y(亿元)1620273037
样本相关系数r(1)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.(2)r的取值范围为[-1,1](3)当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.课堂小结:根据散点图特征,初步构造统计量:年龄/岁脂肪含量/%中心化成对样本数据:将数据以
为零点进行平移,得到平移后的数据为(如右图所示)相关系数公式的推导中心化根据散点图特征,初步构造统计量:年龄/岁脂肪含量/%中心化相关系数公式的推导
一般地,如果变量x和变量y正相关,那么关于均值平移后的大多数点将分布在第一、三象限,对应的成对数据同号居多;如果变量x和变量y负相关,那么关于均值平移后的大多数点将分布在第二、四象限,对应的成对数据异号居多。
························中心化利用散点
的横纵坐标是否同号,可以构造一个量:一般情形下,
表明成对样本数据正相关;
表明成对样本数据负相关.问题:在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度。
我们发现,
的大小与数据的度量单位有关,所以不能直接用它度量成对样本数据相关程度的大小。改变前:改变后:构造初步统计量为了消除单位的影响,进一步做“标准化”处理:为简单起见,把上述“标准化”处理后的成对数据分别记为:仿照Lxy的构造,可以得到我们称r为变量x和变量y的样本相关系数。对初步统计量进行“标准化”r的取值范围:
样本相关系数的取值范围
成对样本数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 临床医学技士试题及答案
- 掌握2024年纺织品检验员试题及答案
- 全面了解纺织工程师考试内容试题及答案
- 国际商业美术设计师行业前景展望试题及答案
- 全球市场中的设计策略适应性试题及答案
- 护士类考试试题及答案
- 教师体罚测试题及答案
- 外伤固定考试题及答案
- 电梯管理员试题及答案
- 烟叶种植面试题及答案
- 简版操作手册-北森招聘
- 微震监测系统
- 中国古代文学史 马工程课件(下)06第七编明代文学 第五章 明代戏曲
- 110kv主变压器选择计算书
- 2017年特高压互联电网稳定及无功电压调度运行
- 客运驾驶人从业行为定期考核制度
- 《新能源材料与器件》教学课件-04电化学能源材料与器件
- 2022年同等学力人员申请硕士学位日语水平统一考试真题
- 城轨道交通人因事故分析及评价研究
- T∕CADERM 2002-2018 胸痛中心(基层版)建设与评估标准
- 50MPa路面抗折混凝土配合比
评论
0/150
提交评论