8.1 成对数据的统计相关性_第1页
8.1 成对数据的统计相关性_第2页
8.1 成对数据的统计相关性_第3页
8.1 成对数据的统计相关性_第4页
8.1 成对数据的统计相关性_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章成对数据的统计分析8.1成对数据的统计相关性8.1.1变量的相关关系练习1.举例说明什么叫相关关系.相关关系与函数关系有什么区别?【答案】答案见解析【解析】【分析】根据相关关系和函数关系概念即可说明.【详解】相关关系:当自变量取值一定,因变量的取值带有一定的随机性(非确定性关系),函数关系:函数关系指的是自变量和因变量之间的关系是相互唯一确定的.相同点:均是指两个变量的关系.不同点:函数关系是一种确定的关系,因果关系;而相关关系是一种非确定性关系,也可能是伴随关系.举例:身高与体重是相关关系,身高越高体重不一定大.2.根据下面的散点图,判断图中的两个变量是否存在相关关系.

【答案】(1)存在相关关系;(2)存在相关关系;(3)不存在相关关系;(3)存在相关关系;【解析】【分析】根据散点图中散点呈现的变化趋势依次判断两个变量间的相关关系即可.【详解】(1)由(1)的散点图可以看到,两个变量确定的散点几乎落在了一条直线附近,所以可以判定两个变量之间存在线性相关关系,图像呈现左上右下趋势,说明两个变量呈负线性相关关系;(2)由(2)的散点图可以看到,两个变量确定的散点几乎落在了一条曲线附近,所以可以判定两个变量之间存在相关关系,而且是非线性相关关系;(3)由(3)的散点图可以看到,两个变量确定的散点没有落在了一条直线或者曲线附近,是杂乱无章的,所以可以判定两个变量之间不存在相关关系;(4)由(4)的散点图可以看到,两个变量确定的散点几乎落在了一条直线附近,所以可以判定两个变量之间存在相关关系,图像呈现左下右上趋势,说明两个变量呈正线性相关关系;3.下表给出了一些地区的鸟的种类数与该地区的海拔高度的数据,鸟的种类数与海拔高度是否存在相关关系?如果是,那么这种相关关系有什么特点?地区ABCDEFGHIJK海拔/m1250115810674577017316106701493762549鸟的种类/种363037111113171329415【答案】存在正相关,相关性较强.【解析】【分析】由表中数据计算相关系数即可得出结果.【详解】设鸟的种类数为,海拔高度为,,,,当时,且时,两变量正相关,相关性较强.所以由数据可知,鸟类的种数随海拔高度增加而增加,两者呈正相关,相关性较强.8.1.2样本相关系数例1根据表8.1-1中脂肪含量和年龄的样本数据,判断两个变量是否线性相关,计算样本相关系数,并刻画它们的相关程度.解:先画出散点图(图8.1-1).观察散点图,可以看出样本点都集中在一条直线附近,由此判断脂肪含量和年龄线性相关.根据样本相关系数的定义,.①利用计算工具计算可得,,,,.代入①式,得.图8.1-1由样本相关系数,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.例2有人收集了某城市居民年收入(即所有居民在一年内收入的总和)与A商品销售额的10年数据,如表8.1-2所示.表8.1-2第n年12345678910居民年收入/亿元32.231.132.935.837.138.039.043.044.6460A商品销售额/万元25.030.034.037.039.041.042.044048.051.0画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断居民年收入与A商品销售额的相关程度和变化趋势的异同.解:画出成对样本数据的散点图(图8.1-6),从散点图看,A商品销售额与居民年收入的样本数据呈现出线性相关关系.由样本数据计算得样本相关系数.由此可以推断,A商品销售额与居民年收入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强.图8.1-6例3在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如表8.1-3所示.编号身高/体重/臂展/编号身高/体重/臂展/1173551691416666161217971170151766116631755217216176491654179621771717560173518282174181694816261736316619184861897180551742016958164817081169211825417091695416622171581641017754176231776117311177591702417358165121786717425173511691317456170体重与身高、臂展与身高分别具有怎样的相关性?解:根据样本数据分别画出体重与身高、臂展与身高的散点图(图8.1-7(1)和(2)),两个散点图都呈现出线性相关的特征.(1)(2)图8.1-7通过计算得到体重与身看、臂展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关.其中,臂展与身高的相关程度更高.练习4.由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的相关关系?为什么?【答案】不一定,原因见详解;【解析】【分析】根据由简单随机抽样得到的成对样本数据具有随机性进行具体的分析即可.【详解】因为由简单随机抽样得到的成对样本数据具有随机性,由此得到的到样本相关系数也具有一般性,因此由简单随机抽样得到的成对样本数据的样本相关系数不一定能确切地反映变量之间的相关关系.5.已知变量x和变量y的3对随机观测数据,,,计算两个变量的样本相关系数.能据此推出这两个变量线性相关吗?为什么?【答案】,线性相关,因为【解析】【分析】计算相关系数即可得出结果.【详解】,,则相关系数,即,的绝对值越接近相关性越强,的绝对值越接近相关性越弱,所以两个变量线性相关,6.画出下列成对数据的散点图,并计算样本相关系数.据此,请你谈谈样本相关系数在刻画两个变量间相关关系上的特点.(1),,,,,;(2),,,,;(3)(-2,-8),(-1,—1),(0,0),(1,1),(2,8),(3,27);(4),,,,.【答案】(1)图见解析;;(2)图见解析;;(3)图见解析;;(4)图见解析;;越接近1,样本的相关性越强,越接近0,相关性越弱.【解析】【分析】根据每组的数据画出散点图,并根据相关系数公式计算相关系数;并由相关系数的大小,来判断样本数据变量的相关关系.【详解】(1)散点图如下:由点数据知:,;;;;则;(2)散点图如下:由点数据知:,;;;;则;(3)散点图如下:由点数据知:,;;;;则;(4)散点图如下:由点数据知:,;;则;综上,由相关系数的值可知,越接近1,样本的线性相关性越强,越接近0,线性相关性越弱.7.随机抽取7家超市,得到其广告支出与销售额数据如下:超市ABCDEFG广告支出/万元1246101420销售额/万元19324440525354请判断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.【答案】线性相关关系;相关程度高;销售额与广告支出的变化趋势相同.【解析】【分析】作出成对数据的散点图,由数据计算相关系数即可得出结果.【详解】成对数据的散点图如图所示:从散点图上可得,超市的销售额与广告支出之间呈现出线性相关关系,由数据可得;,,,,,由此可推断,销售额与广告支出之间具有相关关系,相关程度较强,且销售额与广告支出的变化趋势相同.习题8.1复习巩固8.在以下4幅散点图中,判断哪些图中的y和x之间存在相关关系?其中哪些正相关,哪些负相关?哪些图所对应的成对样本数据呈现出线性相关关系?哪些图所对应的成对样本数据呈现出非线性相关关系.【答案】图(2)(3)(4)中的y和x之间存在相关关系;其中图(2)(4)中的y和x之间呈现正相关关系,图(3)中的y和x之间呈现负相关关系;图(2)(3)中的y和x之间呈现线性相关关系;其中图(4)中的y和x之间呈现非线性相关关系;【解析】【分析】根据散点图中散点呈现的变化趋势依次判断两个变量间的相关关系即可.【详解】(1)由(1)的散点图可以看到,两个变量确定的散点没有落在了一条直线或者曲线附近,是杂乱无章的,所以可以判定两个变量之间不存在相关关系;(2)由(2)的散点图可以看到,两个变量确定的散点几乎落在了一条直线附近,所以可以判定两个变量之间存在相关关系,图像呈现左下右上趋势,说明两个变量呈正线性相关关系;(3)由(3)的散点图可以看到,两个变量确定的散点几乎落在了一条直线附近,所以可以判定两个变量之间存在线性相关关系,图像呈现左上右下趋势,说明两个变量呈负线性相关关系;(4)由(4)的散点图可以看到,两个变量确定的散点几乎落在了一条曲线附近,所以可以判定两个变量之间存在相关关系,而且是非线性相关关系;综上,图(2)(3)(4)中的y和x之间存在相关关系;其中图(2)(4)中的y和x之间呈现正相关关系;图(2)(3)中的y和x之间呈现线性相关关系;其中图(4)中的y和x之间呈现非线性相关关系;综合运用9.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,所得数据如下:航空公司编号12345678910航班正点率/%81.876.876.675.773.872.271.270.891.468.5顾客投诉/次2158856874937212218125顾客投诉次数和航班正点率之间是否呈现出线性相关关系?它们之间的相关程度如何?变化趋势有何特征?【答案】线性相关;;相关程度高,变化趋势是正点率提高一个百分点顾客投诉次数少约为.【解析】【分析】利用最小二乘法求出回归方程即可求解.【详解】设顾客投诉次数为,正点率为,,,设回归方程,,,将代入回归直线方程:可得,所以线性回归方程为:,相关系数,的绝对值越接近,相关性越强,所以相关程度高.变化趋势是正点率提高一个百分点顾客投诉次数少约为.10.根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:编号12345678910x/cm11.21.41.1.82.02.22.42.83.0F/N3.083.764.315.025.516.256.747.408.549.24两个变量的样本相关系数是否为1?请你解释其中的原因.【答案】两个变量的样本相关系数不一定为1(理由见详解)【解析】【分析】比较理想状态下的相关系数与现实情况下的相关系数进行说明,从测量数据的随机性进行分析即可.【详解】两个变量的样本相关系数不一定为1,理由如下:在理想状态下,弹簧伸长的长度与所受的外力成正比,则弹簧伸长的长度x和相应所受外力F之间满足线性函数关系,相关系数必为1;但是在现实情况下,测量数据受很多因素的影响,比如弹簧的材料,粗细,测量的误差等等,所以通过测量获得样本数据也具有随机性,因此通过测量数据求得的相关系数不一定为1.拓广探索11.某地区的环境条件适合天鹅栖息繁衍.有人发现了一个有趣的现象,该地区有5个村庄,其中3个村庄附近栖息的天鹅较多,婴儿出生率也较高;2个村庄附近栖息的天鹅

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论