成对数据的相关关系课件高二下学期数学人教A版选择性_第1页
成对数据的相关关系课件高二下学期数学人教A版选择性_第2页
成对数据的相关关系课件高二下学期数学人教A版选择性_第3页
成对数据的相关关系课件高二下学期数学人教A版选择性_第4页
成对数据的相关关系课件高二下学期数学人教A版选择性_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章

成对数据的统计分析8.1

成对数据的统计相关性1.理解两个变量的相关关系的概念,会作散点图;(重点)2.能够利用散点图判断两个变量之间是否具有相关关系.(重点)3.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.(重点)4.结合实例,会通过相关系数比较多组成对数据的相关性.(难点)学习目标如果变量y是变量x的函数,那么由x就可以唯一确定y.然而,现实中还存在这样的情况:两个变量之间有关系,但密切程度又达不到函数关系的程度.例如,人的体重与身高存在关系,但由一个人的身高值并不能确定他的体重值.那么,该如何刻画这两个变量之间的关系呢?下面我们就来研究这个问题.8.1.1变量的相关关系变量的相关关系一个人的体重与他的身高有关系.一般而言,个子高的人往往体重值较大,个子矮的人往往体重值较小.但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素.像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.两个变量具有相关关系的事例在现实中大量存在.例如:(1)子女身高y与父亲身高x之间的关系;(2)商品销售收入y与广告支出x之间的关系;(3)空气污染指数y与汽车保有量x之间的关系;(4)粮食亩产量y与施肥量x之间的关系.商品销售收入还与商品质量、居民收入等因素有关.影响子女身高的因素还与母亲身高、饮食结构、体育锻炼等有关.气象条件、工业生产排放、居民生活和取暖、垃圾焚烧等都是影响空气污染指数的因素.粮食亩产量还要受到土壤质量、降水量、田间管理水平等因素的影响.因为在相关关系中,变量y的值不能随变量x的值的确定而唯一确定,所以我们无法直接用函数去描述变量之间的这种关系.因此,在研究两个变量之间的相关关系时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断.探究在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表所示,表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据.编号1234567年龄23273941454950脂肪%9.517.821.225.927.526.328.28910111213145354565758606129.630.231.430.833.535.234.6

根据以上数据,你能推断人体的脂肪含量与年龄之间存在怎样的关系吗?为了更加直观地描述上述成对样本数据中脂肪含量与年龄之间的关系,类似于用直方图描述单个变量样本数据的分布特征,我们用图形展示成对样本数据的变化特征.用横轴表示年龄,纵轴表示脂肪含量,则表中每个编号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了如图所示的统计图.我们把这样的统计图叫做散点图.散点图观察散点图,可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势.这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.正相关、负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.由散点图,能够推断脂肪含量与年龄这两个变量正相关.线性相关散点图是描述成对数据之间关系的一种直观方法.观察散点图,从中不仅可以大致看出脂肪含量和年龄呈现正相关性,而且从整体上可以看出散点落在某条直线附近.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.非线性相关(曲线相关)观察散点图,发现:图(1)中的散点落在某条曲线附近,而不是落在一条直线附近,说明这两个变量具有相关性,但不是线性相关;类似地,图(2)中的散点落在一条折线附近,这两个变量也具有相关性,但它们既不是正相关,也不是负相关;图(3)中的散点杂乱无章,无规律可言,看不出两个变量有什么相关性.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.8.1.2样本相关系数通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等.散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像引人均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?样本相关系数样本相关系数与正、负相关的关系样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映成对样本数据的变化特征:当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.样本相关系数与线性相关程度的关系例题解析编号1234567年龄23273941454950脂肪%9.517.821.225.927.526.328.28910111213145354565758606129.630.231.430.833.535.234.6例1根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.

解:先画出散点图,如下图所示.观察散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关.

例2

有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.第n年12345678910居民年收入/亿元32.231.132.935.837.138.039.043.044.646.0A商品销售额/万元25.030.034.037.039.041.042.044.048.051.0(1)解决此类问题的难点是对数据的处理和计算,要特别注意避免运算失误.(2)根据已知数据求得相关系数,利用相关系数绝对值的大小,可以判断两个变量相关性的强弱.方法总结

例3

在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如图所示.体重与身高、臂展与身高分别具有怎样的相关性?编号身高/cm体重/kg臂展/cm编号身高/cm体重/kg臂展/cm1234567891011121317317917517918217318017016917717717817455715262826355815454596756169170172177174166174169166176170174170141516171819202122232425166176176175169184169182171177173173666149604886585458615851161166165173162189164170164173165169解:根据样本数据画出体重与身高、臂展与身高的散点图,分别如图(1)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论