【数学】成对数据的统计相关性 课件-2023-2024学年高二下人教A版(2019)选择性必修第三册_第1页
【数学】成对数据的统计相关性 课件-2023-2024学年高二下人教A版(2019)选择性必修第三册_第2页
【数学】成对数据的统计相关性 课件-2023-2024学年高二下人教A版(2019)选择性必修第三册_第3页
【数学】成对数据的统计相关性 课件-2023-2024学年高二下人教A版(2019)选择性必修第三册_第4页
【数学】成对数据的统计相关性 课件-2023-2024学年高二下人教A版(2019)选择性必修第三册_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章成对数据的统计分析8.1成对数据的统计相关性8.1.1变量的相关关系8.1.2样本相关系数复习引入(1)正方体的体积与棱长函数关系:(2)汽车匀速行驶时的路程与时间函数关系:复习引入

(3)俗话说“庄稼一枝花,全靠肥当家”,这说明施肥的多少对粮食的产量影响很大,施肥量和粮食的产量是确定的函数关系吗?

那么粮食的产量还受其他因素的影响吗?两个变量间的关系除了可能是函数关系外,还可能是其他关系吗?为了搞清这些问题,我们需要学习本节内容。复习引入

我们知道,一个人的体重与他的身高有关系.一般而言,个子高的人往往体重值较大,个子矮的人往往体重值较小.但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素.像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.问题1:上述情境中施肥量与粮食产量之间到底具有怎样的关系?提示:上述两变量间确实存在关系,但又不具备确定性,即当一个变量取值一定时,另一个变量取值带有随机性.概念形成1、变量的相关关系:

两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.注:①相关关系是一种不确定性关系;②相关关系是相对于函数关系而言的.

新知探索

两个变量具有相关关系的事例在现实中大量存在.例如:

新知探索

新知探索

数据判断:两个变量之间的相关关系的确定:样本数据分析

建立模型

估计或推断.①

经验判断;新知探索问题2:在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表所示.表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据.

根据以上数据,你能推断人体的脂肪含量与年龄之间存在怎样的关系吗?新知探索

为了更加直观地描述上述成对数据中脂肪含量与年龄之间的关系,类似于用直方图描述单个变量样本数据的分布特征,我们用图形展示成对样本数据的变化特征.用横轴表示年龄,纵轴表示脂肪含量,则表中每个编号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了如图所示的统计图.我们把这样的统计图叫做散点图.概念形成2.散点图把成对样本数据用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.观察图,可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值得增加,相应的脂肪含量值呈现增加的趋势.这样,由成对样本数据的分布规律,我们可以推断脂肪含量和年龄变量之间存在着相关关系.新知探索

如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称之两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.

由上图,能够推断脂肪含量与年龄这两个变量正相关.3.变量相关关系的分类(1)正相关和负相关

正相关:指的是两个变量有相同的变化趋势,即从整体上来看一个变量会随着另一个变量变大而变大,点的位置散布在从左下角到右上角的区域。负相关:指的是两个变量有相反的变化趋势,即从整体上来看一个变量会随着另一个变量变大而变小,点的位置散布在从左上角到右下角的区域内(2)两个变量正相关和负相关散点图的特点概念形成概念形成(3)线性相关和非线性相关①线性相关散点图是描述成对数据之间关系的一种直观方法.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一一条直线附近,我们就称这两个变量线性相关oxy●●●●●●●●●●②非线性相关

一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.oxy●●●●●●●●●●概念形成散点杂乱无章,无规律可言,看不出两个变量有什么相关性有相关性观察散点图中成对样本数据的分布规律,可大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等.散点图虽然直观,但无法确切(量化)地反映成对样本数据的相关类型和相关程度的大小.例析例1.在下列各个量与量的关系中:①正方体的表面积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③家庭的收入与支出之间的关系;④某户家庭用电量与水费之间的关系.其中是相关关系的为().A.①②

B.③④

C.②④

D.②③答案:D.解析:①正方体的表面积与棱长之间的关系是确定的函数关系;④某户家庭用电量与水费之间无任何关系.②③中,都是非确定的关系,但自变量取值一定时,因变量的取值带有一定的随机性.例析方法技巧:

利用变量间相关关系的概念判断量与量之间的关系时,一般是看当一个变量的值一定时,另一个变量是否带有确定性,两个变量之间的关系具有确定关系——函数关系;两个变量之间的关系具有随机性、不确定性——相关关系.例析例2.某种产品的广告支出费x与销售金额y之间有如表对应数据(单位:百万元):x24568y3040605070①画出散点图;②从散点图中判断销售金额与广告支出费有什么样的关系.解:①以x对应的数据为横坐标,y对应的数据为纵坐标,所作的散点图如图所示.解:②从图中可以发现广告支出费与销售金额之间具有相关关系,并且当广告支出费由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y呈正相关关系.例析

2.判断两个变量具有相关关系的方法(1)根据直观感觉判断,这时要用到已有的知识或学习、生活中的经验等.(2)根据散点图判断,这时要由两个变量相应值的对应关系作出散点图,通过观察散点图中变量的对应点是否分布在某条曲线的周围判定这两个变量是否具有相关关系.形数思考1:能否引入一个适当的“数字特征”,来度量样本数据是正相关还是负相关呢?新知探索新知探究

新知探究平移形数新知探究思考2:Lxy的大小一定能度量出成对样本数据的相关程度大小吗?

是不是Lxy越大,两个变量的相关程度越强?Lxy>0表明成对样本数据正相关;Lxy<0表明成对样本数据负相关.Lxy的大小与数据的度量得有关,如:在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高的单位由米改为厘米,则相应的Lxy将变为原来的100倍,即(Lxy)2>(Lxy)1,但单位的改变并不会导致体重与身高之间相关程度的改变.不宜直接用Lxy度量成对样本数据相关程度的大小.为了消除度量单位的影响,需要对数据作进一步的“标准化”处理.新知探究形数Bug:Lxy的大小受数据的度量单位的影响,但单位的改变并不会导致两个变量之间相关程度的改变.新知探究为了消除度量单位的影响,需要对数据作进一步的“标准化”处理.称r为变量x和变量y的样本(线性)相关系数.新知探究①r的正负:反映成对样本数据的变化趋势变量x和变量y的样本(线性)相关系数:思考3:r的大小能否刻画成对样本数据的相关程度的强弱?r的取值范围是什么?强强弱弱新知探究观察r的结构,联想到二维(平面)向量、三维(空间)向量数量积的坐标表示,

新知探究①r的正负:反映成对样本数据的变化趋势变量x和变量y的样本(线性)相关系数:②r的范围:−1≤r≤1新知探究思考4:当|r|=1时,成对样本数据之间具有怎样的关系呢?即此时两个变量之间满足一种线性(函数)关系,即满足完全线性相关.故|r|越接近1时,线性相关程度越强;|r|越接近0时,线性相关程度越弱;若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-2x+1上,则这组样本数据的样本相关系数为()新知探究①r的正负:反映成对样本数据的变化趋势4、变量x和变量y的样本(线性)相关系数:②r的范围:−1≤r≤1③|r|的大小:反映成对样本数据线性相关的程度(即散点集中于某条直线的程度):|r|越接近1:线性相关程度越强;|r|越接近0:线性相关程度越弱.r=0时,只表明成对样本数据间无线性相关关系,但不排除它们有其他相关关系.④样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.新知探究r=0.97r=-0.85r=0.24r=-0.05正线性相关程度很强负线性相关程度较强正线性相关程度很弱负线性相关程度极弱①r的正负:反映成对样本数据的变化特征②r的范围:−1≤r≤1③|r|的大小:反映成对样本数据间线性相关的程度(即散点集中于一条直线的程度):当|r|越接近1时,线性相关程度越强;当|r|越接近0时,线性相关程度越弱.新知探究如:要确切了解脂肪含量y与年龄x的线性相关程度,需要调查所有人的年龄及其脂肪含量,再将得到的成对数据代入r的公式,计算出相关系数r.在实际中,获得总体中所有的成对数据往往是不容易的.在有限的总体中,可以利用这两个变量取值的所有成对数据,通过上述公式就可计算出两个变量的相关系数,这个相关系数就能确切地反映变量之间相关关系的正负性及线性相关程度的强弱.通过抽样获取两个变量的一些成对样本数据,再计算出样本相关系数,通过样本相关系数去估计总体相关系数,从而了解两个变量之间的相关程度.思想:用样本估计总体样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.新知探索

答案:较高.新知探索

答案:0.3.例析例3、对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是(

)A.r1<r4<0<r3<r2B.r4<r1<0<r3<r2C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3√例析例4、某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如表所示的对应关系:x2468y30405070(1)画出(x,y)的散点图;(2)计算x与y之间的样本相关系数,并刻画它们的相关程度.例析解:(1)画出(x,y)的散点图如图所示.由样本相关系数r≈0.9827,可以推断生产原料耗费与销售额这两个变量正线性相关,且相关程度很强.课堂小结1.相关关系:两个变量有关系,但又没有确切到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论