样本相关系数课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册_第1页
样本相关系数课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册_第2页
样本相关系数课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册_第3页
样本相关系数课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册_第4页
样本相关系数课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

形数通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等.散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像引人均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?8.1.2样本相关系数

思考1

根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?利用散点的横、纵坐标是否同号,可以构造一个量一般情形下,Lxy>0表明成对样本数据正相关;Lxy<0表明成对样本数据负相关.平移形数思考2:Lxy的大小一定能度量出成对样本数据的相关程度大小吗?

是不是Lxy越大,两个变量的相关程度越强?Lxy>0表明成对样本数据正相关;Lxy<0表明成对样本数据负相关.Lxy的大小与数据的度量得有关,如:在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高的单位由米改为厘米,则相应的Lxy将变为原来的100倍,即(Lxy)2>(Lxy)1,但单位的改变并不会导致体重与身高之间相关程度的改变.不宜直接用Lxy度量成对样本数据相关程度的大小.为了消除度量单位的影响,需要对数据作进一步的“标准化”处理.形数Bug:Lxy的大小受数据的度量单位的影响,但单位的改变并不会导致两个变量之间相关程度的改变.为了消除度量单位的影响,需要对数据作进一步的“标准化”处理.称r为变量x和变量y的样本(线性)相关系数.①r的正负:反映成对样本数据的变化趋势变量x和变量y的样本(线性)相关系数:思考3:r的大小能否刻画成对样本数据的相关程度的强弱?r的取值范围是什么?强强弱弱

观察r的结构,联想到二维(平面)向量、三维(空间)向量数量积的坐标表示,①r的正负:反映成对样本数据的变化趋势变量x和变量y的样本(线性)相关系数:②r的范围:−1≤r≤1样本相关系数r是一个描述成对样本数据的数字特征,它反映了两个随机变量之间的线性相关程度.思考4:当|r|=1时,成对样本数据之间具有怎样的关系呢?即此时两个变量之间满足一种线性(函数)关系,即满足完全线性相关.故|r|越接近1时,线性相关程度越强;|r|越接近0时,线性相关程度越弱;若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-2x+1上,则这组样本数据的样本相关系数为()①r的正负:反映成对样本数据的变化趋势变量x和变量y的样本(线性)相关系数:②r的范围:−1≤r≤1③|r|的大小:反映成对样本数据线性相关的程度(即散点集中于某条直线的程度):|r|越接近1:线性相关程度越强;|r|越接近0:线性相关程度越弱.r=0时,只表明成对样本数据间无线性相关关系,但不排除它们有其他相关关系.④样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.如:要确切了解脂肪含量y与年龄x的线性相关程度,需要调查所有人的年龄及其脂肪含量,再将得到的成对数据代入r的公式,计算出相关系数r.在实际中,获得总体中所有的成对数据往往是不容易的.在有限的总体中,可以利用这两个变量取值的所有成对数据,通过上述公式就可计算出两个变量的相关系数,这个相关系数就能确切地反映变量之间相关关系的正负性及线性相关程度的强弱.通过抽样获取两个变量的一些成对样本数据,再计算出样本相关系数,通过样本相关系数去估计总体相关系数,从而了解两个变量之间的相关程度.思想:用样本估计总体样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.

例1根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.解:由样本数据可得由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.编号1234567891011121314年龄/岁2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6

例1根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.编号1234567891011121314年龄/岁2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6解2:由样本数据可得由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.练习.有一个同学家开了一个小卖部,他为了研究气温对热饮料销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的数据的散点图和对比表.解:观察散点图,可看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关.代入公式可得样本相关系数r≈﹣0.97,可以推断脂肪含量和年龄这两个变量的负线性相关程度很强.摄氏温度x-5471015233036热饮杯数y16212811513589716337画出散点图,并用相关系数r判断热饮杯数与当天气温的关系的强弱.

变式1

在一次试验中,测得(x,y)的4组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的样本相关系数为(

)A.1 B.-2C.0 D.-1√解:由样本数据可得课本103页1.由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的相关关系?为什么?解:样本相关系数可以反映变量之间相关的正负性及线性相关的程度,但由于样本数据的随机性,样本相关系数往往不能确切地反映变量之间的相关关系.一般来说,样本量越大,根据样本相关系数推断变量之间相关的正负性及线性相关的程度越可靠,而样本量越小则越不可靠.一个极端的情况是,无论两个变量之间是什么关系,如果样本量取2,则计算可得样本相关系数的绝对值都是1(在样本相关系数存在的情况下),显然据此推断两个变量完全线性相关是不合理的.课本103页2.已知变量x和变量y的3对随机观测数据(2,2),(3,-1),(5,-7),计算成对样本数据的样本相关系数.能据此推断这两个变量线性相关吗?为什么?解:由样本数据可得虽然样本相关系数为-1,三个样本点在一条直线上,但是由于样本量太小,据此推断两个变量完全线性相关并不可靠.解:课本103页3.画出下列成对数据的散点图,并计算样本相关系数.据此,请你谈谈样本相关系数在刻画成对样本数据相关关系上的特点.(1)(-2,-3),(-1,-1),(0,1),(1,3),(2,5),(3,7);(2)(0,0),(1,1),(2,4),(3,9),(4,16);(3)(-2,-8),(-1,-1),(0,0),(1,1),(2,8),(3,27);(4)(2,0)

(1,),(0,2),(-1,),(-2,0).248x-4-320-213-16y-2••••••515x2041310y•••••20.51.5x-320-213-11y••••••51020x-10-320-213-115y-5••••••25样本相关系数主要刻画的是成对样本数据线性相关的程度.例2有人收集了某城市居民年收入(所有居民在一年内收人的总和)与A商品销售额的10年数据,如下表所示.第n年12345678910居民年收入/亿元32.231.132.935.837.138.039.043.044.646.0A商品销售额/万元25.030.034.037.039.041.042.044.048.051.0画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.解:先画出散点图,如图所示.从散点图看,A商品销售额与居民年收入的样本数据呈现出线性相关关系.代入公式可得样本相关系数r≈0.95,A商品销售额与居民年收入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强.例3在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.体重与身高、臂展与身高分别具有怎样的相关性?编号身高/cm体重/kg臂展/cm编号身高/cm体重/kg臂展/cm1234567891011121317317917517918217318017016917717717817455715262826355815454596756169170172177174166174169166176170174170141516171819202122232425166176176175169184169182171177173173666149604886585458615851161166165173162189164170164173165169例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.体重与身高、臂展与身高分别具有怎样的相关性?解:先画出散点图,如图所示.从散点图看,两个散点图都呈现出线性相关.通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关.r1≈0.34∵r2>r1,∴臂展与身高的相关程度更高.r2≈0.78【注】在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断.

变式足球是深受全世界人们喜爱的运动,我国大力发展校园足球.为了解本地区足球特色学校的发展状况,社会调查小组得到如下统计数据:年份x20162017201820192020足球特色学校y(百个)0.300.601.001.401.70根据上表数据,计算y与x的样本相关系数r,并说明y与x的线性相关程度.(附:若0.75≤|r|≤1,则认为y与x的线性相关程度很强;若0.3≤|r|<0.75,则认为y与x的线性相关程度一般;|r|≤0.25,则认为y与x的线性相关程度较弱)解:根据题意得∴y与x的线性相关程度很强.课本103页4.随机抽取7家超市,得到其广告支出与销售额数据如下:解:由样本数据可得正线性相关,相关性较强,销售额与广告支出的变化趋势相同.超市ABCDEFG广告支出/万元1246101420销售额/万元19324440525354请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.P104-3.根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:两个变量的样本相关系数是否为1?若不是,请你解释其中的原因.析:计算可得r≈0.9997由此可得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论