高中数学《8.1 成对数据的统计相关性》课件与导学案_第1页
高中数学《8.1 成对数据的统计相关性》课件与导学案_第2页
高中数学《8.1 成对数据的统计相关性》课件与导学案_第3页
高中数学《8.1 成对数据的统计相关性》课件与导学案_第4页
高中数学《8.1 成对数据的统计相关性》课件与导学案_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人教2019A版选择性必修第三册

第八章

成对数据的统计分析

8.1成对数据的统计相关性学习目标1.理解两个变量的相关关系的概念;2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系;3.会根据相关系数判断两个变量的相关程度.问题导学

我们知道,如果变量y是变量工的函数,那么由x就可以唯一确定y.然而,现实世界中还存在这样的情况:两个变量之间有关系,但密切程度又达不到函数关系的程度.例如,人的体重与身高存在关系,但由一个人的身高值并不能确定他的体重值,那么,该如何刻画这两个变量之间的关系呢?下面我们就来研究这个问题.

我们知道,一个人的体重与他的身高有关系,一般而言,个子高的人往往体重值较大,个子矮的人往往体重值较小,但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素,像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系(correlation).

概念解析两个变量具有相关关系的事例在现实中大量存在,例如:1.子女身高y与父亲身高x之间的关系,一般来说,父亲的个子高,其子女的个子也会比较高;父亲个子矮,其子女的个子也会比较矮,但影响子女身高的因素,除父亲身高外还有其他因素,例如母亲身高、饮食结构、体育锻炼等,因此父亲身高又不能完全决定子女身高.2.商品销售收人y与广告支出x之间的关系,一般来说,广告支出越多,商品销售收入越高,但广告支出并不是决定商品销售收入的唯一因素,商品销售收入还与商品质量、居民收入等因素有关。3.空气污染指数y与汽车保有量x之间的关系,一般来说,汽车保有量增加,空气污染指数会上升,但汽车保有量并不是造成空气污染的唯一因素,气象条件、工业生产排放、居民生活和取暖、垃圾焚烧等都是影响空气污染指数的因素。4.粮食亩产量y与施肥量x之间的关系,在一定范围内,施肥量越大,粮食亩产量就越高,但施肥量并不是决定粮食亩产量的唯一因索,粮食亩产量还要受到土壤质量、降水量、田间管理水平等因素的影响。概念解析变量的相关关系相关关系是一种不确定性关系;相关关系是相对于函数关系而言的.像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.概念解析关系项目函数关系相关关系

相同点都是两个变量间的关系不同点是一种确定关系是一种非确定关系是一种因果关系不一定是因果关系,也可能是伴随关系相关关系与函数关系的异同点概念辨析概念辨析探究1:在对人体的脂肪的含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表所示,表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据。编号1234567年龄23273941454950脂肪9.517.821.225.927.526.328.2编号891011121314年龄53545657586061脂肪29.630.231.430.833.535.234.6根据以上数据,你能推新人体的脂肪含量与年龄之间存在怎样的关系吗?问题探究成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们我们把这样的统计图叫做散点图由散点图可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势.这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.概念解析变量相关关系的分类(1)正相关和负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关.当一个变量的值增加时,另一个变量的相应值也呈现减少的趋势,称这两个变量负相关.概念解析正相关:根据样本数据所作得散点图中,若点散布在从左下角到右上角的区域。对于两个变量的这种相关关系,我们称之为正相关。O负相关:根据样本数据所作得散点图中,若点散布在从左上角到右下角的区域。对于两个变量的这种相关关系,我们称之为负相关。概念解析①线性相关:散点图是描述成对数据之间关系的一种直观方法.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一一条直线附近,我们就称这两个变量线性相关;②非线性相关:一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.O概念解析探究2.通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等,散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像引入平均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?问题探究

平移绘制散点图为这时的散点大多数分布在第一象限、第三象限,大多数散点的横、纵坐标同号,显然,这样的规律是由人体脂肪含量与年龄正相关所决定的。探究3:根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后星现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?问题探究

一般情形下,Lxy>0表明成对样本数据正相关;Lxy<0表明成对样本数据负相关.问题1:

Lxy的大小一定能度量出成对样本数据的相关程度吗?我们发现,Lxy的大小与数据的度量单位有关,所以不能直接用它度量成对样本数据相关程度的大小.在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度.

为了消除单位的影响,进一步做“标准化”处理

样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征:当r>0时,称成对样本数据正相关;当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大。当r<0时,称成对样本数据负相关;当其中一个数据的值变小时,另一个数据的值通常会变大:当其中一个数据的值变大时,另一个数据的值通常会变小。我们称r为变量x和变量y的样本相关系数.样本相关系数概念解析样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度:当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6

参考数据:例1.根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.典例解析

由样本相关系数𝑟≈0.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强。脂肪含量与年龄变化趋势相同.解:先画出散点图,如右图所示观察散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关.归纳总结解:第n年12345678910居民年收入/亿元32.231.132.935.837.138394344.646A商品销售额/万元25.030.034.037.039.041.042.044.048.051.0例2.

有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.典例解析例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.解:

通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正相关.其中,臂展与身高的相关程度更高.体重与身高、臂展与身高分别具有怎样的相关性?跟踪训练×√××当堂达标课堂小结8.1成对数据的统计相关性《8.1.1变量的相关关系》导学案课标要求素养要求1.结合实例,体会两个变量间的相关关系.2.掌握相关关系的判断,能根据散点图对线性相关关系进行判断.通过对两个变量相关关系的学习,提升直观想象及数据分析素养.新知探究俗话说“庄稼一枝花,全靠肥当家”,这说明施肥的多少对粮食的产量影响很大,那么粮食的产量还受其他因素的影响吗?施肥量和粮食的产量是确定的函数关系吗?两个变量间的关系除了可能是函数关系外,还可能是其他关系吗?为了搞清这些问题,我们需要学习本节内容.问题上述情境中施肥量与粮食产量之间到底具有怎样的关系?提示上述两变量间确实存在关系,但又不具备确定性,即当自变量取值一定时,因变量取值带有随机性的两个变量的关系,就称为变量间的相关关系.1.相关关系两个变量间的关系有函数关系,相关关系和不相关关系两个变量有关系,但又没有确切到可由其中的一个去________决定另一个的程度,这种关系称为相关关系.精确地2.正相关、负相关

从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现______的趋势,我们就称这两个变量正相关;如果一个变量值增加时,另一个变量的相应值呈现______的趋势,则称这个两个变量负相关.3.线性相关

一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在________附近,我们就称这两个变量线性相关.

一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.增加减少一条线拓展深化[微判断]1.统计活动中,分析数据时通常用统计图表计算数据的数据特征. (

)2.在一定范围内,农作物的产量与施肥量之间的关系是相关关系. (

)3.对于给定的两个变量的统计数据,都可以作出散点图. (

)√√√[微训练]1.(多选题)下列说法正确的是(

) A.任何两个变量都具有相关关系 B.圆的周长与该圆的半径具有相关关系 C.某商品的需求量与该商品的价格是一种非确定性关系 D.根据散点图可判断两变量是否具有线性相关关系

解析A显然不对,B是函数关系,CD正确.

答案CD2.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图图1;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图图2.由这两个散点图可以判断(

)A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析由这两个散点图可以判断,变量x与y负相关,u与v正相关.答案C[微思考]

相关关系与函数关系的区别和联系是什么?

提示相同点:两者均是指两个变量的关系;

不同点:(1)函数关系是一种确定的关系.如匀速直线运动中时间t与路程s的关系;相关关系是一种非确定的关系.如一块农田的水稻产量与施肥量之间的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系,然而学会新词并不能使脚变大,而是涉及第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高,而且他们的脚也变大.

题型一相关关系的理解【例1】判断以下两个变量之间是否具有相关关系?(1)正方形的面积与其周长之间的关系;(2)父母的身高与子女的身高之间的关系;(3)学生的学号与身高;(4)汽车匀速行驶时的路程与时间的关系.(2)子女身高除了与父母的身高有一定关系外,还与其他因素有关,即子女的身高并不是由其父母的身高唯一确定的,因此二者之间具有相关关系;(3)学生的学号与身高之间没有任何关系,不具有相关关系;(4)若汽车匀速行驶时的速度为v,行驶的路程为s,时间为t,则有s=vt,因此当速度一定时,路程由时间唯一确定,二者之间具有函数关系,而不是相关关系.规律方法函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,

而相关关系不一定是因果关系,也可能是伴随关系.【训练1】

(多选题)下列说法正确的是(

) A.闯红灯与交通事故发生率的关系是相关关系 B.同一物体的加速度与作用力是函数关系 C.产品的成本与产量之间的关系是函数关系 D.广告费用与销售量之间的关系是相关关系

解析闯红灯与发生交通事故之间不是因果关系,但具有相关性,是相关关系,所以A正确;物体的加速度与作用力的关系是函数关系,B正确;产品的成本与产量之间是相关关系,C错误;广告费用与销售量之间是相关关系,D正确.

答案ABD题型二散点图与相关性【例2】某种木材体积与树木的树龄之间有如下的对应关系:树龄2345678体积30344060556270(1)请作出这些数据的散点图;(2)你能由散点图发现木材体积与树木的树龄近似成什么关系吗?解(1)以x轴表示树木的树龄,y轴表示树木的体积,可得相应的散点图如图所示:(2)由散点图发现木材体积随着树龄的增加而呈增加的趋势,且散点落在一条直线附近,所以木材的体积与树龄成线性相关关系.【迁移1】

(变条件,变问法)若近似成线性相关关系,请画出一条直线来近似地表示这种线性相关关系.

解近似拟合直线如图所示:【迁移2】

(变条件,变问法)若该种木材每单位体积的价值是80元,作出木材的价值与树龄之间关系的散点图.

解木材的价值与树龄之间的关系如表所示:树龄2345678体积30344060556270价值2400272032004800440049605600以x轴表示树木的树龄,y轴表示树木的价值,可得相应的散点图如图所示:规律方法判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.【训练2】

5名学生的数学和物理成绩(单位:分)如下:学生成绩

ABCDE数学成绩8075706560物理成绩7066686462判断它们是否具有线性相关关系.解以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.题型三散点图及其应用【例3】下面是水稻产量与施化肥量的一组观测数据:施化肥量15202530354045水稻产量320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增加吗?解(1)散点图如下:(2)从图中可以发现,当施化肥量由小到大变化时,水稻产量也由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增加,不会一直随施化肥量的增加而增加.规律方法

1.画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.2.在这里利用散点图直观感知事物的形态与变化,理解事物间的关联及变化规律,是数学核心素养直观想象的具体体现.【训练3】

(多选题)某中学的兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法正确的是(

)A.沸点与海拔高度呈正相关B.沸点与气压呈正相关C.沸点与海拔高度呈负相关D.沸点与海拔高度、沸点与气压的相关性都很强解析由左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸点与气压呈正相关,沸点与海拔高度呈负相关;由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,故B,C,D正确,A错误.答案BCD一、素养落地1.通过本节课的学习,进一步提升直观想象及数据分析素养.2.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关.二、素养训练1.下列每组的两个变量之间具有相关关系的是(

) A.乌鸦叫,灾难到 B.圆心角的大小与半径 C.物体的质量一定,其密度与体积之间的关系 D.儿童的年龄与身高

解析A,B中的两个变量之间没有关系,C中的两个变量之间是函数关系,D中的两个变量之间是相关关系.

答案D2.下列语句所表示的事件中的因素不具有相关关系的是(

) A.瑞雪兆丰年 B.名师出高徒 C.吸烟有害健康 D.喜鹊叫喜

解析瑞雪对农作物有好处,可能使得农作物丰收,所以瑞雪兆丰年具有相关关系,名师出高徒也具有相关关系,吸烟有害健康也具有相关关系,而喜鹊叫喜,没有必然的关系,故选D.

答案D3.观察下列散点图,具有相关关系的是(

)A.①② B.①③

C.②④ D.②③解析①是函数关系,④不具有相关关系,②③具有相关关系.答案D4.(多选题)对于给定的两个变量的统计数据,下列说法不正确的是(

) A.都可以分析出两个变量之间的关系 B.都可以用一条直线近似地表示两者的关系 C.都可以作出散点图 D.都可以用确定的表达式表示两者的关系

解析给出一组样本数据,不一定能分析出两个变量的关系,更不一定符合线性相关,不一定用一条直线近似地表示,故A、B不正确;但总可以作出相应的散点图,C正确;两个变量的统计数据不一定有函数关系,故D不正确.

答案ABD5.(多选题)下列关系是相关关系的是(

) A.角度和它的余弦值 B.某商场搞促销活动与销售量之间的关系 C.作文水平与课外阅读量之间的关系 D.底面积一定的三棱锥的体积与高之间的关系

解析A,D中两个变量之间的关系是一种确定性关系,而B,C中的两个变量之间的关系是不确定的,所以它们具有相关关系.故选BC.

答案BC8.1成对数据的统计相关性《8.1.2

样本相关系数》导学案课标要求素养要求1.结合实例,会通过相关系数比较多组成对数据的相关性.2.了解样本相关系数与标准化数据向量夹角的关系.通过学习样本相关系数,提升数学抽象及数据分析素养.新知探究散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢?问题若样本系数r=0.97,则成对样本数据的相关程度如何?提示

r=0.97,表明成对样本数据正线性相关程度很强.1.相关系数r的计算注意:相关系数是研究变量之间线性相关程度的量2.相关系数r的性质 (1)当r>0时,称成对样本数据____相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系. (2)样本相关系数r的取值范围为______________.

当|r|越接近1时,成对样本数据的线性相关程度越____;

当|r|越接近0时,成对样本数据的线性相关程度越____.正[-1,1]强弱3.样本相关系数与标准化数据向量夹角的关系拓展深化[微判断]1.回归分析中,若r=±1说明x,y之间具有完全的线性关系.

(

)2.若r=0,则说明成对样本数据间是函数关系.

(

)

提示若r=0,则说明成对样本数据间没有线性相关关系.3.样本相关系数r的范围是r∈(-∞,+∞).

(

)

提示样本相关系数的范围是[-1,1].×√×解析因r>0表明两个变量正相关,故A错误;又因

r∈[-1,1],故B,C错误;两个变量之间的相关系数r的绝对值越接近于1,表明两个变量的线性相关性越强,

r的绝对值越接近于0,表示两个变量之间几乎不存在线性相关,故D正确.答案D2.(多选题)下面的各图中,散点图与相关系数r符合的是(

)解析因为相关系数r的绝对值越接近1,线性相关程度越高,且r>0时正相关,r<0时负相关,故观察各选项,易知B不符合,A,C,D均符合.故选ACD.答案ACD[微思考]

当r=1或-1时,两个变量的相关性如何?

提示当r=1时,两个变量完全正相关;当r=-1时,两个变量完全负相关.题型一线性相关性的检验【例1】现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x(分)与入学后第一次考试的数学成绩y(分)如下:学生号12345678910x12010811710410311010410599108y84648468696869465771≈0.7506.由此可看出这10名学生的两次数学成绩具有线性相关关系.规律方法利用相关系数r判断线性相关关系,需要应用公式计算出r的值,由于数据较大,需要借助计算器.【训练1】假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:x23456y2.23.85.56.57.0所以x与y之间具有很强的线性相关关系.题型二判断线性相关的强弱【例2】维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.甲醛浓度x18202224262830缩醛化度(y)26.8628.3528.7528.8729.7530.0030.36解列表如下ixiyxiyi11826.86324721.4596483.4822028.35400803.722556732228.75484826.5625632.542428.87576833.4769692.8852629.75676885.0625773.562830.0078490084073030.36900921.7296910.80∑168202.9441445892.01364900.16≈0.96.由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.规律方法当相关系数|r|越接近1时,两个变量的相关关系越强,当相关系数|r|越接近0时,两个变量的相关关系越弱.【训练2】

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论