(人教A版)选择性必修三高中数学同步考点讲与练专题8.1 成对数据的统计相关性(解析版)_第1页
(人教A版)选择性必修三高中数学同步考点讲与练专题8.1 成对数据的统计相关性(解析版)_第2页
(人教A版)选择性必修三高中数学同步考点讲与练专题8.1 成对数据的统计相关性(解析版)_第3页
(人教A版)选择性必修三高中数学同步考点讲与练专题8.1 成对数据的统计相关性(解析版)_第4页
(人教A版)选择性必修三高中数学同步考点讲与练专题8.1 成对数据的统计相关性(解析版)_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题8.1成对数据的统计相关性(重难点题型精讲)1.变量的相关关系(1)函数关系

函数关系是一种确定性关系,常用解析式来表示.

(2)相关关系

两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.与函数关系不同,相关关系是一种非确定性关系.2.散点图(1)散点图

成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.

(2)正相关和负相关

如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.3.线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.4.样本相关系数(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(,),(,),,(,),利用相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:(其中,,,和,,,的均值分别为和).①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.

②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.【题型1变量间的相关关系】【方法点拨】根据变量间的相关关系的定义,进行判断求解即可.【例1】下列两个量之间的关系是相关关系的是(

)A.匀速直线运动中时间与位移的关系 B.学生的成绩和身高C.儿童的年龄与体重 D.物体的体积和质量【解题思路】根据相关关系和函数关系的概念即可判断【解答过程】A、D是函数关系;B是不相关关系;C是相关关系,故选:C.【变式1-1】下列说法正确的是(

)A.y=2x2+1中的xB.正四面体的体积与棱长具有相关关系C.电脑的销售量与电脑的价格之间是一种确定性的关系D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量【解题思路】根据相关关系的定义、函数的定义即可判断【解答过程】A,B均为函数关系,故A、B错误;C,D为相关关系,故C错,D对.故选:D.【变式1-2】有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是(

)A.①③ B.②③C.② D.③【解题思路】利用相关关系和函数关系的概念分析解答.【解答过程】①汽车的重量和汽车每消耗1升汽油所行驶的平均路程是负相关关系;②平均日学习时间和平均学习成绩是正相关关系;③立方体的棱长和体积是函数关系,不是相关关系.故选:C.【变式1-3】下列说法正确的是(

)A.任何两个变量都具有相关关系B.球的体积与该球的半径具有相关关系C.农作物的产量与施化肥量之间是一种确定性关系D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系【解题思路】根据相关关系是一种不确定关系,函数关系是一种确定关系,可判断A;根据球的体积与半径之间的关系,可判断该关系为函数关系,可判断B;根据农作物的产量与施化肥量之间的关系可得该关系为一种相关关系,可判断C;根据学生的数学成绩与物理成绩之间是一种相关关系可判断D.【解答过程】解:当两个变量之间具有确定的关系时,两个变量之间是函数关系,而不是相关关系,故A错误;球的体积与该球的半径之间是函数关系,故B错误;农作物的产量与施化肥量之间的关系是相关关系,是非确定性关系,故C错误;学生的数学成绩与物理成绩之间的关系是相关关系,是非确定性关系,故D正确.故选:D.【题型2利用散点图判断相关性】【方法点拨】根据所给的散点图,研究两个变量之间的相关关系,进行求解即可.【例2】对变量x、y由观测数据得散点图1,对变量y、z由观测数据得散点图2.由这两个散点图可以判断(

)A.变量x与y负相关,x与z正相关B.变量x与y负相关,x与z负相关C.变量x与y正相关,x与z正相关D.变量x与y正相关,x与z负相关【解题思路】根据散点图直接判断可得出结论.【解答过程】由散点图可知,变量x与y负相关,变量y与z正相关,所以,x与z负相关.故选:B.【变式2-1】在下列各散点图中,两个变量具有正相关关系的是(

)A. B.C. D.【解题思路】根据散点图中两个变量的变化趋势直接判断即可.【解答过程】对于A,散点的变化具有波动性,非正相关关系,A错误;对于B,当x变大时,y的变化趋势也是逐渐增大,可知两个变量具有正相关关系,B正确;对于C,当x变大时,y的变化趋势是逐渐减小,可知两个变量具有负相关关系,C错误;对于D,两个变量的变化无规律,二者没有相关性,D错误.故选:B.【变式2-2】某中学的兴趣小组在某座山测得海拔高度、气压、沸点的六组数据,并绘制出如图所示的散点图,下列说法错误的是(

)A.气压与海拔高度呈负相关 B.沸点与气压呈正相关C.沸点与海拔高度呈正相关 D.沸点与海拔高度的相关性很强【解题思路】根据正相关、负相关的概念判断.【解答过程】沸点与气压呈正相关,气压与海拔高度呈负相关,所以沸点与海拔高度呈负相关,故选:C.【变式2-3】对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是(

)A.r2<rC.r4<r【解题思路】利用正负相关与线性相关的强弱进行求解即可【解答过程】r1,r3都是正线性相关,所以r1r2,r4都是负线性相关并,所以r2<0,r所以r2<【题型3样本相关系数的意义】【方法点拨】对于所给题目,根据样本相关系数的定义和有关概念来进行判断,即可得解.【例3】两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关系数r如下表,其中拟合效果最好的模型是(

)模型模型1模型2模型3模型4相关系数r0.480.960.150.30A.模型1 B.模型2 C.模型3 D.模型4【解题思路】根据相关系数的定义,判断r的大小,即可判断选项.【解答过程】根据相关系数的定义可知,r越大,约接近于1,则拟合效果越好.由数据可知,模型2的相关系数最大,所以拟合效果最好.故选:B.【变式3-1】对于样本相关系数,下列说法错误的是(

)A.样本相关系数可以用来判断成对样本数据相关的正负性B.样本相关系数可以是正的,也可以是负的C.样本相关系数r∈D.样本相关系数越大,成对样本数据的线性相关程度也越强【解题思路】利用相关系数与成对样本数据间的相关关系逐项判断,可得出合适的选项.【解答过程】对于A选项,样本相关系数可以用来判断成对样本数据相关的正负性,A对;对于B选项,样本相关系数可以是正的,也可以是负的,B对;对于C选项,样本相关系数r∈−1,1对于D选项,样本相关系数的绝对值越大,成对样本数据的线性相关程度也越强,D错.故选:D.【变式3-2】下列有关样本线性相关系数r的说法,错误的是()A.相关系数r可用来衡量x与y之间的线性相关程度B.r≤1,且rC.r≤1,且rD.r≤1,且r【解题思路】根据相关系数的定义,即可判断选项.【解答过程】相关系数是来衡量两个变量之间的线性相关程度的,线性相关系数是一个绝对值小于等于1的量,并且它的绝对值越大就说明相关程度越大,所以不正确的只有D.故选:D.【变式3-3】对于样本相关系数r,下列说法不正确的是(

)A.样本相关系数r可以用来判断成对数据相关的正负性B.样本相关系数r∈[−1,1]C.当r=0时,表明成对样本数据间没有线性相关关系D.样本相关系数r越大,成对样本数据的线性相关程度也越强【解题思路】根据相关系数:1.r≤1;2.r>0,则成对数据为正相关,r<0,则成对数据为负相关;3.r→1,线性相关程度越强,r→0【解答过程】根据相关系数的理解:r≤1⇔r∈[−1,1]r>0,则成对数据为正相关;r<0,则成对数据为负相关;A正确;r→1,线性相关程度越强,r→0,线性相关程度越弱,【题型4样本相关系数的应用】【方法点拨】样本相关系数是对两个变量相关程度进行定量刻画,|r|越大,表明两个变量之间的线性相关程度越强,运用样本相关系数进行判断的一般步骤如下:(1)整理数据,求出相关值;(2)计算样本相关系数;(3)得出结论.【例4】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=120xi=60,i=120yi(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(附:相关系数r=i=1n(x【解题思路】(1)由已知数据求得20个样区野生动物数量的平均数,乘以200得答案;(2)由已知直接利用相关系数公式求解.【解答过程】(1)由已知得样本平均数y=(2)样本(xi,yi【变式4-1】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据xi,yi(i=1,2,⋯,20),其中xi和yi分别表示第i(1)估计该地区这种野生动物的数量;(2)求样本xi【解题思路】(1)计算出样区野生动物的数量的平均值,乘以地块数,即得答案;(2)根据相关系数公式进行计算,可得答案.【解答过程】(1)由已知得样本平均数y=从而该地区这种野生动物数量的估计值为200(2)由i=120xi−x可得样本(xr=i=1【变式4-2】下图是我国2014年至2021年生活垃圾无害化处理量(单位:亿吨)的折线图.(注:年份代码1~7分别对应年份2014~2021.)由折线图看出,可用线性回归模型拟合y与t的关系.请求出相关系数r,并用相关系数的大小说明y与t相关性的强弱.参考数据和公式:i=17yi=10.97,i=17【解题思路】计算出i=17ti【解答过程】由折线图中数据和参考数据得t=i=17i=17yi所以r=i=17ti−【变式4-3】为调查野生动物保护地某种野生动物的数量,将保护地分成面积相近的300个地块,并设计两种抽样方案.方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区,依据抽样数据计算得到相应的相关系数r=0.81;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据xi,yii=1,2,⋅⋅⋅,30,其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=130x(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求方案二抽取的样本xi,y附:若相关系数r∈0.75,1则相关性很强,【解题思路】(1)首先求出样区野生动物平均数,然后利用所求平均数乘以该地区的地块数即可求解;(2)根据所给数据以及相关系数公式即可求r,然后与方案一的相关系数比较,并结合相关系数的意义即可求解.【解答过程】(1)由题意可得,样区野生动物平均数为y−又因为该地区的地块数为300,所以该地区这种野生动物的估计值为300×40=12000.(2)由题中数据可得,样本xir=i=1因为方案一的相关系数为r=0.81,明显小于方案二的相关系数r≈0.94,所以方案二的分层抽样方法更能准确地估计.专题8.1成对数据的统计相关性(重难点题型检测)一.单选题1.对两变量间的关系,下列论述正确的是(

)A.任何两个变量都具有相关关系B.正方形的面积与该正方形的边长具有相关关系C.农作物的产量与施化肥量之间是一种确定性关系D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系【解题思路】由两个变量之间相关关系与函数关系之间的定义及区别即可求解.【解答过程】解:对A:当两个变量之间具有确定关系时,两个变量之间是函数关系,而不是相关关系,所以A错误;对B:正方形的面积与该正方形的边长之间是函数关系,所以B错误;对C:农作物的产量与施化肥量之间是相关关系,是非确定性的关系,所以C错误;对D:学生的数学成绩与物理成绩之间是相关关系,是非确定性的关系,所以D正确;故选:D.2.下列说法正确的是(

)A.圆的面积与半径之间的关系是相关关系B.粮食产量与施肥量之间的关系是函数关系C.一定范围内,学生的成绩与学习时间成正相关关系D.人的体重与视力成负相关关系【解题思路】函数关系是变量之间的确定关系,相关关系是变量之间确实存在关系但不具有确定性,据此判断即可.【解答过程】解:对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;对于B,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以B错误;对于C,一定范围内,学生的成绩与学习时间是成正相关关系的,所以C正确;对于D,人的体重与视力是没有相关关系的,所以D错误.故选:C.3.在建立两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关指数R2如下,其中拟合最好的模型是(

A.模型1的相关指数R2为0.98 B.模型2的相关指数R2C.模型3的相关指数R2为0.50 D.模型4的相关指数R2【解题思路】根据相关指数R2【解答过程】两个变量y与x的回归模型中,它们的相关指数R2在所给的四个选项中0.98是相关指数最大的值,最接近于1,所以拟合效果最好的模型是模型1.故选:A.4.已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=﹣0.957,则(

)A.变量X与Y之间呈正相关关系,且X与Y之间的相关性强于U与V之间的相关性B.变量X与Y之间呈负相关关系,且X与Y之间的相关性强于U与V之间的相关性C.变量U与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性D.变量U与V之间呈正相关关系,且X与Y之间的相关性弱于U与V之间的相关性【解题思路】根据线性相关系数|r|越接近1,表示两个变量之间的相关性越强,线性相关系数r的正负表示两个变量之间呈正相关关系或负相关关系.【解答过程】因为线性相关系数r1=0.837,r2=﹣0.957,所以变量X与Y之间呈正相关关系,变量U与V之间呈负相关关系,X与Y之间的相关性弱于U与V之间的相关性.故选:C.5.下列命题中正确的为()A.相关系数r越大,两个变量的线性相关性越强 B.相关系数r越小,两个变量的线性相关性越弱C.残差平方和越小的模型,拟合的效果越好 D.用相关指数R2来刻画回归效果,R【解题思路】根据“残差”的意义、线性相关系数和相关指数的意义,即可作出正确的判断.【解答过程】相关系数的绝对值r越接近于1,两个变量的线性相关性越强,所以A,B错误;残差平方和越小的模型,拟合的效果就越好,所以C正确;用相关指数R2来刻画回归效果,R故选:C.6.若已知i=1nxi−x2是i=1nyiA.21.2 B.1.22 C.0.92【解题思路】根据相关系数公式计算可得;【解答过程】解:r=i=1n7.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到回归直线方程y=b1x+a1,相关系数为r1;方案二:剔除点10,32,根据剩下的数据得到回归直线方程A.0<r1<C.−1<r1<【解题思路】根据相关系数的意义:其绝对值越接近1,说明两个变量越具有线性相关,以及负相关的意义作判断即可.【解答过程】由散点图可知这两个变量为负相关,所以r1<0,r2<0.因为剔除点10,32后,剩下点的数据更具有线性相关性,8.给出下列结论:在回归分析中(1)可用相关指数R2的值判断模型的拟合效果,R(2)可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)可用相关系数r的值判断模型的拟合效果,r越大,模型的拟合效果越好;(4)可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.以上结论中,不正确的是(

)A.(1)(3) B.(2)(3) C.(1)(4) D.(3)(4)【解题思路】由R2越大,模型的拟合效果越好,R2越大,模型的拟合效果越好,相关系数【解答过程】用相关指数R2的值判断模型的拟合效果,R用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故(2)不正确;可用相关系数r的值判断模型的拟合效果,|r|越大,模型的拟合效果越好,故(3)不正确;用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高,故(4)正确;故选:B.二.多选题9.在下列各量之间,存在相关关系的是(

).A.正方体的体积与棱长之间的关系B.一块农田的水稻产量与施肥量之间的关系C.人的身高与年龄之间的关系D.某户家庭用电量与电价之间的关系【解题思路】根据相关关系的定义直接判断即可.【解答过程】A和D中均是确定性关系,是函数关系;相关关系是一种非确定的关系,一块农田的水稻产量与施肥量有关,是相关关系,故B正确;人的身高与年龄有关,是相关关系,故C正确故选:BC.10.某同学用搜集到的六组数据xi,yii=1,2,⋯,6绘制了如下散点图,在这六个点中去掉BA.决定系数R2变小 B.相关系数rC.残差平方和变小 D.解释变量x与预报变量y相关性变弱【解题思路】从图中分析得到去掉B点后,回归效果更好,再由决定系数,相关系数,残差平方和和相关性的概念和性质作出判断.【解答过程】从图中可以看出B点较其他点,偏离直线远,故去掉B点后,回归效果更好,决定系数R2越接近于1,所拟合的回归方程越优,故去掉B点后,R相关系数r越趋于1,拟合的回归方程越优,故去掉B点后,故相关系数r的绝对值越趋于1,B正确;残差平方和变小拟合效果越好,故C正确;解释变量x与预报变量y相关性增强,D错误.故选:BC.11.对两个变量x与y进行线性相关性和回归效果分析,得到一组样本数据:x1,yA.若所有样本点都在直线y=−x+1上,则两个变量的样本相关系数为r=1B.残差平方和越小的模型,拟合的效果越好C.若r越大,则变量x与y的线性相关性越强D.若r越小,则变量x与y的线性相关性越强【解题思路】根据相关系数r的定义及其意义,对选项逐一判断即可得到结果.【解答过程】当所有的样本点都在直线y=−x+1上时,样本点数据完全负相关,其相关系数r=−1,故A错误;残差平方和越小的模型,R2相关系数r值越大,则变量x与y的线性相关性越强,故C正确;相关系数r越小,则变量x与y的线性相关性越弱,D错误;故选:AD.12.某校高三1班48名物理方向的学生在一次质量检测中,语文成绩、数学成绩与六科总成绩在全年级中的排名情况如下图所示,“”表示的是该班甲、乙、丙三位同学对应的点.从这次考试的成绩看,下列结论正确的是(

)A.该班六科总成绩排名前6的同学语文成绩比数学成绩排名更好B.在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是语文C.数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强D.在甲、乙两人中,其语文成绩名次比其六科总成绩名次靠前的学生是甲【解题思路】结合图形可分析出答案.【解答过程】由图可得,该班六科总成绩排名前6的同学数学成绩比语文成绩排名更好,故A错误;由右图可得丙同学的总成绩排在班上倒数第三名,其语文成绩排在250到300名之间,从左图可得其数学成绩排在400名左右,故B正确;数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强,因为右图的点的分布较左图更分散,故C正确;由左图可得甲的总成绩排在班上第7名,年级名次100多一点,对应到右图可得,其语文成绩排在年级近100名,故甲的语文成绩名次比其六科总成绩名次靠前,由左图可得甲的总成绩排在班上第27名,年级名次接近250名,对应到右图可得,其语文成绩排在年级250名之后,故乙的语文成绩名次比其六科总成绩名次靠后,故D正确;故选:BCD.三.填空题13.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②学生与他(她)的学号之间的关系;③森林中的同一种树木,其断面直径与高度之间的关系;④曲线上的点与该点的坐标之间的关系.其中有相关关系的是①③.(填上你认为正确的所有序号)【解题思路】根据相关关系的定义,逐一判断即可.【解答过程】对于①,人的年龄与他(她)拥有的财富是一种不确定的相关关系;对于②,学生与他(她)的学号之间的关系是一种确定的对应关系,是映射,不是相关关系;对于③,森林中的同一种树木,其断面直径与高度之间的关系是一种不确定的关系,属于相关关系;对于④,曲线上的点与该点的坐标之间的关系是一一对应关系,不是相关关系.综上,其中有相关关系的是①③.故答案为:①③.14.对四组数据进行统计,依次获得如图所示的散点图.关于其相关系数的大小比较,将0、r1、r2、r3、r4从小到大排列,应为【解题思路】根据散点图直接求解即可.【解答过程】由散点图可知0<r3<故答案为:r215.变量X与Y相对应的一组数据为:(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,是则r1与r2的大小关系是【解题思路】根据题意给的数据可知变量Y与X之间的正相关、变量Y与X之间的正相关,进而可得r1>0、【解答过程】由变量X与Y相对应的一组数据为:(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5).可得:变量Y与X之间的正相关,因此r1而由变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可知:变量Y与X之间的正相关,∴r2<0.因此r1与r216.某中学统计了2011~2021这11年本校学生参加高考数学均分、英语均分、总分均分,得到如表所示的表格:年份20112012201320142015201620172018201920202021数学x(分)7577797480817783808281英语m(分)959810010110210310198107106100总分y(分)473481479485490487478492488493489从表中可知,数学和英语这两科中与总分相关性较高的是数学.【解题思路】根据相关系数公式计算可得.【解答过程】设数学学科和英语学科的相关系数分别为r1,r2,x=79,yi=111i=111i=111∴i=111xi−i=111i=111∴i=111mi−∵r1>r故答案为:数学.四.解答题17.判断下列两个变量之间是否具有相关关系:(1)月平均气温与家庭月用电量;(2)一天中的最高气温与最低气温;(3)某企业生产的一种商品的销量与其广告费用;(4)谷物的价格与牛肉的价格;(5)在公式LW=12中的L与W.【解题思路】根据相关关系的定义逐一判断即可.【解答过程】(1)月平均气温的高低不受家庭月用电量的影响,两个变量之间不具有相关关系;(2)一天中的最高气温不受最低气温的影响,两个变量之间不具有相关关系;(3)企业生产的一种商品的销量除了受其广告费用影响,还受其它因素影响,比如商品的质量等,因此这两个变量之间具有相关关系;(4)谷物的价格不受牛肉的价格影响,两个变量之间不具有相关关系;(5)在公式LW=12中,给定L一个值,W有唯一确定的值与之对应,是函数关系,不具有相关关系.18.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:使用年限x(单位:年)24568失效费y(单位:万元)34567根据上表数据,计算y与x的相关系数r,并说明y与x的线性相关性的强弱.(已知若0.75≤r≤1,则认为y与x线性相关性很强;若0.3≤r<0.75,则认为y与x线性相关性一般;若r<0.3,则认为y【解题思路】先求得y与x的相关系数r,再去判断y与x的线性相关性的强弱.【解答过程】由题表知,x=15i=15i=15xi所以r=i=1因为0.75≤r≤1,所以认为y与x的线性相关性很强.19.科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的样本数据,如下表:x(年龄/岁)26273941495356586061y(脂肪含量/%)14.517.821.225.926.329.631.433.535.234.6根据上表的数据得到下图的散点图.根据上表中的样本数据及其散点图,计算样本相关系数(精确到0.01),并描述它们的相关程度.附:参考数据:y=27,i=110xiyi=13527.8参考公式:相关系数r=i=1【解题思路】先求得样本相关系数,再去判断它们的相关程度.【解答过程】根据题表中的样本数据知,x=则样本相关系数r==13527.8−12690由样本相关系数r≈0.98,可以推断人体脂肪含量和年龄的相关程度很强.20.“海水稻”就是耐盐碱水稻,是一种介于野生稻和栽培稻之间的普遍生长在海边滩涂地区,具有耐盐碱的水稻,它比其它普通的水稻均有更强的生存竞争能力,具有抗涝,抗病虫害,抗倒伏等特点,还具有预防和治疗多种疾病的功效,防癌效果尤为显著.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x(‰)对亩产量y(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量y与海水浓度x之间的相关关系,用最小二乘法计算得y与x之间的线性回归方程为y=海水浓度xi34567亩产量yi0.620.580.490.40.31残差e(1)请你估计:当浇灌海水浓度为8‰时,该品种的亩产量.(2)①完成上述残差表:②统计学中,常用相关指数R2来刻画回归效果,R2越大,模型拟合效果越好,并用它来说明预报变量与解释变量的相关性.你能否利用以上表格中的数据,利用统计学的相关知识,说明浇灌海水浓度对亩产量的贡献率?(计算中数据精确到(附:残差公式ei=y【解题思路】(1)根据题意,算出x,y,将样本中心点x,y代入线性回归方程为(2)根据线性回归方程y=−0.08x+0.88和残差公式ei=yi−y【解答过程】(1)根据题意,可得x=3+4+5+6+75而y与x之间的线性回归方程为y=bx+0.88,则0.48=5当x=8时,y=−0.08×8+0.88=0.24(2)①由(1)知y=−0.08x+0.88,根据残差公式e海水浓度xi34567亩产量yi0.620.580.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论