第八章 8.1 成对数据的统计相关性_第1页
第八章 8.1 成对数据的统计相关性_第2页
第八章 8.1 成对数据的统计相关性_第3页
第八章 8.1 成对数据的统计相关性_第4页
第八章 8.1 成对数据的统计相关性_第5页
已阅读5页,还剩8页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Chapter8第八章成对数据的统计分析

§8.1成对数据的统计相关性

【学习FI标】1.结合实例,了解样本相关系数的统计含义2了解样本相关系数与标准化数据向

量夹角的关系.3.结合实例,会通过样本相关系数比较多经成对样本数据的相关性.

知识梳理梳理教材夯实基础

知识点一相关关系

1.相关关系的定义:两个变量有关系,但没有确切到可曰其中一个去精确地决定另一个的程

度,这种关系称为相关关系.

思考相关关系是函数关系吗?

答案不是.函数关系是唯一确定的关系.

2.相关关系的分类

⑴按变量间的增减性分为正相关和负相关.

①正相关:当一个变最的值增加时,另一个变显的相应值也呈现增加的趋势;

②负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势.

(2)按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).

①线性相关:如果两个变最的取值呈现正相关或负相关,而且散点落在一条直线附近,我们

称这两个变量线性相关;

②非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量

非线性相关或曲线相关.

知识点二相关关系的刻画

1.散点图:为了直观描述成对样本数据的变化特征,把每对成对样本数据都用直角坐标系中

的点表示出来,由这些点组成的统计图,叫做散点图.

2.样本相关系数

(1)我们常用样本相关系数r来确切地反映成对样本数据8,对的相关程度,其中r=

n__

E(为一*)(y-y)

ZQLx)2A/Z6'-,v)2

(2)样本相关系数,•的取值范围为匕1」].

①若「>0时,成对样本数据正相关;

②若/<0时,成对样本数据负相关;

③当忻越接近L时,成对样本数据的线性相关程度越强;

④当忻越接近0_时,成对样本数据的线性相关程度越弱.

■思考辨析判断正误----------------------------------------------------------------

1.函数关系是一种确定关系,而相关关系是一种不确定关系.(7)

2.样本相关系数r越大,两变量的相关性越强.(X)

3.散点图可以直观地分析出两个变量是否具有相关性.(V)

4.若变量占y满足函数关系,则这两个变量线性相关.(X)

题型探究探究重点提升素养

--------------------------------------------------N---------------

一、变量间相关关系的判断

例1(1)(多选)下列关系中,属于相关关系的是()

A.正方形的边长与面积之间的关系

B.农作物的产量与施肥量之间的关系

C.出租车费与行驶的里程

D.降雪晟与交通事故的发生率之间的关系

答案BD

解析A中,正方形的边长与面积之间的关系是函数关系;B中,农作物的产量与施肥量之

间不具有严格的函数关系,但具有相关关系;C为确定的函数关系;D中,降雪量与交通事

故的发生率之间具有相关关系.

(2)某种产品的广告支出费x与销售额),之间有如下对应数据(单位:百万元):

X24568

y3040605070

①IE1出散点图:

②从散点图中判断销售金额与广告支出费成什么样的关系?

解①以x对应的数据为横坐标,y对应的数据为纵坐标,所作的散点图如图所示.

024568A

②从图中可以发现广告支出费与销售金额之间具有相关关系,并且当广告支出费由小变大时,

销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系.

反思感悟两个变量是否加关的两种判断方法

(1)根据实际经聆■:借助积累的经脸进行分析判断.

(2)利用数点图:通过数点国,观察它们的分布是否存在一定的规律,直观地进行判断.如果

发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要

受个别点的位置的影响.

跟踪训练1(多选)在下列所示的四个图中,每个图的两个变量具有相关关系的图是()

答案BC

解析图A的两个变量具有函数关系;图BC的两个变量具有相关关系;图D的两个变量之

间既不是函数关系,也不是相关关系.

二'样本相关系数的性质

例2(1)甲、乙、丙、丁四位同学各自对A,6两变量的线性相关性做试验,并用I可归分折

方法分别求得样本相关系数,•如下表:

甲乙丙T

r0.820.780.690.85

则哪位同学的试验结果体现A,B两变量有更强的线性相关性()

A.甲B.乙C.丙D.丁

答案D

解析出越接近1,相关性越强,故选D.

(2)在一组成对样本数据为(X[,y\),(X2>>,2)>(xn,(心2,x\,及,…,x〃不全相等)的

散点图中,若这组成对样本数据的样本相关系数为一1,则所有的样本点(小W=l,2,

〃)满足的方程可以是()

A.y=-$+1B.y=x-1

C.y=x+lD.y=-x2-

答案A

解析•・•这组成对样本数据的样本相关系数为一1,

,这一组成对样本数据(K,V),(X2,沏,…,(X,,为)线性相关,且是负相关.

・•・可排除B,C,D,故选A.

反思感悟样本相关系数的性质

(1),•的绝对值越接近0,相关性越弱.

(2),的绝对值越接近1,相关性越强.

跟踪训练2(1)对变量x,y有成对样本数据叫,y)(i=l,2,…,10),得散点图图1;对变量

u,。有成对样本数据(〃”V,)(/=1,2,10),得散点图图2.由这两个散点图可以判断()

25

2:)

15

1:)

O1234567xO1234567”

图1图2

A.变量x与),正相关,〃与。正相关

B.变量x与),正相关,〃与o负相关

C.变量x与y负相关,〃与0正相关

D.变量x与y负相关,〃与。负相关

答案C

解析由这两个散点图可以判断,变量x与),负相关,〃与。正相关.

(2)(多选)对两个变量的样本相关系数r,下列说法正确的是()

A.M越大,相关程度越大

B.忻越小,相关程度越大

C.|r|趋近于。时,没有线性相关关系

D.H越接近1时,线性相关程度越强

答案AD

解析对于A,|r|越大,相关程度越大,A正确;对于B,忻越小,相关程度越小,B错误;

对于C.|r|趋近于0时,线性相关关系越弱,C错误:对于D,|r|越接近1时,线性相关程度

越强,D正确.综上,正确的是AD.

三、样本相关系数的计算及应用

例3某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:

⑴画出。,历的散点图:

(2)计算x与),之间的样本相关系数,并刻画它们的相关程度.

解(1)画出(x,y)的散点图如图所示.

24

(2)x=5,y=47.5,

444

£W=120,Zy?=9900,£物=1080,

2>通一4xy

故样本相关系数r=­/一

A/(E-V—4x2)(Z.vr—4y2)

\i=\i=\

1080-4X5X47.5

-0.9827.

A/(120-4X52)(9900-4X47.52)

由样本相关系数,•g0.9827,可以推断生产原料耗费与销售额这两个变量正线性相关,且相

关程度很高.

反思感悟线性相关强弱的判断方法

⑴散点图:散点图只是粗略作出判断,其图象越接近直线,相关性越强.

(2)样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关性越强.

跟踪训练3假设关于某种设备的使用年限x(单位:年)与所支出的维修费用M单位:万元)

有如下统计资料:

X23456

y2.23.85.56.57.0

计算y与x之间的样本相关系数(精确到0.001,已知%=9(),三廿140.8,£r^=H2.3,V79

28.9,6Q1.4).

M—2+3+4+5+6

解,:X=--------7------=4,

—2.2+3.8+5.5+6.5+7.0

>'=5=5.

5______

5KJ=112.3-5X4X5=12.3,

£导—5”=90-5X42=10,

5-

S>7-5y2=140.8—125=15.8,

£必一5xv

G二^—^10X15.8V158&X®1.4X8.9

\(>孑-5x2)(£yH5y2)

随堂演练----------基-础-巩-固、学-以-致-用-

1.(多选)下列命题正确的是()

A.任意两个变量都具有相关关系

B.圆的周长与该圆的宜径具有相关关系

C.某商品的需求最与该商品的价格是一种非确定性关系

D.当两个变量相关且样本相关系数,>0时,表明两个变量正相关

答案CD

解析A显然不对,B是函数关系,CD正确.

2.若变量),与x之间的样本相关系数厂=-0.9832,则变量y与.丫之间()

A.不具有线性相关关系

B,具有线性相关关系

C.它们的线性相关关系还需要进一步确定

D.不确定

答案B

解析变量y与x之间的样本相关系数「=一0.9832,仍=0.9832接近1,样本相关系数的绝

对值越大,相关性越强,,变量),与x之间有较强的线性相关关系,故选B.

3.两个变量x,y的样本相关系数n=0.7859,两个变量〃,。的样本相关系数门=-0.9568,

则下列判断正确的是()

A.变量x与),正相关,变量〃与。负相关,变量x与y的线性相关性较强

B.变量x与),负相关,变量〃与。正相关,变量x与),的线性相关性较强

C.变量x与),正相关,变量〃与。负相关,变量〃与。的线性相关性较强

D.变量x与y负相关,变星u与v正相关,变量”与V的线性相关性较强

答案C

解析由样本相关系数力=0.7859>0知工与),正相关,由样本相关系数,2=-0.9568<0知",

。负相关,又|川<比|,・••变量〃与。的线性相关性比x与y的线性相关性强.故选C.

4.据两个变量x,),之间的成对样本数据画出散点图如图,这两个变量是否具有线性相关关

系.(填“是”或“否”)

答案否

解析图中的点分布杂乱,两个变量不具有线性相关关系.

5.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):

固定资产价值33566789910

工业增加值15172528303637424045

根据上表资料计算的样本相关系数约为.

答案0.9918

皿「—3+3+5+6+6+7+8+9+9+10

解析x=------------------------------------------=6.6,

—15+17+25+28+30+36+37+42+40+45

y=m=31.5.

10

1.知识清单:

(1)相关关系.

(2)散点图.

(3)正相关、负相关、线性相关、非线性相关.

(4)样本相关系数.

2.方法归纳:数形姑合.

3.常见误区:相关关系与函数关系不分,样本相关系数绝对值的大小与相关程度的关系.

课时对点练注重双基强化落实

--------------------------------N-----------

力基础巩固

1.若“名师出高徒”成立,则名师与高徒之间存在什么关系()

A.相关关系B.函数关系

C.无任何关系D.不能确定

答案A

2.(多选)给出下列关系,其中有相关关系的是()

A.人的年龄与他(她)拥有的财富之间的关系

B.曲线上的点与该点的坐标之间的关系

C.苹果的产量与气候之间的关系

D.森林中的同一种树木,其截面直径与高度之间的关系

答案ACD

3.两个变量的相关关系有①正相关,②负相关,③不相关,则卜.列散点图从左到右分别反映

的变量间的相关关系是()

A.①②③B.②③①C.②①③D.①③②

答案D

解析对于(1),图中的点或带状分布,且从左到右上升,是①正相关关系;对于(2),图中的

点没有明显的带状分布,是③不相关;对于(3),图中的点成带状分布,且从左到右是下降的,

是②负相关关系.故选D.

4.(多选)某校地理学兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图

如图所示,则下列说法正确的是()

海拔高度(单位:千米)

A.沸点与海拔高度呈正相关

B.沸点与气压呈正相关

C.沸点与海拔高度呈负相关

D.沸点与海拔高度、沸点与气压的相关性都很强

答案BCD

解析由左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸

点与气压呈正相关,沸点与海拔高度呈负相关,由于两人散点图中的点都成线性分布,所以

沸点与海拔高度、沸点与气压的相关性都很强,故B,C,D正确,A错误.

5.变量X与丫相对应的一组成对样本数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变

量U与V相对应的一组成对样本数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).可表示变

量y与x之间的样本相关系数,冷表示变量v与u之间的样本相关系数,则()

A.r2<r)<0B.0</'2<ri

C.r2<0<nD.n=r2

答案C

解析由已知中的数据可知:第一组成对样本数据正相关,则样本相关系数大于零,第二组

成对样本数据负相关,则样本相关系数小于零,故选C.

6.如图所示的两个变量不具有相关关系的有.(填序号)

答案①④

解析①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条

直线周围;④中点的分布没有任何规律可言,A-,y不具有相关关系.

7.给出下列x,y值的数据如下:

X1248

y35917

则根据数据可以判断k和y的关系是.(填“确定关系”“相关关系”或“没有关

系”)

答案确定关系

解析由表中数据可以得到x,),之间是一种函数关系:y=2x+l,所以x,y是一种确定的

关系,即函数关系.

8.对某高三学生在连续9次数学测试中的成绩(单位:分)进行统计得到如图所示的散点图.下

面关于这位同学的数学成绩的分析中,正确的序号有.

130•・

120•.

110-・.

100.*.*

9()•,

j:...........................——►

°123456789测9号

①该同学的数学成绩总的趋势是在逐步提高;

②该同学在这连续九次测试中的最高分与最低分的差超过40分;

③该同学的数学成绩与测试序号具有线性相关性,且为正相关.

答案①②③

解析散点图从左向右看呈上升趋势,所以该同学的数学成绩总的趋势是在逐步提高,①正

确;该同学在这连续九次测试中的最高分大于130分,最低分小于90分,极差超过40分,

②正确;该同学的数学成绩与测试序号具有比较明显的线性相关性,且为正相关,③正确.

9.某个男孩的年龄与身高的统计数据如下表所示:

年龄M岁)123456

身高Mem)788798108115120

⑴画出散点图;

(2)判断),与x是否具有线性相关关系,如果相关,是正相关还是负相关.

解(1)散点图如图所示.

y

120.•

110・

10()・

90・

80・

70

0i23456~x

(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系,且是正相

关关系.

10.关于两个变量x和),的7组数据如下表所示:

X2i232527293235

y711212466115325

求变量),与X的样本相关系数,并判断变量与X之间是正相关还是负相关.

解T=/21+23+25+27+29+32+35)^27.4,

~=1(7+II+21+24+66+115+325)=81.3,

笠=2卜+232+252+272+292+322+35』5414,

产।

7

£蛤州=21X7+23X11+25X21+27X24+29X66+32X115+35X325=18542,

ri

7

Z>?=724-1124-2124-2424-662+1152+3252=124393,

7

18542-7X27.4X81.3

一、(5414—7X274)(124393—7X81了)

2948.66…一

~3520.92杵0・8375.

•・">0,・••变量y与工之间是正相关关系.

叶综合运用

11.两个变量y与x的模型中,分别选择了4个不同模型,它们的样本相关系数,•如下,其

中拟合效果最好的模型是()

模型模型1模型2模型3模型4

样本相关系数r0.980.800.500.25

A.模型1B.模型2C.模型3D.模型4

答案A

12.某统计部门对四组成对样本数据进行统计分析后,获得如图所示的散点图,关于样本相

关系数的比较,其中正确的是()

样本相关系数为八样本相关系数为

(1)(2)

()V

510152()2530355101520253()35

样本相关系数为C样本相关系数为A

(3)(4)

A.心<「2<0<小<-3B.,2<,4<0<〃<门

C.7<2<r4<0<门<外D./<4<r2<0<r3<ri

答案C

解析根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关:

数据越集中在一条直线附近,说明相关性越强,由题中数据可知:(1)(3)为正相关,(2)(4)为

负相关,故门>0,广2<0,心<0,又(1)与⑵中散点图更接近于一条直线,故门打3,力<「4,

因此「2<=4<0<门5.故选C.

13.如图所示,有5组(X,),)数据,去掉哪一组数据之后,剩下的4组数据成线性相关关系()

•D

•E

Ox

A.EB.DC.BD.月

答案B

解析去掉。组数据之后,剩下的4组数据成线性相关关系.

14.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全

年级的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看:

(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是;

(2)在语文和数学两个科目中,内同学的成绩名次更靠前的科目是.

答案(1)乙(2)数学

解析(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是乙;(2)由高三年级

267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级的排名情

况的散点图可知,两个图中,同一个人的总成绩是不会变的.第二个图看,丙是从右往左数

第5个点,即丙的总成绩在班里倒数第5.在左边的图中,找到倒数第5个点,它表示的就是

丙,发现这个点的位置比右边图中丙的位置高,所以语文名次更“大”,即数学的成纸更靠

前.

g拓广探究

15

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论