成对数据的统计相关性(原卷版)_第1页
成对数据的统计相关性(原卷版)_第2页
成对数据的统计相关性(原卷版)_第3页
成对数据的统计相关性(原卷版)_第4页
成对数据的统计相关性(原卷版)_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.1成对数据的统计相关性

【知识点梳理】

1.相关关系

两个变量间的关系有函数关系,相关关系和不相关关系

两个变量有关系,但乂没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.

2.止相关、负相关

从整体上看,当一个变量的值坞加时,另一个变量的相应值乜呈现增加的趋势,我们就称这两个变量止

相关;如果一个变量值增加时,另一个变量的相应值呈现减少的趋势,则称这个两个变量负相关.

3.线性相关

一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条线附近,我们就称这两个变量线

性相关.

一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.

4.相关系数「的计算

注意:相关系数是研究变量之间线性相关程度的量

假设两个随机变量的数据分别为(乃,V),(K2,),2),…,(&,%),对数据作进一步的“标准化处理”处理,

用“=y三工(为一x)2,»=、(y—y)2分别除x和%—J(i=1,2,…,〃,工和1y分别为M,

X2,…,心和V,儿,…,%的均值),得£二,匕£|,k二C由二£|,…,L=,包二21,为简单起

见,把上述“标准化”处理后的成对数据分别记为(即‘,巾),(X2%过),…,W,四),则变量X和变量),的样

本相关系数,•的计算公式如下:

一]®'V'+x2'”'+...+xJ/J)

g(x/—x)(y-y)

(1)当/>0时,称成对样本数据正相关;当代0时,成对样本数据负相关:当r=0时,成对样本数据间

没有线性相关关系.

(2)样本相关系数r的取值范围为[-1,1].

当|r|越接近1时,成对样本数据的线性相关程度越强;

当IH越接近0时,成对样本数据的线性相关程度越弱.

6.样本相关系数与标准化数据向量夹角的关系

r=%y=,1WcosJ=cos。(其中7=(媒,W....xJ),V=(W,城),M|=W=/,。为向量

V和向量V的夹角).

【典型例题】

题型一相关关系的理解

例I.(2021.全国•高二课时练习)下列两个变量间的关系,是相关关系的是()

A.任意实数和它的平方B.圆半径和圆的周长

C.正多边形的边数和内角度数之和D.天空中的云量和下雨

规律方法函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种

因果关系,而相关关系不一定是因果关系,也可能是伴随关系.

例2.(2021・全国•高二课时练习)有几组变最:①汽车的重最和汽车每消耗1升汽油所行驶的平均路程;②

平均口学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是()

A.①@B.②③

C.②D.③

例3.(2021•江西南昌•高一期末)对两变量间的关系,下列论述正确的是()

A.任何两个变量都具有相关关系

B.正方形的面积与该正方形的边长具有相关关系

C.农作物的产量与施化肥量之间是一种确定性关系

D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系

题型二散点图与相关性

例4.(2021•全国•窗课时练习)如下四个散点图中,正相关的是()

规律方法判断两个变量X和间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点

的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影

响.

例5.(2020・全国•高二单元测试(理))有一个食品商店为了调查气温对热饮销售的影响,经过调查得到关

于卖出的热饮杯数与当天气温的数据如下表,绘出散点图如下.通过计算,可以得到对应的叵归方程),=

-2.352x4-147.767,根据以上信息,判断下列结论中正确的是()

7

80

60

40

20

00

80

60

40

20

A.气温与热饮的销售杯数之间成正相关

B.当天气温为2℃时,这天大约可以卖出143杯热饮

C.当天气温为这天恰卖出124杯热饮

D.由于x=0时,),的值与调查数据不符,故气温与卖出热饮杯数不存在线性相关性

例6.(2020・云南・罗平县第二中学高二期末(文))已知某次考试之后,班主任从全班同学中随机抽取一个

容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表,对应散点图如图所示:

学生编号17345678

数学成绩6065707580859095

物理成绩7277808488909395

物理成绩/分

100

90

80.・

70•

60

501~•一一■一^-----------------------------

5060708090100数学成绩/分

根据以上信息,则下列结论:

①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;

②根据散点图,可以判断数学成绩与物理成绩具有•次函数关系;

③从全班随机抽取2名同学(记为甲、乙),若甲同学的数学成绩为80分,乙同学的数学成绩为60分,则

可以判断出甲同学的物理成绩一定比乙同学的物理成绩高;

④从全班随机抽取2名同学(记为甲、乙),若甲同学的数学成绩为80分,乙同学的数学成绩为60分,则

不能判断出甲同学的物理成绩一定比乙同学的物理成绩高;

其中正确的个数是()

A.1B.2C.3D.4

题型三散点图及其应用

例7.(2021•全国•高二课时练习)两对变量A和丛C和。的取值分别对应如表1和表2,画出散点图,分

别判断它们是否具有相关关系;若具有相关关系,说出它们相关关系的M别.

表1

A261813104-1

B202434385064

表2

C05101520253035

D541.67602.66672.09704.99806.71908.59975.421034.75

规律方法1.画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画

不在,使图形失真,导致得出错误结论.

2.在这里利用散点图直观感知事物的形态与变化,理解事物间的关联及变化规律,是数学核心素养直观

想象的具体体现.

题型四线性相关性的检验

例8.(2021・全国•高二课时练习)两对变量A和8,。和。的取值分别对应如表1和表2,画出散点图,分

别判断它们是否具有相关关系:若具有相关关系,说出它们相关关系的区别.

表1

A261813104-1

B202434385064

表2

C05101520253035

D541.67602.66672.09704.99806.71908.59975.421034.75

例9.(2021・全国•高二课时练习)某个男孩的年龄与身高的统计数据如下表所示.

年龄女(岁)123456

身高y(cm)788798108115120

(1)画出散点图:

(2)判断),与x是否具有线性相关关系.

例10.(2021•江苏•高二课时练习)有人收集了某城市居民年收入(即所有居民在一年内收入的总和)与A商

品销售额的10年数据,如表.

第〃年12345678910

居民年收入/亿元32.231.132.935.837.138.039.043.044.646.0

A商品销售额/万元25.030.034.037.039.041.042.044.048.051.0

画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断居民年收入与A商品销售额的相

关程度和变化趋势的异同.

题型五判断线性相关的强弱

例11.(2021.全国•高二课时练习)某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进

行整理得到了第x年与年销量)’(单位:万件)之间的关系如表:

X1234

y12284256

在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它们的相关程度.

,M万件)

60•

50■

40

30■

20

10

31234x

附注:参考数据:胶(』-方、32.6,6=2.24,1>戊=418.

V>=1注1

参考公式:相关系数,=n----------------

规律方法当相关系数H越接近1时,两个变量的相关关系越强,当相关系数”越接近。时.,两个变量的

相关关系越弱.

例12.(2021•吉林吉林•三模(文))2020年是决胜全面建成小康社会、决战脱贫攻坚之年,面对新冠肺炎疫

情和严重洪涝灾害的考验.党中央坚定如期完成脱贫攻坚目标决心不动摇,全党全社会戮力同心真抓实干,

取得了积极成效.某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积x与

相应的管理时间)'的关系如下表所示:

土地使用面积

12345

X(单位:亩)

管理时间)(单811142423

位:月)

并调杳了某村30()名村民参与管理的意愿,得到的部分数据如下表所示;

愿意参与管理不愿意参与管理

男性村民14060

女性村民40

(1)做出散点图,判断土地使用面积x与管理时间了是否线性相关;并根据相关系数,•说明相关关系的强

弱.(若|r|20.75,认为两个变量有很强的线性相关性,〃值精确到0.001).

(2)若以该村的村民的性别与参与管理黄风的情况估计贫困具的情况,口.每位村民参与管理的竟互不影响,

则从该贫困县村民中任取3人,记取到不愿意参与管理的女性村民的人数为X,求X的分布列及数学期望.

参考数据:?=16,X(-V)2=206,7515«22.7

例13.(2019・全国•高三专题练习(文))春节期间,由于高速免贽,车流量逐步增加,某高速口统计了5天

中的车流量与空气质量指数的关系,所得数据如卜表所示:

车流量X(万辆)1212.51313.514

空气质量指数y7476787780

(I)在下列网格纸中绘制出散点图;

1212J131I514

(2)由(1)判断是否能用线性回归模型拟合),与x的关系,并用相关系数加以说明;

(3)记这5天的空气质量指数的平均数为5,若从5天中任选2天的数据作调研,求这2天中恰有1天的

空气质量指数高于5的概率.

工(斗-君(州一刃

参考公式:相关系数r=.参考数据:71=1.414,岳=2236,V10«3.162.

【同步练习】

一、单选题

1.(2021•全国•高二课时练习)某次考试之后,班主任从全班同学中随机抽取8位同学,他们的数学、物理

成绩(单位:分,满分100分)的散点图如图所示:

物理成绩/分

100・

90

80•,

70・

60

5°5060708090100数学成绩/分

根据以上信息,有下列结论:

①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系:

②从全班同学中随机抽取2名同学(记为甲、乙),若甲同学的数学成绩为80分,乙同学的数学成绩为60

分,则可以判断出甲同学的物理成绩一定比乙同学的物理成绩高;

③从全班同学中随机抽取2名同学(记为甲、乙),若甲同学的数学成绩为8()分,乙同学的数学成绩为60

分,则不能判断出甲同学的物理成绩一定比乙同学的物理成绩高.

其中正确的个数是()

A.0B.1C.2D.3

2.12022•四川省内江市第六中学高二开学考试(文))如图,是对某位同学一学期8次体育测试成绩(单位:

分)进行统计得到的散点图,关于这位同学的成绩分析,下列结论错误的是()

B.该同学8次测试成绩的众数是48分

C.该同学8次测试成绩的中位数是49分

D.该同学8次测试成绩与测试次数具有相关性,且呈正相关

3.(2021.全国•高二课时练习)已知变量X与y相对应的一组数据为(10,1),(11.3,2),(11.83),(12.5,4),

(13,5),变量U与V相对应的一组数据为(1数5),(11.3,4),(11.8,3),(12.5,2),(13,1).4表示变量X与丫

之间的线性相关系数,4表示变量U与丫之间的线性相关系数,则下列结论中正确的是()

A,4<4<0B,0<与<耳C.4<0<4D.弓=4

4.(2021・广西・玉林市育才中学高二阶段练习)己知。表示变量X与丫之间的线性相关系数,72表示变量U

与力之间的线性相关系数,且,=。837,•0957,则()

A.变量x与丫之间呈正相关关系,且x与y之间的相关性强于u与V之间的相关性

B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性

c.变量u与v之间呈负相关关系,日x与y之间的相关性弱干u与v之间的相关件

D,变量u与V之间呈正相关关系,且x与丫之间的相关性弱二u与v之间的相关性

5.(2021・全国•高二课时练习)下列说法错误的是()

A.正方体的体积与棱长之间的关系是函数关系

B.人的身高与视力之间的关系是相关关系

C.汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关

D.体重与学习成绩之间不具有相关关系

6.(2021・全国•高一课时练习)最新《交通安全法》实施后,某市管理部门以周为单位,记录的每周查处的

酒驾人数与该周内出现的交通事故数量如下:

酒驾人数X801471211009610387

交通事故)’19313023252420

通过如表数据可知,酒驾人数上与交通事故数)'之间是()

A.正相关B.负相关C.不相关D.函数关系

7.(2021•全国•高一课时练习)如图,5个(尤、)数据,去掉。(3,10)后,下列说法错误的是()

惮.E(10s12)

•ZX3,10)

OX

A.4与y的相关性变强B.残差平方和变大

C.相关指数&变大D.解释变量X与预报变量y的相关性变强

8.(2019•四川•高考模拟(理))下列说法中错误的是

A.先把高二年级的1000名学生编号为1到1000,再从编号为1到50的50名学生中随机抽取1名学生,其编

号为〃"然后抽取编号为"7+5(),〃?+l(X),m+150……的学生,这样的抽样方法是系统抽样法.

B.正态分布N(l,9)在区间(-1,0)和(2,3)上取值的概率相等

C.若两个随机变量的线性相关性越强,则相关系数,•的值越接近于1

D.若一组数据1、。、2、3的平均数是2,则这组数据的众数和中位数都是2

二、多选题

9.(2021・全国•高二单元测试)根据下曲四个散点图中点的分布状态,可以直观地判断两个变量之间具有线

性相关关系的是()

10.(2021.仝国•高二课时练习)下列关于相关系数「的说法中,正确的是()

A.相关系数,・越大,两个变量间线性相关性越强

B.相关系数,•的取值范围是[7』

C.相关系数厂>0时两个变量正相关,厂<0时两个变量负相关

D.相关系数r=1时,样本点在同一直线上

11.(2021•广东广雅中学高三阶段练习)如图是国家统计周公布的2020年下半年快递运输量情况,请根据

图中信息选出正确的选项()

832527.2

A.2020年下半年,每个月的异地快递量部是同城快递量的6倍以上

B.202()年10月份异地快递增长率小于9月份的异地快递增长率(注.增长率指相对前一个月而言)

C.2020年下半年,异地快递量与月份呈正相关关系

D.2020年下半年,同城和异地快递量最高均出现在11月

12.(2021・全国•高二课时练习)为了检验变量%与>的线性相关程度,由样本点(/%),(%外),…,

(XKPXO)求得两个变量的样本相关系数为小则下列说法错误的是()

A.若所有样本点都在直线),=-2x+l上,则r=1

B.若所有样本点都在直线),=-2万+1上,则厂二一1

C.若卜|越大,则变量x与),的线性相关程度越强

D.若卜|越小,则变量上与>的线性相关程度越强

三、填空题

13.(2021.全国•高二课时练习)在一组样本数据(为,y),伍,了2),…,(天,匕)(〃?2小,/、…,/不全相

等)的散点图中,若所有样本点(4,)。=1,2,3「、〃)都在直线21+),-1=0上,则这组样本数据的相关系

数,为.

14.(2021・全国•高二课时练习)若变量x和),满足关系R-0.6X+1,变量),与z正相关,则工与z

相关.

15.(2021・全国•高二课时练习)如图,有5组(北),)数据,去掉点对应的数据后,剩下的4组数据

的线性相关程度最大.

12•£(10,12)

11

10•0(3,10)

9

8

7

6

5.C(4,5)

4.・8(2,4)

3)(1.3)

2

O123456789101112

16.(2021・全国•高二单元测试)对两个变量的相关系数,,有下列说法:(1)卜|越大,相关程度越大;(2)

卜|越小,相关程度越大;(3)年|趋近于0时,没有非线性相关系数;(4)卜|越接近于1时,线性相关程度

越强,其中正确的是.

四、解答题

17.(2022・全国•高二课时练习)互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不

可或缺的一部分,某市一调查机构制对该市市场占有率较高的甲,乙两家网络外卖企业(以下称外卖印、

外卖乙)的经营情况进行了调查,调查结果如下表:

1日2日3日4R5R

外卖甲日接单工(百单)529811

外卖乙日接单)’(百单)2310515

(1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况;

(2)据统计表明,y与X之间具有线性相关关系,请用相关系数,-对y与X之间的相关性强弱进行判断;(若

1-1>0.75,则可认为y与X有较强的线性相关关系,「值精确到0.001)

参考数据:£(七一可5-方=66,Jta-对£(y-寸=77.

Vr-|,-1

18.(2021・全国•高二课时练习)某生物小组为了研究温度对某和酶的活性的影响进行了一组实验,实验数

据经整理得到如下的折线图:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论