版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.1成对数据的统计相关性
◎素养目标•定方向®
・・•・・・・・・・•・・・・・・・・・・••・・・・・・•・・,・・・・・・・・・・・•・•・・・・・・・・・•・・・・・・・・・・•・•
学习目标
1.结合实例了解样本相关系数的统计含义.
2.了解样本相关系数与“标准化”成对数据向量夹角的关系.
3.结合实例,会通过相关系数比较多组成对数据的相关性.
核心素养
1.通过画散点图来判断变量的相关关系,提升数据分析素养.
2.通过样本相关系数的计算,培养数学运算及逻辑推理素养.
日必街知识•探新知④
.....・・・・・・••・・・・・・・・・・・♦・・・♦・・・・・・・♦・・・・・
知识点1变量的相关关系
(1)两个变量的关系
分类函数关系相关关系
两个变量有关系,但乂没有确切到可由其
特征两变量有速置-的关系
中一个去精确地决定另一个的程度
(2)散点图:将样本中的每一个序号下的成对数据用成角坐标系中的点表示出来得到的
统计图.
(3)正相关与负相关
正相关负相关
当个变量的值增加时,另个变量的相应值当个变量的值增加时,另个变量的相应值
也呈现增加的趋势呈现减少的趋势
(4)线性相关:如果两个变量的取值呈现正,相关或负相关,而且散点落在二附近,
则称这两个变量线性相关.
想一想:正相关与负相关是对所有具有相关关系的两个变量而言的,对吗?
提示:不对,正相关与负相关是针对线性相关关系而言的.
练一练:
下列两个变量之间的美系是相关关系的是(D)
A.正方体的棱长和体积
B.单位圆中角的弧度数和所对弧长
0.当亩产量为常数时,土地面积和总产量
D.日照时间与水稻的亩产量
[解析]选项A,B,C中两个变量之间是函数关系,选项D中两个变量之间是相关关系.
知识点2样本的相关系数
n____
Z(X,—x)(y/—y)
⑴相关系数:统计学里一般用r=I
'Z(XL*)二(//—y)'
\//-I/-I
^Xiyi-nxy
—/来衡量P与x的线性相关性的强弱,这里的「称为样本相关
A/(Z。一〃x')(^y,—ny2)
\//=>
系数(简称相关系数).
⑵相关系数的性质
1r〉0时,成对数据正相关;出时,成对数据负相关,
"I越小,两个变量之间的线性相关程度越遹_,1川越大,两个变量之间的线性相关程
2
度越强.
lrl=l时,成对数据构成的点都在一条确定的直线上.
练一练:
对四组不同数据进行统计,获得如图所示的散点图,对它们的样本相关系数进行比较,正
确的是(A)
35
3()
25
20
15
10
5
0
05101520253035
①样本相关系数n
35
3()
2s
20
15
10
5
0
05101520253035
②样本相关系数乃
35
3()
25
20
15
1()
5
0
05101520253035
③样本相关系数n
35
3()
25
20
15
10
5
0
05101520253035
④样本相关系数八
A.水水0<0"B.八<及<0<力<?%
C.ri<n<0<n<nD.Z2<n<0</'i<n
[解析]由给出的四组数据的散点图可以看出,图①和图③中的成对数据是正相关的,样
本相关系数大于0,图②和图④中的成对数据是负相关的,样本相关系数小于0,图①和图②中
的点相对更加集中于一条直线附近,所以相关性更强,所以n接近于1,尼接近于一1,由此可
得调<T<0<r3Gl.
®关建能力-攻重难®
................................................................
题I型I探I究
题型一相关关系的判断
典例1(多选)下列选项中,两变量间具有相关关系的是(ACD)
A.一个人的身高与他(她)的体重之间的关系
B.曲线上的点与该点的坐标之间的关系
C.苹果的产量与气候之间的关系
D.森林中的同一种树木,其横断面直径与高度之间的关系
[分析]直接利用相关关系的定义逐一判断即可.
[解析]选项A,一般地,人的身高与体重是一种相关关系;选项B,曲线上的点与该点的
坐标是一种确定的对应关系,不是相关关系;选项C,苹果的产量与气候之间的关系是一种相
关关系;选项D,森林中的同一种树木,其横断面直径与高度之间的关系是相关关系.
[规律方法]对相关关系的理解
(1)相关关系与函数关系是两种不同的变量关系,函数关系是一种确定性关系,可以用一个
变量确切地表示另一个变量;相关关系是一种非确定性关系,两个变量虽然有关系,但又没有
确切到可由其中一个去精确地决定另一个的程度.
(2)根据变量变化趋势可将相关关系分为正相关和负相关:根据变量分布特征可将相关关系
分为线性相关和非线性相关(曲线相关).
■1。对点训练❶下列五组变量:
①匀速行驶的汽车行驶的路程和行驶的时间;②学生的平均日学习时间和平均学习成绩;
③某人每日吸烟量和其身体健康情况:④正方形的边长和面积:⑤汽车的重量和百公里耗油量.
其中两个变量正相关的是(C)
A.①③B.②④
C.②⑤D.④⑤
[解析]①④中两个变量是确定的函数关系,③中两个变量负相关,只有②⑤中两个变量
正相关.
题型二由散点图判断相关关系
典例2如图所示的散点图分别反映的变量间的相关关系是(D)
A.正相关,负相关,不相关
B.负相夫,不相关,正相夫
C.负相关,正相关,不相关
D.正相关,不相关,负相关
[分析]分别分析三个散点图中的点的分布情况,可得第一个图中两个变量正相关,第二
个图中两个变量不相关,第三个图中两个变量负相关.
[解析]对于图(D,图中的点成带状分布,且从左到右上升,两个变量正相关:对于图(2),
图中的点杂乱无章,没有明显的规律,两个变量不相关;对于图(3),图中的点成带状分布,且
从左到右卜.降,两个变量负相关.故选D.
[规律方法]判断两个变量具有相关关系的方法
(1)根据直观感觉或生活经验等判断;(2)根据成对数据的变化趋势判断;(3)根据散点图判
断:若散点图中各点分布在一条直线或曲线附近,则变量具有相关关系.
由散点图判断两个变量正、负相关的方法
如果散点图中的点落在从左下角到右上角的区域,两个变量正相关;如果散点图中的点落
在从左上角到右卜.角的区域,两个变量负相关.
由散点图判断线性相关程度强弱的方法
在散点图中,散点在某条直线附近越集中,两个变量的线性相关程度越强;散点在某条直
线附近越分散,两个变量的线性相关程度越弱.
对点训练❷⑴对变量筋V由观测数据(方,匕)(/=1,2,…,10),得散点图①;
对变量〃,。由观测数据(①,匕)(/=1,2,10),得散点图②.由这两个散点图可以判断(C)
306()
25•5()
20#••4()
3()
15,•20
1010
5-••
Oi234567^
①②
A.变量*与卜正相关,〃与I,正相关
B.变量x与y正相关,〃与『负相关
C.变量x与y负相关,〃与/正相关
D.变量不与y负相关,〃与/负相关
[解析]由图①可以看出,散点图在从左上角到右下角的带状区域内,所以变量x与y负
相关;由图②可知,散点图在从左下角到右上角的带状区域内,所以变量〃与/正相关.
(2)卜.列散点图中,两个变量线性相关程度最强的是(A)
[解析]对于A选项,散点图中的点成带状分布,且集中分布在一条直线附近,所以两个
变量具有较强的线性相关关系;对于B,C,D选项,散点图中的点成片状分布,两个变量的线
性相关程度较弱或不具有线性相关关系.故选A.
题型三样本相关系数
典例3(1)对于样本相关系数/•来说,下列说法正确的是(C)
A.|r|<l,|r|越接近0,相关程度越强;bl越接近1,相关程度越弱
B.Irl^l,|川越接近1,相关程度越强;IH越大,相关程度越弱
C.|r|^l.I川越接近1,相关程度越强:越接近0,相关程度越弱
D.|r|>l,|川越接近1,相关程度越弱;)1越大,相关程度越强
[解析]用样本相关系数/•可以衡量两个变量之间线性相关程度的强弱,IrlWl,W越接
近1,表示两个变量之间的线性相关程度越强:bl越接近0,表示两个变量之间的线性相关程
度越弱.故选C.
(2)为了对2023年某校月考成绩进行分析,在60分以上的全体同学中随机抽取8位,他们
的数学、物理成绩对应如下表:
学生编号12345678
数学成绩X6872788185889193
物理成绩y7066818379809289
用变量y与x的样本相关系数N精确到0.0D说明物理成绩y与数学成绩X的线性相关程
度的强弱,并说明它们的变化趋势特征.
参考数据:2%凹=52957,A££-8x*ZJJ-8y2P545.82.
/=l
[分析]分别计算出x,y,然后求出样本相关系数广,用样本相关系数说明物理成绩与
数学成绩的相关程度.
「心上口68+72+78+81+85+88+91+93
[解析](2)*=-------------------------------=82,
O
—70+66+81+83+79+80+92+89»
y=---------------3---------------=80,
2筋匕-8xy
所以物理成绩y与数学成绩x的线性相关程度较强,且呈正相关,它们的变化趋势相同.
[规律方法]在统计中常用样本相关系数r来衡量两个变量间线性相关程度的强弱.r的
范围为[-1,1],r为正时,两个变量正相关;r为负时,两个变量负相关;卜越接近1,两个
变量间线性相关程度越强;r越接近0,两个变量间线性相关程度越弱.
对点训练❸为了解某地区足球特色学校的发展状况,某调查小组得到统计数据如
下表:
年份X20142015201620172318
足球特色学校近百个)0.300.601.001.401.70
根据上表数据,计算》,与才的样本相关系数八并说明y与x的线性相关程度的强弱.
参考公式和数据•:
z(必一X)(%—y)比3.6,
Z<XL彳>=10,£(y/—y)'=1.3,
6056.
g(Xi-x)(y1-y)
rB+zwI3.63.6
[解析]由题意得/=//=r-I=QA〜
r5_r5_3.60o6
A/Z〈XLX)2、Z(匕-y)2
0.998.
Vr=0.998非常接近1,与x线性相关程度很强.
易I错I警I示
概念不清致谩
典例4在一组成对样本数据(M,为,(如㈤,…,(x",%)(〃22,xi,x2,,,,,的不全
相等)的散点图中,若所有样本点(小,y,)(7=L2,…,力都在直线y=[r+l上,则这组样本
数据的样本相关系数为(D)
A.-1B.0
1
CD.1
,2
[错解]•・•所有样本点都在直线y=Jx+l上,x的系数为:,故选C.
[正解]因为所有样本点(%,匕)(>=1,2,…,〃)都在直线y=;x+l上,且x,y的变化
趋势相同,所以样本相关系数为1.
◎课堂检..测....固..双..基..④.........................
1.有以下五组变量:
①某商品的销售价格与销售量:
②学生的学籍号与学生的数学成绩;
③坚持每天吃早餐的人数与患胃病的人数;
④气温与冷饮销售量:
⑤电瓶车的重量和行驶每千米的耗电量.
其中两个变量成正相关的是(D)
A.①③B.②④
C
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年执业药师考试(药事管理与法规)模拟练习题库及答案七台河
- 2026年邵阳执业药师(药事管理与法规)资格考试模拟题及答案
- 2026入党积极分子思想报告怎么写(3篇)
- 2026重庆市铜梁区平滩镇人民政府招聘敬老院院长1人笔试题库含答案详解(突破训练)
- 2026中国科学院新疆天文台财务处招聘(1人)笔试题库及参考答案详解(达标题)
- 2026广东佛山高新技术产业开发区管理委员会招聘佛山市火炬服务中心工作人员1人备考题库(完整版)附答案详解
- 2026重庆西南计算机有限责任公司招聘1人备考题库【考试直接用】附答案详解
- 2026安徽中医药大学资产经营有限公司劳务派遣(煎药中心仓管员)招聘1人备考题库及完整答案详解(名校卷)
- 2026江西新余市仙女湖区乡镇国土规划管理所招聘人事代理国土空间规划人员1人笔试题库附答案详解【轻巧夺冠】
- 安徽省宿州市砀山县2026年八上物理期末检测模拟试题含解析
- (2026版)中华人民共和国民族团结进步促进法
- 成都市2022级(2025届)高中毕业班摸底测试(零诊)英语试卷(含答案)
- 天津开发区第一中学2025届高一下生物期末统考试题含解析
- 2024年湖南三一工业职业技术学院单招职业适应性测试题库及答案一套
- 起重机械检测服务起重机械检测服务方案
- 装修工人岗前培训
- 风电工程集电线路施工招标文件范本
- 钢筋工施工详细方案培训
- 办公家具投标方案(技术标)
- 航天器仪器舱结构设计放热设计教学课件
- 学校政府采购自查报告(通用6篇)
评论
0/150
提交评论