版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三节变量间的相关关系、统计案例
2020学考情
课标要求考情分析
1.会作两个相关变量的散点图,会利用散点图
认识变量之间的相关关系.
1.以选择题、填空题的形式考查求线性回归系
2.了解最小二乘法的思想,能根据给出的线
数或利用线性回归方程进行预测,在给出临
性回归系数公式建立线性回归方程.
界值的情况下判断两个变量是否有美.
3.了解独立性检验(只要求2X2列联表)的基
2.在解答题中与频率分布结合考查线也回归
本思想、方法及其简单应用.
方程的建立及应用和独立性检验的应用.
4.了解回归分析的基本思想、方法及其简单
应用.
ZHISHISHULIZHENDUANZKX
知识梳IS诊断自恻21课前热身稔固根基
>知识梳理
知识点一两个变■的线性相关
I.正相关
在散点图中,点散布在从左上鱼到五上鱼的区域,对于两个变量的这种相关关系,我们
将它称为正相关.
2.负相关
在散点图中,点散布在从左上角到右下先的区域,两个变量的这种相关关系称为负相关.
3.线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性
相关关系,这条直线叫做回归直线.
知识点二回归方程
1.最小二乘法
求回归直线,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘
法.
2.回归方程
方程)=以+。是两个具有线性相关关系的变量的一组数据(为,>,])»(X2,y2),…,(X”,
%)的回归方程,其中。,b是待定参数.
**
E(即一x)(y/
Ai=\
b=
Z(x/-T)2LvHnT2
、〃=y—bx.
知识点三回归分析
I.定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
2.样本点的中心
对于一组具有线性相关关系的数据(内,yi),(由,)叫…,(X",»),其中(x,y)称为
样本点的中心.
3.相关系数
当Q()时,表明两个变量正相去;
当X0时,表明两个变量负相关.
厂的绝对值越接近于1,表明两个变量的线性相关性越强.
「的绝对值越接近于0,表明两量之间几乎不存在线性相关关系.通常仍大于时,认为两
个变量有很强的线性相关性.
知识点四独立性检验
1.分类变量:变量的不同“值”表示个体所属的不同类别.像这样的变量称为分类变
量.
2.列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和匕
它们的可能取值分别为3,12}和3,力},其样本频数列联表(称为2X2列联表)为
2X2列联表
>,1总计
XIaba+b
X2Cdc+d
总计a+cb+da+Z7+c+d
构造一个随机变量/=定切图兀器)(〃+〃其中〃=但也为样本容邕
3.独立性检验
利用随机变量里来判断“两个分类变量有关系”的方法称为独立性检验.
,诊断自测
1.思考辨析
判断下列结论正误(在括号内打“J”或“X”)
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(X)
(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(。)
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.(V)
(4)某同学研究卖出的热饮杯数,,与气温x(C)之间的关系,得线性回归方程冲+147.767,
则气温为2c时,一定可卖出143杯热饮.(X)
(5)事件X,丫关系越密切,则由观测数据计算得到的心的观测值越大.(V)
2.小题热身
(1)观察下列各图形,
XH"
OxOxOXOx
①②③④
其中两个变量x,),具有相关关系的图是(C)
A.®®B.①④
C.®®D.@@
(2)两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别
反映的变量间的相关关系是(D)
力yk当
OxOxOx
A.①@③B.②③①
C.②①③D.(£@@
(3)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是
A
35
90
25
0
2V15
10
5
0
51015202530355101520253035
相关系数为A相关系数为Q
①②
35
30
25
20
5
10
1-
3
0
51015202530355101520253035
相关系数为勺相关系数为。
③
A.门〈厂4Vo<厂3<r1B.r4</'2<0</'i<r3
C.后</*2<()<厂3〈r1D./*2<n<0<ri<r3
(4)某汽车的使用年数x与所支出的维修总费用y的统计数据如表:
使用年数力年12345
维修总费用w万元
根据上表可得),关于x的线性回归方程),=饭一0.69,若该汽车维修总费用超过10万元
就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1年计算)(D)
A.8年B.9年
C.10年D.11年
(5)在性别与吃零食这两个分类变量的计算中,下列说法正确的是③.
①若片的观测值为上=6.635,我们有99%的把握认为吃零食与性别有关系,那么在100
个吃零食的人中必有99人是女性;
②从独立性检验可知有99%的把握认为吃零食与性别有关系时,我们说某人吃零食,那
么此人是女性的可能性为99%;
③若从统计量中求出有99%的把握认为吃零食与性别有关系,是指有1%的可能性使得
出的判断出现错误.
解析:(1)由散点图知③④具有相关关系.
(2)第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正相关;第
三个散点图中,散点图中的点是从左上角区域分布到右y角区域,则是负相关;第二人散点
图中,散点图中的点的分布没有什么规律,则是不相关,所以应该是①③②.
(3)由相关系数的定义以及散点图所表达的含义可知/.
(4)由y关于x的线性回归直线卜=历:一0.69过样本点的中心(3234),得力=1.01,即线性
回归方程为;氏一0.69,由;,x—0.69=10得xFO.6,所以预测该汽车最多可使用11年,故选D.
(5)由独立性检验的基本思想可得,只有③正确.
C»KAODIANTAHJIUMINGXIGUILV
02考点摆究明嘶规律支■一谦宜升华强技任能
考点一相关关系的判断
【例11(1)在一组样本数据(沏,巾),(X2>(一,%)(〃22,xi>及,…,x〃不
全相等)的散点图中,若所有样本点(为,%)(,=1,2,…,川都在直线y=%+I上,则这组样本
数据的样本相关系数为()
A.-1B.0
C,2D.1
(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为
3Q
2x5)0
2>00
1()>500
100
()500
00
ZX1,1I1
。12345678910x
①x,),是负相关关系;
②在该相关关系中,若用),=qecM拟合时的相关系数的平方为此用;=&+:拟合时的
相关系数的平方为“,则
③X、),之间不能建立线性回归方程.
【解析】(1)所有点均在直线上,则样本相关系数最大即为1.故选D.
(2)①显然正确;由散点图知,用尸CMM拟合的效果比用;=鼠+;拟合的效果要好,
故②正确;-),之间能建立线性回归方程,只不过预报精度不高,故③不正确.
【答案】(DD⑵①②
方法技巧
判定两个变量正、负相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变
量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)相关系数">0时,正相关/<0时,负相关.
(3)线性回归方程中:力>0时,正相关;6<0时,负
相关.
位变期IT练
1.已知变量X和y近似满足关系式慰+1,变量y与Z正相关.下列结论中正确的是(C)
A.%与1y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,X与z负相关
D.工与y负相关,x与z正相关
解析:由冲+1,知上与y负相关,即y随工的增大而减小,又y与z正相关,所以z随
y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关.
2.甲、乙、丙、丁四位同学各自对A,8两变量的线性相关性做试验,并用回归分析方
法分别求得相关系数,•与残差平方和〃?如下表:
甲乙丙T
r
in106115124103
则哪位同学的试验结果体现A,B两变量有更强的线性相关性(D)
A.甲B.乙C.丙D.丁
解析:在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性
越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差
平方和最小,综上可知丁的试验结果体现了A,8两变量有更强的线性相关性.
考点二回归分析
[例2]下图是某地区2012年至2018年生活垃圾无害化处理量(单位:万吨)的折线
Lo
.E8
Lo
4
1o
1o
.Q2
Lo
。.8O
注:年份代码1〜7分别表示对应年份2012〜2018.
(1)由折线图看出,可用线性回归模型拟合),与F的美系,请用相关系数加。>0.75线性相
关较强)加以说明;
(2)建立y与1的回归方程(系数精确到0.01),预测2019年该地区生活垃圾无害化处理量.
附注:
参考数据:加=9.32,士砂产40.17,、8—7)2=0.55,币=2.646.
尸।尸1i=i
L(lI)(y-y)
参考公式:相关系数,----J^=,
A/Z(fi~~)2t(y>~~f
Z(Lt)(y>-y)
回归方程;=;+或中斜率和截距最小二乘估计公式分别为:b=-----------------------,«=
Z(6-t)2
1=1
~-b-7.
【解】(1)由折线国中数据和附注中参考数据得
t=4,-t)2=28,-A/S(yi-y)2=0.55,
尸i尸i
7__7_7
ty)=E〃VLt&
尸1;-li-\
=40.17-4X9.32=2.89,
一X2X2.646)=0.99.
因为.v与I的相关系数近似为0.99.说明.v与1的浅性相关程度相当高,从而可以用线
性回归模型拟合与/的关系.
⑵由亍=,7户1.331及⑴
Z(6-f)(,一丁)
Af=l
得〃=---;------------=,28)^0.10,
S(6—7)2
i-l
A__A
a=y~btX420.93.
所以y关于i的回归方程为..将2019年对应的r=8代入回归方程得;X8=1.72.
所以预测2019年该地区生活垃圾无害化处理量约1.72万吨.
方法技巧
1.线性回归分析问题的类型及解题方法
(I)求线性回归方程:
①利用公式,求出回归系数几£
②待定系数法:利用回归直线过样本点中心求系数.
(2)利用回归方程进行预测:
把回归直线方程看作一次函数,求函数值.
(3)利用回归直线判断正、负相关:决定正柜关还是
负相关的是系数R
2.模型拟合效果的判断
(1)残差平方和越小,模型的拟合效果越好.
(2)相关指数*越大,模型的拟合效果越好.
(3)回归方程的拟合效果,可以利用相关系数判断,
当IrI越趋近于1时,两变量的线性相关性越强.
铳变式训练
1.某单位为了解用电量M千瓦时)与气温x(°C)之间的关系,随机统计了某4天的用电量
与当天气温,并制作了对照表:
气温x(℃)181310-I
用电量M千瓦时)24343864
由表中数据得线性回归方程y=bx+a中〃=—2,预测当温度为一5℃时,用电量约为
(D)
A.64千瓦时B.66千瓦时
C.68千瓦时D.70千瓦时
AA
解析:由已知得工=10,7=40,将其代入回归方程得40=-2X10+小解得4=60,
故回归方程为y=-2x+60,当工=-5时,>=70.故选D.
2.二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格),(单位:
万元/辆)进行整理,得到如下数据:
使用年数X234567
售价y201283
z=lny
下面是z关于x的折线图:
(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明;
⑵求y关于x的回归方程,并预测某辆A型号二手车当使用年数为9年时售价约为多少;
J、;小数点后保留两位有效数字)
(3)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据Q)求出的回归方程
预测在收购该型号二手车时车辆的使用年数不得超过多少年.
n__
Z(Xi-x)8—y)2>通一〃xy
参考公式:b=------------
£(即一X)2z>/—/?X.
Z(XLX)(),i—>')
1=1
A/Z(Xj-x)2X(y,-y)2
\j1=1产।
参考数据:
666
£⑪=187.4,2i%=47.64,〉?=139,
i=\/=1i=l
Zp-T)2=4.18,Zp-?)2=13.96,
£(ZLW20.38,lnO.7118«»-0.34.
一1
解:(1)由题意,知A=不乂(2+3+4+5+6+7)=4.5,
—|
z=dX(3+2.48+2.08+1.86+1.48+1.10)=2,
又玄的=47.64,
E(即一X)2=4.18,
47.64-6XX2
-----777T-=-,6.3954)^-0.99,
・•・z与x的相关系数大约为-0.99,说明z与x的线性相关程度很高.
:47.64-6XX2”
(2)b=]*_6*2—=一』7.5户一0.36,
1J,u/、
:,a=z~bxX4.5=3.62,
,z与戈的线性回归方程是zr+3.62,又z=lny,
・•・丁关于x的回归方程是;=-
A
令x=9,得),=e'=e,
•KO.38,
Ay=1.46,即预测某辆A型号二手车当使用年数为9年时售价约为1.46万元.
(3)当),20.7118,即F20.7118=”。718=52—034,解得xWll,因此,预测在收购
该型号二手车时车辆的使用年数不得超过11年.
考点三独立性检验
【例3】目前,浙江和上海已经成为新高考综合试点的“排头兵”,有关其他省份新
高考改革的实施安排,教育部部长在十九大上做出明确表态:到2020年,我国将全面建立起
新的高考制度.新高考规定:语文、数学和英语是考生的必考科目,考生还需从物理.、化学、
生物、历史、地理和政治六个科目中选取三个科目作为选考科目.若一个学生从六个科目中
选出了三个科目作为选考科目,则称该学生的选考方案确定;否则,称该学生选考方案待确
定.例如,学生甲选择“物理、化学和生物”三个选考科目,则学生甲的选考方案确定,“物
理、化学和生物”为其选考方案.
某校为了解高一年级840名学生选考科目的意向,随机选取60名学生进行了一次调查,
统计选考科目人数如下表:
选考方案确定情况物理化学生物历史地理政治
确定的有16人16168422
男生
待确定的有12人860200
确定的有20人6102016Av6
女生
待确定的有12人AM810002
(1)估计该学校高一年级选考方案确定的学生中选考生物的学生有多少人?
⑵将2X2列联表填写完整,并通过计算判断能否有99.9%的把握认为选历史与性别有
关?
选历史不选历史总计
选考方案确定的男生
选考方案确定的女生
总计
(3)从选考方案确定的16名男生中随HL选出2名,设随机变量=
L[0,2名男生生选选考考方方案案不相同同'求4的分布列及数学期望
3
”(“die)?
附:〃=a+b+c+d.
'(a+b)(a+c)(c+d)(b+d)'
P(K9心)
Ao
【解】(1)由题意可知,选考方案确定的男生中确定选考生物的学生有8人,选考方案
确定的女生中确定先考生物的学生有20人,则该学校高一年级选考方案确定的学生中选考生
物的学生约有京X而X840=392(人).
(2)2X2列联表填写完整为
选历史不选历史总计
选考方案确定的男生41216
选考方案确定的女生1642()
总计201636
由2X2列联表可得,
,36X(4X4-12X16产
K~=20X16X20X16
_36X162X1121Q89
=20X16X20X16=100
=10.89>10.828,
所以有99.9%的把握认为选历史与性别有关.
(3)由题表中数据可知,选考方案确定的男生中有8人选择物理、化学和生物;有4人选
择物理、化学和历史;有2人选择物理、化学和地理;有2人选择物理、化学和政治.
由已知得?的取值为0,1.
a+cW+G+G3
汽『)=To,
P(<=0)=l-P(^=l)
=[(或P(4=O)
cicHc.lc.i+clci7
=g=而)
所以j的分布列为
g01
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园厨师自救制度规范
- 科技人才档案管理制度
- 三个班客服排班制度规范
- 酒店保养石材制度规范标准
- 法警队严格考勤制度规范
- 档案学校信息化采购制度
- 干事档案管理制度
- 机构合伙人制度规范要求
- 校级领导带课制度规范要求
- 仓库配货人员制度规范要求
- DB1331-T 025.1-2022 雄安新区工程建设关键质量指标体系:建筑工程
- 旅游行业如何玩转视频号 从0到1开启私域营销
- 急腹症影像诊断课件
- 【《紫鑫药业财务报告审计失败案列分析》12000字(论文)】
- 三级医院营养科建设方案
- 医院外联部主任述职报告
- 集团内部融媒体管理办法
- ASTM-D1238中文翻译(熔融流动率、熔融指数、体积流动速率)
- 2025年浙江省宁波市镇海中学高考英语模拟试卷(1月份)
- 短视频创作-短视频手机拍摄与剪辑
- 车辆挂靠驾校合同协议
评论
0/150
提交评论