




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题57成对数据的统计分析(新高考专用)
目录
【知识梳理】................................................................2
【真题自测】................................................................4
【考点突破】................................................................9
【考点1】成对数据的相关性..................................................9
【考点2】回归分析..........................................................11
【考点3】独立性检验........................................................14
【分层检测】...............................................................18
【基础篇】.................................................................18
【能力篇】.................................................................22
考试要求:
1.了解样本相关系数的统计含义.
2.了解一元线性回归模型和2X2列联表,会运用这些方法解决简单的实际问题.
3.会利用统计软件进行数据分析.
■“知识梳理
1.变量的相关关系
(1)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为
相关关系.
(2)相关关系的分类:正相关和负相关.
(3)线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这
两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或
曲线相关.
2.样本相关系数
⑴相关系数厂的计算
变量x和变量y的样本相关系数r的计算公式如下:
11
S一M-y)
«=1
(2)相关系数r的性质
①当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样
本数据间没有线性相关关系.
②样本相关系数r的取值范围为「一1,11
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.一元线性回归模型
(1)经验回归方程与最小二乘法
我们将〈=£+:称为y关于%的经验回归方程,也称经验回归函数或经验回归公式,其图形称
为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的3二叫做。的最小二
2
乘估计,
其中
nn
y
—•一1)(”•—J)Hx,yl,~ln^Jc~y
-i=i=1
b=—n
2v2
S(JC,—JC)ZJ/i-nx
=1i=i
a=y-bx.
(2)利用决定系数F刻画回归效果
(乂一3,尸
z
J?=l-—n
\、
:=1,收越大,即拟合效果越好,F越小,模型拟合效果越差.
4.列联表与独立性检验
(1)2X2列联表
一般地,假设有两个分类变量X和匕它们的取值分别为{xi,基}和{”,"},其2X2列联表
为
y
X合计
尸券
X~X\aba+b
X~X2cdc~\~d
合计a~\~cb+dn—a~\~b~\~c~\~d
⑵临界值
H(nd-be")2
/=(小)(c+d)Q+c)•忽略/的实际分布与该近似分布的误差后,对于任何
小概率值a,可以找到相应的正实数Xa,使得「&三发)=&成立.我们称Xa为a的临界值,这
个临界值就可作为判断H大小的标准.
(3)独立性检验
基于小概率值a的检验规则是:
当三、我时,我们就推断Ho不成立,即认为X和Y不独立,该推断犯错误的概率不超过a;
当/2<羽时,我们没有充分证据推断Ho不成立,可以认为X和y独立.
这种利用X2的取值推断分类变量X和y是否独立的方法称为X2独立性检验,读作“卡方独立
性检验”,简称独立性检验.
下表给出了X2独立性检验中几个常用的小概率值和相应的临界值
3
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
I常用结论
1.求解经验回归方程的关键是确定回归系数:,b,应充分利用回归直线过样本点的中心(x,y).
2.根据经验回归方程计算的(值,仅是一个预报值,不是真实发生的值.
3.根据/的值可以判断两个分类变量有关的可信程度,若/越大,则两分类变量有关的把握越
大.
真题自测
一、单选题
1.(2024•全国•高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的
亩产量(单位:kg)并整理如下表
亩产
[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200)
量
频数61218302410
根据表中数据,下列结论中正确的是()
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
2.(2023・全国•高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样
调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,
则不同的抽样结果共有().
A.C-C短种B.CMC鼠种
C.CQC禽种D.C%c北种
二、多选题
3.(2023•全国•高考真题)有一组样本数据%,%,…,%,其中4是最小值,%是最大值,则()
A.无2,无3,羽,无5的平均数等于不,%,…,%的平均数
B.毛,尤3,4尤5的中位数等于百,%,1%的中位数
4
C.x2,x3,x4,x5的标准差不小于占,马,…,毛的标准差
D.尤3,%毛的极差不大于百,…,毛的极差
三、解答题
4.(2024・全国•高考真题)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产
品中随机抽取150件进行检验,数据如下:
优级品合格品不合格品总计
甲车间2624050
乙车间70282100
总计96522150
⑴填写如下列联表:
优级品非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲,乙两车间产品
的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率p=0.5,设万为升级改造后抽取的n件产品的优级品率.如果
万>P+1.65J约二",则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生
产线智能化升级改造后,该工厂产品的优级品率提高了?(丽之2.247)
n(ad-bc)2
(〃+Z?)(c+d)(a+c)(b+d)
P(K2>k)0.0500.0100.001
k3.8416.63510.828
5.(2023•全国•高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20
只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养
在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
5
对照组的小白鼠体重的增加量从小到大排序为
15.218.820.221.322.523.225.826.527.530.1
32.634.334.835.635.635.836.237.340.543.2
试验组的小白鼠体重的增加量从小到大排序为
7.89.211.412.413.215.516.518.018.819.2
19.820.221.622.823.623.925.128.232.336.5
⑴计算试验组的样本平均数;
(2)(回)求40只小白鼠体重的增加量的中位数加,再分别统计两样本中小于,"与不小于机的数据的个数,
完成如下列联表
n<m>m
对照组□□
试验组□□
(回)根据G)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加
量有差异?
n(ad-bc)2
(a+6)(c+d)(a+c)(6+d),
P(K2>k]0.1000.0500.010
k2.7063.8416.635
6.(2023•全国,高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20
只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养
在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
⑴设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望;
⑵实验结果如下:
对照组的小白鼠体重的增加量从小到大排序为:
15.218.820.221.322.523.225.826.527.530.1
32.634.334.835.635.635.836.237.340.543.2
实验组的小白鼠体重的增加量从小到大排序为:
6
7.89.211.412.413.215.516.518.018.819.2
19.820.221.622.823.623.925.128.232.336.5
(i)求40只小鼠体重的增加量的中位数机,再分别统计两样本中小于机与不小于的数据的个数,完成如下
列联表:
n<m>m
对照组□□
实验组U□
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量
有差异.
n(ad-bc)2
附:K2=
(a+6)(c+d)(a+c)(b+d))
0.1000.0500.010
2
P(K>k0)2.7063.8416.635
7.(2023•全国•高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,
每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测
量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为%,%(7=1,2,…,10).试
验结果如下:
试验序号i12345678910
伸缩率看545533551522575544541568596548
伸缩率力536527543530560533522550576536
记%记的样本平均数为样本方差为?.
=1,2,…,10),4,Z?,z10z,
⑴求1/;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果
z>2.£,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否
V10
7
则不认为有显著提高)
8.(2023•全国•高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于。的人判定为阳性,小于或等于c的人判
定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为。9);误诊率是将未患病者判定为阳
性的概率,记为我。).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
⑴当漏诊率p(c)=0.5%时,求临界值c和误诊率4(c);
(2)设函数〃c)=p(c)+q(c),当ce[95,105]时,求/(c)的解析式,并求/(c)在区间[95,105]的最小值.
考点突破
【考点1]成对数据的相关性
一、单选题
1.(2024・四川成都•二模)对变量苍丁有观测数据Q,yJ(ieN*),得散点图1;对变量”#有观测数据
(M;,V;)(ZGN*),得散点图24表示变量彳,丫之间的线性相关系数,4表示变量以v之间的线性相关系数,则
A.变量X与y呈现正相关,且用〈闾B.变量X与y呈现负相关,且用〉同
8
C.变量尤与y呈现正相关,且间>团D.变量X与y呈现负相关,且用〈同
2.(2024・四川凉山•三模)调查某校高三学生的身高X和体重y得到如图所示散点图,其中身高X和体重V相
B.学生身高和体重呈正相关
C.学生身高和体重呈负相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.8255
二、多选题
3.(22-23高三上•江苏无锡•期末)已知由样本数据(4%)[=1,2,3,…,10)组成的一个样本,得到经验回归方
程为夕=2x-0.4,且元=2,去除两个样本点(-2,1)和(2,-1)后,得到新的经验回归方程为$=3x+g.在余
下的8个样本数据和新的经验回归方程中().
A.相关变量x,y具有正相关关系
B.新的经验回归方程为9=3X-3
C.随着自变量x值增加,因变量y值增加速度变小
D.样本(4,8.9)的残差为-0.1
4.(2024•湖南衡阳•模拟预测)为了研发某种流感疫苗,某研究团队收集了10组抗体药物的摄入量与体内
抗体数量的数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值,抗体药物摄
入量为x(单位:mg),体内抗体数量为y(单位:AU/mL).根据散点图,可以得到回归直线方程为:
y=0.34x+0.05.下列说法正确的是()
^
12
1
11
1
7
9
1
1
8
1
1
7
1
1
6
1
15
1
1
48.84949.249.449.649.85050.250.4*
9
A.回归直线方程表示体内抗体数量与抗体药物摄入量之间的线性相关关系
B.回归直线方程表示体内抗体数量与抗体药物摄入量之间的函数关系
C.回归直线方程可以精确反映体内抗体数量与抗体药物摄入量的变化趋势
D.回归直线方程可以用来预测摄入抗体药物后体内抗体数量的变化
三、填空题
5.(23-24高三上•浙江,开学考试)已知成对样本数据(4%),(%,%),…,(五,”)(北3)中士,马,…,当互不相等,
且所有样本点(4%)(7=1,2,…㈤都在直线y=-gx+l上,则这组成对样本数据的样本相关系数r=
反思提升:
判断相关关系的两种方法:
(1)散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;
如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.
(2)决定系数法:利用决定系数判定,F越趋近1,拟合效果越好,相关性越强.
【考点2】回归分析
一、单选题
1.(2024・四川绵阳•二模)已知变量x,y之间的线性回归方程为9=2x+l,且变量x,y之间的一组相关数
据如表所示,
X2468
y58.213m
则下列说法正确的是()
A.〃?=17
B.变量y与x是负相关关系
C.该回归直线必过点(5,11)
D.x增加1个单位,y一定增加2个单位
2.(2024•全国•模拟预测)2023年第19届亚运会在杭州举行,亚运会的吉祥物琮琮、莲莲、宸宸深受大家
喜爱,某商家统计了最近5个月销量,如表所示:若y与x线性相关,且线性回归方程为?=-。6元+0,则
下列说法不正确的是()
时间X12345
销售量W万只54.543.52.5
A.由题中数据可知,变量y与无负相关
10
B.当x=5时,残差为0.2
C.可以预测当x=6时销量约为2.1万只
D.线性回归方程9=-0.6x+d中4=5.7
二、多选题
3.(23-24高三上•广东揭阳,期末)2023年入冬以来,流感高发,某医院统计了一周中连续5天的流感就诊
人数y与第%(%=1,2,3,4,5)天的数据如表所示.
X12345
y21IQa15a90109
根据表中数据可知尤,y具有较强的线性相关关系,其经验回归方程为y=20尤+10,则()
A.样本相关系数在(0』内B.当x=2时,残差为-2
C.点(3,15a)一定在经验回归直线上D.第6天到该医院就诊人数的预测值为130
4.(2024•全国•模拟预测)为了预测某地的经济增长情况,某经济学专家根据该地2023年1〜6月的GDP
的数据y(单位:百亿元)建立了线性回归模型,得到的经验回归方程为y=0.42x+a,其中自变量x指的
是1〜6月的编号,其中部分数据如表所示:
时间2023年)月2023年2月2023年3月2023年4月2023年5月2023年6月
编号X123456
W百亿元为%11.107%线
参考数据:£W=796,-»2=70.
i=li=l
则下列说法正确的是()
A.经验回归直线经过点(3511)
B.<7=10.255
C.根据该模型,该地2023年12月的GDP的预测值为14.57百亿元
D.相应于点(%,%)的残差为0二03
三、填空题
5.(2024•江苏•一模)已知变量x,y的统计数据如下表,对表中数据作分析,发现y与X之间具有线性相关
关系,利用最小二乘法,计算得到经验回归直线方程为9=0.8尤+&,据此模型预测当x=10时亍的值
为.
11
X56789
y3.54566.5
6.(2024・陕西渭南•一模)已知一组数据点(4%)(,=1,2,,7),用最小二乘法得到其线性回归方程为
77
y——2x+4,若Z玉=7,则£%=•
i=l«=1
四、解答题
7.(2024•山东日照•二模)某公司为考核员工,采用某方案对员工进行业务技能测试,并统计分析测试成绩
以确定员工绩效等级.
⑴已知该公司甲部门有3名负责人,乙部门有4名负责人,该公司从甲、乙两部门中随机选取3名负责人
做测试分析,记负责人来自甲部门的人数为X,求X的最有可能的取值:
-7xz
------------x0.02
(0)已知某部门测试的平均成绩为60分,估计其绩效等级优秀率;
5)根据统计分析,大致认为各部门测试平均成绩尤〜其中〃近似为样本平均数元,/近似为
样本方差经计算s。20,求某个部门绩效等级优秀率不低于0.78的概率.
参考公式与数据:①ln0.15工-1.9,e1'2»3.32,ln5.2a1.66.
n__
八Y^-nxy
②线性回归方程9=加+6中,》=弓--------,d=y-bx.
2—2
2^xi-nx
i=i
③若随机变量X〜,贝P(〃-cr<X<〃+cr)=0.6826,P(〃—2b<X<〃+2cr)=0.9544,
P(〃-3cr<X<〃+3b)=0.9974.
8.(22-23高三上•山东青岛・期末)由相〃个小正方形构成长方形网格有机行和〃列.每次将一个小球放到一个
小正方形内,放满为止,记为一轮.每次放白球的频率为P,放红球的概率为q,P+4=l.
12
⑴若根=2,P=q=;,记y表示100轮放球试验中"每一列至少一个红球”的轮数,统计数据如表:
n12345
y7656423026
求y关于〃的回归方程Iny=加+。,并预测〃=10时,y的值;(精确到1)
1?
(2)若m=2,n=2,p=~,q=~,记在每列都有白球的条件下,含红球的行数为随机变量X,求X的分
布列和数学期望;
⑶求事件〃不是每一列都至少一个红球〃发生的概率,并证明:(i-yw)n+(i-^f>1.
k
-X七%-反守5_
附:经验回归方程系数:5=37--------------,a=y-bx,2%/ny,=53,百]=3.8.
_居2i=l
z=l
反思提升:
n——
A^^.XiyiYLJQyAA—A—A
(1)求经验回归方程:利用公式,二.求0;利用a=y一以求a,写出经验回归方程.
Y^Xi—nx2
(2)经验回归方程的拟合效果,可以利用相关系数卜|判断,当|r|越趋近于1时,两变量的线性相
关性越强.或利用决定系数K判断,F越大,拟合效果越好.
⑶非线性经验回归方程转化为线性经验回归方程的方法
AAAAAAAAAAA
①若y=a+by[x,设£=疝,则y=a+初;②若满足对数式:y=a+blnx,设,=ln%,则y=a+
A
bt-,③若满足指数式:y=ciec2x,两边取对数解Iny=lnci+czx,设z=lny,a=lnci,b=ci,
贝Uz=a+bx.
【考点3】独立性检验
一、单选题
1.(2024•黑龙江哈尔滨•二模)针对2025年第九届亚冬会在哈尔滨举办,校团委对"是否喜欢冰雪运动与学
生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢冰雪运动的人数占男生人数
的三,女生中喜欢冰雪运动的人数占女生人数的;,若依据&=0.05的独立性检验,认为是否喜欢冰雪运动
63
与学生性别有关,则被调查的学生中男生的人数不可能是()
2_n{ad-be)2
(a+b)(c+d)(a+c)(b+d)
a0.10.050.010.0050.001
13
%2.7063.8416.6357.87910.828
A.48B.54C.60D.66
2.(2024•宁夏银川•一模)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优
秀统计成绩,得到如下所示的列联表:
优秀非优秀总计
甲班10b
乙班C30
合计
A.列联表中c的值为30,6的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按97.5%的可靠性要求,能认为"成绩与班级有关系”
D.根据列联表中的数据,若按97.5%的可靠性要求,不能认为"成绩与班级有关系”
二、多选题
3.(2024•山东临沂•一模)下列结论正确的是()
A.一组样本数据的散点图中,若所有样本点a,%)都在直线^=0.95%+1上,则这组样本数据的样本相
关系数为0.95
B.已知随机变量,N(3,4),若J=2〃+l,则
C.在2x2列联表中,若每个数据a,》,c,d均变成原来的2倍,则/也变成原来的2倍
2
,2n(ad-be)_,、
CX-7i/\/j,其中〃=a+6+c+d)
(a+b)(c+d)(a+c)[b+d)
D.分别抛掷2枚质地均匀的骰子,若事件A="第一枚骰子正面向上的点数是奇数",3="2枚骰子正面
向上的点数相同",则A2互为独立事件
4.(22-23高三下•浙江•开学考试)下列结论中,正确的有()
14
A.数据4,1,6,2,9,5,8的第60百分位数为5
B.若随机变量舁"(1,4),尸(空一2)=0.21,则尸(公4)=0.79
C.己知经验回归方程为夕=Bx+1.8,B.x=2,y=20,则B=9.1
D.根据分类变量X与¥的成对样本数据,计算得到f=9.632,依据小概率值a=0.001的/独立性检
验(%0m=10.828),可判断X与Y有关联,此推断犯错误的概率不大于0.001
三、填空题
5.(21-22高二下•福建福州•期末)为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
疾病
药物合计
未患病患病
服用a50—a50
未服用80—。a—3050
合计8020100
若在本次考察中得出"在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值
为.(其中心40且aeN*)(参考数据:76.635»2.58,J10.828—3.29)
2n(ad-bc]
附:%=-,---------77—^~77——------------7,ll=a+b+C+d
(a+6)(c+d)(a+c)(6+d)
a0.10.050.010.0050.001
xa2.7063.8416.6357.87910.828
6.(2024・上海金山•二模)为了考察某种药物预防疾病的效果,进行动物试验,得到如下图所示列联表:
疾病
药物合计
未患病患病
服用m50-m50
未服用80—mm—3050
合计8020100
取显著性水平a=0.05,若本次考察结果支持“药物对疾病预防有显著效果",则加(〃二40,meN)的最小值
为_________
15
n(ad-be)2
(参考公式:/=;参考值:P(Z2>3.841)»0.05)
(a+b)(c+d)(a+c)(b+d)
四、解答题
7.(2023,广东深圳•二模)飞盘运动是一项入门简单,又具有极强的趣味性和社交性的体育运动,目前已经
成为了年轻人运动的新潮流.某俱乐部为了解年轻人爱好飞盘运动是否与性别有关,对该地区的年轻人进行
了简单随机抽样,得到如下列联表:
飞盘运动
性别合计
不爱好爱好
男61622
女42428
合计104050
⑴在上述爱好飞盘运动的年轻人中按照性别采用分层抽样的方法抽取10人,再从这10人中随机选取3人
访谈,记参与访谈的男性人数为X,求X的分布列和数学期望;
(2)依据小概率值。=0.01的独立性检验,能否认为爱好飞盘运动与性别有关联?如果把上表中所有数据都扩
大到原来的10倍,在相同的检验标准下,再用独立性检验推断爱好飞盘运动与性别之间的关联性,结论还
一样吗?请解释其中的原因.
附./_"(ad-bc》
其中“=a+b+c+d.
(a+b)(c+d)(a+c)(b+d)
a0.10.010.001
Xa2.7066.63510.828
8.(2024•吉林•模拟预测)短视频已成为当下宣传的重要手段,东北某著名景点利用短视频宣传增加旅游热
度,为调查某天南北方游客来此景点旅游是否与收看短视频有关,该景点对当天前来旅游的500名游客调
查得知,南方游客有300人,因收看短视频而来的280名游客中南方游客有200人.
⑴依据调查数据完成如下列联表,根据小概率值a=0.001的独立性检验,分析南北方游客来此景点旅游是
否与收看短视颍有关联:单位:人
短视频
游客合计
收看未看
16
南方游客
北方游客
合计
⑵为了增加游客的旅游乐趣,该景点设置一款5人传球游戏,每个人得到球后都等可能地传给其余4人之
一,现有甲、乙等5人参加此游戏,球首先由甲传出.
(i)求经过,次传递后球回到甲的概率;
(ii)记前机次传递中球传到乙的次数为X,求X的数学期望.
n(ad-be,f_tn\jn_
参考公式:z2=其中〃=a+/?+c+d;E\=ZE(Xj
(a+b)(c+d)(Q+c)(Z?+d)VZ=17z=l
附表:
a0.10.050.010.0050.001
2.7063.8416.6357.87910.828
反思提升:
L在2X2列联表中,如果两个变量没有关系,则应满足ad—尻心0.|〃一阳越小,说明两个变
量之间关系越弱;|ad一尻|越大,说明两个变量之间关系越强.
2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2X2列联表:
(2)根据公式/=
〃(ad-bc)之
计算X2;
(a+6)(a+c)(b+d)(c+d)
(3)通过比较/与临界值的大小关系来作统计推断.
分层检测
【基础篇】
一、单选题
1.(2024•浙江宁波•二模)某校数学建模兴趣小组为研究本地区儿子身高y(cm)与父亲身高x(cm)之间的关
系,抽样调查后得出'与x线性相关,且经验回归方程为9=O.85X+29.5.调查所得的部分样本数据如下:
父亲身高x(cm)164166170173173174180
儿子身高y(cm)165168176170172176178
17
则下列说法正确的是()
A.儿子身高了(cm)是关于父亲身高x(cm)的函数
B.当父亲身高增加1cm时,儿子身高增加0.85cm
C.儿子身高为172cm时,父亲身高一定为173cm
D.父亲身高为170cm时,儿子身高的均值为174cm
2.(2024•天津河西•一模)随着居民家庭收入的不断提高,人们对居住条件的改善的需求也在逐渐升温.某
城市统计了最近5个月的房屋交易量,如下表所示:
时间尤12345
交易量y(万套)0.50.81.01.21.5
若丫与尤满足一元线性回归模型,且经验回归方程为a=o-24x+e,则下列说法错误的是()
A.根据表中数据可知,变量'与x正相关
B.经验回归方程f=0.24x+C中&=0.28
C.可以预测x=6时房屋交易量约为1.72(万套)
D.x=5时,残差为-0.02
3.(2024•天津•一模)下列说法正确的是()
A.一组数据7,8,8,9,11/3,15,17,20,22的第80百分位数为17;
B.根据分类变量X与丫的成对样本数据,计算得到力2=4.712,根据小概率值a=Q05的独立性检验
(马05=3.841),可判断X与y有关联,此推断犯错误的概率不大于0.05;
C.两个随机变量的线性相关性越强,相关系数的绝对值越接近于0;
D.若随机变量。,〃满足〃=3。-2,则。⑻=3。0-2.
4.(23-24高三上•天津北辰•期中)下列结论中,错误的是()
A.数据4,1,6,2,9,5,8的第60百分位数为6
B.若随机变量尸偌4-2)=0.21,则P(JW4)=0.79
C.已知经验回归方程为y=〃x+1.8,且x=2,y=20,贝心=9.1
D.根据分类变量X与丫成对样本数据,计算得到*2=9.632,依据小概率值a=0.001的/独立性检验
(^0,001=10.828),可判断x与y有关联,此推断犯错误的概率不大于0.001
二、多选题
5.(2023•湖北•模拟预测)下列命题中正确的是()
18
A.若样本数据耳,々,L,尤20的样本方差为3,则数据25+1,2X2+1,L,2X20+1的方差为7
B.经验回归方程为a=0.3-0.7x时,变量x和y负相关
C.对于随机事件A与'P(A)>0,P(B)>0,若P(A|B)=P(A),则事件A与B相互独立
D.若乂~《7,£|,则P(X=L)取最大值时左=4
6.(2024•山东枣庄•模拟预测)已知两个变量y与尤对应关系如下表:
X12345
y5m8910.5
若y与无满足一元线性回归模型,且经验回归方程为9=L25x+4.25,则()
A.y与尤正相关B.m=7
C.样本数据y的第60百分位数为8D.各组数据的残差和为0
7.(2024・湖北武汉•二模)下列结论正确的是()
A.一组数据7,8,8,9,11,13,15,17,20,22的第80百分位数为17
B.若随机变量机〃满足〃=3”2,则。(〃)=3。©-2
C.若随机变量tN(4,(T2),且尸C<6)=0.8,贝。2(2<4<6)=。.6
D.根据分类变量X与V的成对样本数据,计算得到力2=4.712.依据e=0.05的独立性检验(xo,o5=3-841),
可判断x与y有关
三、填空题
8.(23-24高三下•上海嘉定•阶段练习)某产品的广告支出费用无(单位:万元)与销售额y(单位:万元)
的数据如下表:
X24568
y3040a5070
已知y关于x的线性回归方程为y=6.5x+15.1,则表格中实数a的值为.
9.(23-24高二下•江西赣州•期中)甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算
得到各自研究的两个随机变量的线性相关系数分别为4=066,々=-0.97,4=092,〃=0.89,则这四人
中,研究的两个随机变量的线性相关程度最高.
10.(2024・上海长宁•二模)收集数据,利用2x2列联表,分析学习成绩好与上课注意力集中是否有关时,
提出的零假设为:学习成绩好与上课注意力集中(填:有关或无关)
19
四、解答题
11.(2024•四川成都•模拟预测)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速
增长态势,某线下家电商场为提升人气和提高营业额也开通了在线直播,下表统计了该商场开通在线直播
⑵根据第1至第5天的数据分析,可用线性回归模型拟合y与尤的关系,试求出该线性回归方程并估计该商
场开通在线直播的第10天的线下顾客人数.
n
(参考公式:相关系数7=I,TI,_,参考数据:同。13.038
店(x厂方区(%-丫)2
Vi=lVi=l
£(%一元)(外一歹)£七y一"无》
回归方程:y=bx+a^其中匕=3-,a=y-bx)
方(占-可2h位2
1=11=1
12.(2024,四川内江•三模)2024年2月10日至17日(正月初一至初八),"2024•内江市中区新春极光焰火
草地狂欢节"在川南大草原举行,共举行了8场精彩的烟花秀节目.前5场的观众人数(单位:万人)与场
次的统计数据如表所示:
场次编号X12345
观众人数y0.70.811.21.3
⑴已知可用线性回归模型拟合y与尤的关系,请建立V关于X的线性回归方程;
(2)若该烟花秀节目分A、B、C三个等次的票价,某机构随机调查了该烟花秀节目现场200位观众的性别与
购票情况,得到的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 如何提高信息系统项目管理师考试中的回答准确性试题及答案
- 西方立法机关的功能与作用试题及答案
- 软考网络工程师学习资源分享试题及答案
- 公共政策危机沟通策略研究试题及答案
- 计算机三级软件测试在政策中的应用试题及答案
- 机电工程的职业发展路径试题及答案
- 网络安全态势感知技术试题及答案
- 网络工程师全面准备试题及答案
- 前沿公共政策研究热点试题及答案
- 软件设计师考试心理调适方法与试题与答案
- 消防水管道改造应急预案
- 2021城镇燃气用二甲醚应用技术规程
- 【保安服务】服务承诺
- 07第七讲 发展全过程人民民主
- 弱电智能化系统施工方案
- 对外派人员的员工帮助计划以华为公司为例
- 2020-2021学年浙江省宁波市镇海区七年级(下)期末数学试卷(附答案详解)
- GB/T 9162-2001关节轴承推力关节轴承
- GB/T 34560.2-2017结构钢第2部分:一般用途结构钢交货技术条件
- 阅读绘本《小种子》PPT
- 医院清洁消毒与灭菌课件
评论
0/150
提交评论