版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3讲成对数据的统计分析
・砒练知识通关
I.在用经验回归方程研究四组数据的拟合效果时,分别作出下列四个关于四组数据的残差
图,则用线性回归模型拟合效果最佳的是(A)
CD
解析用残差图判断模型的拟合效果时,残差点比较均勺地落在水平的带状区域中,说明
这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合效果越好.故选A.
2.[全国卷I]某校一个课外学习小组为研究某作物种子的发芽率y和温度工(单位:°C)
的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(为,.%)(/=1,
2,…,20)得到如图所示的散点图.
由此散点图,在1()℃至40c之间,下面四个回归方程类型中最适宜作为发芽率y和温度
x的回归方程类型的是(D)
A.y=a+〃xB.yj+bx2
Cj=a+be'D.y=a+bliu
解析由散点图可以看出,随着温度工的增加,发芽率y增加到一定程度后,变化率越来
越慢,符合对数型函数的图象特征.
3.[2024江苏徐州模拟]如图,在一组样本数据4(2,2),B(4,
皿7|
3),C(6,4),D(8,7),E(10,6)的散点图中,若去掉。(^10.6
(8,7),则下列说法正确的为(D)
A.样本相关系数,变小
B.残差平方和变大
C.决定系数R?变小
D.自变量x与因变量),的相关程度变强
解析由散点图分析可知,只有。点偏离直线较远,去掉。点后,x与},的线性相关程度
变强,且为正相关,所以样本相关系数/•变大,决定系数R2变大,残差平方和变小,故选
D.
4.[2024青岛市检测]已知某设备的使用年限x(年)与年维护费用),(千元)的对应数据
如下表:
x24568
>-34.56.57.59
由所给数据分析可知:x与),之间具有线性相关关系,且,,关于x的经验回归方程为9=
1.05x4-a,则6=(B)
A.0.75B.0.85C.0.95D.1.05
解析由题意可知元=2+4-5+6+8=5,尸3+4.5+6.5+7.5+9=6],则6.1=1.05X5+匾所以6
=6.1-1.05X5=0.85,故选B.
5.[多选/2024九江模拟]根据最小二乘法,由一组样本点(即,y,)(其中i=l,2,…,
300)求得的经验回归方程是9=h+篦则下列说法正确的是(BD)
A.至少有一个样本点落在经验回归直线夕=以+4上
B.若所有样本点都在经验回归直线夕=>+6上,则变审:间的相关系数为土1
A
C.对所有的解释变量为(i=l,2,300),加叶6的值一定与y•有误差
D.若经验回归直线夕=晨+6的斜率片>0,则变量x.与y正相关
解析经脸回归直线必过样本点的中心,但样本点可能都不在经脸回归直线上,故A缙
误;若所有样本点都在经脸回归直线?=欧+6上,则变量间的相关系数为±1,故B正
确;若所有的样本点都在经验回归直线尸晨+6上,贝晟,+a的值与v相等,故C错误;
相关系数「与b符号相同,若经验回归直线夕=或+6的斜率匕>0,则—>0,样本点散布在
从左下角到右上角的区域,则变量x与),正相关,故D正确.故选BD.
6.[多选Z2024贵州统考]某学校高三年级甲、乙两班共1。5人进行了一次数学测试.按照成
绩大于或等于12()分(满分15()分)的同学评价为“优秀生”,其他分数的同学评价为
“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽
取1人,“优秀生”的概率为1根据表(2)的数据,可断定下列说法正确的是
(BC)
表⑴单位:人
班级成绩合计
优秀生潜力生
甲班10b
乙班C30
合计105
表(2)
a0.050.010.001
Xa3.8416.63510.828
A.列联表中。的值为30,b的值为35
B.列联表中c的值为20,5的值为45
C.根据列联表中的数据,有95%的把握认为成绩与班级有关
D.根据列联表中的数据,发有95%的把握认为成绩与班级有关
解析因为在这105人中随机抽取1人,“优秀生”的概率为5,所以“优秀生”的人数为
105X^=30,“潜力生”的人数为105—30=75,所以c=30-10=20,。=75—30=45,
故A错B对;
因为公=小;黑黑善)工6」09>3.841,所以有9£%的把握认为成绩与班级有关,故
C对D错.故选BC.
7.[多选Z2024云南师大附中月考]已知变量x,y之间的经验回归方程为少=10.3—0.7x,且
变量x,y的数据如表所示,则下列说法正确的是(BC)
X681012
y6m32
A.变量本与>正相关
B.实数m的值为5
C.该经验回归直线必过点(9,4)
D.相应于(10,3)的残差为0.3
解析由表格数据得,=+8+10+12=9,9=6+m+3+2=3,将点(以山)代入经验
4444
回归方程夕=10.3—0.7不得,^^=10.3-0.7X9,解得〃?=5,所以选项B正确;
土2=4,即样本点的中心为(9,4),所以选项C正确;
4
当变量X增加时,变量),加应值减少,两个变量负相关,所以选项A错误;
由残差的定义知,观测值成去预测值为残差,由经验回归方程9=10.3—0.7抬令x=10,
得预测值夕=3.3,则相应于(10,3)的残差为3—3.3=—0.3,所以选项D错误.故选BC.
8.[2024海南月考]某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,
具体数据如下表:
单位:人
专业
性别合计
非统计专业统计专业
男131023
女72027
合计203050
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到22=
50\:3誉:*7)2=4.844,因为口2>3.841,所以判定主修统“专业与性别有关系,那么这
Z3XZ/XZUX3U
种判断出错的可能性最大为1%.
附:
a0.100.050.0100.001
Xa2.7063.8416.63510.828
解析因为□2>3.841=XQO5,所以依据小概率值Q=0.05的独立性检验,认为主修统计专
业与性别有关,出错的可能性最大为5%.
9.某手机运片阍为了拓展业务,现对该手机使用潜在客户进仃调查,随机抽
取国内、国外潜在用户代表各100名,调查用户对是否使用该手机的态度,
得到如图所示的等高堆积条形图.根据等高图,依据小概率值a=0.005的独
EKM外
立性检验,能(填“能”或“不能”)认为持乐观态度和国内外差异有RA代人
关.
?n(ad—be),,,,.
附:X(a+b)(c+d)(a+c)g+d)'〃a+Hc+d
a0.010.0050.001
与6.6357.87910.828
解析零假设为Ho:持乐观态度和国内外差异无关.由题填写2X2列联表如下,
单位:名
态度
潜在客户合计
乐观不乐观
国内代表6040100
国外代表4060100
合计100KX)200
根据列联表得口2:端黑爆暗
8>7.879xo.oof»
所以依据小概率值a=0.0D5的独立性检验,我们推断丛不成立,即能认为持乐观态度和
国内外差异有关.
10.[2024武汉部分学校调考]某校为考查学生对紧急避给知识的掌握情况,从全校学生中
选取200名学生进行紧急避险知识测试,其中男生110名,女生90名.所有学生的测试成
绩(单位:分)都在区间[50,100]内,由测试成绩数据作出如图所示的频率分布直方图.
(1)若从频率分布直方图中估计出样本的平均数与中位数相等,求图中小的值;
(2)规定测试成绩不低于80分为优秀,已知共有45名男生测试成绩优秀,完成下面的列
联表,并根据小概率值a=0.05的独立性检验,能否推断男生和女生的测试成绩优秀率有
差异?
单位:人
测试成绩
性别合计
优秀不优秀
男生45
女生
合计
参考公式与数据:/2=n(ad—be)
(a+b)(c+d)(a+c)(b+d)
a0.10.050.01
用2.7063.8416.635
解析⑴由题意,第一组的频率/组距为总一〃?-0.04—0.025—0.01=0.025一6.
样本平均数的估计值为1CX[(0.025-w)X55+wX65+0.04X75+0.025X85+
0.01X95]=74.5+100%
样本中位数的估计值为70+10x。。,-1『也。1-。。25-03J=76.25.
0.04
所以74.5+IOO/n=76.25,解得机=0.0175.
(2)零假设男生和女生的测试成绩优秀率没有差异.
测试成绩优秀的总人数为200X10X(0.025+0.01)=70.
得到列联表:
单位:人
测试成绩
,性别合计
优秀不优秀
男生4565110
女生256590
合计70130200
?200X(45X6S-25X65)
yz=-------------------------------------=—^3.750.841=x.05.
4110X90X70X1306930
所以根据小概率值a=0.()5的独立性检验,不能推断男生和女生的测试成绩优秀率有差异.
II.[全国卷II]某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为
调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单
随机抽样的方法抽取20个作为样区,调查得到样本数据5,3=1,2,…,20),
其中为和K・分别表示第,•个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,
2020202020
2
并计算得Z为=60,Zy/=1200,Z(为一元)2=80,£(yi-y)=9000,£(为一
i=li=li=li=li=l
%)•(y,—y)=800.
(1)求该地区这种野生均物数量的估计值(这种野生动物数量的估计值等于样区这种野生
动物数量的平均数乘地块数).
(2)求样本(即,>7)(Z-1,2,…,20)的相关系数(精确到0.01).
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该
地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
n
Z<^|—y)
附:相关系数*•,V2^1.414.
n-2n2
X(Xi-x)Z(yr)
i=l
120
解析(i)由已知得样本平均数5?=;ZM=6O,从而该地区这种野生动物数量的估计值
20i=l
为60X200=12(X)0.
(2)样本(xt,»)(i=l,2,…,20)的相关系数
20
X(Xi-x)(yi-y)
800_2>/2
i=l-0.94.
I20220,80X9000—3
i=li=i
(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机
抽样.
理由如下:由(2)知,各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于
各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层
随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而
可以获得该地区这种野生动物数量更准确的估计.
能力练
12.[2024内江模拟]某网络直播平台调研“大学生是否喜欢观看体育比赛直播与性别有
关“,从某高校男、女生中各随机抽取100人进行问卷调查,得到如下数据(5W〃?W15,
机£N).
喜欢观看不喜欢观看
男生80-/n20+m
女生50+〃?50—"7
通过计算,有95%以上的把握认为大学生喜欢观看体育比赛直播与性别有关,则在被调查
的100名女生中喜欢观看体育比赛直播的人数的最大值为(C)
附U黑黑…,其中〃—。+"c+H
a0.150.100.050.0100.001
2.0722.7063.8416.63510.828
A.55B.57C.58D.60
解析因为丫2=.(ad-bc)_______200[(80—m)(50-m)-(20+m)(50+m)产_
X(a+d)(c+d)(a+c)(b+d)100x100x130x70
2
2384],所以(15—机)2243.69,又5W〃?W15,所以15—〃127,解得
〃?W8,故在被调查的100名女生中喜欢观看体育比赛直播的人数的最大值为58.故选C.
13.[多选Z2O23长沙市适应性考试]自然环境中,大气压就受到各种因素的影响,如温度、
湿度、风速和海拔等方面的改变,都将导致大气压强发生相应的变化,其中以海拔的影响
最为显著.如图是根据一组观测数据得到的海拔6km〜15km的大气压强(单位:kPa)散
点图,根据一元线性回归模型得到经验回归方程为%=—4.0戈+68.5,决定系数为厝=
0.99;根据非线性回归模型得到非线性经验回归方程为%=132.9e-0•⑹。决定系数为爆=
0.99,则下列说法正确的是(ACD)
■大气K・g
Sf>7t910II121)14IS修急
A.由散点图可知,大气压强与海拔负相关
B.由方程%=—4.0.1+68.5可知,海拔每升高1km,大气压强必定降低4.0kPa
C.由方程%=—4.0\+68.5可知,样本点(II,22.6)的残差为-1.9
D.对比两个回归模型,结合实际情况,方程凫=132.9eF」63,的预报效果更好
解析观察题中散点图,可知大气压强与海拔负相关,即A正确;通过经验回归方程%=
-4.0.r+68.5,可知海拔每升高1km,大气压强大约降低4.0kPa,即B错误;当x=11
时,代入方程%=—4.0犬一68.5计算可得预测值%=24.5,则残差为22.6—24.5=—1.9,即
C正确:随着海拔的增加:大气压强越来越小,但不可能为负数,因此,方程为=
132.9e-0i63x的预报效果更好,即D正确.故选ACD.
14.[2024庆阳检测]己知某池塘中水生植物的覆盖水塘面积x(单位:dm2)与水生植物的
株数y(单位:株)的关系可以用模型y=cek(c>0)云拟合,设z=ln»,,x与z的数据如
表格所示:
x3467
z22.54.57
由上表可得x与z的经验回归方程E=12r+*则c=I?.
解析由已知可得,完=3…6+7=5,簿=2+2.5+45+7=4,所以4=1.2X5+a,解得6=2,
44
所以2=12Y—2,由z=lny,得ln),=12t—2,所以),={上一2=屋2.4汽则。=e一2
15.[2024云南模拟]某新能源汽车公司从2018年到2022年汽车年销售量),(单位:万辆)
的散点图如下:
80
70
60
50
40
30
20
10
0201820192020202】2022东份
记年份代码为X(x=l,2,3,4,5).
(I)根据散点图判断,模型①-与模型②),=cH•加,哪一个更适宜作为年销售量),
关于年份代码x的经验回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y关于x的经验回归方程.
(3)预测2024年该公司新能源汽车销售量.
参考数据:
55
£孙
yZ婷
i=li=li=li=l
34559796572805
参考公式:经验回归直线,=:+云的斜率和截距的最小二乘估计公式分别为b=
n_”
I(Xj-x)(yj-y)gxiM-7反歹AA
-------~»a=y-bx.
£(%j—x)xf—nx2
i=il=i
解析(1)由散点图知,模型②更适宜作为年销售量y关于年份代码x的经脸回归方程.
(若线性相关,则可以看出各散点大概排列在一条直线附近)
(2)设r=Ar,
£x?
由已知得£=0'=11,9=34,
S
Z砂i=£2M=2805,£妤=£婷=979,
i=li=li=li=l
5__
MLN:-5ty2805-5x11x342805-1870935
所以d------=---------=--------=—=2.5,
yf2-5t2979-5X112979—605374
i=i*
c=34-2.5X11=6.5,
所以),关于f的经验回归方程为,=6.5+2.53
即y关于A-的经验回归方程为,=6.5I2.5A2.
(3)2024年对应的年份代码为x=7,(一定要弄清年份代码)
得(=6.5+2.5X72=129,
所以预测2024年该公司新能源汽车销售品为129万辆.
16.[2024浙江名校联考]某科研所研究表明,绝大部分抗抑郁、抗焦虑的药物都有一个奇
特的功效,就是刺激人体大脑多巴胺(Dopamine)的分泌,所以又叫“快乐药”.其实科
学、合理、适量•的有氧运动就会增加人体大脑多巴胺的分泌,从而缓解抑郁、焦虑的情绪.
定义运动后一天内多巴胺含量超过400Hg是明显有效运动,否则是不明显有效运动.树人中
学为了了解学生明显有效运动是否与性别有关,对运动后的60名学生进行检测,其中女生
与男生的人数之比为1:2,女生中明显有效运动的人数占j男生中明显有效运动的人数
占*
(I)根据所给的数据完成卜表,并依据小概率值。=0.10()的独立性检验,判断明显有效
运动是否与性别有关,并说明理由.
单位:人
性别
运动合计
女生男生
明显有效运动
不明显有效运动
合计
(2)若从树人中学所有学生中抽取II人,用样本的频率估计概率,则II人中不明显有效
运动的人数最有可能是多少?
n(ad—be)
附:x2='其中〃=a+"+c+d.
(.a+b)(c+d)(a+c)(b+d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民航安检站内部管理制度
- 河长办机关内部管理制度
- 海关事务内部审计制度
- 扎兰屯职业学院《现代微处理器原理及应用》2024-2025学年第二学期期末试卷
- 灭鼠公司内部培训制度
- 煤矿内部市场化制度
- 煤矿运输科内部考核制度
- 四川文理学院《标志与色彩》2024-2025学年第二学期期末试卷
- 监理内部沟通制度
- 科室内部卫生管理制度
- 第六单元联读公开课一等奖创新教学设计统编版高中语文必修下册
- 2026国家统计局桐庐调查队招聘编外工作人员1人考试参考题库及答案解析
- 2025年河南林业职业学院单招职业适应性考试题库附答案解析
- 2026天津宏达投资控股有限公司及所属企业招聘工作人员16人备考题库附参考答案详解(考试直接用)
- 25-26第二学期初三年级历史备课组工作计划:研析中考真题优化复习策略提升历史学科应试能力
- 林业项目监理工作总结与报告
- 化工造粒工安全教育考核试卷含答案
- 制冷基础知识课件
- 放射科质控管理(技师组)
- 2026年江西单招新能源汽车技术专业基础经典题详解
- 手键拍发课件
评论
0/150
提交评论