版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3讲成对数据的统计分析
・砒练知识通关
I.在用阅历回来方程探讨四组数据的拟合效果时,分别作出下列四个关于四组数据的残差
图,则用线性回来模型拟合效果最佳的是(A)
CD
解析用残差图推断模型的拟合效果时,残差点比较分整地落在水平的带状区域中,说明
这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合效果越好.故选A.
2.[全国卷I]某校一个课外学习小组为探讨某作物种子的发芽率y和温度工(单位:°C)
的关系,在20个不同的温度条件下进行种子发芽试验,由试验数据(为,.%)(/=1,
2,…,20)得到如图所示的散点图.
由此散点图,在1()℃至40c之间,下面四个回来方程类型中最相宜作为发芽率y和温度
x的回来方程类型的是(D)
\.y=a-\-bxB.yj+bx2
Cj=a+be'D.y=a+bliu
解析由散点图可以看出,随着温度工的增加,发芽率y增加到确定程度后,变更率越来
越慢,符合对数型函数的图象特征.
3.[2024江苏徐州模拟]如图,在一组样本数据4(2,2),B(4,
皿7|
3),C(6,4),D(8,7),E(10,6)的散点图中,若去掉。(^10.6
(8,7),则下列说法正确的为(D)
A.样本相关系数,变小
B.残差平方和变大
C.确定系数R?变小
D.自变量x与因变量),的相关程度变强
解析由散点图分析可知,只有。点偏离直线较远,去掉。点后,x与},的线性相关程度
变强,且为正相关,所以样本相关系数;■变大,确定系数R2变大,残差平方和变小,故选
D.
4.[2024青岛市检测]已知某设备的运用年限x(年)与年维护费用),(千元)的对应数据
如下表:
x24568
>-34.56.57.59
由所给数据分析可知:x与),之间具有线性相关关系,且,,关于x的阅历回来方程为9=
1.05x4-a,则6=(B)
解析由题意可知±=>4-;+6+8=5,歹=3+4.5+6$5+7.5+9=6J,则6.1=1.05X5+跖所以我
=6.1-1.05X5=0.85,故选B.
5.[多诜4024九江模拟]依据最小一乘法,由一组样本点(埼,>0(其中,=1,2,....
A
300)求得的阅历回来方程是夕=心+6,则下列说法正确的是(BD)
A.至少有一个样本点落在阅历回来直线歹=队+6上
B.若全部样本点都在阅历回来直线y=>+6上,则变量间的相关系数为土1
C.对全部的说明变量苞(i=l,2,…,300),加什6的值确定与9有误差
D.若阅历回来直线夕=晨+6的斜率i>0,则变量x与y正相关
解析阅历回来直线必过样本点的中心,但样本点可能都不在阅历回来直线上,故A缙
误;若全部样本点都在阅历回来直线夕=晨+6上,则变显间的相关系数为±1,故B正
确;若全部的样本点都在阅历回来直线式上,则5加+6的值与y相等,故C错误;
相关系数r与b符号相同,若阅历回来直线的斜率b>0,则r>0,样本点散布在
从左下角到右上角的区域,则变量x与},正相关,故D正确.故选BD.
6.[多选/2024贵州统考]某学校面三年级甲、乙两班共105人进行了一次数学测试.依据成
果大于或等于120分(满分150分)的同学评价为“优秀生”,其他分数的同学评价为
“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽
取1人,“优秀生”的概率为泉依据表(2)的数据,可断定下列说法正确的是
(BC)
表(1)单位:人
班级成果合计
优秀生潜力生
甲班10b
乙班C30
合计105
表(2)
a0.050.010.001
Xa3.8416.63510.828
A.列联表中。的值为30,b的值为35
B.列联表中c的值为20,5的值为45
C.依据列联表中的数据,有95%的把握认为成果与班级有关
D.依据列联表中的数据,发有95%的把握认为成果与班级有关
解析因为在这105人中随机抽取1人,“优秀生”的概率为5,所以“优秀生”的人数为
105X^=30,“潜力生”的人数为105—30=75,所以c=30-10=20,。=75—30=45,
故A错B对;
因为六屿;黑:so筹:6」。9>3.841,所以有第%的把握认为成果与班级有关,故
C对D错.故选BC.
7.[多选Z2024云南师大附中月考]已知变量x,y之间的阅历回来方程为少=10.3—0.7x,且
变量x,y的数据如表所示,则下列说法正确的是(BC)
X681012
y6m32
A.变量本与>正相关
B.实数m的值为5
C.该阅历回来直线必过点(9,4)
D.相应于(10,3)的残差为0.3
解析由表格数据得,…=9,六。十…将点(,山)代入阅历
44494
回来方程夕=10.3—0.7x得,等巴=10.3—0.7X9,解得〃?=5,所以选项B正确;
土2=4,即样本点的中心为(9,4),所以选项C正确;
4
当变量X增加时,变量),加应值削减,两个变量负相关,所以选项A错误;
由残差的定义知,观测值成去预料值为残差,由阅历回来方程夕=10.3—0.7抬令x=10,
得预料值夕=3.3,则相应于(10,3)的残差为3—3.3=—0.3,所以选项D错误.故选BC.
8.[2024海南月考]某高校“统计初步”课程的老师随机调查了选该课的一些学生的状况,
详细数据如下表:
单位:人
专业
性别合计
非统计专业统计专业
男131023
女72027
合计203050
为了推断主修统计专业是否与性别有关系,依据表中的数据,得到f=
50\:3*7)4844,因为12>3.841,所以判定主修统订专业与性别有关系,那么这
Z3XZ誉/XZ:UX3U;
种推断出错的可能性最大为五%.
附:
a0.100.050.0100.001
Xa2.7063.8416.63510.828
解析因为□2>3.841=XQO5,所以依据小概率值Q=0.05的独立性检验,认为主修统计专
业与性别有关,出错的可能性最大为5%.
9.某手机运片阍为了拓展业务,现对该手机运用潜在客户进仃调查,随机抽
取国内、国外潜在用户代表各100名,调查用户对是否运用该手机的看法,
得到如图所示的等高积累条形图.依据等高图,依据小概率值a=0.005的独
EKM外
立性检验,能(填“能”或“不能”)认为持乐观看法和国内外差异有RA代人
关.
?n(ad—be),,,,.
附:X(a+b)(c+d)(a+c)g+d)'〃a+Hc+d
a0.010.0050.001
与6.6357.87910.828
解析零假设为Ho:持乐观看法和国内外差异无关.由题填写2X2列联表如下,
单位:名
看法
潜在客户合计
乐观不乐观
国内代表6040100
国外代表4060100
合计100KX)200
2
相拉切侬主;Vri2—200x(60X60-40X40)-
Q0-7Q*/7JQ”v八0,八0八0.£,
100X100X100X100
所以依据小概率值a=0.0D5的独立性检验,我们推断丛不成立,即能认为持乐观看法和
国内外差异有关.
10.[2024武汉部分学校调考]某校为考查学生对紧急避3佥学问的驾驭状况,从全校学生中
选取200名学生进行紧急避险学问测试,其中男生110名,女生90名.全部学生的测试成
果(单位:分)都在区间[50,100]内,由测试成果数据作出如图所示的频率分布直方图.
(1)若从频率分布直方图中估计出样本的平均数与中位数相等,求图中小的值;
(2)规定测试成果不低于80分为优秀,已知共有45名男生测试成果优秀,完成下面的列
联表,并依据小概率值a=0.05的独立性检验,能否推断男生和女生的测试成果优秀率有
差异?
单位:人
测试成果
性别合计
优秀不优秀
男生45
女生
合计
参考公式与数据:/2=n(ad—be)
(a+b)(c+d)(a+c)(b+d)
a0.10.050.01
用2.7063.8416.635
解析⑴由题意,第一组的频率/组距为总一〃?-0.04—0.025—0.01=0.025一6.
样本平均数的估计值为1CX[(0.025-w)X55+wX65+0.04X75+0.025X85+
0.01X95]=74.5+100%
样本中位数的估计值为70+10x。。,-1『也。1-。。25-03J=76.25.
0.04
所以74.5+IOO/n=76.25,解得机=0.0175.
(2)零假设男生和女生的测试成果优秀率没有差异.
测试成果优秀的总人数为200X10X(0.025+0.01)=70.
得到列联表:
单位:人
测试成果
,性别合计
优秀不优秀
男生4565110
女生256590
合计70130200
?200X(45X6S-25X65)
yz=-------------------------------------=—^3.750.841=x.05.
4110X90X70X1306930
所以依据小概率值a=0.()5的独立性检验,不能推断男生和女生的测试成果优秀率有差异.
II.[全国卷II]某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为
调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简洁
随机抽样的方法抽取20个作为样区,调查得到样本数据5,3=1,2,…,20),
其中为和K・分别表示第,•个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,
2020202020
2
并计算得Z为=60,Zy/=1200,Z(为一元)2=80,£(yi-y)=9000,£(为一
i=li=li=li=li=l
%)•(y,—y)=800.
(1)求该地区这种野生均物数量的估计值(这种野生动物数量的估计值等于样区这种野生
动物数量的平均数乘地块数).
(2)求样本(即,>7)(Z-1,2,…,20)的相关系数(精确到0.01).
(3)依据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该
地区这种野生动物数量更精确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
n
Z<^|—y)
附:相关系数*•,V2^1.414.
n-2n2
X(Xi-x)Z(yr)
i=l
120
解析(i)由已知得样本平均数5?=;ZM=6O,从而该地区这种野生动物数量的估计值
20i=l
为60X200=12(X)0.
(2)样本(xt,»)(i=l,2,…,20)的相关系数
20
X(Xi-x)(yi-y)
800_2>/2
i=l-0.94.
I20220,80X9000—3
i=li=i
(3)分层随机抽样:依据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机
抽样.
理由如下:由(2)知,各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于
各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,接受分层
随机抽样的方法较好地保持了样本结构与总体结构的一样性,提高了样本的代表性,从而
可以获得该地区这种野生动物数量更精确的估计.
能力练
12.[2024内江模拟]某网络直播平台调研“高校生是否宠爱观看体育竞赛直播与性别有
关“,从某高校男、女生中各随机抽取100人进行问卷调查,得到如下数据(5W〃?W15,
机£N).
宠爱观看不宠爱观看
男生80-/n20+m
女生50+〃?50—"7
通过计算,有95%以上的把握认为高校生宠爱观看体育竞赛直播与性别有关,则在被调查
的100名女生中宠爱观看体育竞赛直播的人数的最大值为(C)
附:倒=,其中〃=q+0+c+d.
(a-i-b)(c+d)(a+c)(b+d)
a0.150.100.050.0100.001
Xu2.0722.7063.8416.63510.828
A.55B.57C.58D.60
解析因为丫2=.(-c)2_200[(80—m)(50-m)-(20+m)(50+m):_
肿,X(a+d)(c+d)(a+c)(b+d)100x100x130x70
2
23.841,所以(15—机)2243.69,又5W〃?W15,m£N,所以15—〃127,解得
机<8,故在被调查的100名女生中宠爱观看体育竞赛直播的人数的最大值为58.故选C.
13.[多选Z2024长沙市适应性考试]自然环境中,大气压就受到各种因素的影响,如温度、
湿度、风速和海拔等方面的变更,都将导致大气压强发生相应的变更,其中以海拔的影响
最为显著.如图是依据一组观测数据得到的海拔6km〜15km的大气压强(单位:kPa)散
点图,依据一元线性回来模型得到阅历回来方程为%=—4.0戈+68.5,确定系数为厝=
0.99;依据非线性回来模型得到非线性阅历回来方程为%=132.9e-0•⑹。确定系数为端=
0.99,则下列说法正确的是(ACD)
•大WAP.
S67t910II121)14is修急
A.由散点图可知,大气压强与海拔负相关
B.由方程%=-4.0x+68.5可知,海拔每上升1km,大气压强必定降低4.0kPa
C.由方程%=—4.0\+68.5可知,样本点(II,22.6)的残差为-1.9
D.对比两个回来模型,结合实际状况,方程凫=132.9eF」63,的预报效果更好
解析视察题中散点图,可知大气压强与海拔负相关,即A正确;通过阅历回来方程%=
-4.0.r+68.5,可知海拔每上升1km,大气压强大约降低4.0kPa,即B错误;当x=11
时,代入方程%=—4.(卜一68.5计算可得预料值%=24.5,则残差为22.6—24.5=—1.9,即
C正确:随着海拔的增加:大气压强越来越小,但不行能为负数,因此,方程为=
132.9e-0i63x的预报效果更好,即D正确.故选ACD.
14.[2024庆阳检测]己知某池塘中水生植物的覆盖水塘面积x(单位:dm2)与水生植物的
株数y(单位:株)的关系可以用模型y=cek(c>0)云拟合,设z=ln»,,x与z的数据如
表格所示:
x3467
z22.54.57
由上表可得X与z的阅历回来方程E=12r+*则c=I?.
解析由已知可得,完=3…6+7=5,簿=2+2.5+45+7=4,所以4=1.2X5+a,解得6=2,
44
所以2=12Y—2,由z=lny,得ln),=12t—2,所以),={上一2=屋2.4汽则。=e一2
15.[2024云南模拟]某新能源汽车公司从2024年到2024年汽车年销售量),(单位:万辆)
的散点图如下:
80
70
60
50
40
30
20
10
0201820192020202】2022东份
记年份代码为X(x=l,2,3,4,5).
(I)依据散点图推断,模型①-与模型②),=cH•加,哪一个更相宜作为年销售量),
关于年份代码x的阅历回来方程?(给出推断即可,不必说明理由)
(2)依据(1)的推断结果,建立y关于x的阅历回来方程.
(3)预料2024年该公司新能源汽车销售量.
参考数据:
55
£孙
yZ婷
i=li=li=li=l
34559796572805
参考公式:阅历回来直线,=:+云的斜率和截距的最小二乘估计公式分别为b=
n_”
I(Xj-x)(yj-y)gxiM-7反歹AA
-------~»a=y-bx.
£(%j—x)xf—nx2
i=il=i
解析(1)由散点图知,模型②更相宜作为年销售量y关于年份代码x的闵历回来方程.
(若线性相关,则可以看出各散点或许排列在一条直线旁边)
(2)设r=Ar,
£x?
由已知得£=0'=11,9=34,
S
Z砂i=£2M=2805,£妤=£婷=979,
i=li=li=li=l
5__
MLN:-5ty2805-5x11x342805-1870935
所以d------=---------=--------=—=2.5,
yf2-5t2979-5X112979—605374
i=i*
c=34-2.5X11=6.5,
所以),关于f的阅历回来方程为,=6.5+2.53
即,美于k的阅历何来方程为,=6.5I2.5A2.
(3)2024年对应的年份代码为x=7,(确定要弄清年份代码)
得(=6.5+2.5X72=129,
所以预料2024年该公司新能源汽车销售品为129万辆.
16.[2024浙江名校联考]某科研所探讨表明,绝大部分抗抑郁、抗焦虑的药物都有一个奇
异的功效,就是刺激人体大脑多巴胺(Dopamine)的分泌,所以又叫“欢乐药”.其实科
学、合理、适量•的有氧运动就会增加人体大脑多巴胺的分泌,从而缓解抑郁、焦虑的心情.
定义运动后一天内多巴胺含量超过400Hg是明显有效运动,否则是不明显有效运动.树人中
学为了了解学生明显有效运动是否与性别有关,对运动后的60名学生进行检测,其中女生
与男生的人数之比为1:2,女生中明显有效运动的人数占j男生中明显有效运动的人数
占*
(I)依据所给的数据完成卜表,并依据小概率值。=0.100的独立性检验,推断明显有效
运动是否与性别有关,并说明理由.
单位:人
性别
运动合计
女生男生
明显有效运动
不明显有效运动
合计
(2)若从树人中学全部学生中抽取II人,用样本的频率估计概率,则II人中不明显有效
运动的人数最有可能是多少?
n(ad—be)
附:x2='其中〃=a+"+c+d.
(.a+b)(c+d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小型仓储建设方案
- 农产品促销工作方案
- 数字乡村建设推动方案
- 浙江省杭州市杭州中学2025-2026学年下学期八年级阶段性综合练习数学试题(含答案)
- 深圳妇女儿童建设方案
- 2026年元宇宙商业模式分析方案
- 海水监测工作方案怎么写
- 地下电缆敷设施工方案
- 少年警队活动实施方案
- 经常性督导工作方案
- 钢结构墙板拆除施工方案
- 第十一章-中国古代史学课件
- 全国统一市政工程预算定额
- 部编版道德与法治五年级下册第11课《屹立在世界的东方》精美课件
- 工艺技术文件审批流程
- 全媒体运营师题库(附参考答案)
- MOOC 孙子兵法-湖南大学 中国大学慕课答案
- 二十世纪的中国宗族研究
- 2024年上海市消防救援总队消防文员招聘笔试参考题库附带答案详解
- JBT 10205.2-2023 液压缸 第2部分:缸筒技术规范 (正式版)
- (完整版)xx中学“双积双评”积分入团实施方案
评论
0/150
提交评论