版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
I专题突破
专题五概率与统计
第3讲统计与成对数据的分析(新高考专用)
【真题自测】..................................................................2
【考点突破】..................................................................9
【考点一】统计图表、数字特征....................................................9
【考点二】回归分析............................................................14
【考点三】独立性检验..........................................................22
【专题精练】..................................................................29
考情分析:
岛考对本讲内容的考食往往以实际问题为背景,考食随机抽样与用样本估计总体、经验I可归方程的求解与
运用、独立性检验问题,常与概率综合考查,中等难度.
*真题自测
一、单选题
1.(2024•全国•高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的
亩产量(单位:kg)并整理如下表
亩产
[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1203)
量
频数61218302410
根据表中数据,下列结论中正确的是()
A.100块稻III亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
2.(2023•全国•高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样
调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,
则不同的抽样结果共有().
A.CEC2种B.C2-C或种
C.种D.C%C蒜种
3.(2022,全国•高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽
取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和
讲座后问卷答题的正确率如下图:
100%
95%
90%
裕85%...................♦...........................*.......♦................*.......♦........
含80%............................■..........................................................*■……*讲座前
固75%...........................................................*.......................................•讲座后
70%.............................*.....................................................................
65%……*.....................................*
60%-*.............*-
0IIIIiIIIII
I2345678910
居民编号
则()
A.讲座前问卷答题的正确率的中位数小于70%
B.饼座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
二、解答题
4.(2022•全国•高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为
良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾
病的人群中随机调查了100人(称为对照组),得到如卜数据:
不够良好良好
病例组4060
对照组1090
⑴能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,8表示事件"选到的人患有该疾
热粤与鬻孚的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为兄
病
|A)P(B|A)
RP(A|4)P(A\B)
(0)l止明;R;
P(A\B)P(A\B)
利用该调查数据,给出P(A|8),P(A|加的估计值,并利用(附的结果给出A的估计值.
附心…(:常:;…),
P(K2^k)0.0500.0100.001
k3.8416.63510.828
5.(2022•全国•高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木
的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截而积(单位:m?)和材积量(单位:mD,
得到如下数据:
样本号i12345678910总和
根部横截面积七0.040.060.040.080.080.050.050.070.070.060.6
材枳量,0.250.400.220.540.510.340.360.460.420.403.9
1010III
并计算得3d=0.038,=1.6158,Z”=0.2474.
1=11=1日
⑴估计该林区这种树木平均一棵的根部横截面枳与平均一棵的材枳量:
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
⑶现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.己
知树木的材枳量与其根部横截面枳近似成正比.利用以上数据给出该林区这种树木的总材枳量的估计值.
力a7)
附:相关系数“下㈡-------:--------•,4^3.377.
启(D专(一)2
6.(2023•全国•高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20
只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养
在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
⑴设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望:
(2)实验结果如下:
对照组的小白鼠体重的增加量从小到大排序为:
15.218.820.221.322.523.225.826.527.530.1
32,634.334.835.635.635.836.237.340.543.2
实验组的小白鼠体重的增加量从小到大排序为:
7.89.211.412.413.215.516.518.018.819.2
19.820.221.622.823.623.925.128.232.336.5
(i)求40只小鼠体重的增加量的中位数/〃,再分别统计两样本中小于〃?与不小于的数据的个数,完成如
列联表:
n30
对照组□□
实验组□□
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭虱环境中与正常环境中体重的增加量
有差异.
2=-----n(ad-bcy-----
(a+/,)(c+d)(a+c)(〃+d)
k.0.1000.0500.010
”(片/)2.7063.8416.635
参考答案:
题号123
答案CDB
1.C
【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可判断B:根据极差计
算方法即可判断C:根据平均值计算公式即可判断D.
【详解】对于A,根据频数分布表可知,6+12+18=36<50,
所以亩产量的中位数不小于1050kg,故A错误:
对于B,亩产量不低于M(X)kg的频数为24+10=34.
所以低T-1100kg的稻田占比为笠芸一=66%,故B错误;
11JU
对于C,稻田亩产量的极差最大为1200-900=300,最小为1150-950=200,故C1E确:
对于D,由频数分布表可得,平均值为
—x(6x925+12x975+18x!025+30>d075+24x1125+10x1175)=1067,故D错误.
故选:C.
2.C
【分析】利用分层抽样的原理和组合公式即可得到答案.
【详解】根据分层抽样的定义知初中部共抽取60x黑=40人,高中部共抽取60x黑=20,
6(K)6()()
根据组合公式和分步计数原理则不同的抽样结果共有c^,c*种.
故选:D.
3.B
【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.
【详解】讲座前中位数为“)%;,S%>70%,所以A错;
讲座后问卷答题的正确率只有•个是80%.4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率
的平均数大于85%,所以B对:
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标注差大于讲座后正确率的标准差,所
以C错;
讲座后问卷答题的正确率的极差为100%-80%=20%,
讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错.
故选:B.
4.⑴答案见解析
(2)(i)证明见解析:(ii)R=6:
【分析】(1)由所给数据结合公式求出力的值,将其与临界值比较大小,由此确定是否有99%的把握认为患
该疾病群体与未患该疾病群体的卫生习惯有差异;(2川)根据定义结合条件概率公式即可完成证明;(ii)根据
(i)结合已知数据求A.
n(ad-bc)200(40x90-60x10)-
【详解】(1)由已知不=24t
(a+b)(c+d)(a+c)[b+d)50xl50xl00xlC0
又AK?26.635)=0.01,24>6,635.
所以有99%的把握认为患该疾病群体与未患该疾病群体的H生习惯有差异.
阳.i?:P(3|A)P(B\A)_P{AB)P(A)P」所P(J
⑴口力丽应瓦i而一瓦而"T瓦而
P⑻P(AB)P(B)
nFkAA=,—•—
P⑻P(AB)P(B)P(AB)
所加畿•霜,
(ii)
由已知尸(A|8)=辞,尸(A|加=4,
I(X)10()
_60--90
又"川8)=而,「⑷所而,
所以R=・m国=6
P(A|B)P(A|B)
5.(l)0.06nr;0.39m3
(2)0.97
(3)1209m3
【分析】<1)计算出样本的一棵根部横截面枳的平均值及一棵材枳量平均值,即可估il•该林区这种树木平
均一棵的根部横截面积与平均一棵的材积量:
(2)代入题给相关系数公式去计算即可求得样本的相关系数值;
(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材枳量的估计
值.
【详解】(1)样本中10棵这种树木的根部横截面积的平均值了=辞=0.06
样本中10棵这种树木的材积量的平均值》=芳39=0.39
据此可估计该林区这种树木平均一棵的根部横截面积为0.06m?,
平均•棵的材积量为0.39而
10
)(.0
(2)序-嘴a
0.2474-10x0.06x0.390.01340.0134八八一
=/=/»------------«0.97
7(0.038-10x0.062)(1.6158-10xO.392)V0.00018960.01377
则//0.97
(3)设该林区这种树木的总材积量的估计值为Yn?,
又已知树木的材积量与其根部横截面积近似成正比,
0.06186
可得解之得y=l209mL
0.39Y
则该林区这种树木的总材积量估计为1209ma
6.⑴分布列见解析,E(X)=1
(2)(i)/〃=23.4:列联表见解析,(ii)能
【分析】(1)利用超几何分布的知识即可求得分布列及数学期望:
(2)(i)根据中位数的定义即可求得机=23.4,从而求得列联表;
(ii)利用独立性检验的卡方计算进行检验,即可得解.
【详解】(1)依题意,X的可能取值为0J2,
则尸<乂=0)=等=蜉,/乂=1)=警=黑,尸(乂=2)=警=磊
Jo7yCM39C4G7o
所以X的分布列为:
X012
192019
P与而刀
故EiX)=0x」10+lx9±0+2x1」0=l.
783978
(2)(i)依题意,可知这40只小白鼠体重增量的中位数是将两组数据合在一起,从小到大排后第20位与
第21位数据的平均数,观察数据可得第20位为23.2,第21位数据为23.6,
23.2+23.6cc“
所rrK以Im=---------=23.4,
2
故列联表为:
<m>m合计
对照组61420
实验组14620
合计202040
6.400>3.841,
所以能有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.
考点突破
【考点一】统计图表、数字特征
核心梳理:
步页率"频率"
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示工[云,频率=组距X源■彳.
组距组距
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面枳和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中
点的横坐标之和.
一、单选题
1.(2024•四川•模拟预测)甲、乙两名运动员在一次射击训练中各射靶20次,命中环数的频率分布条形图
如下.设甲、乙命中环数的众数分别为Z”Z乙,方差分别为或,则()
A.Z甲=Z乙,s甲>$2B.Z牛=Z乙,s甲<$乙
C.Z甲>Z乙,跖>$2D.Z甲<Z乙,$市>$2
2.(2024•辽宁•一模)下图是2022年5月―2023年5月共13个月我国纯电动汽车月度销量及增长情况统
计图(单位:万辆),则下列说法错误的是()(注:同比:和上一位同期相比)
2022年5月-2023年5月我国纯电动汽车月度销量及增长情况
单位:万辆单位:%
我国纯电动汽车月度销量(万辆)
。同比增长率(%)
A.2023年前5个月我国纯电动汽车的销量超过214万辆
B.这13个月我国纯电动汽车月度销量的中位数为61.5万辆
C.这13个月我国纯电动汽车月度销量的众数为52.2万辆
D.和上一年同期相比,我国纯电动汽车月度销量有增有减
二、多选题
3.(2024•河南•模拟预测)某地教师招聘考试,有3200人参加笔试,满分为100分,笔试成绩前20%(含
20%)的考生有资格参加面试,所有考生的笔试成绩和年龄分别如频率分布直方图和扇形统计图所示,贝人)
A.90后考生比00后考生多150人B.笔试成绩的60%分位数为80
C.参加面试的考生的成绩最低为86分D.笔试成绩的平均分为76分
4.(2024・广东汕头•一模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学
生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名
学生中,成绩位于[80,90)内的学生成绩方差为12,成绩位于[90,100)内的同学成绩方差为10.则()
参考公式:样本划分为2层,各层的容量、平均数和方差分别为:/〃、亍、0.记样本平均数为
石,样本方差为基,3m
^+(手-近)1+氏[$+任一⑹
A.a=O.(XM
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
三、填空题
5.(2024•甘肃白银•三模)一组样本数据12,15,12,13,18,10,16,19,15,12的众数为,中位数为.
6.(2024・山东济宁•一模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本
题共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6
分,有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某
小题止确选项为一:个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题
的考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随和什也
选了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为.
7.(23-24高二上•湖北武汉•开学考试)有一组按从小到大顺序排列的数据:3,5,X,8,9,10,若其极
差与平均数相等,则这组数据的中位数为.
8.(2023•山东聊城•模拟预测)某市统计高中生身体素质的状况,规定身体素质指标值不小于60就认为身
KKI
体素质合格.现从全市随机抽取100名高中生的身体素质指标值x,a=l,2,3,…,100),经计算=7200,
J-I
10()
=100x(72?+36).若该市高中生的身体素质指标值服从正态分布,则估计该市高中生身体素
r=l
质的合格率为.(用百分数作答,精确到0.1%)
参考数据:若随机变量X服从正态分布则P("bWXW〃+c”0.6827,
P(〃一2bWX工〃+2。)«0.9545,P(“一3b«XV〃+3b)=0.9973.
参考答案:
题号1234
答案ABBDBCD
1.A
【分析】观察给定的图表,利用众数的意义运动员命中环数的集中与分散程度判断即可.
【详解】根据图表知,甲、乙命中环数的众数均为7环,则Zp=Z乙;
甲运动员命中的环数比较分散,乙运动员命中的环数比较集中,则*〉
故选:A
2.B
【分析】根据统计图表数据一一分析即可.
【详解.】2023年前5个月我国纯电动汽车的销量为28.7+37.6+49+47.1+52.2=214.6万辆,
即2023年前5个月我国纯电动汽车的销量超过214万辆,故A正确:
将这13个月纯电动汽车的月度销量由小到大依次排列为28.7,34.7,37.645.7.47.1,
47.6.49.52252.2,53.9,54.1,61.5,62.4,
则中位数为其中第7个数据,即49万辆,故B错误:
这些数据中只有52.2出现2次,其他数据均只出现1次,故众数为52.2万辆,故C正确:
2023年1月的同比增长率为负数,其它月份的同比增长率为正数,
故和上一年同期相比,我国纯电动汽车月度销量有增有减,故D正确.
故选:B.
3.BD
【分析】根据题意,由统计图表中的数据,结合频率分布直方图的面积和六分位数,以及平均数的计算公
式,逐项判定,即可求解.
【详解】对于A中,由年龄的扇形统计图,可得90后的考生有3200x45%=1440人,
00后的考生有3200x40%=1280人,可得1440-1280=160人,所以A不正确:
对于B中,由频率分布直方图性质,可得(O.Ol+O02+«+a+O.Ol)xlO=l,
解得“=().03,则前三个矩形的面积和(0。1+0.02+0.03)x10=0.6,
所以试成绩的60%分位数为80分,所以B正确:
对于C中,设面试成绩的最低分为X,由前三个矩形的面枳和为0.6,第四个矩形的面枳为0.3,则
80+卷X10=86.6H87分,所以C不正确;
对于D中,根据频率分布直方图的平均数的计算公式,可得考试的平均成绩为:
7=55x0.1+65x0.2+75x0.3+85x0.3+95x0.1=76分,所以D正确.
故选:BD.
4.BCD
【分析】利用频率分布直方图中,所有直方图的面积之和为1,列等式求出实数〃的值,可判断A选项:利
用中位数的定义可判断B选项:利用总体平均数公式可判断C选项;利用方差公式可判断D选项.
【详解】对于A选项,在频率分布直力图中,所有直方图的面积之和为1,
则(2i+3a+7a+6a+2a)xl0=2(X)“=l,解得a=0.(X)5,A错;
对于B选项,前两个矩形的面积之和为(为+3a)xl0=50a=0.25<0.5,
前三个矩形的面积之和为®/+3,,+7a)xl0=120a=0.6>0.5,
设计该年级学生成绩的中位数为小则"?e(70,80),
根据中位数的定义可得0.25+(〃L70)x0.035=0.5,解得〃?=77.14,
所以,估计该年级学生成绩的中位数约为77.14.B对:
对于C选项,估计成绩在80分以上的同学的成绩的平均数为
6"x85+2ax95=87.5分,C对;
64+2。6a+2a
对于D选项,估计该年级成绩在8()分及以上的学生成绩的方差为
;[12+(87.5-85)1+;[10+(87.5-95)[=30.25,D对.
故选:BCD.
5.1214
【分析】将数据从小到大重新排成一列,根据众数及中位数的定义,即可求出结果.
【详解】将样本数据1215,1213,18,10,16,19,15,12,从小排到大得到10,1212,12,13,15,15,16,18,19,
由众数及中位数的定义知:众数为12,中位数为巨|史=【4,
故答案为:12,14.
6.11
【分析】列举出所有的得分情况,再结合中位数的概念求答案即可.
【详解】由题意得小明同学第一题得5分;
第二题选了2个选项,可能得分情况有3种,分别是得0分、4分和6分;
第二题选了1个选项,可能得分情况有3种,分别是得。分、2分和3分:
由于相同总分只记录一次,因此小明的总分情况有:6分、8分、9分、10分、12分、13分、14分、15分
共8种情况,
所以中位数为U宇=11,
故答案为:1L
7."-5/y
【分析】由极差和平均数求出x,即可求出中位数.
【详解】依题意可得极差为10-3=7,平均数为1(3+5+x+8+9+10)=[(35+x),
66
所以3(35+x)=7,解得x=7,
所以中位线为写=75
故答案为:7.5
8.97.7%
【分析】计算样本的平均数和方差,由此估计从b,再结合参考数据求P(X>60).
1100
【详解】因为100个数据X],工2,%3,…,$00的平均值了京2%=72,
1UU/.I
方差/得加司喘&TOO4M3(72,+36)一372+36,
所以〃的估计值为〃=72,o的估计值为。=6.
设该市高中生的身体素质指标值为X,
由R”一2。《XV〃+2。)u0.9545,得P(72-12<X<72+12)=P(60<X<84)«0.9545,
/、/、/、\-P(i.i-2a<X<LI+2G\1-0,9545
P(X>84)=P(X>/7+2cr)=P(X<A'-2<T)=——--------------------------«——--
所以P(X260)=P(60<X<84)+P(X>84)=0,9545+-x(l-0.9545)=0.97725=97.7%.
2
故答案为:97.7%.
规律方法:
(1)对于给出的统计图表,一定要结合问题背景理解图表意义.
(2)颇率分布直方图中纵坐标不要误以为是须率.
【考点二】回归分析
核心梳理:
求经脸回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
AA
(2)计算出x,y,b.
(3)写出经验回归方程.
一、单选题
1.(2024•四川成都•模拟预测)某老师为了了解数学学习成绩得分y(单位:分)与每天数学学习时间单
100100、
E>,=5600,W>=11200,并据此求得),关于x的线性
(MM7
回归方程为,,=加+56.若一位同学每天数学学习时间约80分钟,则可估计这位同学数学成绩为()
A.106B.122C.136D.140
2.(2023・四川南充•一模)某商品的地区经销商对2023年1月到5月该商品的销售情况进行了调查,得到
如卜统计表.发现销售量,(万件)与时间工(月)成线性相关,根据表中数据,利用最小二乘法求得y与
x的回归自.线方程为:y=0.48.v+0.56.则下列说法错误的是()
时间X(月)12345
销售量y(万件)11.62.0a3
A.由回归方程可知2024年1月份该地区的销售量为6.8万件
B.表中数据的样本中心点为(3,2.0)
C.a=2.4
D.由表中数据可知,y和x成正相关
二、多选题
3.(21-22高三上•重庆黔江•阶段练习)下列说法中正确的是()
A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变
B.回归直线5=公+&恒过样本点的中心(元刃,且至少过一个样本点
C.用相关指数配来刻画回归效果时,R2越接近1,说明模型的拟合效果越好
D.在2x2列联表中,8c|的值越大,说明两个分类变量之间的关系越弱
4.(2024•浙江•一模)为调研加工零件效率,调研员通过试验获得加工零,牛个数x与所用时间y(单位:min)
的5组数据为:(10,52),(20,67),(30,70),(40,75),(50,86),根据以上数据可得经验回归方程为:y=0.76x+〃,
则()
A.a=47.3
B.回归直线),=0.76%+。必过点(30,70)
C.加工60个零件的时间大约为92.8min
D.若去掉(30,70),剩下4组数据的经验回归方程会有变化
三、填空题
5.(23-24高二上•四川绵阳•期末)某工厂为了对新研发的•种产品进行合理定价,将该产品按事先拟定的
价格进行试销,得到如下数据:
单价(元)456789
销量(件)908483807568
由表中数据,求得线性回归方程£=Tx+”,若在这些样本点中任取一点,则它在回归直线右上方的概率为
6.(2024・全国•模拟预测)某巾一水果店为了了解相橘的月销售量丁(单位:千克)与月平均气温人(单位:
。(2)之间的关系,随机统计了4个月的柑橘的月销售量与当月的平均气温,其数据如卜.表:
月平均气温x/℃181282
月销售量y/千克26456277
由表中数据得到关于X的线性回归方程为3=-3.25X+G,气象部门预测2024年4月该市的平均气温为4%:,
据此估计该水果店2024年4月柑橘的销售量为千克.
四、解答题
7.(2024•河南郑州・三模)按照《中华人民共和国环境保护法》的规定,每年生态环境部都会会同国家发展
改革委等部门共同编制《中国生态环境状况公报》,并向社会公开发布.下表是2017-2021年五年《中国生
态环境状况公报》中酸雨区面积约占国土面积的百分比(£%):
年份2017年2018年2019年2020年2021年
年份代码国12345
6.45.55.04.83.8
⑴求2017-2021年年份代码U与月的样本相关系数(精确到0.01):
⑵请用样本相关系数说明该组数据中y与x之间的关系可用•元线性回归模型进行描述,并求出y关于彳的
经验回归方程;
⑶预测2024年的酸雨区面积占国土面积的百分比.
(I可归直线的斜率和截距的最小二乘法估计公式分别为:
A(55
b=----------------,ci=y-bx,Zx/=70.6.Zy,2=133.69
f=l
心一方
,-1,5^64«=6
附:样本相关系数,「
悔―丫氏一亚
8.(23-24高三上•湖南衡阳•阶段练习)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科
技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入),(单位:亿元)的散点图,其中
年份代码1010分别对应年份201302022.
「年研发投入),(亿元)
85
80,•••
75-.•*
70*,
65•
*_।_।_।।_।_।_•_।_>_•---->
012345678910年份代码x
图1
根据散点图,分别用模型①),=法+。,②丁乂十八后作为年研发投入),(单位:亿元)关于年份代码x的
经验I可归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计
量的值:
i<),io,1010
£(一),Z(—)£(y
yt-刃&-工)
1=1r=lr=lr=l
752.2582.54.512028.35
_110
表中4=喜,"正毕•
⑴根据残差图,判断模型①和模型②哪一•个更适宜作为年研发投入》(单位:亿元)关于年份代码X的经
验回归方程模型?并说明理由:
(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程:
(ii)设该科技公司的年利润L(单位:亿元)和年研发投入y(单位:亿元)满足^=(111.225-),)&(xwN'
且XE[1,20]),问该科技公司哪一年的年利润最大?
附:对于一组数据(右,为),(x2,y2),....(七,二),其经验回归直线$,=4+去•的斜率和截距的最小二乘估计
之('-工)(丫-于)__
分别为八J-----------,a=y-bx.
£("才
参考答案:
题号12R4
答案CAACBC
【分析】利用回归方程经过样本中心可求G,故可估计这位同学每天数学学习时间约80分钟后的数学成绩.
【详解】由题设可得工=费=56,),=^^=112,
故112=%x56+56,故3=1,故),=x+56,
故当x=80时,),=80+56=136,
故选:C.
2.A
【分析】根据给定数据,结合回归直线的特性逐项判断即得.
[详解]依题意,l="2+:+4+5=3jJg;+"+3=2^£,
而y与x的回归直线方程为:),=0.48x+0.56,贝ij与工=3x0.48+0.56,
解得。=2.4,亍=2.0,表中数据的样本中心点为(3,2.0),BC正确;
由0.4B>0,得),和x成正相关,D正确;
2024年1月份,即x=13,由1口1归直线方程),=0.48.t+0.56,得y=0.48x13+0.56=6.8.
因此2024年1月份该地区的销售量约为6.8万件,A错误.
故选:A
3.AC
【分析】
对A:由方差的性质即可判断:对B:由回归直线的性质即可判断:对C:利用相关指数六的性质即可判断;
对D:由卡方的意义即可判断.
【详解】对A:将一组数据中的每一个数据都加上或减去同一个常数后,数据的波动性不变,
故方差不变,故A正确:
对B:1可归直线,=%+。恒过样本点的中心(冗田正确,但不一定会过样本点,
故B错误:
对C:用相关指数心来刻画回归效果时,R-越接近1,说明模型的拟合效果越好,
故C正确;
对D:住2x2列联表中,1加cl的值越大,说明两个分类变M之间的关系越强,
故D错误.
故选:AC.
4.BC
【分析】求得数据的样本中心点可判断B:结合回归方程可求出々=47,2可判断A:将x=60代入回归方程
求得预测值可判断C:根据5,=0.76犬+47.2恒过(30,70),可判断D.
【详解】X=^(10+20+30+40+50)=30,于=((52+67+70+75+86)=70,
所以),=0.76x+a恒过(30,70),所以70=0.76x30+a,
解得:a=47.2,故A错误:B正确;
所以»=0.76x+47.2,令x=60,贝ij5=0.76x60+47.2=92.8,
故加工60个零件的时间大约为92.8min,故C正确:
因为»=0.761+47.2恒过(3(),70),
所以剩下4组数据的经验回归方程不会有变化,故D错误.
故选:BC.
5.1/0.5
【分析】根据表中数据可得回归方程,进而确定在回归直线右上方的个数,进而可得概率.
H.:n-4I5I6I7I8I9.__90i84i83ISOi75i68
[详解]由已IA知---------------=6.5,y=----------------------=80,
66
又样本中心(冗田在回归直线%Tx+a匕
即80=Tx6.5+a,解得。=106.
所以I可归直线方程为y=-4X+106,
当x=4时,y=-4x4+106=90,所以点(4,90)在回归直线上:
当x=5时,$=-4x5+106=86,所以点(5.84)在回归直线左下方:
当x=6时,卞="4乂6+106=82,所以点(6,83)在回归直线右上方:
当K=7时,>'=-4x7+106=78,所以点(7,80)在回归直线右上方;
当x=8时,>'=-4x8+106=74,所以点(8,75)在回归直线右上方;
当x=9时,>'=-4x9+106=70,所以点(9.68)在回归直线左下方;
所以6个样本点中在1口1归直线右上方的有3个,
所以在这些样本点中任取一点,则它在回归直线右上方的概率为:,
故答案为:
6.72
【分析】求出样本中心,求出。,求H线性回归方程即可求解.
【详解】由题表得工=彳(18+12+8+2)=10,y=-^-(26+45+62+77)=52.5,
所以回归直线A-3.25%+力过点(10,52.5),
得52.5=—3.25xlO+力,解得4=85,则线性回归方程为]=-3.25x+85,
所以当x=4日寸,>'=-3.25x4+85=72,
故估计该水果店2024年4月柑橘的销售量为72千克.
故答案为:72.
7.⑴-0.98
(2)y=-O.59x+6.87
(3)预测2024年的酸雨区面积占国土面积的百分比为2.15%
【分析】(1)由表中数据结合题中数据,求出相关数值,代入相关系数
r=~r=----j;-------即可得出答案;
宓号-5)2次(凹-刃2
V/=1/=1
(2)由(1)知一才-0.98,卜|接近1,即可说明线性相关关系极强;根据(1)中求出的数据,即可求出2=-0.59,
=6.87,进而得到回归直线方程:
(3)将x=8代入回归直线方程,即可预测2024年的酸雨区面积占国土面积的百分比.
1+2+3+4+5,
【详解】(1)由已知可得,x=-------------=3,
5
6.4+5.5+5.0+4.8+3.8
—=5.1
5
由题可列下衣:
-2-1012
1.30.4-0.1-0.3-1.3
yf-y
2(芯-1)()0=-5.9历七一工『=加
y)2=Vl64,
i=\V1=1
-5.9-5.9
6«-0.98
山;F序—)2屈〜
(2)由小问I知,V与X的相关系数,•力-0.9&M接近1,所以y与X之间具有极强的线性相关关系,可用
线性回归模型进行描述.
.2(若一村(£一方_59
由小问1知,-----------=停=一0.59,
10
/=|
4=亨一辰=5.1—(一0.59)x3=6.87,
所求经验回归方程为y=-0.59x4-6.87.
(3)令x=8,则y=-0.59x8+6.87=2.15,预测2024年的酸雨区面枳占国土面积的百分比为2.15%.
8.⑴选择模型②更适宜,理由见解析
(2)(i)y=60.825+6.3&(ii)该公司2028年的年利润最大
【分析】(1)根据残差图确定:
(2)根据最小二乘法求非线性|可归方程即可求解;
【详解】(1)根据图2可知,模型①的残差波动性很大,说明拟合关系较差;
模型②的残差波动性很小,基本分布在。的附近,说明拟合关系很好,所以选择模型②更适宜.
(2)(i)设/=所以y=c+d/,
,2(升一加」)2835_
所以d=qF----------;-=r^-=6.3,c=y-dt=75-6.3?2.2560.825,
Z(,力45
/=1
所以y关于x的经验回归方程为>'=60.825+6.3右
(ii)由题设可得L=(U1.225-y)五=011.225-6.3五—60.825)6=-b:5x+50.4«,
当取对称轴即6=2空=4,即x=16时,年利润L有最大值,
2x6.3
故该公司2028年的年利润垠大.
规律方法:__
(1)样本点不一定在经脸回归直线上,但点(7,亍)一定在经脸回归直线上.
A
(2)求b时,灵活选择公式,注意公式的推导和记忆.
(3)利用样本桐关系数判断相关性强弱口九看|,|的大小,而不是,的大小.
(4)区分样本相关系数r与决定系数A?.
(5)通过经脸回归方程求的都是估计值,而不是真实值.
【考点三】独立性检验
核心梳理:
独立性检脸的一般步骤
⑴根据样本数据列2X2列联表.
(2)根据公式下=7晨”;八八,计算Z2的值.
A[a+b)(c+d)(a+c)(b4-d)人
(3)查表比较/与临界值的大小关系,作统计判断.片越大,对应假设事件4°成立(两类变量相互独立)的概
率越小,”()不成立的概率越大.
一、解答题
1.(2024•安徽合肥•二模)树人中学高三(1)班某次数学质量检测(满分150分)的统计数据如下表:
性别参加考试人数平均成绩标准差
男3010016
女20901S
在按比例分配分层随机抽样中,已知总体划分为2层,把第一层样本记为百,占,内,…,,,其平均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 坡道开挖施工方案(3篇)
- 天赐网店营销方案(3篇)
- 孔洞单项施工方案(3篇)
- 年会活动经费策划方案(3篇)
- 展台特色活动策划方案(3篇)
- 护士应急预案制作(3篇)
- 料场变更施工方案(3篇)
- 景县庭院施工方案(3篇)
- 案件应急照预案(3篇)
- 永州房产营销方案(3篇)
- 城市地下排水管网检测报告模板
- 2025年西安中考试卷物理及答案
- 石材加工准入政策评析-洞察与解读
- (完整版)波形护栏安装施工方案
- 机加车间刀具使用管理制度
- 高岭土施工方案
- 炎症性肠病超声诊断
- DBJ-T 15-119-2023 预拌混凝土用机制砂应用技术规程
- 子宫腺肌病合并痛经护理查房
- 《电磁场与微波技术实验教程》课件 第六章 天线仿真实验
- 胃神经内分泌肿瘤课件
评论
0/150
提交评论