版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2027届新高三数学热点突破复习成对数据的统计分析五年高考考点1变量间的相关关系1.★★(2023天津,7,5分)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰“鸢飞戾天,鱼跃于
渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收
集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2).计算得样本相关系数为0.8642,利用最小二乘法求得相应的经验回归方程为
=0.7501x
+0.6105.根据以上信息,如下判断正确的为
()A.花萼长度与花瓣长度不存在相关关系B.花萼长度与花瓣长度负相关C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值约为5.8612cmD.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为
0.8642
C
解析题图2中的散点大致落在一条从左下角到右上角的直线附近,这说明成对样本数
据之间存在正相关关系,故A、B错误;把x=7代入经验回归方程
=0.7501x+0.6105,得
=5.8612,故C正确;由于样本发生变化,所以样本相关系数不一定相同,故D错误.2.★★(2024天津,3,5分)下列散点图中,样本相关性系数最大的是
()
A
解析观察各选项可知,A选项图中散点分布比较集中,且大体接近一条直线,呈现明显
的正相关,线性回归模型的拟合效果比较好,|r|相比于其他三个选项的图更接近1.故
选A.3.★★(跨学科·生物)(2020课标Ⅰ,文5,理5,5分)某校一个课外学习小组为研究某作
物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实
验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是
()A.y=a+bx
B.y=a+bx2C.y=a+bex
D.y=a+blnx
D
解析由散点图可知,发芽率随温度增长的速度越来越慢,符合对数曲线增长的变化规
律,故选D.4.★★★(2025上海,17,14分)2024年东京奥运会,中国获得了男子4×100米混合泳接力金
牌.以下是历届奥运会男子4×100米混合泳接力项目冠军成绩记录(单位:秒),数据按照
升序排列:206.78,207.46,207.95,209.34,209.35,210.68,213.73,214.84,216.93,216.93.(1)求这组数据的极差与中位数;(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;(3)若比赛成绩y关于年份x的回归方程为
=-0.311x+
,年份x的平均数为2006,预测2028年冠军队的成绩(精确到0.01秒).解析
(1)由题意,数据的最大值为216.93,最小值为206.78,则极差为216.93-206.78=10.15;数据中间两数为209.35与210.68,则中位数为
=210.015.故极差为10.15,中位数为210.015.(2)由题意,数据共10个,211以上数据有4个,设事件A=“恰有2个数据在211以上”,则P(A)=
=
,故恰有2个数据在211以上的概率为
.(3)由题意,成绩的平均数为
×(206.78+207.46+207.95+209.34+209.35+210.68+213.73+214.84+216.93+216.93)=211.399,由直线
=-0.311x+
过点(2006,211.399),得
=211.399+0.311×2006=835.265,故回归直线方程为
=-0.311x+835.265.当x=2028时,y=-0.311×2028+835.265=204.557≈204.56.故预测2028年冠军队的成绩为204.56秒.5.★★★(2022全国乙理,19,12分)某地经过多年的环境治理,已将荒山改造成了绿水青
山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横
截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i123456根部横截面积xi材积量yi0.040.250.060.400.040.220.080.540.080.510.050.34样本号i78910总和根部横截面积xi材积量yi0.050.360.070.460.070.420.060.400.63.9并计算得
=0.038,
=1.6158,
xiyi=0.2474.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面
积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出
该林区这种树木的总材积量的估计值.附:相关系数r=
,
≈1.377.解析
(1)估计该林区这种树木平均一棵的根部横截面积为
=
=0.06(m2),平均一棵的材积量为
=
=0.39(m3).(2)样本相关系数r=
=
=
=
=
≈
≈0.97.【计算r=
时,需要将分子、分母稍加变换,采用题设中给出的数据求解】即该林区这种树木的根部横截面积与材积量的样本相关系数约为0.97.(3)设这种树木的根部横截总面积为Xm2,总材积量为Ym3,则
=
,则Y=
=
=1209,所以该林区这种树木的总材积量的估计值为1209m3.三年模拟1.★(2025届福建龙岩一中开学考,1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,
xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=
x+1上,则这组样本数据的相关系数为
()A.-1
B.0
C.
D.1
D
解析由题设知,所有样本点(xi,yi)(i=1,2,…,n)都在直线y=
x+1上,∴这组样本数据完全正相关,因此其相关系数为1,故选D.2.★★(2026届广东毕业班第一次调研,3)已知样本点数据(xi,yi)(i=1,2,3,4,5)大致呈线性
分布,且yi≤yi+1,其经验回归方程为
=2x-
,若y3=5,y5=8,数据yi的80%分位数为7,则当i=4时,随机误差的残差为
()A.-0.5
B.0.5
C.-1.5
D.1.5
B
解析将yi从小到大排列,80%×5=4,所以
=7⇒y4=6,预测值为
=5.5,所以残差为观测值-预测值
=6-5.5=0.5,故选B.3.★★(2026届湖南部分学校大联考,4)为了研究y关于x的线性相关关系,收集了5组样本
数据(见下表).若已求得一元线性回归方程
=
x+0.34,则下列选项中正确的是
(
)
Ax12345y0.50.911.11.5A.
=0.22B.x与y呈现负相关C.当x=8时,y的预估值为2.2D.去掉样本点(3,1)后,x与y的样本相关系数r必会改变解析
=
=3,
=
=1,则样本点的中心为(3,1).对于A,由3
+0.34=1,得
=0.22,因此A正确;对于B,由
>0,得x与y呈现正相关,因此B错误;对于C,当x=8时,y的预估值为
=0.22×8+0.34=2.1,因此C错误;对于D,因为(3,1)是样本点的中心,由相关系数公式知,去掉该点后,x与y的样本相关系数
r不会改变,因此D错误.故选A.4.★★(2026届浙江Z20第一次联考,2)将收集到的6对样本数据(xi,yi)(i=1,2,3,4,5,6)制作
成如图所示的散点图(点旁数据为该点坐标),由最小二乘法计算得回归直线l1的方程:
=
x+
,相关系数为r1,决定系数为
.残差分析后确定点E对应残差过大,把它去掉后,再用剩下的5对样本数据计算得回归直线l2的方程:
=
x+
,相关系数为r2,决定系数为
.则以下结论中,不正确的是()
D
A.r1>0,r2>0
B.
>0,
>0C.
>
D.
>
解析从散点图可以看出,两个变量是正相关,因此A正确;从散点图可以看出,回归直线的斜率是正数,且l1的斜率大于l2的斜率,因此B和C正确;从散点图可以看出,去掉“离群点”E后,相关性更强,拟合的效果更好,又R2值越大,模型
的拟合效果越好,所以
<
,因此D错误.故选D.5.★★★(多选)(2026届湖南衡阳八中期中,10)根据变量Y和x的成对样本数据,由一元线
性回归模型
得到线性回归模型
=
x+
,对应的残差如图所示,则残差模型
(
)
BD
A.满足回归模型E(e)=0的假设B.不满足回归模型E(e)=0的假设C.满足回归模型D(e)=σ2的假设D.不满足回归模型D(e)=σ2的假设解析根据一元线性回归模型
中对随机误差e的假定,残差散点图中散点应是比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域
内,而由题图中残差图可知残差与观测变量x有线性关系,因此残差模型不满足回归模型E(e)=0的假设,不满足回归模型D(e)=σ2的假设.故选BD.6.★★★(多选)(2025届广东广州摸底,9)中欧班列是推进“一带一路”沿线国家道路
联通、贸易畅通的重要举措.在中欧班列带动下,某外贸企业出口额逐年提升,以下为该
企业近6个月的出口额情况统计,若已求得y关于x的经验回归方程为
=28x+
,则
(
)AD
月份编号x123456出口额y/万元16254377102159A.y与x正相关B.样本数据y的第40百分位数为34C.当x=3时,残差的绝对值最小D.用模型y=enx+m描述y与x的关系更合适解析对于A,当x的值增加时,相应y的值也呈现增加的趋势,得出y与x正相关,因此A正
确;对于B,样本数据y的6个取值从小到大依次是16,25,43,77,102,159,由6×40%=2.4,得第40
百分位数为第3个数据43,因此B错误;对于C,
=
=
,
=
=
,将(
,
)代入
=28x+
,得
=28×
+
,解得
=-
,所以
=28x-
,所以当x=3时,相应残差的绝对值为
=
,当x=2时,相应残差的绝对值为
=
<
,因此C错误;对于D,根据题意作出散点图,如图,
由图可知用模型y=enx+m描述y与x的关系更合适,因此D正确.故选AD.7.★★★(2026届福建莆田一中月考,13)若变量x和y的4对观测数据为(-2,-10),(-1,-5),(1,
4),(2,11),两个变量满足一元线性回归模型
(随机误差ei=yi-bxi),则参数b的最小二乘估计值为___________.
5.1
解析依题意,两个变量满足一元线性回归模型
随机误差ei=yi-bxi,则随机误差平方和Q=(-10+2b)2+(-5+b)2+(4-b)2+(11-2b)2=(100-40b+4b2)+(25-10b+b2)+(16-8b+b2)+(121-44b+4b2)=10b2-102b+262,易知Q是关于b的二次函数,当b=-
=
=5.1时,随机误差平方和Q取得最小值,因此参数b的最小二乘估计值为5.1.8.★★★(2026届广东广州阶段测试,15)经验表明,一般树的胸径(树的主干在地面以上
1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸
径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据,并根据
数据作出散点图(如图).经计算得
xi=348,
yi=264,
xiyi=7793,
=24,
=6.(1)推断两个变量是否线性相关,计算样本相关系数r(精确到0.01),并推断它们的相关程
度;(2)试根据以上数据建立树高关于胸径的经验回归方程(系数精确到0.01),并预测胸径
为45cm的树高.附:相关系数r=
,回归方程
=
x+
中,
=
,
=
-
.解析
(1)根据树高与树的胸径的散点图,可判断两个变量线性相关.根据题中所给数据,得n=12,
=
=
=29,
=
=
=22.所以r=
=
=
≈0.95>0.75,由于r的值接近于1,因此线性相关性较强.故两个变量线性相关,且相关程度较强.(2)由(1)知n=12,
=29,
=22.所以
=
=
=
≈0.24,
=
-
=22-
×29≈15.10.所以经验回归方程为
=0.24x+15.10.当x=45时,
=0.24×45+15.10=25.9,即树高的预测值为25.9m.故树高关于胸径的经验回归方程为
=0.24x+15.10,预测胸径为45cm的树高为25.9m.9.★★★★(2026届重庆实验外国语学校月考,18)蝗虫能对农作物造成严重伤害,每只
蝗虫的平均产卵数y(单位:个)和平均温度x(单位:℃)有关.现收集到一只蝗虫的产卵数y
和温度x的8组观测数据,制成图1所示的散点图.现用两种模型①y=ebx+a,②y=cx2+d分别
进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
(xi-
)2
(ti-
)2
(zi-
)(xi-
)
(yi-
)(ti-
)24362.964616842268850.470308表中zi=lnyi,
=
zi,ti=
,
=
ti.(1)根据残差图,比较模型①、②的拟合效果,模型______比较合适.根据所选择的模型,
利用上表中的参考数据,求出y关于x的回归方程.(2)根据以往统计,该地每年平均温度达到30℃以上时蝗虫会对农作物造成严重伤害,
需要人工防治,其他情况均不需要人工防治.设该地每年平均温度达到30℃以上的概率为p(0<p<1),该地今后n(n≥3,n∈N*)年恰好需要2次人工防治的概率为f(p).①求f(p)取得最大值时对应的概率p0;②当f(p)取最大值时,设该地今后5年需要人工防治的次数为X,求X的均值和方差.附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线
=
u+
的斜率和截距的最小二乘估计分别为
=
,
=
-
.解析
(1)模型①比较合适,理由如下:模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状区
域宽度窄,所以模型①的拟合效果更好,故选模型①比较合适.【思路探究:换元法解决非线性回归方程问题,在模型①y=ebx+a中,两边取自然对数:lny=
bx+a,换元:z=lny,将非线性回归模型转化为线性回归模型解决】y=ebx+a,则lny=bx+a,令z=lny,则
=
+
x,由所给的参考数据可得,
=
=
=0.3,所以
=
-
=2.9-0.3×24=-4.3,因此z关于x的经验回归方程为
=0.3x-4.3,即lny=0.3x-4.3,所以产卵数y关于温度x的回归方程为
=e0.3x-4.3.(2)①由题意得,f(p)=
p2(1-p)n-2(0<p<1,n≥3,n∈N*),【思路探究:二项分布问题直接用公式求概率,再利用导数知识求最大值】所以f'(p)=2
p(1-p)n-2-(n-2)
p2·(1-p)n-3=
p(1-p)n-3[2(1-p)-(n-2)·p]=
p(1-p)n-3(2-np),令f'(p)=0,得p=
,当p∈
时,f'(p)>0,当p∈
时,f'(p)<0,所以f(p)在
上单调递增,在
上单调递减,所以f(p)取得最大值时对应的概率p0=
(n≥3,n∈N*).②由①知,当p0=
(n≥3,n∈N*)时,f(p)取最大值,所以当n=5时,p0=
,由题意可知每年需要人工防治的概率为p=
,且X服从二项分布,即X~B
,所以E(X)=np=5×
=2,D(X)=np(1-p)=5×
×
=
.五年高考考点2独立性检验1.★★(2025全国一卷,15,13分)为研究某疾病与超声波检查结果的关系,从做过超声波
检查的人群中随机调查了1000人,得到如下列联表:超声波检查结果组别
正常不正常合计患该疾病20180200未患该疾病78020800合计8002001000(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.附:χ2=
,
.解析
(1)由题意知超声波检查结果不正常的人数为200,患该疾病的人数为180,所以超声波检查结果不正常者患该疾病的概率的估计值p=
=0.9.(2)零假设为H0:超声波检查结果与患该疾病无关.χ2=
=765.625>10.828=x0.001,根据小概率值α=0.001的独立性检验,我们推断H0不成立,即超声波检查结果与患该疾病
有关.2.★★★(2024全国甲理,17,12分)某工厂进行生产线智能化升级改造.升级改造后,从该
工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品合格品不合格品总计甲车间2624050乙车间70282100总计96522150(1)填写如下列联表:
优级品非优级品甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认
为甲、乙两车间产品的优级品率存在差异?(2)已知升级改造前该工厂产品的优级品率p=0.5.设
为升级改造后抽取的n件产品的优级品率,如果
>p+1.65
,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?
(
≈12.247)附:K2=
,解析
(1)列联表如下:
优级品非优级品甲车间2624乙车间7030K2=
=4.6875,∵3.841<4.6875<6.635,∴有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为
甲、乙两车间产品的优级品率存在差异.(2)由题知
=
=0.64,∵p=0.5,∴p+1.65
=0.5+1.65×
=0.5+
≈0.5+
≈0.567,∵
>p+1.65
,∴可以认为生产线智能化升级改造后,该工厂的优级品率提高了.三年模拟1.★★(创新情境)(2026届辽宁部分学校联考,15)随着我国人工智能(AI)的突破性发
展,近期许多优秀的人工智能(AI)应用软件发布并上线.这些软件凭借强大的创新功能
和极具吸引力的用户体验,在社交媒体上引发了广泛的讨论,产生了显著的社会效应.某
科技公司新开发了一款人工智能(AI)应用软件,为了测试青年人和中年人对该软件的应用体验是否良好,某机构从中青年用户中随机调查了300人,得到如下2×2列联表(单位:人):组别应用体验合计良好不良好青年用户3m+n2m-n
中年用户m+nm+2n150合计
300(1)求m,n的值;(2)补全2×2列联表,根据小概率值α=0.001的独立性检验,分析不同年龄段的用户对该软
件的应用体验是否存在差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026湖南株洲市醴陵市事业单位招聘12人考试参考题库及答案详解
- 2026陕西省煤田地质集团有限公司招聘402人笔试备考题库及答案详解
- 川南幼儿师范高等专科学校 2026年上半年公开考核招聘教师及专职辅导员笔试备考题库及答案详解
- 2026中国联通昭通市分公司招聘4人笔试备考题库及答案详解
- 2026陕西西安市安居资产运营管理集团有限公司招聘3人笔试模拟试题及答案详解
- 骨关节疼痛的物理治疗
- 2026江西省气象部门国家气象事业单位招聘9人考试参考题库及答案详解
- 2026贵州遵义师范学院科研助理岗位招聘16人考试参考题库及答案详解
- 2026泰和新材集团股份有限公司(宁东产业园)招聘25人笔试模拟试题及答案详解
- 汽车涂装生产线操作工诚信竞赛考核试卷含答案
- 2026福建厦漳泉城际铁路有限责任公司社会招聘34人考试参考题库及答案解析
- 2026年湖北高考语文试卷含答案
- 湖北省2025年普通高中学业水平合格性考试数学试题及答案
- YY/T 1437-2023医疗器械GB/T 42062应用指南
- 过程装备与控制工程专业导论
- 年产10万吨纯净水生产项目可行性研究报告
- 微系统封装基础
- 第六部分预混可燃气的火焰
- GB/T 9119-2010板式平焊钢制管法兰
- GB/T 29127-2012救生艇及吊钩释放系统定期检验维护方法
- GB/T 10069.3-2008旋转电机噪声测定方法及限值第3部分:噪声限值
评论
0/150
提交评论