版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第84讲成对数据的统计分析
知识梳理
知识点一、变量间的相关关系
|、变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫
相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非
常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其
中的规律,对它们的关系作出判断.
注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一
种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是
伴随关系.
2、散点图
将样本中的脚数据点|冈腌在平面直角坐标系中,所得图形叫做放点
图.根据散点图中点的分布可以直观地判断两个变量之间的关系.
(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关
关系,我们将它称为正相关,如图(1)所示:
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关
关系,我们将它称为负相关,如图(2)所示.
(1)当回I时,表示两个变量正相关;当回I时,表示两个变量负相关.
(2)睁接近年表示两个变量的线性相关性越强;国接近他表示两个变量间儿
乎不存在线性相关关系.当函口时,所有数据点都在一条直线上.
(3)通常当|冈|时,认为两个变量具有很强的线性相关关系.
知识点二、线性回归
1、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(X2,y2),…,(&,y”),其回归方程|区]|
的求法为
0
其中,0,惮,(也[1称为样不点的中心.
2、残差分析
对于预报变量值通过观测得到的数据称为观测值他通过回归方程得到的曲:为预
测值,观测值减去预测值等于残差,描尔为相应于点|冈|的残差,即有|冈|冈]•残
差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始
数据中是否存在可疑数据等,这方面工作称为残差分析•.
(1)残差图
通过残差分析,残差点|冈|比较均匀地落在水平的带状区域落,说明选用的模型比较
合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高:反之,不合适.
(2)通过残差平方和冈分析,如果残差平方和越小,则说明选用的模型
的拟合效果越好;反之,不合适.
(3)相关指数
用相关指数来刻画回归的效果,其计算公式是:
国他接近于他说明残差的平方和越小,也表示回归的效果越好.
2
知识点三、非线性回归
解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换
元将陌生的非线性回归方程化归转化为我们熟悉的线性回归方程.
求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归
方程系数,还原后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要
细心,避免计算错误.
1、建立非线性回归模型的基本步骤:
(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非
线性关系);
(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用
反比例函数、二次函数、指数函数、对数函数、幕函数模型等):
(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;
(5)按照公式计算线性I可归方程中的参数(如最小二乘法),得到线性I可归方程;
(6)消去新元,得到非线性回归方程;
(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型
是否合适等.
知识点四、独立性检验
1、分类变量和列联表
(I)分类变量:
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2x2列联表.
一般地,假设有两个分类变量X和匕它们的取值分别为{[由时和{[由他,其样
本领数列联表(称为2x2歹IJ联表)为
回回总计
同
3
回卬
总计
国La___
从同列表中,依据叵|与叵|
Ms的值可直观得出结论:两个变量是否有关系.
2、等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等
高条形图表示列联表数据的频率特征.
(2)观察等高条形图发现因与凶相差很大,就判断两个分类变量之间有关系.
3、独立性检验
计算随机变量0利用国的取值推断分类变量x和y是否
独立的方法称为z2独立性检验.
昂0.100.()50.0100.()050.001
向2.7063.8416.6357.87910.828
【解题方法总结】
常见的非线性回归模型
(1)指数函数型51(目且耳,叵1)
两边取自然对数即叵
令0",原方程变为],然后按线性回归模型求出国,国.
(2)对数函数型国
0,原方程变为,然后按线性回归模型求出口口
令因
(3)塞函数型国
两边取常用对数,回,即|
0,原方程变为],然后按线性回归模型求出Q回.
令因
4
令回,原方程变为回""一|,然后按线性回归模型求出口Q
(5)反比例函数型H型
令,原方程变为叵二□,然后按线性回归模型求出口.
必考题型全归纳
题型一:变量间的相关关系
例1.(2024・河北•高三校联考期末)下列四幅残差分析图中,与一元线性回归模型拟合精
度最局的是()
A.B.
C.D.
【答案】D
【解析】用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明
这样的模型比较合适,
带状区域的宽度越窄,说明模型的拟合精度越高,显然D选项的拟合精度最高.
故选:D.
例2.(2024.天津蓟州.高三校考开学考试)对两个变量马国行线性相关检验,得线性相
关系数|冈],对两八变量或骅行线性相关检验,得线性相关系数|冈则
下列判断正确的是()
A.变量朝变相关.变量朝感a相关,变量朝理J线性相关性较强
B.变量弱理相关,变量朝朝相关,变量豉理线性相关性较强
C.变量朝吨E相关,变量段里相关,变量曲聊线性相关性较强
5
D.变量中些相关,变量照瑕E相关,变量姿诚勺线性相关性较强
【答案】C
【解析】因为线性相关系数且,所以法理相关,
因为线性相关系数向]»所以相关,
又因为匠一|,所以变量或啜勺线性相关性比心理线性相关性强,
故A、B、D错误,C正确.
故选:C.
例3.(2024•宁夏吴忠•高三盐池高级中学校考阶段练习)在如图所示的散点图中,若去掉
点旺则下列说法正确的是()
A.样本相关系数曾大
B.变量费变量皿相关程度变弱
C.变量被变量更正相关
D.变量被变量理J相关程度变强
【答案】D
【解析】由散点图知,自变量朝因变量再负相关,即目,故C错误;
去掉点聃,即一步接近I,所以q霁小,故A错误;
去掉点脚,善昂姒线性相关加强,即相关程度变强,故B错误,D正确.
故选:D.
变式1.(2024・四川成都・高三统考阶段练习)已知建筑地基沉降预测对于保证施工安全,
实现信息化监控有着重要意义.某工程师建立了四个函数模型来模拟建筑地基沉降随时间
的变化趋势,并用相关指数、误差平方和、均方根值三个指标来衡量拟合效果.相关指数
越接近I表明模型的拟合效果越好,误差平方和越小表明误差越小,均方根值越小越
好.依此判断下面指标对应的模型拟合效果最好的是()
A.
6
相关指数误差平方和均方根值
0.9498.4910.499
B.
相关指数误差平方和均方根值
0.9334.1790.436
C.
相关指数误差平方和均方根值
0.9971.7010.141
D.
相关指数误差平方和均方根值
0.9972.8990.326
【答案】C
【解析]相关指数越接近于I,拟合效果越好,比较相关指数知,可选C,D,
误差平方和及均方根值都越小,拟合效果越好,观察误差平方和和均方根值,知C的拟合
效果最好.
故选:C.
变式2.(2024.高三课时练习)甲、乙、丙、丁四位同学各自对,A,3两变量的线性相关
性做试验,并用I可归分析方法分别求得相关系数「与残差平方和用如下表:
甲乙丙T
r0.820.780.690.85
m106115124103
则能体现A,8两变量有更强的线性相关性的是()
A.甲B.乙C.丙D.T
【答案】D
【解析】在验证两个变显之间的线性相关关系中,相关系数的绝对值越接近于1,相关性
7
越强,
在四个选项中只有丁的相关系数最大,
残差平方和越小,相关性越强,只有丁的残差平方和最小,
综上可知丁的试验结果体现枭孙变量有更强的线性相关性,
故选:D.
变式3.(2024•河北石家庄•统考三模)观察下列四幅残差图,满足一元线性回归模型中对
随机误差的假定的是()
A.
B.
C.
D.
8
【答案】B
【解析】根据一元线性回归模型中对随机误差聊假定,残差应是均值为。、方差为回J
随机变量的观测值.
对于A选项,残差与观测时间有线性关系,故A错;
对于B选项,残差比较均匀地分布在以取值为。的横轴为对称轴的水平带状区域内;故B
正确;
对十C选项,残差与观测时间有非线性关系,故C错;
对于D选项,残差的方差不是一个常数,随着观测时间变大而变大,故D错.
故选:B.
变式4.(2024.全国•高三专题练习)甲、乙、丙、丁四位同学分别对一组变量进行线性相
关试验,并分别计算相关系数鼻则线性相关程度最高的是()
甲乙丙T
20.870.910.580.83
A.甲B.乙C.丙D.T
【答案】B
【解析】因为相关系数康大,线性相关程度越强,
所以线性相关程度最高的是乙.
故选:B
变式5.(2024・全国•高三专题练习)给出下列有关线性I可归分析的四个命题:
①线性回归直线未必过样本数据点的中心向二];
②回归直线就是散点图中经过样本数据点最多的那条直线;
③当相关系数百|时,两个变量正相关;
④如果两个变量的相关性越强,则相关系数弯越接近二生
9
其中真命题的个数为()
A.4B.QC.口D.1
【答案】A
【解析】对于①,线性回归直线一定过样本数据点的中心匚不,故①错误;
对于②,回归直线在散点图中可能不经过任何一个样本数据点,故②错误;
对于③,当相关系数百时,两个变量正相关,故③正确;
对于④,如果两个变量的相关性越强,则相关性系数弱;越接近于型甲故④错误.
故真命题的个数为I,
故选:A.
【解题方法总结】
判定两个变量相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到
右下角,两个变量负相关.
(2)样本相关系数:当,>o时,正相关;当KO时,负相关;m越接近于1,相关性越
强.
(3)经验回归方程:当同时,正相关;当同时,负相关.
题型二:一元线性回归模型
例4.(2024.天津蓟州•高三校考开学考试)为研究某种细菌在特定环境下,随时间变化的
繁殖情况,得到如卜.实验数据:
天数显河]地地1
繁殖个数0T•个年
由最小二乘法得[由匚由勺线性回归方程为|回------1,则当可时,繁殖个数地勺预测值
为()
A.L3B.|臼|C.|曰|D.|同|
IlIIIIII
【答案】B
【解析】由题中数据可得:0,0
因为回归直线必过样本中心,
所以回
10
所以I区]I,
所以当r^~~।时,|囚卜
故选:B
例5.(2024.湖南长沙•高三长郡中学校联考阶段练习)某社区为了丰富退休人员的业余文
化生活,自2018年以来,始终坚持开展“悦读小屋读书活动”.下表是对2018年以来近5年
该社区退休人员的年人均借阅量的数据统计:
年份20182019202020212022
年份代码证12345
年人均借阅量驻(册)口回162228
(参考数据:s)通过分析散点图的特征后,年人均借阅量定于年份代码聊回
归分析模型为叵-----],则2024年的年人均借阅量约为()
A.31B.32C.33D.34
【答案】C
0
【解析】因为回,所以1田
L2J
所以回归方程为区1,当1国时,*
故选:C.
例6.(2024.辽宁•辽宁实验中学校考模拟预测)已知X,),的对应值如下表所示:
X02468
y1国LgJLg_11
若y与x线性相关,且回归直线方程为|回-----则同()
A.2B.3C.4D.5
【答案】B
【解析】s
又回归直线方程为I国-----I,
11
],解得后~~l.
故选:B.
变式6.(2024.广西南宁浦宁二中校联考模拟预测)某单位在当地定点帮扶某村种植一-种
草莓,并把这种原本露天种植的草莓搬到了大棚里,获得了很好的经济效益.根据资料显
示,产出的草莓的箱数单位:箱)与成本y(单位:千元)的关系如下:
X102030406080
y回回回回□
(1)根据散点图可以认为工与),之间存在线性相关关系,请用最小二乘法求出线性回归方程
冈|(地曲分数表示)
(2)某农户种植的草莓主要以300元/箱的价格给当地大型商超供货,多余的草莓全部以200
元/箱的价格销售给当地小商贩.据统计,往年1月份当地大型商超草莓的需求量为5。
箱、100箱、150箱、200箱的概率分别为”,他[:根据回归方程以及往年商超草
鞋的需求情况进行预测,求今年1月份农户草莓的种植量为200箱时所获得的利润情
况.(最后结果精确到个位)
附:S,因,在线性回归直线方程|冈----1中
【解析】(1)因为国
所以凶
由题意可知s
又因为0
所以回归方程为s
12
(2)由回归方程知,若农户草寿的种植量为200箱,则成本为回
(千元).
设农户草莓的种植量为200箱时的收入为中元,200箱草莓供给大型商超和小商贩分别我有
和驻显然I1——I,
由题意|回|,因此同以及丫的可能取值如下表:
50100150200
150100500
Ls--------4500C500005500060000
所以y的分布列为:
Y45000500005500060000
所以0
所以预测所获利润约为0元.
变式7.(2024.江西•高三统考开学考试)某新能源汽车销售部对今年I月至7月的销售量
进行统计与分析,因不慎丢失一些数据,现整理出如下统计表与一些分析数据:
月份1月2月3月4月5月6月7月
月份代号比1234567
销售量[1(单位:万辆)15.6虽1%口37.739.644.5
其中I叵]I
(1)若值或弱递增的等差数列,求从7个月的销售量中任取1个,月销售量不高于27
万辆的概率;
⑵若s.朝辿勺样本相关系数耳二|,求善于•聊线性回归方程
冈并预测今年8月份的销售量(值青确至IJ0.1).
13
0-
附:相关系数,线性回归方程直三|中斜率和截距的最小二
0"一
乘估计公式分别为,面
参考数据:|冈|冈.
【解析】(1)因为I叵]I.所以回,
所以I国I,
又入口匚感递增的等差数列,所以I田III」口I,
所以I臼T,所区।-1,
所以月销售曷不高干27万辆的有15.6,日郸3个.又某本事件总数为7,
故所求概率为"
(2)由表中数据可知,0
区IH
由和,
0
得
所以|因
由国土Ia-T,得|冈|,
故[善丁项勺线性回归方程为I国.
当I臼厨,I区I,
所以预测今年8月份的销售最大约为50.4万辆.
变式8.(2024.四川成都.高三石室中学校考开学考试)已知某绿豆新品种发芽的适宜温度
在百三]之间,一农学实验室研究人员为研究温度工(喃与绿豆新品种发芽数),
(颗)之间的关系,每组选取了成熟种子50颗,分别在对应的|臼I的温度环境下进
14
行实验,得到如下散点图:
其中I区T;0,0
⑴运用相关系数进行分析说明,是否可以用线性回归模型拟合皿项勺关系?
(2)求出用于曲线性回归方剧冈.一并预测在目的温度下,种子的发芽的颗数.
参考公式:相关系数,回归直线方程I9|,其中
,I冈参考数据:I冈-----.
【解析】(1)根据题意,得0
0
s
因而相关系数
由于I冈很接近1,・'.可以用线性回归方程模型拟合y与x的关系.
0
15
・•・由于皿勺回归方程为0
若I臼则回颗.
・•・在目的温度下,预测种子的发芽颗数为44.
变式9.(2024.安徽冕州・蒙城第一中学校联考模拟预测)为调查某地区植被覆盖面积火(单
位:公顷)和野生动物数量),的关系,某研究小组将该地区等面积花分为400个区块,从
中随机抽取40个区块,得到样本数据百一|(|凶~部分数据如下:
X•••2.73.63.23.9•••
y・.・50.663.752.154.3・・・
经计算得:S,区,因0
(1)利用最小二乘估计建立),关于x的线性回归方程:
(2)该小组又利用这组数据建立了x关于),的线性回归方程,并把这两条拟合直线画在同一
坐标系国下,横坐标x,纵坐标的意义与植被覆盖面枳x和野生动物数量),一致.设前
者与后者的斜率分别为注@比较口)勺大小关系,并证明.
附:y关于x的回归方程旧.一|中,斜率和截距的最小二乘估计公式分别为:
Is
'冈:
【解析】(1)0.0,0,向
故回归方程为[百];
0
(2)x关于y的线性回归方程为何
-0[H
16
0”……一
则,「为),与X的相关系数,
又回,5H,故可,即口,
下证:।回|,
若|冈T,则旧即|回旭成立,
代入表格中的一组数据得:।臼1,矛盾,
故瓦•
综上,y关于x的回归方程为|区].二.
【解题方法总结】
求经验回归方程的步骤
题型三:非线性回归
例7.(2024・湖南•校联考模拟预测)若需要刻画预报变用我U解释变显璃勺相关关系,且
从已知数据中知道预报变量中簿着解释变量磷勺增大而减小,并且随着解释变量或勺增
大,预报变量弱致趋于一个确定的值,为拟合硬口国间的关系,应使用以下回归方程
中的(耳,q为自然对数的底数)()
A.|臼|B.|臼C.[7|D.|国
【答案】D
【解析】对于A:因为耳]在定义域内单调递增且耳,所以中构着或勺增大而增大,不
合题意,故A错误;
对于B:因为匚―I在定义域内单调递增且可,所以虽短着朝增大而减小,当解释变
MlIl>Ii-I--l>不合题意,故B错误;
对于c:因为I冈I在定义域内单调递增月.耳|,所以硬0着展勺增大而减小,当解释变
17
量[m"I,Irj~1>不合题意,故C错误;
对于D:因为|回[在定义域内单调递减且同,所以用的着项勺增大而减小,当
解释变量三二I,与二,故D错误;
lxlHH
故选:D.
例8.(2024.全国•高三专题练习)云计算是信息技术发展的集中体现,近年来,我国云计
算市场规模持续增长.己知某科技公司2018年至2022年云计算市场规模数据,旦市场规模
丁与年份代码工的关系可以用模型|冈T(其中e为自然对数的底数)拟合,设
回二得到数据统计表如下:
年份2018年2019年2020年2021年2022年
年份代码X12345
云计算市场规模W千万元7.4112036.666.7
La——।22.433.64
由上表可得经验回归方程QI,则2025年该科技公司云计算市场规模),的估计值
为()
A.国£B.国C.[gjD.回
【答案】B
【解析】因为面-----1,
所以I区I,
即经验回归方程I凹------
当I臼1时,Ig---------1>
所以|冈一『,
即2025年该科技公司云计算市场规模),的估计值为0,
故选:B
例9.(多选题)(2024・福建厘门•原门一中校考三模)在对具有相关关系的两个变量进行回
归分析时,若两个变量不呈线性相关关系,可以建立含两个待定参数的非线性模型,并引
入中间变量将其转化为线性关系,再利用最小二乘法进行线性回归分析.卜列选项为四个同
学根据自己所得数据的散点图建立的非线性模型,且散点图的样木点均位于第一象限,则
18
其中可以根据上述方法进行回归分析的模型有()
B.眄|
D.旧
,令叵
【解析】对于选项A:0则冈
对于选项B:
即I冈令l_g_l则画
对于选项D:[冈]令|二侧向
此时斜率为生,与最小二乘法不符.
故选:ABC
变式10.(2024.全国•高三专题练习)已知变量的关系可以用模型回二|拟合,设
山上表可得线性回归方程I,则目|()
C.属D.LJ
【答案】B
【解析】由表格数据知回~i,r^~i.即样本中心点为回],
由।臼1,得।臼I,
即I臼I,
所以国—I,即।臼I,可得国二],
故选:B.
变式11.(2024・全国•高三专题练习)某校课外学习小组研究某作物种子的发芽率/温度
19
选(单位:同)的关系,由实验数据得到如图所示的散点图.由此散点图判断,最适宜作为
发芽率咕口温度朝回归方程类型的是()
A.|臼----1B.|@
C旧ID.后
【答案】D
【解析】由散点图可见,数据分布成递增趋势,但是呈现上凸效果,即增加缓慢.
A中,|臼|是直线型,均匀增长,不符合要求:
B中,|区]"[是二次函数型,图象呈现下凸,增氏也较快,不符合要求;
C中,|区]一|是指数型,爆炸式增长,增长快,不符合要求;
D中,|臼|是对数型,增长缓慢,符合要求.
故对数型最适宜该I可归模型.
故选:D.
变式12.(2024.全国•高二专题练习)兰溪杨梅从5月15日起开始陆续上市,据调查统
计,得到杨梅销售价格(单位:。元/千克)与上市时间,(单位:天)的数据如下表所
刁”
时间〃(单位:天)102070
销售价格Q(单位:元/千克)10()50100
根据上表数据•,从下列困数模型中选取一个描述杨梅销售价格。与上市时间/的变化关
系:|冈|.利用你选取的函数模型,在以下四个日
期中,杨梅销售价格最低的口期为()
A.6月5日B.6月15日C.6月25日D.7月5日
【答案】C
【解析】根据表中数据,描述杨梅销位价格Q与上市时间Q的变化关系不可能是常数函
20
数、也不可能是单调函数,
函数回]在回~|时均为单调函数,这与表格中的数据不吻合,
所以应选取冈-----进行描述,
将表中数据0代入I冈I可得
HH]l
,解得L所以国
国卜所以当值□时杨梅销售价格最低,
,6月25日时|e",7月5日时|eT;
而6月5日而臼6月15日时B
所以耳ZI时杨梅销售价格最低.
故诜:C.
变式13.(2024.四川泸卅高三四川省泸县第四中学校考开学考试)抗体药物的研发是生物
技术制药领域的一个重要组成部分,抗体药物的摄入量与体内抗体数量的关系成为研究抗
体药物的一个重要方面.某研究团队收集了10组抗体药物的摄入量与体内抗体数量的数
据,并对这些数据作了初步处理,得到了如图所示的散点图及一叫统计量的值,抗体药物
摄入量为x(单位:口),体内抗体数量为),(单位:宫二I).
100
29.2121634.4
(1)根据经验,我们选择|冈|作为体内抗体数量y关于抗体药物摄入量x的P1归方程,将
|冈|两边取对数,得|国可以看出后]与国具有线性相关关系,试根据
参考数据建立[至于展勺回归方程,并预测抗体药物摄入量为旧□时.体内抗体数量理
21
值;
(2)经技术改造后,该抗体药物的有效率z大幅提高,经试验统计得z服从正态分布
国一一…卜那这种抗体药物的有效率萼过0.54的概率约为多少?
LS-------------------------1,L0--------------
③取I目..
【解析】(1)将向三|两边取对数,得I臼-----
设后~~I,@二],则回归方程变为「臼I,
由表中数据可知,0,s
0I
所以,向
所以||x|I,即||x|
故y关于X的回归方程为I回],
当I臼时,冈•
(2)因为z服从正态分对回:其中叵三l[g1>
所以|冈一一
所以凶
故这种抗体药物的有效率z超过0.54的概率约为回一|.
变式14.(2024♦江西赣州高三校考阶段练习)为了研究某种细菌随天数聊化的繁殖个数
他收集数据如下:
天数2123456
22
(1)在图中作出繁殖个数理于天数粤化的散点图,并由散点图判断I冈I(国为常
数)与I国I(回为常数,且I叵]…,哪一个适宜作为繁殖个数定于天数轻
化的回归方程类型?(给出判断即可,不必说明理由)
(2)对于非线性回归方程旧|(回为常数,且[亘…]),令后三],可以得到繁
殖个数的对数2关于天数X具有线性关系及一些统计量的值.
口0-00
3.5062.833.5317.50596.5712.09
(i)证明:“对于非线性回归方程叵二令国二|,可以得到繁殖个数的对数誉于
天数卷有线性关系(即|冈------|为常数)
(ii)根据(i)的判断结果及表中数据,建立善于朝回归方程(系数保留2位小
数).
附:对于一组数据后]其回归直线方程|冈-----1的斜率和截距的最
区”……一
小二乘估计分别为
【解析】(1)作出散点图如图所示.
23
由散点图看出样本点分布在•条指数型曲线厄||的周围,
故选择回为回归方程较宜.
(2)(i)由已知:令国,则叵
则区I,|回|,即I回L所以繁殖个数的对数q苦于天数朝有线性关系•
(ii)由(i)知繁殖个数的对数口养于天数法1]"以用线性回归方程来拟合.由表中数据可
得,
0
得到卷土聊线性回归方程为其,乂I区।I,
因此细菌的繁殖个数定于天数日的非线性回归方程为I区
变式15.(2024•重庆沙坪坝•高三重庆八中校考阶段练习)在正常生产条件下,根据经验,
可以认为化肥的有效利用率近似服从正态分布回,而化肥施肥量因农作物的种
类不同每亩也存在差异.
⑴假设生产条件正常,记脚示化肥的有效利用率,潮国|;
(2)课题组为研究每亩化肥施用量与某农作物亩产量之间的关系,收集了10组数据,并对
这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值.其中每亩化肥施用量
为选(单位:公斤),粮食亩产量为弓(单位:百公斤)
参考数据:
0回00
24
65091.552.51478.630.5151546.5
冈I,I+2'鼻口
(i)根据散点图判断,|国一一|与面~~哪一个适宜作为该农作物亩产量定于每亩化
肥施用量或勺回归方程(给出判断即可,不必说明理由):
(ii)根据(i)的判断结果及表中数据,建立忠于聊回归方程;并预测每亩化肥施用
量为27公斤时,粮食亩产量C的值回一十
【解析】(1)由回……,根据正态分布曲线的对称性,
可得0
(2)(i)由散点图可知哂黑勺关系不是线性关系,所以|冈|适宜作为粮食亩产的需
于每亩化肥施用量(朝回归方程;
(ii)因为|冈…|,所以I回二…_|,令I回________"_]I,则|向回|,
0
由表可得|因------|,所以,
所以画,所以匐,所以回,
当5~1时,响-----(百公斤)
变式16.(2024.重庆.高三校联考开学考试)某公司为了解年研发资金投入量x(单位:亿
元)对年销售额y(单位:亿元)的影响.对公司近12年的年研发资金投入量双和年销售额
W的数据,进行了对比分圻,建立了两个模型:①|冈@冈其中。,夕,
L/均为常数,e为自然对数的底数,并得到一些统计量的值.令
25
,经计算得如下数据:
a00-口
20667724604.20
0一00-0
312502153.0814
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)(i)根据分析及表中数据,建立y关于x的回归方程;
(ii)若下一年销售额),需达到90亿元,预测下一年的研发资金投入量x是多少亿元?
0
附:①相关系数,回归直|冈—中公式分别为
0
②参考数据:
【解析】(1)设模型①和②的相关系数分别为〃,2
S
由题意可得:
0
所以I区由相关系数的相关性质可得,模型②的拟合程度更好.
(2)(i)由(1)知,选择模型②.
先建立u关于x的线性回归方程,
因为[_0二}可得的即LE二
26
H
可得
所以卜关于X的线性回归方程为|冈------即|冈……
(ii)下一年销售额需达到90亿元,即值
代入|回],得|国------,
因为叵]-1,则I臼I,
所以s,
故预测下一年的研发资金投入量约是21.67亿元.
变式17.(2024.江苏镇江江苏省镇江中学校考三模)经观测,长江中某鱼类的产卵数理
温度朝关,现将收集到的温度用和产卵数扃|的10组观测数据作了初步处
理,得到如图的散点图及一些统计量表.
回口回———
360国国同国
0-H0H
3回目
表中0”.一
⑴根据散点图判断,面与向]哪一个适宜作为[曲勒间的回归方
程模型并求出生于我“白方程;(给出判断即可,不必说明理由)
27
⑵某兴趣小组抽取两批鱼卵,已知第一批中共有6个鱼卵,其中“死卵”有2个;第二批中
共有8个鱼卵,其中“死卵”有3个.现随机挑选一批,然后从该批次中随机取出2个鱼
卵,求取出“死卵”个数的分布列及数学期望.
附:对于一组数据厄其回归直线后|的斜率和截距的最小二
回
乘估计分别为
【解析】(1)根据散点图判断,看出样本点分布在一条指数函数的周围,
目关于蜜勺回归方程为0
(2)由题意,设随机挑选一批,取出两个鱼卵,其中“死卵”个数为弓则型取值为
耳,
设同'所取两个鱼卵来自第“匕'|回所以0,
设向下所取两个鱼卵有“死卵'叵二I,
由全概率公式
0
0
0
所以取出“死卵”个数的分布列为:
日012
28
a-.....
所以取出“死卵”个数的数学期望呵.
变式18.(2024•广西南宁南宁三中校考一模)数据显示中国车载音乐已步入快速发展期,
随着车我音乐的商业化模式进•步完善,市场将持续力,大,下表为2018—2022年中国车我
音乐市场规模(单位:十亿元),其中年份2018—2022对应的代码分别为1-5.
年份代码证12345
车载音乐市场规模弓2.83.97.312.017.0
(Drii上表数据知,可用指数函数模型|冈微合直武勺关系,请建立忠于聊回归方
程;
(2)根据上述数据求得忠于或勺回归方程后,预测2024年的中国车载音乐市场规模.
参考数据:
S百回
1.9433.821.71.626.84
其中I冈I,|回I
参考公式:对于一组数据百|[g|,/1|区1|其回归直线0的斜率和截
设国二I,所以1日〕,
设国I,I回一-1,设田I,
因为,I国一”,
29
回一一_
所以叵区
因卜所以|B|,
所以|回~|,|回:所以|区1.
(2)把2024年代码百%[入方程,
得0(十亿元)
故预测2024年的中国车载音乐市场规模45.628(十亿元)
变式19.(2024•安徽合肥・合肥市第八中学校考模拟预测)当前移动网络已融入社会生活的
方方面面,深刻改变了人们的沟通、交流乃至整个生活方式.4G网络虽然解决了人与人随时
随地通信的问题,但随着移动互联网快速发展,其已难以满足未来移动数据流最暴涨的需
求,而5G作为一种新型移动通信网络,不但可以解决人与人的通信问题,而且还可以为
用户提供增强现实、虚拟现实、超高清(3。)视频等更加身临其境的极致业务体验,更重要
的是还可以解决人与物、物与物的通信问题,从而满足移动医疗、车联网、智能家居、工业控
制、环境监测等物联网应用需求,为更好的满足消费者对5G网络的需求,中国电信在某地
区推出了六款不同价位的流量套餐,每款套餐的月资费工(单位:元)与购买人数y(单
位:万人)的数据如下表:
套餐ABCDEF
月资费X(元)384858
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大型企业人力资源部经理招聘流程解析
- 企业集团内部审计实施与技巧
- 京东零售市场分析面试精讲
- 交通物流领域调度员岗位面试全解析
- 体育产业赛事策划与执行全流程详解
- 数据驱动企业运营的秘诀:如何应对数据中台经理面试
- 2026年高考生物细胞结构示意图解析试题
- 2026年信息技术在医疗领域应用前景讲座试题
- 社交自媒体时代的演讲稿
- 把青春留给时间演讲稿
- 给孩子讲大数据
- 2025年江苏农林职业技术学院单招职业技能测试题库完整参考答案详解
- 2026年黑龙江林业职业技术学院单招综合素质考试题库必考题
- 以竹代塑产品生产建设项目实施方案
- 2025年泰国驾校中文题库及答案
- GB/T 46194-2025道路车辆信息安全工程
- 医院行政岗笔试试题及答案
- 记账实操-咖喱牛肉制作成本核算
- 托育培训基础知识课件
- 2025年党员个人问题清单及整改措施
- 单招考试题库护理类及答案解析
评论
0/150
提交评论