版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题11线性回归直线与非线性回归直线方程【考点预测】1、两个变量线性相关(1)散点图:将样本中个数据点(i=1,2,…,)描在平面直角坐标系中得到的图形.(2)正相关与负相关①正相关:散点图中的点散布在从左下角到右上角的区域.②负相关:散点图中的点散布在从左上角到右下角的区域.2、回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程.(3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据,,.②设所求回归方程为,其中是待定参数.③由最小二乘法得其中,是回归方程的斜率,是截距.3、当经验回归方程并非形如()时,称之为非线性经验回归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下:曲线方程变换公式变换后的线性关系式建立非线性经验回归模型的基本步骤(1)确定研究对象,明确哪个是解释变量,哪个是响应变量;(2)由经验确定非线性经验回归方程的模型;(3)通过变换(一般题目都有明显的暗示如何换元,换元成什么变量),将非线性经验回归模型转化为线性经验回归模型(特别注意:使用线性回归方程的公式,注意代入变换后的变量);(4)按照公式计算经验回归方程中的参数,得到经验回归方程;(5)消去新元,得到非线性经验回归方程;(6)得出结果后分析残差图是否有异常.【典型例题】例1.(2023·黑龙江双鸭山·高二双鸭山一中校考期末)已知数据的三对观测值为,用“最小二乘法”判断下列直线的拟合程度,则效果最好的是(
)A. B. C. D.【答案】A【解析】当拟合直线为时,预报值与实际值的差的平方和,当拟合直线为时,预报值与实际值的差的平方和,当拟合直线为时,预报值与实际值的差的平方和,当拟合直线为时,预报值与实际值的差的平方和,故最小,即效果最好的是.故选:A.例2.(2023·广西钦州·高二钦州一中校考期中)下对于两个变量和进行回归分析,得到一组样本数据:,,,,则下列说法正确的是(
)①由样本数据得到的回归直线必经过样本点中心②用来刻画回归效果,的值越小,说明模型的拟合效果越好③残差平方和越小的模型,拟合的效果越好④用相关系数来衡量两个变量之间线性关系的强弱时,越接近于,相关性越弱;A.①② B.①③④ C.①②③ D.①③【答案】D【解析】由题意得:样本中心点在回归直线上,故①正确;越大拟合效果越好,故②不正确;残差平方和越小的模型,拟合效果越好,故③正确;用相关系数来衡量两个变量之间线性关系的强弱时,越接近于,相关性越强,故④不正确.故选:D例3.(2023·福建三明·高二校联考期中)下列命题中,错误的命题是(
)A.在一组样本数据(不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为B.设随机变量,,则C.在的展开式中,的系数是35D.残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适【答案】A【解析】在一组样本数据(不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据为函数关系,相关性非常强,为,又因为,为正相关,所以,所以,故A错误;随机变量,所以,因为所有,所以,故B正确;在的展开式中,的系数,故C正确;残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,故D正确.故选:A.例4.(2023·四川雅安·高二统考期末)某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为ycm,测得一些数据如下表所示:第x度y/cm0479111213作出这组数的散点图如下(1)请根据散点图判断,与中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测第196天这株幼苗的高度(结果保留整数).附:,
参考数据:1402856283【解析】(1)根据散点图,更适宜作为幼苗高度y关于时间x的回归方程类型;(2)令,则构造新的成对数据,如下表所示:x149162536491234567y0479111213容易计算,,.通过上表计算可得:因此∵回归直线过点,∴,故y关于的回归直线方程为从而可得:y关于x的回归方程为令,则,所以预测第196天幼苗的高度大约为29cm.例5.(2023·湖北·高二统考期末)快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本(单位:元)与当天揽收的快递件数即揽件量(单位:千件)之间的关系,对该网点近天的每日揽件量(单位:千件)与当日收发一件快递的平均成本(单位:元)()的数据进行了初步处理,得到散点图及一些统计量的值.表中,.(1)根据散点图判断与哪一个更适宜作为关于的经验回归方程类型?并根据判断结果及表中数据求出关于的经验回归方程;(2)已知该网点每天的揽件量(单位:千件)与单件快递的平均价格(单位:元)之间的关系是,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的经验回归方程解决以下问题:①预测该网点某天揽件量为千件时可获得的总利润;②单件快递的平均价格为何值时,该网点一天内收发快递所获利润的预报值最大?附:对于一组具有线性相关关系的数据,其经验回归直线的斜率和截距的最小二乘估计分别为,.【解析】(1)由散点图可知:更适宜作为关于的经验回归方程类型;令,则,,关于的经验回归方程为:.(2)设收发千件快递获利千元,则;①当时,,即该网点某天揽收件快递可获得的总利润约为元.②,令,解得:,当时,;当时,;在上单调递增,在上单调递减,当时,,此时;单件快递的平均价格元时,该网点一天内收发快递所获利润的预报值最大.例6.(2023·河南三门峡·高三统考期末)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A区B区C区D区外来务工人数x/万3456就地过年人数y/万2.5344.5(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程.(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市E区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E区就地过年的人员发放的补贴总金额;②若A区的外来务工人员中甲、乙选择就地过年的概率分别为p,,其中,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求p的取值范围.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.【解析】(1))由题,,,,,,所以相关系数,因为y与x之间的相关系数近似为0.99,说明y与x之间的线性相关程度非常强,所以可用线性回归模型拟合y与x之间的关系.,,故y关于x的线性回归方程为.(2)①将代入,得,故估计该市政府需要给E区就地过年的人员发放的补贴总金额为(万元).②设甲、乙两人中选择就地过年的人数为X,则X的所有可能取值为0,1,2,,,.所以,所以,由,得,又,所以,故p的取值范围为.例7.(2023·西藏拉萨·高一校联考期末)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为10千克时,西红柿亩产量的增加量约为多少?附:相关系数公式.参考数据:回归方程中斜率和截距的最小二乘估计公式分别为.【解析】(1)由已知数据可得,,所以,,,所以相关系数.因为,所以可用线性回归模型拟合y与x的关系.(2),,所以回归方程为.当时,.即当液体肥料每亩使用量为10千克时,西红柿亩产量的增加量约为550千克例8.(2023·陕西西安·高二统考期末)新冠肺炎疫情发生以来,中医药全面参与疫情防控救治,做出了重要贡献.某中医药企业根据市场调研与模拟,得到研发投入x(亿元)与产品收益y(亿元)的数据统计如下:研发投入x(亿元)12345产品收益y(亿元)3791011(1)计算x,y的相关系数r,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若,则线性相关程度一般,若,则线性相关程度较高)(2)求出y关于x的线性回归方程,并预测研发投入20(亿元)时产品的收益.参考数据:,,.附:相关系数公式:,回归直线方程的斜率,截距.【解析】(1)∵,,,∴,∴该中医药企业的研发投入x与产品收益y具有较高的线性相关程度.(2)∵,,∴.∴y关于x的线性回归方程为,将代入线性回归方程可得,,∴预测研发投入20(亿元)时产品的收益为40.3(亿元).例9.(2023·黑龙江大庆·高二大庆市东风中学校考期末)下表所示是我国2015年至2021年生活垃圾无害化处理量(单位:亿吨).年份2015201620172018201920202021处理量(亿吨)1.81.972.12.262.42.552.69(1)由数据可知,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),并预测2023年我国生活垃圾无害化处理量.附:,,,.相关系数;回归方程中斜率和截距的最小二乘估计公式分别为:,.【解析】(1)由表中数据和附注中数据可得:,,所以.因为y与t的相关系数近似为0.999,说明y与t的线性相关相当高,从而可以用线性回归模型拟合y与t的关系.(2)由(1)得,.所以y关于t的回归方程为:.将2023代入回归方程得:.所以预测2023年我国生活垃圾无害化处理量将约3亿吨.例10.(2023·江西吉安·高二校考期中)某科技公司研发了一项新产品,经过市场调研,对公司1月份至6月份销售量及销售单价进行统计,销售单价(千元)和销售量(千件)之间的一组数据如下表所示:月份123456销售单价销售量(1)试根据1至5月份的数据,建立关于的回归直线方程;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过千件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?参考公式:回归直线方程,其中.参考数据:,.【解析】(1)因为,,所以,得,于是关于的回归直线方程为;(2)当时,,则,故可以认为所得到的回归直线方程是理想的.【过关测试】一、单选题1.(2023·福建福州·高二福州三中校考期中)下列说法正确的是(
)A.在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B.线性回归方程对应的直线至少经过其样本数据点中的一个点C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,相关指数为0.95的模型比相关指数为0.78的模型拟合的效果差【答案】C【解析】对于A,统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,所以A错;对于B,线性回归方程对应的直线可能不过任何一个样本数据点,所以B错误;对于C,残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以C正确;对于D,回归分析中,相关指数为的模型比相关指数为的模型拟合的效果好,所以D错误.故选:C2.(2023·陕西宝鸡·高二统考期中)在对两个变量x,y进行回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求回归方程;④根据所收集的数据绘制散点图.则下列操作顺序正确的是(
)A.①②④③ B.③②④① C.②③①④ D.②④③①【答案】D【解析】根据回归分析的思想,可知对两个变量x,y进行回归分析时,应先收集数据(xi,yi),然后绘制散点图,再求回归方程,最后对所求的回归方程作出解释.故选:D3.(2023·陕西渭南·高二统考期末)某校课外学习小组研究某作物种子的发芽率和温度(单位:)的关系,由实验数据得到如图所示的散点图.由此散点图判断,最适宜作为发芽率和温度的回归方程类型的是(
)A. B.C. D.【答案】D【解析】由散点图可见,数据分布成递增趋势,但是呈现上凸效果,即增加缓慢.A中,是直线型,均匀增长,不符合要求;B中,是二次函数型,图象呈现下凸,增长也较快,不符合要求;C中,是指数型,爆炸式增长,增长快,不符合要求;D中,是对数型,增长缓慢,符合要求.故对数型最适宜该回归模型.故选:D.4.(2023·福建福州·高二福建省福州第一中学校考期末)在一组样本数据,,,的散点图中,若所有样本点(,2,,7)都在曲线附近波动,经计算,,,则实数(
)A.0.5 B.0.5 C.1 D.1【答案】A【解析】因为,,所以,解得.故选:A.5.(2023·河南南阳·高二统考期末)用模型拟合一组数据时,令,将其变换后得到回归直线方程,则(
)A.e B. C. D.2【答案】D【解析】对两边同时取对数,则,令,则,所以,所以.故选:D.6.(2023·广东江门·高二统考期末)下列说法:①样本相关系数的取值范围是;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则,的值分别是和0.3;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为中,,,,则;④若变量和满足关系且变量与正相关,则与也正相关.其中正确的个数是(
)A.1 B.2 C.3 D.4【答案】B【解析】对于①,样本相关系数的取值范围是,故①错误;对于②,由,两边取对数,可得,令,可得,,,,,故②正确;对于③,回归直线方程中,,,,则,故③正确;对于④,若变量和满足关系,与负相关,又变量与正相关,则与负相关,故④错误;故选:B二、多选题7.(2023·黑龙江哈尔滨·高二哈尔滨三中校考期末)下列关于回归分析的说法中,正确的是(
)A.在回归分析中,散点图内的散点大致落在一条从左下角到右上角的直线附近,我们称两个变量呈正相关B.在回归分析中,残差点所在的带状区域宽度越宽,说明模型的拟合精度越高C.在回归分析中,样本数据中一定有样本点D.决定系数越大,模型的拟合效果越好【答案】AD【解析】由散点大致落在一条从左下角到右上角的直线附近可知直线斜率为正,故两个变量呈正相关,A正确;残差点所在的带状区域宽度越窄,拟合精度越高,故B错误;为样本中心点,不一定在样本数据中,故C错误;决定系数越大,拟合效果越好,故D正确.故选:AD8.(2023·黑龙江齐齐哈尔·高二统考期末)下列说法中,正确的命题有(
)A.在做回归分析时,残差图中残差点分布的带状区域的宽度越窄,表示拟合效果越好B.线性经验回归直线至少经过样本点,,…,中的一个C.若表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,且,,则与之间的相关性强于与之间的相关性D.用模型去拟合一组数据时,为了求出非线性经验回归方程,设,求得线性经验回归方程为,则,【答案】AD【解析】对于A,由残差图的特征可知,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高,所以A正确.对于B,线性回归方程必过样本点的中心,不一定过样本中的一个点,所以B错误.对于C,相关系数越大,说明线性相关性越强,反之,则越弱,,所以与之间的相关性更强,所以C错误.对于D,对模型两边同时取对数,则,与线性方程比较,可知,,故D正确故选:AD.9.(2023·山东济南·高二统考期末)某同学将收集到的六对数据制作成散点图如下,得到其经验回归方程为,计算其相关系数为,决定系数为.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的五对数据计算得到经验回归方程为,相关系数为,决定系数为.下列结论正确的是(
)A. B.C. D.【答案】AC【解析】由图可知两变量呈现正相关,故,,去掉“离群点”后,相关性更强,所以,故,故A正确,B不正确.根据图象当去掉F点后,直线的基本在A,B,C,D,E附近的那条直线上,直线的倾斜程度会略向轴偏向,故斜率会变小,因此可判断,故C正确,D错误.故选:AC.10.(2023·福建福州·高三校考期中)下列命题正确的是(
)A.在回归分析中,相关指数越小,说明回归效果越好B.已知,若根据2×2列联表得到的观测值为4.1,则有95%的把握认为两个分类变量有关C.已知由一组样本数据(,2,,n)得到的回归直线方程为,且,则这组样本数据中一定有D.若随机变量,则不论取何值,为定值【答案】BD【解析】对于A选项:在回归分析中,相关指数越大,说明回归效果越好,故A错误;对于B选项:,若根据2×2列联表得到的观测值为4.1,则有的把握认为两个分类变量有关,故B正确;对于C选项:根据回归直线方程为,由,得到是一个估计值,因此这组样本数据不一定有,故C错误;对于D选项:若随机变量,为对称轴,则不论取何值,为定值,故D正确.故选:BD11.(2023·山东青岛·高二统考期中)将两个变量的对样本数据在平面直角坐标系中表示为散点图,根据满足一元线性回归模型及最小二乘法,求得其经验回归方程为,设为回归直线上的点,则下列说法正确的是(
)A.越小,说明模型的拟合效果越好B.利用最小二乘法求出的线性回归直线一定经过散点图中的某些点C.相关系数的绝对值越接近于,说明成对样本数据的线性相关程度越强D.通过经验回归方程进行预报时,解释变量的取值不能距离样本数据的范围太远,求得的预报值不是响应变量的精确值【答案】CD【解析】A.当所有时,,当所有时,,显然后者拟合效果好,故错误;B.利用最小二乘法求出的线性回归直线一定经过样本中心,不一定经过散点图中的某些点,故错误;C.相关系数的绝对值越接近于,说明成对样本数据的线性相关程度越强,故正确;D.样本取值会影响回归方程的运用范围,求得的预报值不是响应变量的精确值,故正确;故选:CD12.(2023·广东广州·高二统考期末)在实际应用中,用回归方程中的估计回归模型中的,下列说法正确的有(
)A.随机误差的方差越小,用预报真实值的精度越低B.越接近于1,线性回归模型的拟合效果越好C.残差平方和越大,线性回归模型的拟合效果越差D.对于个样本点,,…,,线性回归直线过样本点的中心【答案】BCD【解析】随机误差的方差越小,用预报真实值的精度越高,所以A选项错误;越接近于1,线性回归模型的拟合效果越好,所以B选项正确;残差平方和越大,线性回归模型的拟合效果越差,所以C选项正确;对于个样本点,,…,,线性回归直线过样本点的中心,所以D选项正确.故选:BCD13.(2023·广东佛山·高二统考期末)2021年5月18日,《佛山市第七次全国人口普查公报》发布.公报显示,佛山市常住人口为9498863人.为了进一步分析数据特征,某数学兴趣小组先将近五次人口普查数据作出散点图(横坐标为人口普查的序号,第三次普查记为1,……,第七次普查记为5,纵坐标为当次人口普查佛山市人口数),再利用不同的函数模型作出回归分析,如下图,以下说法正确的是(
)A.佛山市人口数与普查序号呈正相关关系B.散点的分布呈现出很弱的线性相关特征C.回归方程2的拟合效果更好D.应用回归方程1可以预测第八次人口普查时佛山市人口会超过1400万【答案】AC【解析】对于A:散点图中的点的分布从左下方至右上方,故呈正相关关系,故A正确;对于B:利用模型1,样本点基本分布在直线的两侧,故具有较强的线性相关特征,故B错误;对于C:因为,所以回归方程2的拟合效果更好,故C正确;对于D:利用模型1,当时,,故D错误;故选:AC14.(2023·湖南衡阳·高三衡阳市一中校考期中)下列说法正确的有(
)A.函数的最小值为2.B.函数的零点所在的区间大致是.C.若A∩B为不可能事件,A∪B为必然事件,则事件A与事件B互为对立事件D.以拟合一组数据时,经代换后的经验回归方程为,则【答案】CD【解析】对于A,由于,由不等式可得,当且仅当时等号取得到,但是无解,故等号取不到,故函数的最小值不是2,故A错误,对于B,当时,,当时,,又均为上的单调递增函数,故函数在上没有零点,故B错误,对于C,A∩B为不可能事件,A∪B为必然事件,则事件A与事件B互为对立事件,故C正确,对于D,,所以,故D正确,故选:CD.15.(2023·福建三明·高三校联考期中)下列说法正确的有(
)A.若事件与事件互斥,则事件与事件对立B.若随机变量,则方差C.若随机变量,,则D.以模型去拟合一组数据时,为了求出回归方程,设,求得线性回归方程为,则的值分别是和【答案】BCD【解析】由对立事件和互斥事件定义可得,对立事件是互斥的,互斥事件不一定对立,所以A选项错误;由二项分布可得,又由公式可得,所以B选项正确;正态分布,对称轴,,得,又因为与关于对称,所以,所以C选项正确;将两边同时取得,,与对应,则,即,,所以D选项正确.故选:BCD三、填空题16.(2023·黑龙江大庆·高二铁人中学校考期中)下列命题中结论正确的是________________.(1)对两个变量进行回归分析,若所有样本点都在直线上,则;(2)对两个变量进行回归分析,以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则,的值分别是和;(3)某人投篮一次命中的概率为,某次练习他进行了20次投篮,每次投篮命中与否没有影响,设本次练习他投篮命中的次数为随机变量X,则当取得最大值时,.(4)已知,则【答案】(2)(4)【解析】对于(1),对两个变量进行回归分析,若所有样本点都在直线上,则,故(1)不正确;对于(2),由及得,所以,,故(2)正确;对于(3),依题意可知,,,假设最大,则,得,得,得,得,得,因为,所以或,所以当取得最大值时,或,故(3)不正确;对于(4),由,两边对求导得,令,得,故(4)正确.故答案为:(2)(4).17.(2023·江苏连云港·高二统考期末)若某地的财政收入x与支出y满足线性回归方程(单位:亿元),其中,,.若今年该地区财政收入为10亿元,则年支出预计不会超过________亿元.【答案】10【解析】由题意得财政收入x与支出y满足线性回归方程为,其中,当时,,因为,所以,所以今年该地区财政收入为10亿元,则年支出预计不会超过10亿元,故答案为:10四、解答题18.(2023·河北邯郸·高二校考期中)已知关于的一组有序数对分别为,,,,,,,对应的散点图如下.(1)根据散点图,判断(,)和(,)中哪个模型的拟合效果更好;(2)请用你在(1)中选出的模型对变量,的关系进行拟合,求出关于的回归方程.参考数据:,,,.参考公式:在线性回归方程中,,.【解析】(1)根据散点图判断,用(,)的拟合效果更好.(2)根据进行拟合,两边同时取对数得,故,则.因为,,,,所以.把代入,得,所以,,则,即关于的回归方程为.19.(2023·新疆哈密·高二校考期末)哈三中高二数学备课组对学生的记忆力和判断力进行统计分析,所得数据如下表所示:468102356(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.(参考公式:,)【解析】(1)由表中数据可得,,,所以,所以,所以关于的线性回归方程为,(2)当时,,所以记忆力为9的学生的判断力约为5.420.(2023·山西太原·高二统考期中)下表是某公司从2014年至2020年某种产品的宣传费用的近似值(单位:千元)年份2014201520162017201820192020年份代号x1234567该种产品的宣传费用y59.364.168.874.082.190.099.1以x为解释变量,y为预报变量,若以为回归方程,则相关指数;若以为回归方程,则相关指数.(1)判断与,哪一个更适合作为该种产品的宣传费用的近似值y关于年份代号x的回归方程,并说明理由;(2)根据(1)的判断结果及表中数据,求出y关于年份代号x的回归方程(系数精确到0.1).参考数据:.参考公式:.【解析】(1)更适合作为该种产品的宣传费用的近似值y关于年份代号x的回归方程.因为越大,说明模型的拟合效果越好.(2)由表格中数据有,,则.21.(2023·辽宁沈阳·高二东北育才双语学校校考期中)为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导.根据统计,该田园综合体西红柿亩产量的增加量(千克)与某种液体肥料每亩使用量(千克)之间的对应数据如下.(千克)24568(千克)300400400400500(1)由上表数据可知,可用线性回归模型拟合与的关系,请计算相关系数并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);(2)求关于的回归方程,并预测当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为多少千克?附:相关系数公式,参考数据:.回归方程中斜率和截距的最小二乘估计公式分别为,.【解析】(1)由已知数据可得,,所以,,,所以相关系数.因为,所以可用线性回归模型拟合与的关系.(2),,所以回归方程为.当时,,即当液体肥料每亩使用量为15千克时,西红柿由产量的增加量约为700千克.22.(2023·福建南平·高二统考期末)某服装企业采用服装个性化设计为客户提供服务,即由客户提供身材的基本数据用于个人服装设计.该企业为了设计所用的数据更精准,随机地抽取了10位男子的身高和臂长的数据,数据如下表所示:身高164165168172173176178181182191臂长160164161170175181170182180187(1)根据表中的数据,求男子的身高预报臂长的线性回归方程,并预报身高为170cm的男子的臂长(男子臂长计算结果精确到0.01);(2)统计学认为,两个变量、的相关系数r的大小可表明两变量间的相关性强弱.一般地,如果|r|[0.75,1],那么相关性很强;如果|r|[0.30,0.75),那么相关性一般;如果|r|[0,0.30),那么没有相关性.求出r的值,并判断变量x、y的相关性强弱(结果精确到0.01).附:线性回归方程其中,,,,,,,【解析】(1),由,得所以所求线性回归方程为当时,所以身高为170cm的男性臂长约为(2),因为r[0.75,1],所以变量间的相关性很强.23.(2023·河南驻马店·高一统考期末)宁夏西海固地区,在1972年被联合国粮食开发署确定为最不适宜人类生存的地区之一.为改善这一地区人民生活的贫困状态,上世纪90年代,党中央和自治区政府决定开始吊庄移民,将西海固地区的人口成批地迁移到更加适合生活的地区.为了帮助移民人口尽快脱贫,党中央作出推进东西部对口协作的战略部署,其中确定福建对口帮扶宁夏,在福建人民的帮助下,原西海固人民实现了快速脱贫,下表是对2016年以来近5年某移民村庄100位移民的年人均收入的统计:年份20162017201820192020年份代码12345人均年收入(千元)1.32.85.78.913.8现要建立关于的回归方程,有两个不同回归模型可以选择,模型一:;模型二:,即使画出关于的散点图,也无法确定哪个模型拟合效果更好,现用最小二乘法原理,已经求得模型二的方程为.(1)请你用最小二乘法原理,结合下面的参考公式求出模型一的方程(计算结果保留到小数点后一位);(2)请你用最小二乘法原理,比较哪个模型拟合效果更好,已经计算出模型二的参考数据为.参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘法估计公式分别为,.【解析】(1)根据题给数据计算得:,根据参考公式有:所以模型一的回归方程为:(2)由模型一的回归方程可得:.因为所以模型二的拟合效果更好.24.(2023·福建泉州·高二晋江市第一中学校考期中)某汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x(亿元)与科技改造直接收益y(亿元)的数据统计如下:x2346810132122232425y1222314250565868.56867.56668当时,建立了y与x的两个回归模型:模型①:;模型②:;当时,确定y与x满足的经验回归方程为:.(1)根据下列表格中的数据,比较当时模型①、②的相关指数,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车发动机科技改造的投入为16亿元时的直接收益.回归模型模型①模型②回归方程182.479.2(附:刻画回归效果的相关指数)(2)为鼓励科技创新,当科技改造的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入16亿元与20亿元时公司实际收益的大小.(附:用最小二乘法求经验回归方程的系数公式)【解析】由表格中的数据,有,即,可见模型①的相关指数小于模型②的相关指数.说明回归模型②刻画的拟合效果更好.所以当亿元时,科技改造直接收益的预测值为:(亿元).由已知可得:,,当亿元时,y与x满足的经验回归方程为:,当亿元时,科技改造直接收益的预测值,当亿元时,实际收益的预测值为亿元亿元,科技改造投入20亿元时,公司的实际收益更大.25.(2023·黑龙江哈尔滨·高二哈师大附中校考期末)某商场对商品近天的销售情况进行整理,得到如下数据,经统计分析,日销售量(件)与时间(天)之间具有线性相关关系.时间()日销售量()(1)请根据表格提供的数据,用最小二乘法原理求出关于的线性回归方程.(2)已知商品近天内的日销售价格(元)与时间(天)的关系为.根据(1)中求出的线性回归方程,预测为何值时,商品的日销售额最大.(参考公式,)【解析】(1)根据题意,,,所以回归系数为:,,故所求的线性回归方程为;
(2)由题意日销售额为;
当,时,,即当时,(元);
当,时,,即当时,(元),
综上所述,当时,(元),所以估计天时,商品的日销售额最大,为元.26.(2023·山西·高二统考期中)某生产制造企业统计了近10年的年利润(千万元)与每年投入的某种材料费用(十万元)的相关数据,作出如下散点图:选取函数作为每年该材料费用和年利润的回归模型.若令,则,得到相关数据如表所示:31.5151549.5(1)求出与的回归方程;(2)计划明年年利润额突破1亿,则该种材料应至少投入多少费用?(结果保留到万元)参考数据:.【解析】(1)因为由表中数据得,所以,所以,所以年该材料费用和年利润额的回归方程为;(2)令,得,所以(十万),故下一年应至少投入498万元该材料费用.27.(2023·浙江嘉兴·高三嘉兴一中校考期中)根据中国海洋生态环境状况公报,从2017年到2021年全国直排海污染物中各年份的氨氮总量(单位:千吨)与年份的散点图如下:记年份代码为,,对数据处理后得:60.51.52107617(1)根据散点图判断,模型①与模型②哪一个适宜作为关于的回归方程?(给出判断即可,不必说明理由)(2)根据(1)的判断结果,建立关于的回归方程,并预测2022年全国直排海污染物中的氨氮总量(计算结果精确到整数).参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,.【解析】(1)根据散点图的趋势,可知模型②适宜作为关于的回归方程.(2),.故关于的回归方程为,即关于的回归方程为,2022年对应的年份代码为,,故预计2022年全国直排海污染物中的氨氮总量为3吨.28.(2023·福建三明·高二统考期末)在国家大力发展新能源汽车产业的政策下,我国新能源汽车的产销量高速增长.已知某地区2014年底到2021年底新能源汽车保有量的数据统计表如下:年份(年)20142015201620172018201920202021年份代码x12345678保有量y/千辆1.952.924.386.589.8715.0022.5033.70参考数据:,,其中(1)根据统计表中的数据画出散点图(如图),请判断与哪一个更适合作为y关于x的经验回归方程(给出判断即可,不必说明理由),并根据你的判断结果建立y关于x的经验回归方程:(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下降的百分比相同.若2021年底该地区传统能源汽车保有量为500千辆,预计到2026年底传统能源汽车保有量将下降10%.试估计到哪一年底新能源汽车保有量将超过传统能源汽车保有量.参考公式:对于一组数据,v1),),…,,其经验回归直线的斜率和截距的最小二乘估计公式分别为,;【解析】(1)根据该地区新能源汽车保有量的增长趋势知,应选择的函数模型是,令,则因为,所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 光通信技术工程师考核试卷及答案解析
- 热硫化硅橡胶生产工安全理论知识考核试卷含答案
- 2026年土壤污染精准修复技术项目公司成立分析报告
- 2026年医疗健康产业链金融项目可行性研究报告
- 2026年低空保险服务项目公司成立分析报告
- 2026年类脑智能项目可行性研究报告
- 2026年即时零售 票务预订项目公司成立分析报告
- 2026年声学多普勒流速剖面仪项目可行性研究报告
- 2026年环境保护法规环境影响评价考试题库及答案
- 2026年旅游景点介绍与路线规划基础模拟题
- 2026春译林8下单词表【Unit1-8】(可编辑版)
- 阶梯式早期活动在ICU机械通气患者中的应用课件
- 2025-2030中国高级生产计划与排产系统(APS)行业运行现状与投资规划分析报告
- 征兵体检外科标准
- 【9物安徽中考卷】2025年安徽省中考招生考试真题物理试卷(真题+答案)
- 4输变电工程施工质量验收统一表式(电缆工程电气专业)-2024年版
- 传统元素与现代设计建筑融合创新
- 上海市海绵城市建设技术标准图集DBJT08-128-2019 2019沪L003、2019沪S701
- 外研版(三起)(2024)三年级下册英语Unit 2 单元测试卷(含答案)
- DB11-T 353-2021 城市道路清扫保洁质量与作业要求
- 《货运险培训进出口》课件
评论
0/150
提交评论