版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第02讲8.2一元线性回归模型及其应用(8.2.1一元线性回归模型+8.2.2一元线性回归模型参数的最小二乘法估计)课程标准学习目标①了解一元线性回归模型的含义,理解两个变量之间随机关系的一元线性回归模型的作用与意义。②了解残差在线性回归与非线性回归问题的作用及意义。③了解一元线性回归模型参数与最小二乘估计的推导过程,理解最小二乘估计的原理。④会结合题意求一元线性回归方程。⑤会用相关指数进行分析模型拟合的效果情况.。通过本节课的学习,要求会求一元线性回归方程,会进行残差分析,能判断回归模型的拟合效果,能利用样本数据建立统计模型并能进行预测知识点1:一元线性回归模型(1)一元线性回归模型我们称SKIPIF1<0为SKIPIF1<0关于SKIPIF1<0的一元线性回归模型,其中SKIPIF1<0称为因变量或响应变量,SKIPIF1<0称为自变量或解释变量;SKIPIF1<0和SKIPIF1<0为模型的未知参数,SKIPIF1<0称为截距参数,SKIPIF1<0称为斜率参数;SKIPIF1<0是SKIPIF1<0与SKIPIF1<0之间的随机误差.(2)随机误差在线性回归模型SKIPIF1<0中,SKIPIF1<0和SKIPIF1<0为模型的未知参数,SKIPIF1<0是SKIPIF1<0与SKIPIF1<0之间的误差,通常SKIPIF1<0为随机变量,称为随机误差.它的均值SKIPIF1<0,方程SKIPIF1<0.线性回归模型的完整表达式为SKIPIF1<0,在此模型中,随机误差SKIPIF1<0的方差SKIPIF1<0越小,用SKIPIF1<0预报真实值SKIPIF1<0的精度越高.知识点2:一元线性回归模型参数的最小二乘法(1)经验回归方程的求解法:最小二乘法回归直线方程过样本点的中心SKIPIF1<0,是回归直线方程最常用的一个特征;我们将SKIPIF1<0称为SKIPIF1<0关于SKIPIF1<0的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的SKIPIF1<0,叫做SKIPIF1<0,SKIPIF1<0的最小二乘估计,其中SKIPIF1<0称为回归系数,它实际上也就是经验回归直线的斜率,SKIPIF1<0为截距.其中SKIPIF1<0【即学即练1】(2024上·全国·高三专题练习)某校数学建模学生社团进行了一项实验研究,采集了SKIPIF1<0的一组数据如下表所示:SKIPIF1<0234567SKIPIF1<052.54540302517.5该社团对上述数据进行了分析,发现SKIPIF1<0与SKIPIF1<0之间具有线性相关关系.(1)画出表中数据的散点图,并指出SKIPIF1<0与SKIPIF1<0之间的相关系数SKIPIF1<0是正还是负;(2)求出SKIPIF1<0关于SKIPIF1<0的线性回归方程,并写出当SKIPIF1<0时,预测数据SKIPIF1<0的值.附:在线性回归方程SKIPIF1<0中,SKIPIF1<0,其中SKIPIF1<0为样本平均值.【答案】(1)散点图见解析,负(2)SKIPIF1<0,SKIPIF1<0【详解】(1)由题意得散点图如图所示:由图可知SKIPIF1<0与SKIPIF1<0之间成负相关关系,所以SKIPIF1<0是负.(2)因为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,SKIPIF1<0,∴关于SKIPIF1<0线性回归方程为SKIPIF1<0,所以当SKIPIF1<0时,SKIPIF1<0.(2)求经验回归方程的步骤①作出散点图,判断两变量是否具有线性相关关系,若具有线性相关关系,则可求其经验回归方程;②列表求出SKIPIF1<0,SKIPIF1<0的值;③利用公式先计算SKIPIF1<0,再根据经验回归直线过样本点的中心SKIPIF1<0计算SKIPIF1<0;④写出经验回归方程SKIPIF1<0.求经验回归方程,关键在于正确求出系数SKIPIF1<0,SKIPIF1<0,由于计算量较大,所以计算时要仔细谨慎、分层进行,避免因计算产生错误要特别注意,只有两个变量呈线性相关关系时,求出的经验回归方程才有意义.(3)经验回归方程的性质①经验回归直线一定过点SKIPIF1<0,点SKIPIF1<0通常称为样本点的中心;②一次函数SKIPIF1<0的单调性由SKIPIF1<0的符号决定,函数递增的充要条件是SKIPIF1<0;函数递减的充要条件是SKIPIF1<0.这说明:SKIPIF1<0与SKIPIF1<0正相关的充要条件是SKIPIF1<0;SKIPIF1<0与SKIPIF1<0负相关的充要条件是SKIPIF1<0.③在经验回归方程SKIPIF1<0中,SKIPIF1<0是经验回归直线的斜率,SKIPIF1<0是截距.一般地,当回归系数SKIPIF1<0时,说明两个变量呈正相关关系,它的意义是当SKIPIF1<0每增大一个单位时,SKIPIF1<0平均增大SKIPIF1<0个单位;当SKIPIF1<0时,说明两个变量呈负相关关系,它的意义是当SKIPIF1<0每增大一个单位时,SKIPIF1<0平均减小SKIPIF1<0个单位.知识点3:残差(1)残差对于响应变量SKIPIF1<0,通过观测得到的数据称为观测值,通过经验回归方程得到的SKIPIF1<0称为预测值,观测值减去预测值称为残差.(2)残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.(3)残差分析残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.其步骤为:计算残差SKIPIF1<0化残差图SKIPIF1<0在残差图中分析残差特性.【即学即练2】(2024·全国·高三专题练习)对于一组具有线性相关关系的样本数据SKIPIF1<0,其样本中心为SKIPIF1<0,回归方程为SKIPIF1<0,则相应于样本点SKIPIF1<0的残差为(
)A.SKIPIF1<0 B.SKIPIF1<0C.SKIPIF1<0 D.SKIPIF1<0【答案】C【详解】因为残差是实际观察值与估计值(拟合值)之间的差,所以相应于样本点SKIPIF1<0的残差为SKIPIF1<0,故选:C.知识点4:决定系数SKIPIF1<0(1)残差平方和残差平方和SKIPIF1<0,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.(2)决定系数SKIPIF1<0决定系数SKIPIF1<0是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.SKIPIF1<0,SKIPIF1<0越大,即拟合效果越好,SKIPIF1<0越小,模型拟合效果越差.【即学即练3】(2023下·青海西宁·高二校考阶段练习)甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:甲乙丙丁R20.980.780.500.85建立的回归模型拟合效果最好的同学是.【答案】选甲相关指数R2越大,表示回归模型拟合效果越好.【详解】相关指数SKIPIF1<0越大,相关性越强,回归模型拟合效果越好,所以效果最好的是甲.(3)决定系数SKIPIF1<0与相关系数SKIPIF1<0的联系与区别①相关系数SKIPIF1<0反映两个变量的相关关系的强弱及正相关或负相关,决定系数SKIPIF1<0反映回归模型的拟合效果.②在含有一个解释变量的线性模型中,决定系数SKIPIF1<0的数值是相关系数SKIPIF1<0的平方,其变化范围为SKIPIF1<0,而相关系数的变化范围为SKIPIF1<0.③当相关系数SKIPIF1<0接近于1时,说明两变量的相关性较强,当SKIPIF1<0接近于0时,说明两变量的相关性较弱;而当SKIPIF1<0接近于1时,说明经验回归方程的拟合效果较好.题型01由散点图判断是否线性相关【典例1】(2023下·河南南阳·高二唐河县第一高级中学校考阶段练习)2003年春季,我国部分地区SARS流行,党和政府采取果断措施,防治结合,很快使病情得到控制,下表是某同学记载的5月1日至5月12日每天北京市SARS治愈者数据,以及根据这些数据绘制出的散点图日期5.15.25.35.45.55.65.75.85.95.105.115.12人数100109115118121134141152168175186203下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系;②根据此散点图,可以判断日期与人数具有一次函数关系.其中正确的个数为(
)A.0个 B.1个 C.2个 D.以上都不对【答案】B【详解】由题意,做出散点图如下图所示,
由图可知,日期与人数具有线性相关关系,但不是一次函数关系,①正确,②错误,故选:B.【典例2】(2023·全国·高二专题练习)某个男孩的年龄与身高的统计数据如下表所示:年龄x(岁)123456身高y(cm)788798108115120(1)画出散点图;(2)判断y与x是否具有线性相关关系,如果相关,是正相关还是负相关.【答案】(1)答案见解析(2)y与x具有线性相关关系,且是正相关关系.【详解】(1)散点图如图所示:
(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系,且是正相关关系.【变式1】(2023下·高二课时练习)下列四个图中,两个变量x,y具有线性相关关系的是(
)A.①② B.①②④ C.②③④ D.②④【答案】D【详解】由图可知,②④中的点集中在一条直线的附近,所以图②④中的两个变量具有线性相关关系,故选:D.题型02求回归直线方程【典例1】(2024上·江西赣州·高二统考期末)大气污染物SKIPIF1<0(直径不大于2.5SKIPIF1<0的颗粒物)的浓度超过一定限度会影响人的身体健康.为研究SKIPIF1<0浓度y(单位:SKIPIF1<0)与汽车流量x(单位:千辆)的线性关系,研究人员选定了10个城市,在每个城市建立交通监测点,统计了24h内过往的汽车流量以及同时段空气中的SKIPIF1<0浓度,得到如下数据:城市编号12345678910总和x1.3001.4440.7861.6521.7561.7541.2001.5001.2000.90813.5y667621170156120721201001291030并计算得SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.(1)求变量SKIPIF1<0关于SKIPIF1<0的线性回归方程;(2)根据SKIPIF1<0内SKIPIF1<0浓度确定空气质量等级,SKIPIF1<0浓度在0~35SKIPIF1<0为优,35~75SKIPIF1<0为良,75~115SKIPIF1<0为轻度污染,115~150SKIPIF1<0为中度污染,150~250SKIPIF1<0为重度污染,已知某城市SKIPIF1<0内过往的汽车流量为1360辆,判断该城市的空气质量等级.参考公式:线性回归方程为SKIPIF1<0,其中以SKIPIF1<0.【答案】(1)SKIPIF1<0(2)轻度污染【详解】(1)由题意得SKIPIF1<0,SKIPIF1<0又因为SKIPIF1<0,SKIPIF1<0所以SKIPIF1<0所以SKIPIF1<0所以变量y关于x的线性回归方程为SKIPIF1<0.(2)当SKIPIF1<0辆SKIPIF1<0千辆时,可得SKIPIF1<0因为SKIPIF1<0所以该城市的空气质量等级为轻度污染.【典例2】(2024上·重庆沙坪坝·高三重庆八中校考阶段练习)在入室盗窃类案件中,出现频率最高的痕迹物证之一就是足迹.负重行走对足迹步伐特征影响的规律强,而且较为稳定.正在行走的人在负重的同时,步长变短,步宽变大,步角变大.因此,以身高分别为170cm,175cm,180cm的人员各20名作为实验对象,让他们采取双手胸前持重物的负重方式行走,得到实验对象在负重0kg,5kg,10kg,15kg,20kg状态下相对稳定的步长数据平均值.并在不同身高情况下,建立足迹步长s(单位:cm)关于负重x(单位:kg)的三个经验回归方程.根据身高170cm组数据建立线性回归方程①:SKIPIF1<0;根据身高175cm组数据建立线性回归方程②:SKIPIF1<0根据身高180cm组数据建立线性回归方程③:SKIPIF1<0.(1)根据身高180cm组的统计数据,求SKIPIF1<0,SKIPIF1<0的值,并解释参数SKIPIF1<0的含义;身高180cm不同负重情况下的步长数据平均值负重x/kg05101520足迹步长s/cm74.3573.5071.8068.6065.75(2)在一起盗窃案中,被盗窃物品重为9kg,在现场勘查过程中,测量得犯罪嫌疑人往返时足迹步长的差值为4.464cm,推测该名嫌疑人的身高,并说明理由.附:SKIPIF1<0.为回归方程,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0【答案】(1)SKIPIF1<0,SKIPIF1<0,参数SKIPIF1<0的含义详见解析(2)嫌疑人身高为175cm,理由详见解析【详解】(1)由题意可知:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,SKIPIF1<0;SKIPIF1<0的含义表示,负重每增加SKIPIF1<0足迹步长减少SKIPIF1<0.(2)设被盗窃物品重为9kg时,身高170cm的步长误差为SKIPIF1<0,高175cm的步长误差为SKIPIF1<0,高180cm的步长误差为SKIPIF1<0,由题意可得,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,因为SKIPIF1<0与测量得犯罪嫌疑人往返时足迹步长的差值SKIPIF1<0最接近,所以犯罪嫌疑人身高为175cm.【典例3】(2024上·全国·高三专题练习)某种产品的广告费支出x(单位:万元)与销售额y(万元)之间有如下一组数据:广告费支出x24568销售额y3040605070(1)求出样本点中心(2)求回归直线方程(其中SKIPIF1<0,SKIPIF1<0)【答案】(1)SKIPIF1<0(2)SKIPIF1<0【详解】(1)由题意可得:SKIPIF1<0,SKIPIF1<0,所以样本点中心为SKIPIF1<0.(2)由题意可得:SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,SKIPIF1<0,所以回归直线方程为SKIPIF1<0.【变式1】(2024上·黑龙江牡丹江·高三牡丹江市第二高级中学校联考期末)近期,一些地方中小学生“课间10分钟”问题受到社会广泛关注,国家号召中小学要增加学生的室外活动时间.但是进入12月后,天气渐冷,很多学生因气温低而减少了外出活动次数.为了解本班情况,一位同学统计了一周(5天)的气温变化和某一固定课间该班级的学生出楼人数,得到如下数据:温度SKIPIF1<0(零下SKIPIF1<0)710111517出楼人数SKIPIF1<0201617107(1)利用最小二乘法,求变量SKIPIF1<0之间的线性回归方程;附:用最小二乘法求线性回归方程SKIPIF1<0的系数:SKIPIF1<0SKIPIF1<0(2)预测当温度为SKIPIF1<0时,该班级在本节课间的出楼人数(人数:四舍五入取整数).(3)为了号召学生能够增加室外活动时间,学校举行拔河比赛,采取3局2胜制(无平局).在甲、乙两班的较量中,甲班每局获胜的概率均为SKIPIF1<0,设随机变量X表示甲班获胜的局数,求SKIPIF1<0的分布列和期望.【答案】(1)SKIPIF1<0(2)19(3)分布列见解析;期望为SKIPIF1<0【详解】(1)SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,回归直线方程为SKIPIF1<0.(2)当SKIPIF1<0时,SKIPIF1<0(人),所以,预测当温度为SKIPIF1<0时,该班级在本节课间的出楼人数为19人.(3)随机变量SKIPIF1<0可取0,1,2.SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0的分布列为:SKIPIF1<0012pSKIPIF1<0SKIPIF1<0SKIPIF1<0所以SKIPIF1<0的数学期望为SKIPIF1<0.【变式2】(2024上·全国·高三专题练习)下面给出了根据我国SKIPIF1<0年SKIPIF1<0年水果人均占有量SKIPIF1<0(单位:SKIPIF1<0)和年份代码SKIPIF1<0绘制的散点图(SKIPIF1<0年SKIPIF1<0年的年份代码SKIPIF1<0分别为SKIPIF1<0).
(1)根据散点图分析SKIPIF1<0与SKIPIF1<0之间的相关关系;(2)根据散点图相应数据计算得SKIPIF1<0,SKIPIF1<0,求SKIPIF1<0关于SKIPIF1<0的线性回归方程.(精确到SKIPIF1<0)附:回归方程SKIPIF1<0中斜率和截距的最小二乘估计公式分别为:SKIPIF1<0,SKIPIF1<0【答案】(1)SKIPIF1<0与SKIPIF1<0之间是正相关关系(2)SKIPIF1<0【详解】(1)由散点图可以看出,散点大致分布在某一直线的附近,且当SKIPIF1<0由小变大时,SKIPIF1<0也由小变大,SKIPIF1<0与SKIPIF1<0之间是正相关关系.(2)由表格数据得:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0关于SKIPIF1<0的线性回归方程为SKIPIF1<0.【变式3】(2024·全国·高三专题练习)在一次抽样调查中测得SKIPIF1<0个样本点,得到下表及散点图.SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0
(1)根据散点图判断SKIPIF1<0与SKIPIF1<0哪一个适宜作为SKIPIF1<0关于SKIPIF1<0的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果试建立SKIPIF1<0与SKIPIF1<0的回归方程;(计算结果保留整数)参考公式:SKIPIF1<0【答案】(1)SKIPIF1<0(2)SKIPIF1<0【详解】(1)由题中散点图可以判断,SKIPIF1<0适宜作为SKIPIF1<0关于SKIPIF1<0的回归方程;(2)令SKIPIF1<0,则SKIPIF1<0,原数据变为SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0由表可知SKIPIF1<0与SKIPIF1<0近似具有线性相关关系,计算得SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以,SKIPIF1<0,则SKIPIF1<0.所以SKIPIF1<0关于SKIPIF1<0的回归方程是SKIPIF1<0.题型03求样本中心(根据样本中心求参数)【典例1】(2024上·全国·高三专题练习)具有线性相关关系的变量SKIPIF1<0的一组数据如下:x0123y-5-4.5-4.2-3.5其线性回归直线方程为SKIPIF1<0,则回归直线经过(
)A.第一、二、三象限 B.第二、三、四象限C.第一、二、四象限 D.第一、三、四象限【答案】D【详解】解:由图表中的数据知:x,y呈正相关,所以SKIPIF1<0,又SKIPIF1<0,则样本中心为SKIPIF1<0,在第四象限,所以回归直线经过第一、三、四象限,故选:D【典例2】(2024下·全国·高二随堂练习)已知SKIPIF1<0取表中的数值,若SKIPIF1<0具有线性相关关系,线性回归方程为SKIPIF1<0,则SKIPIF1<0=(
)SKIPIF1<00134SKIPIF1<0a4.34.86.7A.2.2 B.2.4 C.2.5 D.2.6【答案】A【详解】由题意可知:SKIPIF1<0,SKIPIF1<0,所以样本中心SKIPIF1<0为SKIPIF1<0,代入回归方程有:SKIPIF1<0,解得SKIPIF1<0.故选:SKIPIF1<0.【典例3】(2024下·全国·高二随堂练习)某公司一种型号的产品近期销售情况如表:月份SKIPIF1<023456销售额SKIPIF1<0(万元)15.116.317.017.218.4根据上表可得到回归直线方程SKIPIF1<0,据此估计,该公司7月份这种型号产品的销售额为(
)A.18.85万元 B.19.3万元 C.19.25万元 D.19.05万元【答案】D【详解】由表中数据可得SKIPIF1<0,SKIPIF1<0,因为回归直线过样本点的中心,所以SKIPIF1<0,解得SKIPIF1<0,所以回归直线方程为SKIPIF1<0,则该公司7月份这种型号产品的销售额为SKIPIF1<0万元.故选:D【典例4】(多选)(2024上·浙江宁波·高三统考期末)某电商平台为了对某一产品进行合理定价,采用不同的单价在平台试销,得到的数据如下表所示:单价x/元88.599.510销量y/万件8985807868根据以上数据得到SKIPIF1<0与SKIPIF1<0具有较强的线性关系,若用最小二乘估计得到经验回归方程为SKIPIF1<0,则(
)A.相关系数SKIPIF1<0 B.点SKIPIF1<0一定在经验回归直线上C.SKIPIF1<0 D.SKIPIF1<0时,对应销量的残差为SKIPIF1<0【答案】BC【详解】由表中数据可得SKIPIF1<0,所以样本中心为SKIPIF1<0,故SKIPIF1<0在经验回归直线上,B正确,由SKIPIF1<0可得SKIPIF1<0与SKIPIF1<0具负相关,故A错误,将SKIPIF1<0代入SKIPIF1<0可得SKIPIF1<0,解得SKIPIF1<0,C正确,当SKIPIF1<0时,SKIPIF1<0,所以残差为SKIPIF1<0,D错误,故选:BC【变式1】(2024上·四川绵阳·高二绵阳南山中学实验学校校考期末)已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程为SKIPIF1<0必过点(
)A.(2,2) B.(1.5,0)C.(1.5,4) D.(1,
2)【答案】C【详解】由已知SKIPIF1<0,SKIPIF1<0,所以回归直线一定过中心点SKIPIF1<0.故选:C.【变式2】(2024上·重庆·高三重庆巴蜀中学校考期中)已知变量x,γ呈线性相关关系,回归方程为SKIPIF1<0,且变量x,y的样本数据如下表所示x-2-1012y54m21据此计算出在SKIPIF1<0时,预测值为-0.2,则m的值为(
)A.3 B.2.8 C.2 D.1【答案】C【详解】由题意知回归方程为SKIPIF1<0过点SKIPIF1<0,则SKIPIF1<0,即SKIPIF1<0;又SKIPIF1<0,SKIPIF1<0,由于回归方程为SKIPIF1<0必过样本中心点SKIPIF1<0,故SKIPIF1<0,故选:C【变式3】(2024下·全国·高二随堂练习)变量x,y的数据如下所示:x54321y21.5110.5回归直线恒过点.【答案】SKIPIF1<0【详解】变量SKIPIF1<0的平均值为SKIPIF1<0,变量SKIPIF1<0的平均值为SKIPIF1<0,故回归直线恒过点SKIPIF1<0.故答案为:SKIPIF1<0.【变式4】(2024上·全国·高三专题练习)某地建立了农业科技图书馆,供农民免费借阅,收集了近5年的借阅数据如下表:年份20192020202120222023年份代码SKIPIF1<012345年借阅量SKIPIF1<0万册4.95.15.55.75.8根据上表,可得SKIPIF1<0关于SKIPIF1<0的线性回归方程为SKIPIF1<0.则SKIPIF1<0.【答案】SKIPIF1<0【详解】根据表格可知,SKIPIF1<0,SKIPIF1<0,代入SKIPIF1<0,可得SKIPIF1<0.故答案为:SKIPIF1<0题型04根据回归直线方程估计数据【典例1】(2024上·黑龙江齐齐哈尔·高三校联考期末)已知在特定的时期内某人在一个月内每天投入的体育锻炼时间SKIPIF1<0(分钟)与一个月内减轻的体重SKIPIF1<0(斤)的一组数据如表所示:SKIPIF1<03040506070SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0一个月内减轻的体重SKIPIF1<0与每天投入的体育锻炼时间SKIPIF1<0之间具有较强的线性相关关系,其线性回归直线方程是SKIPIF1<0,据此模型估计当此人在一个月内每天投入的体育锻炼时间为90分钟时,该月内减轻的体重约为(
)A.SKIPIF1<0斤 B.SKIPIF1<0斤 C.SKIPIF1<0斤 D.SKIPIF1<0斤【答案】A【详解】由表中数据可得SKIPIF1<0,SKIPIF1<0,将SKIPIF1<0代入SKIPIF1<0得SKIPIF1<0,解得SKIPIF1<0,即SKIPIF1<0,则当SKIPIF1<0时,SKIPIF1<0.故选:A.【典例2】(2024下·全国·高二随堂练习)某科学兴趣小组的同学认为生物都是由蛋白质构成的,高温可以使蛋白质变性失活,于是想初步探究某微生物的成活率与温度的关系,微生物数量SKIPIF1<0(个)与温度SKIPIF1<0的部分数据如下表:温度SKIPIF1<0481018微生物数量SKIPIF1<0(个)30221814由表中数据算得回归方程为SKIPIF1<0,预测当温度为SKIPIF1<0时,微生物数量为个.【答案】9【详解】由表格数据可知,SKIPIF1<0,SKIPIF1<0,因为点SKIPIF1<0在直线SKIPIF1<0上,所以SKIPIF1<0,即SKIPIF1<0,故当SKIPIF1<0时,SKIPIF1<0,即预测当温度为SKIPIF1<0时,微生物数量为9个.故答案为:9【变式1】(2024上·全国·高三专题练习)如果在一次实验中,测得SKIPIF1<0的五组数值如下表所示,经计算知,y对x的线性回归方程是SKIPIF1<0,预测当SKIPIF1<0时,SKIPIF1<0(
)x01234y1015203035A.73.5 B.74 C.74.5 D.75【答案】B【详解】由题意可得:SKIPIF1<0,即样本中心点为SKIPIF1<0,则SKIPIF1<0,解得SKIPIF1<0,所以SKIPIF1<0,令SKIPIF1<0时,SKIPIF1<0,预测当SKIPIF1<0时,SKIPIF1<0.故选:B【变式2】(2024上·全国·高三专题练习)牛膝是苋科多年生药用草本植物,具有活血通经、补肝肾、强筋骨等功效,可用于治疗腰膝酸痛等症状.某农户种植牛膝的时间SKIPIF1<0(单位:天)和牛膝的根部直径SKIPIF1<0(单位:SKIPIF1<0)的统计表如下:SKIPIF1<02030405060SKIPIF1<00.81.32.23.34.5由上表可得经验回归方程为SKIPIF1<0,若此农户准备在SKIPIF1<0时采收牛膝,据此模型预测,此批牛滕采收时间预计是第天.【答案】110【详解】SKIPIF1<0,SKIPIF1<0,又SKIPIF1<0过点SKIPIF1<0,所以SKIPIF1<0,即SKIPIF1<0,当SKIPIF1<0时,SKIPIF1<0,所以此批牛膝采收时间预计是第110天.故答案为:110题型05残差计算【典例1】(2024·全国·高三专题练习)已知一组样本数据SKIPIF1<0,SKIPIF1<0,,SKIPIF1<0,根据这组数据的散点图分析SKIPIF1<0与SKIPIF1<0之间的线性相关关系,若求得其线性回归方程为SKIPIF1<0,则在样本点SKIPIF1<0处的残差为(
)A.38.1 B.22.6 C.SKIPIF1<0 D.91.1【答案】C【详解】因为观测值减去预测值称为残差,所以当SKIPIF1<0时,SKIPIF1<0,所以残差为SKIPIF1<0SKIPIF1<0.故选:C.【典例2】(2024·云南楚雄·云南省楚雄彝族自治州民族中学校考一模)对具有线性相关关系的变量SKIPIF1<0有一组观测数据SKIPIF1<0(SKIPIF1<0),其经验回归方程为SKIPIF1<0,且SKIPIF1<0,SKIPIF1<0,则相应于点SKIPIF1<0的残差为.【答案】SKIPIF1<0/SKIPIF1<0【详解】SKIPIF1<0经验回归直线SKIPIF1<0过样本点的中心SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0经验回归方程为SKIPIF1<0.当SKIPIF1<0时,SKIPIF1<0,SKIPIF1<0残差为SKIPIF1<0.故答案为:SKIPIF1<0.【典例3】(2023·全国·高二专题练习)随机选取变量SKIPIF1<0和变量SKIPIF1<0的SKIPIF1<0对观测数据,选取的第SKIPIF1<0对观测数据记为SKIPIF1<0,其数值对应如下表所示:编号SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0计算得:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.(1)求变量SKIPIF1<0和变量SKIPIF1<0的样本相关系数(小数点后保留SKIPIF1<0位),判断这两个变量是正相关还是负相关,并推断它们的线性相关程度;(2)假设变量SKIPIF1<0关于SKIPIF1<0的一元线性回归模型为SKIPIF1<0.(ⅰ)求SKIPIF1<0关于SKIPIF1<0的经验回归方程,并预测当SKIPIF1<0时SKIPIF1<0的值;(ⅱ)设SKIPIF1<0为SKIPIF1<0时该回归模型的残差,求SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0的方差.参考公式:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.【答案】(1)答案见解析(2)①答案见解析;②SKIPIF1<0【详解】(1)解:SKIPIF1<0,所以,这两个变量负相关,且具有较强的线性相关性.(2)解:①SKIPIF1<0,则SKIPIF1<0,所以,SKIPIF1<0关于SKIPIF1<0的经验回归方程为SKIPIF1<0,当SKIPIF1<0时,则SKIPIF1<0,所以,当SKIPIF1<0时,SKIPIF1<0的预测值为SKIPIF1<0;②由SKIPIF1<0,计算得该回归模型的残差如下表所示:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0所以,残差的方差为SKIPIF1<0.【变式1】(2024·全国·高三专题练习)根据一组样本数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的散点图分析x与y之间是否存在线性相关关系,求得其线性回归方程为SKIPIF1<0,则在样本点SKIPIF1<0处的残差为(
)A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<0【答案】B【详解】把SKIPIF1<0代入SKIPIF1<0,得SKIPIF1<0,所以在样本点SKIPIF1<0处的残差SKIPIF1<0.故选:B.【变式2】(2024·全国·高三专题练习)从某大学中随机选取8名女大学生,其身高x(单位:cm)与体重y(单位:kg)数据如下表:x165165157170175165155170y4857505464614359若已知y与x的线性回归方程为SKIPIF1<0,设残差记为观测值与预测值之间的差(即残差SKIPIF1<0)那么选取的女大学生身高为175cm时,相应的残差为.【答案】4【详解】已知y与x的线性同归方程为SKIPIF1<0当SKIPIF1<0时:SKIPIF1<0,相应的残差为:SKIPIF1<0故答案为:4【变式3】(2023·高二课时练习)高中女学生的身高预报体重的回归方程是SKIPIF1<0(其中SKIPIF1<0,SKIPIF1<0的单位分别是cm,kg),则此方程在样本点SKIPIF1<0处的残差是.【答案】1.5【详解】由样本数据得到,女大学生的身高预报体重的回归方程是SKIPIF1<0,当SKIPIF1<0时,SKIPIF1<0,此方程在样本SKIPIF1<0处残差为:SKIPIF1<0.故答案为:1.5.题型06相关指数计算【典例1】(2024上·全国·高三期末)2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造.根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下表:建立了y与x的两个回归模型:模型①:SKIPIF1<0,模型②:SKIPIF1<0;序号1234567x234681013y15222740485460(1)根据表格中的数据,比较模型①,②的相关指数SKIPIF1<0的大小;(2)据(2)选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益.附:刻画回归效果的相关指数SKIPIF1<0,且当SKIPIF1<0越大时,回归方程的拟合效果越好.SKIPIF1<0.回归模型模型①模型②SKIPIF1<079.3120.2【答案】(1)SKIPIF1<0(2)收益为SKIPIF1<0【详解】(1)对于模型①,对应的SKIPIF1<0,故对应的SKIPIF1<0,故对应的相关指数SKIPIF1<0,对于模型②,同理对应的相关指数SKIPIF1<0,SKIPIF1<0.(2)故模型②拟合精度更高、更可靠.故对A型材料进行应用改造的投入为17亿元时的直接收益为SKIPIF1<0.【典例2】(2023·全国·高二专题练习)已知SKIPIF1<0与SKIPIF1<0之间的数据如下表:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0(1)求SKIPIF1<0关于SKIPIF1<0的线性回归方程;(2)完成下面的残差表:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0并判断(1)中线性回归方程的回归效果是否良好(若SKIPIF1<0,则认为回归效果良好).附:SKIPIF1<0SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.【答案】(1)SKIPIF1<0;(2)表格见解析,良好.【详解】(1)由已知图表可得SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0,故SKIPIF1<0.(2)∵SKIPIF1<0,∴SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,则残差表如下表所示,SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0∵SKIPIF1<0SKIPIF1<0,∴SKIPIF1<0,∴该线性回归方程的回归效果良好.【典例3】(2021下·山东青岛·高二统考期中)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如下表所示:月份SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0物流成本SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0利润SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0残差SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0根据最小二乘法公式求得线性回归方程为SKIPIF1<0.(1)求SKIPIF1<0的值,并利用已知的线性回归方程求出SKIPIF1<0月份对应的残差值SKIPIF1<0;(2)请先求出线性回归模型SKIPIF1<0的决定系数SKIPIF1<0(精确到SKIPIF1<0);若根据非线性模型SKIPIF1<0求得解释变量(物流成本)对于响应变量(利润)决定系数SKIPIF1<0,请说明以上两种模型哪种模型拟合效果更好?(3)通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为SKIPIF1<0万元.请重新根据最小二乘法的思想与公式,求出新的线性回归方程.附1(修正前的参考数据):SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.附2:SKIPIF1<0.附3:SKIPIF1<0,SKIPIF1<0.【答案】(1)SKIPIF1<0,SKIPIF1<0;(2)SKIPIF1<0;线性回归模型SKIPIF1<0拟合程度更好;(3)SKIPIF1<0.【详解】(1)因为SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0SKIPIF1<0,解得SKIPIF1<0,所以SKIPIF1<0月份对应的残差值SKIPIF1<0;(2)由已知公式得SKIPIF1<0,SKIPIF1<0,所以线性回归模型SKIPIF1<0拟合程度更好;(3)由(1)可知,第八组数据的利润应为SKIPIF1<0(万元)此时SKIPIF1<0,又SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,所以SKIPIF1<0,所以重新采集数据后,线性回归方程为SKIPIF1<0.【变式1】(2022下·宁夏·高二六盘山高级中学校考阶段练习)有一组统计数据SKIPIF1<0和SKIPIF1<0,根据数据建立了如下的两个模型:①SKIPIF1<0,②SKIPIF1<0.通过残差分析发现第①个线性模型比第②个线性模型拟合效果好.若SKIPIF1<0分别是相关指数和残差平方和,则下列结论正确的是.①SKIPIF1<0>SKIPIF1<0,②SKIPIF1<0<SKIPIF1<0,③SKIPIF1<0<SKIPIF1<0,④SKIPIF1<0>SKIPIF1<0.【答案】①③【详解】解:用相关指数SKIPIF1<0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年榆林市第一医院医护人员招聘考试参考题库及答案详解
- 2026年陕西省人民医院医护人员招聘考试备考试题及答案详解
- (2026版)学校矛盾纠纷排查管理制度
- 2026年平安银行(上海分行)人员招聘笔试参考题库及答案详解
- 2026年天津市传染病医院医护人员招聘笔试备考试题及答案详解
- 2026年亦庄同仁医院医护人员招聘笔试参考题库及答案详解
- 2026年牡丹江市第二人民医院医护人员招聘考试参考试题及答案详解
- 2026年南京银行人员招聘考试参考题库及答案详解
- 2026年沈阳铁路局沈阳中心医院医护人员招聘考试参考试题及答案详解
- 2026年无锡市精神卫生中心槐树巷门诊部医护人员招聘笔试备考题库及答案详解
- 2026年高考新高考一卷英语真题及答案
- 学堂在线 智能医学发展前沿 章节测试答案
- 2026上海中考生物知识点总结训练含答案
- 2026年高考英语天津卷试卷附答案
- 企业突发环境事件隐患排查和治理工作指南
- 2026年高考英语全国二卷卷及答案(新课标卷)
- 大四毕业论文体育教育
- 反劫持课件教学课件
- ADA 糖尿病诊疗标准(2025版)
- 基孔肯雅热知识测试试题含答案
- 《民营经济促进法》解读与案例分析课件
评论
0/150
提交评论