版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题13一元线性回归模型及其应用一、考情分析二、考点梳理1.相关关系与回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关;在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关;如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.2.线性回归方程:(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:,其回归方程为,则注意:线性回归直线经过定点.(3)相关系数:.【技能方法】(1)利用散点图判断两个变量是否有相关关系是比较直观简便的方法.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.(2)利用相关系数判定,当越趋近于1相关性越强.当残差平方和越小,相关指数越大,相关性越强.(3)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,也可计算相关系数进行判断.若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.(4)正确运用计算的公式和准确的计算,是求线性回归方程的关键.并充分利用回归直线过样本点的中心进行求值.【易错指导】1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
三、题型突破重难点题型突破01相关系数与回归分析例1.(1)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是(
)A. B.C. D.(2)(多选题)某公司大力推进科技创新发展战略,持续加大研发投入(单位:万元),不断提升公司的创新能力2016年至2020年该公司的研发投入如下表所示:年份20162017201820192020年份编号x12345研发投入y/万元5193m175211若y与x线性相关,由上表数据求得的线性回归方程为,则一下结论正确的是(
)A. B.y与x正相关C.该公司平均每年增加研发投入约11.4万元 D.2018年该公司的研发投入的残差为(3)习近平总书记在十九大报告中指出,必须树立和践行“绿水青山就是金山银山”的生态文明发展理念,这将进一步推动新能源汽车产业的迅速发展.根据近几年我国某新能源汽车的年销售量的调研,做出如图所示的散点图,给出与销售的两种回归模型①,②,你认为哪个模型更适宜_________.(从①②中选一个填到空格处)【变式训练1-1】下列有关样本相关系数说法不正确的是(
)A.,且越接近1,相关程度越大B.,且越接近0,相关程度越小C.,且越接近1,相关程度越大D.相关系数用来衡量变量x与y的线性相关程度【变式训练1-2】(多选题)甲公司从某年起连续7年的利润情况如下表所示.第年1234567利润(亿元)2.93.33.64.45.25.9根据表中的数据可得回归直线方程为,则以下正确的是(
)A. B.相关系数C.第8年的利润预计大约为8.3亿元 D.第6个样本点的实际值比预测值小0.1【变式训练1-3】(多选题)对两组数据进行统计后得到的散点图如图,关于其线性相关系数的结论正确的是(
)A. B. C. D.重难点题型突破02“直线型”回归方程的应用例2.自公安部交通管理局部署全国公安交管部门开展“一盔一带”安全守护行动以来,德州市电动自行车安全头盔平均佩戴率大幅提升.下表是德州市一主干路段对电动车驾驶人和乘坐人“不佩戴安全头盔”人数统计数据:月份89101112不佩戴安全头盔人数1601201007050附:回归方程中,斜率和截距最小二乘法估计公式分别为,.相关系数,.(1)请利用相关系数说明“不佩戴安全头盔”与月份有很强的线性相关关系(系数精确到0.01);(2)求y关于x的回归方程.【变式训练2-1】小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调查了20家服装店,统计得到了它们的面积x(单位:)和日均客流量y(单位:百人)的数据,并计算得,,,.(1)求y关于x的回归直线方程;(2)已知服装店每天的经济效益,该商场现有的商铺出租,根据(1)的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺?附:回归直线的斜率和截距的最小二乘估计分别为:,.重难点题型突破03“曲线型”回归方程的应用例3.某生物研究所为研究某种昆虫的产卵数和温度的关系,经过一段时间观察,收集到如下数据:产卵数以该种昆虫的产卵数和温度为变量,作出如图所示的散点图,现分别用模型①与模型②进行分析.(1)请利用模型②建立两个变量之间的函数关系式(系数保留两位小数);(2)已知模型①的回归直线方程为,模型②的样本相关系数,请根据相关系数判断哪个模型的拟合效果更好;(3)该种昆虫的防治以喷洒杀虫剂为主,其防治成本与温度和产卵数的关系为,用(2)中得出的拟合效果最好的模型计算,当温度(取整数)为何值时,昆虫的防治成本的预估值最小?附:对于一组数据、、…、,其回归直线的斜率和截距的最小二乘估计分别为,,样本相关系数.参考数据:,,设,则,.【变式训练3-1】根据党中央规划的“精准发力,着力提高脱贫攻坚成效”的精准扶贫、精准脱贫路径,某农业机械上市公司为强化现代农业的基础支撑,不断投入资金对产品进行研发,从而提升农机装备的应用水平.通过对该公司近几年的年报公布的研发费用x(亿元)与产品的直接收益y(亿元)的数据进行统计,得到如下表:年份2015201620172018201920202021年份编号123456723468101315222740485460根据数据,可建立y关于x的两个回归模型:模型①:;模型②:.(1)根据表格中的数据,分别求出模型①,②的相关指数的大小(保留三位有效数字);(2)根据(1)选择拟合精度更高、更可靠的模型,若2022年该公司计划投入研发费用17亿元,预测可为该公司带来多少直接收益.附:相关指数,.回归模型模型①模型②79.1318.86【答案】(1),(2)72.93亿元【变式训练3-2】为了构筑“绿色长城”,我国开展广泛的全民义务植树活动,有力推动了生态状况的改善.森林植被状况的改善,不仅美化了家园,减轻了水土流失和风沙对农田的危害,而且还有效提高了森林生态系统的储碳能力.某地区统计了2011年到2020年十年中每年人工植树成活数(,2,3,…,10)(单位:千棵),用年份代码(,2,3,…,10)表示2011年,2012年,2013年,…,2020年,得到下面的散点图:对数据进行回归分析发现,有两个不同的回归模型可以选择,模型一:,模型二;,其中是自然对数的底数.(1)根据散点图,判断所给哪个模型更适宜作为每年人工植树成活数y与年份代码x相关关系的回归分析模型(给出判断即可,不必说明理由);(2)根据(1)中选定的模型,求出y关于x的回归方程;(3)利用(2)中所求回归方程,预测从哪一年开始每年人工植树成活棵数能够超过5万棵?附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计公式分别为:,.参考数据:,,,设(,2,3,…,10),,,,.四、课堂训练1.2021年春季.新冠肺炎疫情在印度失控.下图是印度某地区在60天内感染新冠肺炎的累计病例人数y(万人)与时间t(天)的散点图.则下列最适宜作为此模型的回归方程的类型是(
)A. B. C. D.2.将一组数据绘制成如图所示的散点图,根据散点图,下面四个回归方程类型中最适宜作为y和x的回归方程类型的是(
)A. B.C. D.3.下列说法错误的是(
)A.用相关系数r来衡量两个变量之间线性关系的强弱时,越接近于1,相关性越弱B.当相关系数时,表明两变量负相关C.当相关系数时,表明两变量线性不相关D.当相关系数时,表明两变量有较强的线性相关程度4.对某位同学5次体育测试的成绩(单位:分)进行统计得到如下表格:第x次12345测试成绩y3940484850根据上表,可得y关于x的线性回归方程为,下列结论不正确的是(
)A.B.这5次测试成绩的方差为20.8C.y与x的线性相关系数D.预测第6次体育测试的成绩约为545.(多选题)根据变量与的对观测数据,求得相关系数,线性回归方程,则下列说法正确的是(
)A.与正相关且相关性较弱B.与负相关且相关性很强C.每增加1个单位时平均减少0.6D.若,则6.(多选题)“中国最具幸福感城市调查推选活动”由新华社《瞭望东方周刊》、瞭望智库共同主办,至今已连续举办15年,累计推选出80余座幸福城市,现某城市随机选取30个人进行调查,得到他们的收入、生活成本及幸福感分数(幸福感分数为0~10分),并整理得到散点图(如图),其中x是收入与生活成本的比值,y是幸福感分数,经计算得回归方程为.根据回归方程可知()A.y与x成正相关B.样本点中残差的绝对值最大是2.044C.只要增加民众的收入就可以提高民众的幸福感D.当收入是生活成本3倍时,预报得幸福感分数为6.0447.有一组统计数据和,根据数据建立了如下的两个模型:①,②.通过残差分析发现第①个线性模型比第②个线性模型拟合效果好.若分别是相关指数和残差平方和,则下列结论正确的是________.①>,②<,③<,④>.8.已知一种植物一年生长的高度y与发芽期的平均温度x的关系可以用模型(其中e为自然对数的底数)拟合,设,其变换后得到一组数据:x2023252730z22.4334.6由上表可得线性回归方程为,则当时,估计该植物一年生长的高度y的值为______.9.一家物流公司的管理人员想研究货物的运送距离和运送时间的关系.为此,他抽取该公司最近10辆卡车的运货记录作为随机样本,得到如下数据:运送距离x/km825215107055048092013503256701215运送时间y/天3.51.04.02.01.03.04.51.53.05.0(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态;(2)计算相关系数,说明这两个变量之间的相关程度;(3)利用最小二乘法求出这两个变量之间的回归直线方程.10.2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A区B区C区D区外来务工人数x/万3456就地过年人数y/万2.5344.5(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求关于的线性回归方程.(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.(i)若该市E区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E区就地过年的人员发放的补贴总金额;(ii)若A区的外来务工人员中甲、乙选择就地过年的概率分别为,,该市政府对甲、乙两人的补贴总金额的期望不超过1500元,求的取值范围.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.专题13一元线性回归模型及其应用A组基础巩固1.某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系134573040605070y与x的线性回归方程为,当广告支出5万元时,随机误差的效应(残差)为(
)A.20 B.-10 C.10 D.-6.52.2021年初以来,5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升,某手机商城统计了1月-5月以来5G手机的实际销量,如下表所示:月份x1月2月3月4月5月销售量y(千只)0.50.61.01.41.7若y与x线性相关,且求得线性回归方程为,则下列说法不正确的是(
)A.由题中数据可知,变量x和y正相关,且相关系数一定小于1B.由题中数据可知,6月份该商场5G手机的实际销量为2(千只)C.若不考虑本题中的数据,回归直线可能不过中的任一个点D.若不考虑本题中的数据,,则回归直线过点3.为研究变量x,y的相关关系,收集得到下面五个样本点:x56.5788.5y98643若由最小二乘法求得y关于x的回归直线方程为,则据此计算残差为0的样本点是(
)A. B. C. D.4.从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生活.世界性与区域性温度的异常、旱涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量y与温度x的关系可以用模型(其中e为自然对数的底数)拟合,设,其变换后得到一组数据:x2023252730z22.4334.6由上表可得经验回归方程,则当x=60时,蝗虫的产卵量y的估计值为(
)A. B.10 C.6 D.5.某种产品的广告支出费用x(单位:万元)与销售额y(单位:万元)之间有如下关系:x24568y3040705060已知y与x的线性回归方程为,则当广告支出费用为5万元时,残差为(
)A.40 B.30 C.20 D.106.下图是某地区2001年至2021年环境保护建设投资额(单位:万元)的折线图.根据该折线图判断,下列结论正确的是(
)A.为预测该地2022年的环境保护建设投资额,应用2001年至2021年的数据建立回归模型更可靠B.为预测该地2022年的环境保护建设投资额,应用2010年至2021年的数据建立回归模型更可靠C.投资额与年份负相关D.投资额与年份的相关系数7.以下说法错误的是(
)A.用样本相关系数r来刻画成对样本数据的相关程度时,若越大,则成对样本数据的线性相关程度越强B.经验回归方程一定经过点C.用残差平方和来刻画模型的拟合效果时,若残差平方和越小,则相应模型的拟合效果越好D.用相关指数来刻画模型的拟合效果时,若越小,则相应模型的拟合效果越好8.(多选题)下列命题正确的是(
)A.若且,则B.对于随机事件A和B,若,则事件A与事件B独立C.回归分析中,若相关指数越接近于1,说明模型的拟合效果越好;反之,则模型的拟合效果越差D.用等高条形图粗略估计两类变量X和Y的相关关系时,等高条形图差异明显,说明X与Y无关9.年初以来,技术在我国已经进入高速发展的阶段,手机的销量也逐渐上升,某手机商城统计了近个月来手机的实际销量,如下表所示:月份年月年月年月年月年月月份编号销量/千部若与线性相关,且求得线性回归方程为,则下列说法:①;②与正相关;③与的相关系数为负数;④月份该手机商城的手机销量约为万部.其中正确的是________.(把正确的序号填在横线上)10.有如下四个命题:①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44.②相关系数,表明两个变量的相关性较弱.③若由一个列联表中的数据计算得的观测值,那么有95%的把握认为两个变量有关.④用最小二乘法求出一组数据的回归直线方程后要进行残差分析,相应于数据的残差是指.以上命题“错误”的序号是___________()0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.82811.某设备的使用年数x与所支出的维修总费用y的统计数据如下表:使用年数x(单位:年)23456维修总费用y(单位:万元)1.54.55.56.57.5根据上表可得经验回归方程为.现有一对测量数据,则该数据的残差为______万元.B组能力提升12.近期新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖.(1)该校教职工有410人,高二学生有620人,高三学生有610人,①用分层抽样的方法,求高一学生每天抽检人数;②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级.你认为哪种方案更合理,并给出理由.(2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下:第天12345用时(小时)1.21.21.11.01.0①计算变量和的相关系数(精确到0.01),并说明两变量线性相关的强弱;②根据①中的计算结果,判定变量和是正相关,还是负相关,并给出可能的原因.参考数据和公式:,相关系数.13.“不关注分数,就是对学生的今天不负责:只关注分数,就是对学生的未来不负责.”为锻炼学生的综合实践能力,长沙市某中学组织学生对雨花区一家奶茶店的营业情况进行调查统计,得到的数据如下:月份x24681012净利润(万元〕y0.92.04.23.95.25.1(1)设.试建立y关于x的非线性回归方程和(保留2位有效数字);(2)从相关系数的角度确定哪一个模型的拟合效果更好,并据此预测次年2月()的净利润(保留1位小数).附:①相关系数,回归直线中斜率和截距的最小二乘估计公式分别为;②参考数据:,14.年月日,第四届中国国际进口博览会在上海开幕,共计多家参展商参展,多项新产品,新技术,新服务在本届进博会上亮相.某投资公司现从中选出种新产品进行投资.为给下一年度投资提供决策依据,需了解年研发经费对年销售额的影响,该公司甲、乙两部门分别从这种新产品中随机地选取种产品,每种产品被甲、乙两部门是否选中相互独立.(1)求种新产品中产品被甲部门或乙部门选中的概率;(2)甲部门对选取的种产品的年研发经费(单位:万元)和年销售额(单位:十万元)数据作了初步处理,得到下面的散点图及一些统计量的值.根据散点图现拟定关于的回归方程为.求、的值(结果精确到);(3)甲、乙两部门同时选中了新产品,现用掷骰子的方式确定投资金额.若每次掷骰子点数大于,则甲部门增加投资万元,乙部门不增加投资;若点数小于,则乙部门增加投资万元,甲部门不增加投资,求两部门投资资金总和恰好为万元的概率.附:对于一组数据、、、,其回归直线的斜率和截距的最小二乘估计分别为,,,.15.发展清洁能源,是改善能源结构、保障能源安全、推进生态文明建设的重要任务.十三五以来,我国加快调整能源结构,减少煤炭消费、稳定油气供应、大幅增加清洁能源比重,风电、光伏等可再生能源发电效率不断提高.据资料整理统计我国从2015年到2019年的年光伏发电量如表:年份20152016201720182019编号x12345年光伏发电量(亿千瓦时)395665117817752243其中.(1)请用相关系数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 变配电考试科目及答案
- 网络事业部面试策略
- 小学民办学校教师五险一金缴纳-基于2023年社保局缴费凭证抽查
- 道德与法治 法治与德治相得益彰同步课件-2025-2026学年统编版道德与法治八年级下册
- 雨课堂学堂在线学堂云审计学(西南石油大学)单元测试考核答案
- 小区广场概念设计方案
- 盐酸丙美卡因滴眼液联合用药效果研究
- 三下乡社会实践活动总结9篇
- 人生的选择演讲稿(集锦15篇)
- 2025-2030智慧农业项目实施效果市场认可度投资评估规划分析研究
- 丁烷安全知识培训课件
- 2025年美国心脏学会(AHA)心肺复苏(CPR)和心血管急救(ECC)指南
- 白皮书《中国外贸产业带全景图鉴》
- 品牌活动策划与执行指南手册
- 数控机床操作工岗位操作安全手册
- 机动车年检免检申请委托书范本
- 2025版药典凡例培训
- 2026年一级造价师之建设工程计价考试题库500道附完整答案【名校卷】
- 十年(2016-2025)高考化学真题分类汇编:专题27 电解原理及其应用(解析版)
- 肺吸虫病教学课件
- 公文格式培训课件
评论
0/150
提交评论