




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第2课时回归分析的应用1.根据线性回归方程,对相关结论进行预测.2.理解从散点图进行非线性回归分析的意义,掌握如何将非线性回归问题转化为线性回归问题的方法.3.了解在解决实际问题的过程中寻找更好的模型的方法.重点:根据线性回归方程,对相关结论进行预测,探究非线性模型通过变换转化为线性回归模型的方法.难点:了解常用函数的图像特点,选择不同的模型建模,并通过相关指数对不同的模型进行比较.有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?要回答这个问题,我们
2、先来一起学习本节的知识吧!问题1:相关系数的概念及相关系数r的性质相关系数r用来描述线性相关关系的强弱,且样本相关系数r=.r有如下性质:(1)|r|1; (2)|r|越接近于1,误差Q越小,x,y的线性相关程度越强; (3)|r|越接近于0,误差Q越大,x,y的线性相关程度越弱; (4)当r>0时,称两个变量正相关;当r<0时,称两个变量负相关;当r=0时,称两个变量线性不相关. 问题2:在回归分析中,通过模型计算预测变量的值时,应注意的问题.(1)回归方程只适用于我们所研究的样本的总体; (2)我们所建立的回归方程一般都有时间性
3、; (3)样本取值的范围会影响回归方程的适用范围; (4)不能期望回归方程得到的预测值就是预测变量的精确值. 问题3:几种能转化为线性回归模型的非线性回归模型(1)幂函数曲线y=axb作变换u=ln y,v=ln x,c=ln a,得线性函数u=c+bv. (2)指数曲线y=aebx作变换u=ln y,c=ln a,得线性函数u=c+bx. (3)倒指数曲线y=a作变换u=ln y,c=ln a,v=,得线性函数u=c+bv. (4)对数曲线y=a+bln x作变换u=y,v=ln x,得线性函数u=a+bv. 问题4:非线
4、性回归问题进行回归分析的方法(1)若问题中已给出经验公式,这时可以将解释变量进行交换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决. (2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图像作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量交换,将问题化为线性回归分析问题来解决. 从以下几个方面认识相关关系:(1)相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随
5、关系.相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可以使我们处理更为广泛的数学应用问题,还可以使我们对函数关系的认识上升到一个新的高度.一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认其具有线性相关关系后,再求其回归直线方程;由部分数据得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性的相关关系问题转化成确定性的函数关系问题进行研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预测、资料补充等方面有着广泛的应用.1.下列两个变量
6、之间的关系不是函数关系的是().A.角度和它的余弦值B.正方形的边长和面积C.正n边形的边数和各内角度数之和D.人的年龄和身高【解析】函数关系就是一种变量之间的确定性的关系,A,B,C三项都是函数关系,它们的函数表达式分别为f()=cos,g(a)=a2,h(n)=n-2.D项不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选D.【答案】D2.为了表示n个点与相应直线在整体上接近程度,我们常用()表示.A.(yi-y)B.(yi-)C.(yi-y)2D.(yi-)2【解析】由回归直线方程y=a+bx,可知y为一个量的估计量,而yi为它的实际值,在最小二乘法中yi-(a+bx)2,即(y
7、i-y)2,故选C.【答案】C3.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为. 【解析】因为A,B,C,D四点都在直线y=x+1上,故填y=x+1.【答案】y=x+14.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?(2)估计最小的船的船员数和最大的船的船员数.【解析】(1)船员平均人数之差=0.
8、006×吨位之差=0.006×1000=6,即船员平均相差6人.(2)9.1+0.006×192=10.252,估计最小的船的船员数为10.9.1+0.006×3246=28.576,估计最大的船的船员数为28.利用公式,确定回归直线方程某5名学生的数学和化学成绩如下表:学生学科ABCDE数学成绩(x)8876736663化学成绩(y)7865716461(1)画出散点图;(2)求化学成绩(y)对数学成绩(x)的回归直线方程.【方法指导】熟记公式,根据表格计算公式中所需的各种数据.【解析】(1)散点图(略).(2)=73.2,=67.8,xiyi=250
9、54,=27174,所以b=0.625.a=-b=67.8-0.625×73.2=22.05.所以y对x的回归直线方程为y=0.625x+22.05.【小结】利用公式求解时应注意以下几点:求b时应先求出,xiyi,再由a=-b求a的值,并写出回归直线方程.线性回归方程中的截距a和斜率b都是通过样本估计而来,存在着误差,这种误差可能导致预测结果的偏差.回归直线方程y=a+bx中的b表示x增加1个单位时y的变化量为b,而a是不随x的变化而变化的量.可以利用回归直线方程y=a+bx预测在x取某一个值时,y的估计值.根据回归直线方程,对结果进行分析或预测从某大学中随机选取 8 名女大学生,其
10、身高和体重数据如下表:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预测体重的回归方程,并预测一名身高为 172 cm 的女大学生的体重.【方法指导】可以计算出r0.798.这表明体重与身高有较强的线性相关关系,从而可以建立身高和体重的线性回归方程,根据身高和体重的线性回归方程,由身高预测体重.【解析】由于问题中要求根据身高预测体重,因此选取身高为自变量 x,体重为因变量 y.作出散点图(如图).从图中可以看出,样本点呈条状分布,身高和体重有较强的线性相关关系,因此可以用线性回归方程来近似刻画它们之间
11、的关系,根据公式,可以得到b0.848,a-85.712.于是得到回归方程y=0.848x-85.712.因此,对于身高172cm 的女大学生,由回归方程可以预测其体重为y=0.848×172-85.712=60.144kg.【小结】解析中b=0.848是斜率的估计值,说明身高 x 每增加1个单位时,体重y就增加0.848kg,这表明体重与身高具有正的线性相关关系.尽管身高172cm的女大学生的体重不一定是60.144kg,但一般可以认为她的体重接近60.144kg.可线性化的非线性回归问题一只红铃虫的产卵数y和温度x之间的7组观测数据列于下表:温度x/21232527293235产
12、卵数y/个711212466115325试建立y与x之间的回归方程,并预测温度为28 时产卵数目.【方法指导】作出散点图(或根据已知的散点图)分析欲采用较为恰当的拟合曲线,用换元法转化成线性关系再进行回归分析.【解析】选择变量,画散点图.在散点图中,根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=c1的周围,其中c1和c2是待定参数.即问题变为如何估计待定参数c1和c2.我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.这样,就可以利用线性回归模型来建立 y 和 x 之间的非线性回归方程了.由已知表
13、的数据可以得到变换后的样本数据表(下表):x21232527293235z1.9463.3983.0453.1784.1904.7455.784下图给出了表中数据的散点图.从图中可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由表中的数据得到线性回归方程z=0.242x-2.884.相关系数r0.953.因此红铃虫的产卵数对温度的非线性回归方程为y=e0.242x-2.884.当x=28时,y49.预测当气温为28时,产卵数为49个.综上所述,在本题中指数函数模型比一元线性模型、二次函数模型有更好的拟合效果.【小结】对于给定的样本点(x1,y1),(x2,y2),(x
14、n,yn),其中 a 和 b 都是未知参数.应先根据散点图或利用相关系数r判断两变量间是否存在线性相关关系,若两变量线性相关性显著,采用例1的方法进行线性回归分析;若两变量线性相关性不显著,则可采用例2的方法和步骤进行拟合效果分析.在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s)5101520304050607090120深度y(m)610101316171923252946试求腐蚀深度y对时间t的回归直线方程.【解析】经计算可得相关系数r0.982,所以可以认为y与t之间有较强的线性相关关系.46.36,19.45,=36750,=5422,tiyi=
15、13910.b=0.3.a=-b=19.45-0.3×46.365.542.故所求的回归直线方程为y=0.3t+5.542.一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数,现观测得到(x,y)的4组观测值为(8,5),(12,8),(14,9),(16,11).(1)假定y与x之间有线性相关关系,求y对x的回归直线方程;(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒.(精确到1转/秒)【解析】(1)设回归直线方程为y=bx
16、+a,=12.5,=8.25,=660,xiyi=438.于是b=,a=-b=8.25-×12.5=-×=-.故所求的回归直线方程为y=x-.(2)由y=x-10,得x15,即机器速度不得超过15转/秒.为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)用天数x作解释变量,繁殖个数y作预测变量,作出这些数据的散点图;(2)建立解释变量x与预测变量y之间的回归方程.【解析】(1)所作散点图如图所示.(2)由散点图看出样本点分析在一条指数函数y=c1的周围,于是令z=lny,则x、z数据如下表格,x
17、123456z1.792.483.223.894.555.25由计算器得z=0.69x+1.112,r0.9999,则有y=e0.69x+1.112.1.给定x与y的一组样本数据,求得相关系数r=-0.990,则().A.y与x不相关B.y与x非线性相关C.y与x正相关D.y与x负相关【解析】因为r<0,故选D.【答案】D2.下列两个变量之间的关系不是函数关系的是().A.角度和它的正切值B.人的右手一柞长和身高C.正方体的棱长和表面积D.真空中自由落体运动物体的下落距离和下落时间【解析】由正切函数y=tanx知A是函数关系;人的右手一柞长和身高不是确定的关系,故B不是函数关系;设正方体
18、的棱长为a,则它的表面积S=6a2,C是函数关系;由物理知识知,自由落体运动物体的下落距离h和下落时间t满足h=gt2(t>0),D是函数关系.【答案】B3.已知回归直线的方程为y=2-2.5x,则当x=25时,y的估计值是. 【解析】将x=25代入方程得y=2-2.5×25=-60.5.【答案】-60.54.某市统计19942021年在校中学生每年高考考入大学的百分比,把农村、县镇、城市分开统计,为了便于计算,把1994年编号为0,1995年编号为1,2021年编号为10,如果把每年考入大学的百分比作为统计变量,把年份从0到10作为自变量进行回归分析,可得到下面三条
19、回归直线,城市:y=9.50+2.54x;县镇:y=6.76+2.32x;农村:y=1.80+0.42x.(1)对于农村学生来讲,系数等于0.42意味着什么?(2)在这一阶段,哪里的大学入学率增长最快?【解析】(1)对于农村学生来讲,系数等于0.42意味着19942021年在校中学生每年高考考入大学的百分比逐年增加0.42.(2)在这一阶段,城市的大学入学率增长最快.(2022年·山东卷)某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y=bx+a中的b为9.4,据此模型预测广告费用为6万元时
20、销售额为().A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解析】由表可计算=,=42,因为点(,42)在回归直线y=bx+a上,且b为9.4,所以42=9.4×+a, 解得a=9.1,故回归方程为y=9.4x+9.1,将x=6代入方程得y=65.5,选B.【答案】B 1.观察两个变量(存在线性相关关系)的数据如下:x-10-6.99-5.01-2.983.9857.998.01y-9-7-5-34.014.9978则两变量间的线性回归方程为().A.y=x+1B.y=xC.y=2x+D.y=x+1【解析】由于线性回归
21、方程一定经过样本点的中心(,),所以本题只需求出,然后代入所给选项进行检验,即可得到答案.由表中数据可得=0,=0,只有B项中的方程过点(0,0),故选B.【答案】B2.在以下四个散点图中(如图所示),适用于作线性回归的散点图为().A.B.C.D.【解析】表示正相关,表示负相关.【答案】B3.若线性回归方程y=a+bx中,b=0,则相关系数r=. 【解析】由b=0,得(xi-)(yi-)=0,所以r=0.【答案】04.某种产品的广告费用支出x(万元)与销售额y(万元)之间有如下的对应数据:x(万元)24568y(万元)3040605070(1)求相关系数和回归直线方程;(2)据此预
22、测广告费用支出为10万元时销售收入y的值.【解析】(1)=(2+4+5+6+8)=5,=(30+40+60+50+70)=50,=22+42+52+62+82=145,=302+402+602+502+702=13500,xiyi=1380,r=0.919,即两变量间有很强的线性相关关系.b=6.5,a=-b=50-6.5×5=17.5,故回归直线方程为y=6.5x+17.5.(2)当x=10时,预测y的值为y=10×6.5+17.5=82.5.5.已知对一组观测值(xi,yi)作出散点图后,确定其具有线性相关关系.若对于y=bx+a,求得b=0.51,=61.75,=38
23、.14,则回归直线方程为().A.y=0.51x+6.65B.y=6.65x+0.51C.y=0.51x+42.30D.y=42.30x+0.51【解析】y=bx+a过点(,),a=-b=38.14-0.51×61.756.65,y=0.51x+6.65.【答案】A6.炼钢时钢水的含碳量与冶炼时间是().A.确定性关系B.相关关系C.函数关系D.无任何关系【解析】解答本题的关键是弄清相关关系的定义及相关关系与函数关系的区别.【答案】B7.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的线性相关关系,现取8组观测值,计算得xi=52,yi=228,=478,xiyi
24、=1849,则y与x的回归直线方程是.(精确到小数点后两位数) 【解析】根据给出的数据可先求=xi=6.5,=yi=28.5,然后代入公式b=2.62,从而a=-bx=28.5-2.62×6.5=11.47,所以回归直线方程y=11.47+2.62x.【答案】y=11.47+2.62x8.在彩电显影中,由经验可知形成染料光学密度y与析出银的光学密度x的公式为y=A(b<0),现测得试验数据如下:xi0.050.060.250.310.070.100.380.430.140.200.47yi0.100.141.001.120.230.371.191.250.590.791.29试求y对x的回归方程.【解析】由题意知,对于给定的公式y=A(b<0)两边取自然对数,得lny=lnA+.与线性回归方程相对照可以看出,只要令u=,v=lny,a=lnA,就有v=a+bu.这是v对u的线性回归方程,对此再套用相关系数公式,求回归系数a和b.题目中所给的数据由变量置换u=,v=lny,变为如下所示的数据:ui20.00016
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 甘肃省庆阳市庙渠初级中学2024届中考二模数学试题含解析
- 2024-2025公司员工安全培训考试试题附答案【典型题】
- 钣金焊接素材褶边
- 25年公司厂级员工安全培训考试试题及答案审定
- 2025公司、项目部、各个班组三级安全培训考试试题【含答案】
- 2025年公司厂级安全培训考试试题及答案考点精练
- 2025各个班组三级安全培训考试试题含答案AB卷
- 2024-2025新入职工入职安全培训考试试题及答案(全优)
- 2024-2025企业员工岗前安全培训考试试题答案突破训练
- 2024-2025员工三级安全培训考试试题模拟题
- 电源产品性能和可靠性测试报告
- 大学生思政课课件
- 2022年中国中信集团有限公司招聘笔试试题及答案解析
- 肾脏移植课件
- 食品生产许可审查通则解读课件
- 医院“双培养”制度
- GB∕T 37370-2019 中国常见色色名和色度特性
- DB34∕T 1948-2013 建设工程造价咨询档案立卷标准
- 漫画教你精益生产课件
- 国内外桥梁垮塌事故案例分析
- GB∕T 20721-2022 自动导引车 通用技术条件
评论
0/150
提交评论