




免费预览已结束,剩余10页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
31回归分析的基本思想及其初步应用学习目标1了解随机误差、残差、残差图的概念2会通过分析残差判断线性回归模型的拟合效果3掌握建立线性回归模型的步骤知识链接1什么叫回归分析?答回归分析是对具有相关关系的两个变量进行统计分析的一种方法2回归分析中,利用线性回归方程求出的函数值一定是真实值吗?答不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等预习导引1线性回归模型(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),回归直线的斜率和截距的最小二乘估计公式分别为,其中(,)称为样本点的中心(4)线性回归模型ybxae,其中a和b是模型的未知参数,e称为随机误差,自变量x称为解释变量,因变量y称为预报变量2残差的概念对于样本点(x1,y1),(x2,y2),(xn,yn)而言,它们的随机误差为eiyibxia,i1,2,n,其估计值为iyiiyixi,i1,2,n,i称为相应于点(xi,yi)的残差3刻画回归效果的方式(1)残差图法作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高(2)残差平方和法残差平方和 (yii)2,残差平方和越小,模型拟合效果越好(3)利用r2刻画回归效果r21;r2表示解释变量对于预报变量变化的贡献率r2越接近于1,表示回归的效果越好.要点一求线性回归方程例1某班5名学生的数学和物理成绩如下表:学生学科abcde数学成绩(x)8876736663物理成绩(y)7865716461(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩解(1)散点图如图(2)(8876736663)73.2,(7865716461)67.8.xiyi8878766573716664636125 054.x88276273266263227 174.所以0.625.67.80.62573.222.05.所以y对x的回归直线方程是0.625x22.05.(3)x96,则0.6259622.0582,即可以预测他的物理成绩是82.规律方法(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义跟踪演练1以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积/m211511080135105销售价格/万元24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150 m2时的销售价格解(1)数据对应的散点图如下图所示:(2)xi109, (xi)21 570,23.2, (xi)(yi)308.设所求回归直线方程为x,则0.196 2,0.181 42.故所求回归直线方程为0.196 2x1.814 2.回归直线如上图所示(3)据(2),当x150 m2时,销售价格的估计值为0.196 21501.814 231.244 2(万元)要点二线性回归分析例2为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求线性回归方程;(2)求出r2;(3)进行残差分析解(1)散点图如图(51015202530)17.5,(7.258.128.959.9010.911.8)9.487,x2 275,xiyi1 076.2计算得,0.183,6.285,所求回归直线方程为0.183x6.285.(2)列表如下:yii0.050.0050.080.0450.040.025yi2.241.370.540.411.412.31所以 (yii)20.013 18, (yi)214.678 4.所以,r210.999 1,回归模型的拟合效果较好(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系规律方法在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据然后,通过残差1,2,n来判断模型拟合的效果,判断原始数据中是否存在可疑数据若残差点比较均匀地分布在水平带状区域内,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高跟踪演练2已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x1416182022y1210753求y对x的回归直线方程,并说明回归模型拟合效果的好坏解(1416182022)18,(1210753)7.4,x1421621822022221 660,xiyi14121610187205223620,所以1.15.7.41.151828.1,所以所求回归直线方程是1.15x28.1.列出残差表:yii00.30.40.10.2yi4.62.60.42.44.4所以, (yii)20.3, (yi)253.2,r210.994,所以回归模型的拟合效果很好要点三非线性回归分析例3下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x40时y的值解(1)作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线yc1ec2x的周围,其中c1,c2为待定的参数(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa(aln c1,bc2)的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为0.272x3.849,e0.272x3.849.残差yi711212466115325i6.44311.10119.12532.95056.770128.381290.3250.5570.1011.8758.9509.2313.38134.675(3)当x40时,ye0.272x3.8491 131.规律方法解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,预报变量为y;(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题;(4)分析拟合效果:通过计算相关指数等来判断拟合效果;(5)写出非线性回归方程跟踪演练3为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;(2)描述解释变量x与预报变量y之间的关系;(3)计算相关指数解(1)作散点图如图所示(2)由散点图看出样本点分布在一条指数函数yc1ec2x的周围,于是令zln y,则有变换后的样本点应分布在直线zbxa(aln c1,bc2)的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为x123456z1.792.483.223.894.555.25由计算器得:0.69x1.115,则有e0.69x1.115.(3)i6.0812.1224.1748.1896.06191.52yi612254995190, (yi)24.816 1, (yi)224 642.8,r210.999 8,即解释变量天数对预报变量繁殖细菌个数解释了99.98%.1下列各组变量之间具有线性相关关系的是()a出租车费与行驶的里程b学习成绩与学生身高c身高与体重d铁的体积与质量答案c2若劳动生产率x(千元)与月工资y(元)之间的线性回归方程为5080x,则下列判断正确的是()a劳动生产率为1 000元时,月工资为130元b劳动生产率提高1 000元时,月工资平均提高80元c劳动生产率提高1 000元时,月工资平均提高130元d月工资为210元时,劳动生产率为2 000元答案b3某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()a.10x200 b.10x200c.10x200 d.10x200答案a解析由于销售量y与销售价格x成负相关,故排除b、d.又当x10时,a中y100,而c中y300,c不符合题意,故选a.4某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号12345工作年限x/年35679推销金额y/万元23345(1)求年推销金额y关于工作年限x的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额解(1)设所求的线性回归方程为x,则0.5,0.4.所以年推销金额y关于工作年限x的线性回归方程为0.5x0.4.(2)当x11时,0.5x0.40.5110.45.9(万元)所以可以估计第6名推销员的年推销金额为5.9万元回归分析的基本思路(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程x);(4)按一定规则估计回归方程中的参数;(5)提出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.一、基础达标1在下列各量之间,存在相关关系的是()正方体的体积与棱长之间的关系;一块农田的水稻产量与施肥量之间的关系;人的身高与年龄之间的关系;家庭的支出与收入之间的关系;某户家庭用电量与电价之间的关系a b c d答案d2设某大学的女生体重y(单位:kg)与身高x(单位:cm)有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,下列结论中不正确的是()ay与x具有正的线性相关关系b回归直线过样本点的中心(,)c若该大学某女生身高增加1 cm,则其体重约增加0.85 kgd若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案d解析由回归方程为0.85x85.71知y随x的增大而增大,所以y与x具有正的线性相关关系;由最小二乘法建立回归方程的过程知xx (),所以回归直线过样本点的中心(,);利用回归方程可以估计总体,所以d不正确3某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为()a63.6万元 b65.5万元c67.7万元 d72.0万元答案b解析,42,又x必过(,),429.4,9.1.线性回归方程为9.4x9.1.当x6(万元)时,9.469.165.5(万元)4甲、乙、丙、丁四位同学各自对a,b两变量做回归分析,分别得到散点图与残差平方和 (yii)2如下表甲乙丙丁散点图残差平方和115106124103哪位同学的实验结果体现拟合a,b两变量关系的模型拟合精度高?()a甲 b乙 c丙 d丁答案d5如果散点图的所有点都在一条直线上,则残差均为_,残差平方和为_,相关指数为_答案0016对具有线性相关关系的变量x和y,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为_答案106.5x解析由题意知2,3,6.5,所以36.5210,即回归直线的方程为106.5x.7某个服装店经营某种服装,在某周内纯获利y(元)与该周每天销售这种服装件数x之间的一组数据如下表:x3456789y66697381899091(1)求样本中心点;(2)画出散点图;(3)求纯获利y与每天销售件数x之间的回归方程解(1)6,79.86,中心点(6,79.86)(2)散点图如下:(3)因为4.75,51.36,所以4.75x51.36.二、能力提升8(2013福建)已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为x.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()a.b,a b.b,ac.a d.b,a答案c解析,b2,a2.9下表是x和y之间的一组数据,则y关于x的回归方程必过()x1234y1357a.点(2,3) b点(1.5,4)c点(2.5,4) d点(2.5,5)答案c解析回归方程必过样本点的中心(,),即(2.5,4)10如图是x和y的一组样本数据的散点图,去掉一组数据_后,剩下的4组数据的相关指数最大答案d(3,10)解析去掉d(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大11某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程x;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,先将数据处理如下:年份200642024需求量257211101929对处理的数据,容易算得0,3.2,6.5,3.2.由上述计算结果,知所求回归直线方程为2576.5(x2 006)3.2.即6.5(x2 006)260.2.(2)利用所求得的直线方程,可预测2012年的粮食需求量为6.5(2 0122
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 校园超市消防知识培训课件
- 2026届湖南省衡阳二十六中高二化学第一学期期末学业质量监测试题含答案
- 铸造造型试题及答案
- 街道特勤考试试题及答案
- 饥荒家园测试题及答案
- 校园安全知识培训课件专题
- 会议工作试题及答案
- 唐朝写诗考试题及答案
- 中工会考试试题及答案
- 产业招商面试题及答案
- NBT 33018-2015 电动汽车充换电设施供电系统技术规范
- 《科技英语翻译方法》课件
- 血液透析诊疗指南
- 2023年河南省对口升学养殖类专业课试卷
- 社区健康服务与管理教案
- 房屋装修合同范本下载
- 2023学年一年级语文下册看拼音写词语字帖(全册 部编版)
- 沙漠学全套课件
- 浪潮入职测评题库
- 《外国人来华工作许可证》聘用合同或任职证明正规范本(通用版)
- 三人制篮球赛计分表
评论
0/150
提交评论