线性回归方程(1)_第1页
线性回归方程(1)_第2页
线性回归方程(1)_第3页
线性回归方程(1)_第4页
线性回归方程(1)_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.3 变量间的相关关系变量间的相关关系 有些教师常说:有些教师常说:“如果你的数学成绩好,那如果你的数学成绩好,那么你的物理学习就不会有什么大问题么你的物理学习就不会有什么大问题” 按照这种按照这种说法,似乎学生的物理成绩与数学成绩之间也存说法,似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系?在着某种关系。你如何认识它们之间存在的关系?物理成绩物理成绩 数学成绩数学成绩 学习兴趣学习兴趣 学习时间学习时间 其他因素其他因素结论:变量之间除了函数关系外,还有结论:变量之间除了函数关系外,还有 。问题引入:问题引入:思考:考察下列问题中两个变量之间的关系:思考:考

2、察下列问题中两个变量之间的关系:(1 1)商品销售收入与广告支出经费;)商品销售收入与广告支出经费;(2 2)粮食产量与施肥量;)粮食产量与施肥量;(3 3)人体内的脂肪含量与年龄;)人体内的脂肪含量与年龄;(4 4)圆的面积与半径;)圆的面积与半径;(5 5)匀速直线运动中的时间与路程)匀速直线运动中的时间与路程。(1 1)函数关系:)函数关系:当自变量取值一定时,因变量取值由它唯一确定当自变量取值一定时,因变量取值由它唯一确定 正方形面积正方形面积S S与其边长与其边长x x之间的函数关系之间的函数关系S=xS=x2 2 , 一块农田的水稻产量与施肥量之间的关系一块农田的水稻产量与施肥量之

3、间的关系 。1.1.两变量之间的关系两变量之间的关系 (2)相关关系:)相关关系: 当自变量取值一定时,因变量的取值带有一定的随机当自变量取值一定时,因变量的取值带有一定的随机性性对自变量边长的每一个确定值,都有唯一确定的面积的值对自变量边长的每一个确定值,都有唯一确定的面积的值与之对应。与之对应。确定关系确定关系水稻产量并不是由施肥量唯一确定,在取值上带有随机性水稻产量并不是由施肥量唯一确定,在取值上带有随机性不确定关系不确定关系(1 1)相关关系与函数关系的异同点:)相关关系与函数关系的异同点: 相同点:均是指两个变量的关系相同点:均是指两个变量的关系 不同点:不同点:函数关系是一种确定的

4、关系函数关系是一种确定的关系 相关关系是一种非确定关系;相关关系是一种非确定关系;函数关系是一种因果关系,而相关关系不一定是因果关函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是随机关系系,也可能是随机关系.(2)函数关系与相关关系之间有着密切联系:)函数关系与相关关系之间有着密切联系: 在一定的条件下可以相互转化在一定的条件下可以相互转化.而对于具有线性相关关系而对于具有线性相关关系的两个变量来说,当求得其回归直线方程后,又可以用的两个变量来说,当求得其回归直线方程后,又可以用一种确定性的关系对这两个变量间的取值进行估计:一种确定性的关系对这两个变量间的取值进行估计:1.下列关系

5、中下列关系中,是带有随机性相关关系的是是带有随机性相关关系的是 .正方形的边长与面积的关系正方形的边长与面积的关系;水稻产量与施肥量之水稻产量与施肥量之间的关系间的关系;人的身高与年龄之间的关系人的身高与年龄之间的关系;降雪量与降雪量与交通事故发生之间的关系交通事故发生之间的关系.2. 下列两个变量之间的关系哪个不是函数关系下列两个变量之间的关系哪个不是函数关系()()A角度和它的余弦值角度和它的余弦值B. 正方形边长和面积正方形边长和面积C正边形的边数和它的内角和正边形的边数和它的内角和 D. 人的年龄和身高人的年龄和身高D年龄年龄2323272739394141454549495050脂肪

6、脂肪9 95 517178 821212 225259 927275 526263 328282 2年龄年龄5353545456565757585860606161脂肪脂肪29296 630302 231314 430308 833335 535352 234346 6根据上述数据,人体的脂肪含量和年龄之间有怎样的关根据上述数据,人体的脂肪含量和年龄之间有怎样的关系?系?在一次对人体的脂肪含量和年龄关系的?在一次对人体的脂肪含量和年龄关系的? 下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点,称该图为系,作出各个点,称该图为散点图散

7、点图.如图:如图:O202530 35 4045 505560 65年龄年龄脂肪含量脂肪含量5101520253035401 1、散点图:将样、散点图:将样本中本中n n个数据点个数据点(xixi,yi)yi)(i i1 1,2,n n)描在平)描在平面直角坐标系中,面直角坐标系中,以表示具有相关关以表示具有相关关系的两个变量的一系的两个变量的一组数据的图形叫做组数据的图形叫做散点图散点图. .由散点图支持了我们从数据表中得出如下结论:由散点图支持了我们从数据表中得出如下结论:a. a. 如果所有的样本点如果所有的样本点都落在某一函数曲线上都落在某一函数曲线上,就用,就用 该该函数函数来描述变

8、量之间的关系。来描述变量之间的关系。b.b.如果所有的样本点都落在如果所有的样本点都落在某一函数曲线附近某一函数曲线附近,变,变量之间就有量之间就有相关关系相关关系。c.c.如果所有的样本点都落在如果所有的样本点都落在某一直线附近某一直线附近,变量之,变量之间就有间就有线性相关关系线性相关关系。 从刚才的散点图发现:年龄越大,体内脂肪含量从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从越高,点的位置散布在从左下角到右上角左下角到右上角的区域的区域. . 称称它们成它们成正相关正相关. 但有的两个变量的相关,如下图所示:但有的两个变量的相关,如下图所示: 如高原含氧量与海拔高度如

9、高原含氧量与海拔高度的相关关系,海平面以上,的相关关系,海平面以上,海拔高度越高,含氧量越少海拔高度越高,含氧量越少. . 作出散点图发现,它作出散点图发现,它们散布在从们散布在从左上角到右下角左上角到右下角的区域内。又如汽车的载重的区域内。又如汽车的载重和汽车每消耗和汽车每消耗1 1升汽油所行升汽油所行使的平均路程,称它们成使的平均路程,称它们成负负相关相关. .O5 5个学生的数学和物理成绩如下表个学生的数学和物理成绩如下表:ABCDE数学8075706560物理7066686462画出散点图画出散点图,解:解:数学成绩数学成绩由散点图可见,两者之间具有正相关关系。由散点图可见,两者之间具

10、有正相关关系。有一个同学家开了一个小卖部,他为了研究气有一个同学家开了一个小卖部,他为了研究气温对热饮销销售的影响,经过统计,得到一个温对热饮销销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:卖出的热饮杯数与当天气温的对比表:摄氏温度摄氏温度 26 18 13 10 4 -1 热饮杯数热饮杯数 20 24 34 38 50 64(1)(1)画出散点图;画出散点图;(2)(2)从散点图中发现气温与热饮销售杯数之间从散点图中发现气温与热饮销售杯数之间关系的一般规律;关系的一般规律;解解: (1): (1)散点图散点图(2)(2)气温与热饮杯数成负相关气温与热饮杯数成负相关, ,即气

11、温越高,卖出即气温越高,卖出去的热饮杯数越少。去的热饮杯数越少。温度温度热饮杯数热饮杯数人体脂肪含量百分比与年龄散点图02040020406080年龄脂肪含量散散点点图图回归直线:如果散点图中点的分布回归直线:如果散点图中点的分布从从整体整体上看上看大致在大致在一条直线附近,我们就称这两个变量之间具有一条直线附近,我们就称这两个变量之间具有线性相线性相关关系关关系,这条直线就叫做,这条直线就叫做回归直线回归直线。 这条回归直线的方程,简称为回归方程这条回归直线的方程,简称为回归方程。1.1.回归方程被样本数据惟一确定,各样本点大致回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近分布在

12、回归直线附近. .对同一个总体,不同的样本对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有数据对应不同的回归直线,所以回归直线也具有随机性随机性. . 2.2.对于任意一组样本数据,利用上述公式都可以对于任意一组样本数据,利用上述公式都可以求得求得“回归方程回归方程”,如果这组数据不具有线性相,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的关关系,即不存在回归直线,那么所得的“回归回归方程方程”是没有实际意义的是没有实际意义的. .因此,对一组样本数据,因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再应先作散点图,在具有线性相关关系的前提下再求回

13、归方程求回归方程. .方案一:采用测量的方法:先画一条直线,测方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。斜率和截距,就得到回归方程。脂肪010203040020406080脂肪方案二、在图中选取两点画直线,使得直线两方案二、在图中选取两点画直线,使得直线两侧的点的个数基本相同。侧的点的个数基本相同。脂肪010203040020406080脂肪方案三、在散点图中多取几组点,确定几条直方案三、在散点图中多取几组点,

14、确定几条直线的方程,分别求出各条直线的斜率和截距的线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率平均数,将这两个平均数作为回归方程的斜率和截距。和截距。脂肪010203040020406080脂肪设已经得到具有线性相关关系的变量的一组数据:设已经得到具有线性相关关系的变量的一组数据: (x x1 1,y y1 1),(),(x x2 2,y y2 2),),(,(x xn n,y yn n)设所求的回归直线方程为设所求的回归直线方程为Y=bx+aY=bx+a,其中其中a a,b b是待定是待定的系数。当变量的系数。当变量x x取取x x1 1,x x2 2,x

15、 xn n时,可以得到时,可以得到 Y Yi i=bx=bxi i+a+a(i=1i=1,2 2,n n)它与实际收集得到的它与实际收集得到的y yi i之间偏差是之间偏差是 y yi i-Y-Yi i=y=yi i-(bx-(bxi i+a)+a)(i=1i=1,2 2,n n)(x1,y1)(x2,y2)(xi ,yi )yi-Yiy x这样,用这这样,用这n n个偏差的和来刻画个偏差的和来刻画“各点与此直线的整体偏差各点与此直线的整体偏差”是比较合适的。是比较合适的。上述三种方案均有一定的道理,但可靠性不强,我们上述三种方案均有一定的道理,但可靠性不强,我们回到回归直线的回到回归直线的定

16、义定义。(yi-Yi)的最小值的最小值ni=1|yi-Yi|的最小值的最小值ni=1(yi-Yi)2的最小值的最小值ni=1Q=(y1-bx1-a) 2+(y2-bx2-a) 2+(yn-bxn-a) 2当当a,b取什么值时,取什么值时,Q的值最小,即总体偏差最小的值最小,即总体偏差最小1221,niiiniixyn x ybxn xayb x(xi-x)()(yi-y)ni=1b=(xi-x)ni=1a=y-bx计算回归方程的斜率和截距的一般公式:计算回归方程的斜率和截距的一般公式: xbyaxnxyxnyxxxyyxxbniiniiiniiniii,)()(1221121其中,其中,b是回

17、归方程的斜率,是回归方程的斜率,a是截距。是截距。注:对具有线性相关关系的两个变量,其回归直线一定注:对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心通过样本点的中心,yx求样本数据的线性回归方程,可按下列步骤进行:求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均数第一步,计算平均数 , , xy1niiix y21niix第二步,求和第二步,求和 , , 1122211()(),()nniii iiinniiiixx yyxynx ybay bxxxxnx 第三步,计算第三步,计算 ybxa第四步,写出回归方程第四步,写出回归方程 例例1 1:假设某设备的使用年限x(

18、年)和所支出的维修费用y(万元)有如下统计资料:使用年限使用年限x x( (年年) )2 23 34 45 56 6维修费用维修费用y y( (万元万元) )2.22.23.83.85.55.56.56.57.07.0由资料知 y对 x呈线性关系,试求:;,) 1 (的值中的回归直线方程ababxy(2)估计使用年限是10年时,维修费用估计是多少?解解:(1) 制表:制表:i12345合计合计xi2345620yi2.23.85.56.57.025xi24916253690 xi yi4.411.422.032.542.0112.3. 3 .112,90, 5, 4:51512iiiiiyxx

19、yx于是有23. 1103 .1245905453 .1122b08.0423.15xbya(2)回归直线方程是.08. 023. 1xy(2)估计使用年限是10年时,维修费用估计是多少?)(4 .1238.1208. 01023. 1,10万元时当yx答:估计使用10年时,维修费用估计是12.4万元。练习练习某种产品是的广告费支出某种产品是的广告费支出x x(单位:百万元)(单位:百万元)与销售额与销售额y y(单位:百万元)之间有如下对(单位:百万元)之间有如下对应数据应数据(1 1)画出散点图;)画出散点图;(2 2)如果)如果x x与与y y具有相关关系,求回归具有相关关系,求回归直线方程,并说明直线方程,并说明b b的意义的意义解(1)散点图如图所示:1735910305080销售额(百万元)广告费(百万元)(2)由散点图可知:X与Y具有相关关系5152155013801

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论