第09章线性回归计算推荐课件_第1页
第09章线性回归计算推荐课件_第2页
第09章线性回归计算推荐课件_第3页
第09章线性回归计算推荐课件_第4页
第09章线性回归计算推荐课件_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章第九章 一元线性回归一元线性回归2021/8/221回归分析适合研究哪类问题回归分析适合研究哪类问题? ?回归方程的显著性检验适合什么情况回归方程的显著性检验适合什么情况? ?回归系数的显著性检验适合什么情况回归系数的显著性检验适合什么情况? ? 第九章一元线性回归第九章一元线性回归2021/8/2229.1 9.1 回归分析的基本概念回归分析的基本概念 9.1.1 9.1.1 因变量因变量(Y)(Y)与自变量与自变量(X)(X)之间的关系之间的关系根据因变量与自变量之间的关系不同,可以分为两种类型:根据因变量与自变量之间的关系不同,可以分为两种类型:函数关系函数关系 统计关系统计关系

2、第九章一元线性回归第九章一元线性回归2021/8/2239.1.1 9.1.1 因变量因变量(Y)(Y)与自变量与自变量(X)(X)之间的关系之间的关系1.1.函数关系函数关系 即对两个变量即对两个变量X X,Y Y来说,当来说,当X X值值确定后,确定后,Y Y值按照一定的规律唯一确定,值按照一定的规律唯一确定,即形成一种精确的关系。即形成一种精确的关系。 例如例如: :微积分学中所研究的一般变量之间的微积分学中所研究的一般变量之间的函数关系就属于此种类型。函数关系就属于此种类型。 第九章一元线性回归第九章一元线性回归2021/8/2249.1.1 9.1.1 因变量因变量(Y)(Y)与自变

3、量与自变量(X)(X)之间的关系之间的关系2.2.统计关系统计关系 即当即当X X值确定后,值确定后,Y Y值不是唯一确定的,值不是唯一确定的,但大量统计资料表明,这些变量之间还但大量统计资料表明,这些变量之间还是存在着某种客观的联系。是存在着某种客观的联系。 例如:图例如:图9.19.1在直角坐标平面上,标出了在直角坐标平面上,标出了1010个观测点的坐标位置,他们表示以家庭为单个观测点的坐标位置,他们表示以家庭为单位,某种商品年需求量与该商品价格之间位,某种商品年需求量与该商品价格之间的的1010对调查数据。对调查数据。 第九章一元线性回归第九章一元线性回归2021/8/2259.1.2

4、9.1.2 回归分析回归分析图图9-19-1第九章一元线性回归第九章一元线性回归2021/8/2269.1.2 9.1.2 回归分析回归分析回归分析回归分析(Regression Analysis) (Regression Analysis) 就是应用统计方法,对大量的观测数据进行整就是应用统计方法,对大量的观测数据进行整理、分析和研究,从而得出反映事物内部规律理、分析和研究,从而得出反映事物内部规律性的一些结论性的一些结论( (数学模型数学模型) )。 第九章一元线性回归第九章一元线性回归2021/8/2279.2 9.2 一元线性回归模型一元线性回归模型 9.2.1 9.2.1 统计关系的

5、特征统计关系的特征统计关系统计关系特征特征 观测点散布在统计关系直线的周围,此观测点散布在统计关系直线的周围,此种情况说明种情况说明Y Y的变化除了受自变量的变化除了受自变量X X影响以外,还受其他因素的影响。影响以外,还受其他因素的影响。因此试图建立这样一个回归模型,通过对此模型因此试图建立这样一个回归模型,通过对此模型所作的一些假设,可以体现出上述统计关系所刻划的特征。所作的一些假设,可以体现出上述统计关系所刻划的特征。因变量因变量Y Y随自变量随自变量X X有规律的变化,而统有规律的变化,而统计关系直线描述了这一变化的趋势。计关系直线描述了这一变化的趋势。第九章一元线性回归第九章一元线性

6、回归2021/8/2289.2.2 9.2.2 一元线性回归模型假设一元线性回归模型假设u根据统计关系特征,可以进行下述假设:根据统计关系特征,可以进行下述假设:假设假设(2)(2)这些这些Y Y的概率分布的均值,有规律的随的概率分布的均值,有规律的随X X变化而变化变化而变化(1)(1)对于自变量的每一水平对于自变量的每一水平X X,存在着,存在着Y Y的一个概率分布;的一个概率分布;第九章一元线性回归第九章一元线性回归2021/8/2299.2.3 9.2.3 一元线性回归模型一元线性回归模型Y Y与与X X具有统计具有统计关系而且是线性关系而且是线性 建立建立回归模型回归模型Y Yi i

7、=0 0+1 1X Xi i+i i (i=1,2,n) (i=1,2,n) 其中其中,(X (X i,i,Y Yi i) )表示表示(X,Y)(X,Y)的第的第i i个观测值,个观测值,0 0 , , 1 1为参数,为参数,0 0+1 1X Xi i为反映统计关系直线的分量,为反映统计关系直线的分量, i i为反映在统计关系直线周围散布的随机分量为反映在统计关系直线周围散布的随机分量 i iN (0,N (0,2 2) )。第九章一元线性回归第九章一元线性回归2021/8/22109.2.3 9.2.3 一元线性回归模型一元线性回归模型u对于任意对于任意X Xi i值有:值有: Y Yi i

8、服从正态分布服从正态分布E(YE(Yi i)=)=0 0+ +1 1X Xi i; 各各Y Yi i间相互独立间相互独立 Y Yi iN(N(0 0+1 1X Xi i,2 2) ) 。22)(iY第九章一元线性回归第九章一元线性回归2021/8/22119.2.3 9.2.3 一元线性回归模型一元线性回归模型图图9-29-2第九章一元线性回归第九章一元线性回归2021/8/22129.2.4 9.2.4 一元线性回归方程一元线性回归方程最小二乘法最小二乘法 Y Y与与X X之间之间为线性关系为线性关系 选出一条最能反选出一条最能反映映Y Y与与X X之间关系之间关系规律的直线规律的直线 第九

9、章一元线性回归第九章一元线性回归2021/8/22139.2.4 9.2.4 一元线性回归方程一元线性回归方程Y Yi i= =0 0+ +1 1X Xi i+ +i i 0 0和和1 1均未知均未知 根据样本数据根据样本数据对对0 0和和1 1进行估计进行估计 0 0和和1 1的估计的估计值为值为b b0 0和和b b1 1 建立一元线性回归方程建立一元线性回归方程 XbbY10第九章一元线性回归第九章一元线性回归2021/8/22149.2.4 9.2.4 一元线性回归方程一元线性回归方程一般而言,所求的一般而言,所求的b b0 0和和b b1 1应能使每个样本观测点应能使每个样本观测点(

10、X(X i i,Y,Y i i) )与回归直线之间的偏差尽可能小,即使观察值与拟与回归直线之间的偏差尽可能小,即使观察值与拟合值的误差平方和合值的误差平方和Q Q达到最小。达到最小。 图图9-4 9-4 回归方程原理图回归方程原理图第九章一元线性回归第九章一元线性回归2021/8/22159.2.4 9.2.4 一元线性回归方程一元线性回归方程令令 2110)(niiiXbbYQQ Q达到最小值达到最小值b b0 0和和b b1 1称为最小二乘估计量称为最小二乘估计量 微积分中极值微积分中极值的必要条件的必要条件 niiiXbbYbQ1100)(2niiiiXXbbYbQ1101)(2 令偏导

11、数为令偏导数为0 0niiniiYXbnb1110iniiniiniiYXXbXb112110解方程解方程第九章一元线性回归第九章一元线性回归2021/8/22169.2.4 9.2.4 一元线性回归方程一元线性回归方程nXXnYXYXXXYYXXbiniiniiiiiniiniii21211211)()()()(XbYb10(9-5)(9-5)(9-6)(9-6)第九章一元线性回归第九章一元线性回归2021/8/22179.2.5 9.2.5 最小二乘估计量最小二乘估计量b b0 0,b,b1 1的特性的特性b b0 0,b,b1 1的特性的特性线性性线性性无偏性无偏性第九章一元线性回归第九

12、章一元线性回归2021/8/22189.2.5 9.2.5 最小二乘估计量最小二乘估计量b b0 0,b,b1 1的特性的特性(1) (1) 线性特性线性特性 由(由(9-59-5)得)得niiniiiniiniiiXXYXXXXYYXXb1211211)()()()(niiiiXXXXC12)(令令niiiYCb11则则 表明表明b b1 1是是Y Yi i的线性组合的线性组合 第九章一元线性回归第九章一元线性回归2021/8/22199.2.5 9.2.5 最小二乘估计量最小二乘估计量b b0 0,b,b1 1的特性的特性同理,可得同理,可得 niiiYkb10XCnkii1b b0 0是

13、是Y Yi i线线性组合性组合第九章一元线性回归第九章一元线性回归2021/8/22209.2.5 9.2.5 最小二乘估计量最小二乘估计量b b0 0,b,b1 1的特性的特性(2) (2) 无偏性无偏性可以证明可以证明b b0 0和和b b1 1分别是分别是0 0和和1 1的无偏估计的无偏估计(过程比较繁琐,参照第五章内容(过程比较繁琐,参照第五章内容有兴趣大家自己证明。)有兴趣大家自己证明。) 第九章一元线性回归第九章一元线性回归2021/8/22219.3 9.3 总平方和分解总平方和分解9.3.1 9.3.1 总平方和分解总平方和分解YYYYYYiiiiniininiiiiYYYYY

14、Y121122)()()(niiiiYYYY10)(第九章一元线性回归第九章一元线性回归2021/8/22229.3.1 9.3.1 总平方和分解总平方和分解图图9-5 9-5 总平总平方和分解图方和分解图 第九章一元线性回归第九章一元线性回归2021/8/22239.3.1 9.3.1 总平方和分解总平方和分解总离差平方和总离差平方和 niiYYSSTO12)(它表示没有它表示没有X X的影响,的影响,单纯考察数据中单纯考察数据中Y Y的变动情况。的变动情况。第九章一元线性回归第九章一元线性回归2021/8/22249.3.1 9.3.1 总平方和分解总平方和分解回归平方和回归平方和niiY

15、YSSR12)(表示各表示各 的变动程度,该变动是由于回归直线的变动程度,该变动是由于回归直线中各中各X Xi i 的变动所引起的,并且通过的变动所引起的,并且通过X X对对Y Y的线性影响表现出来。的线性影响表现出来。 iY第九章一元线性回归第九章一元线性回归2021/8/22259.3.1 9.3.1 总平方和分解总平方和分解误差平方和误差平方和niiiYYSSE12)(表示各表示各Y Yi i围绕所拟合的回归直线的变动程度围绕所拟合的回归直线的变动程度 SSTOSSTO= =SSRSSR+ +SSESSE第九章一元线性回归第九章一元线性回归2021/8/22269.3.1 9.3.1 总

16、平方和分解总平方和分解SSE=SSTO-SSRSSE=SSTO-SSRniniiinYYSSTO1212)()(121221niniiinXXbSSR第九章一元线性回归第九章一元线性回归2021/8/22279.3.2 9.3.2 自由度的分解自由度的分解SSTOSSTOniiYY10)(自由度自由度 T T为为n-1 n-1 SSESSE0 0和和1 1用了用了两个正规方程两个正规方程 自由度自由度 E E为为n-2 n-2 SSRSSRniiYY10)(自由度自由度 R R为为1 1 第九章一元线性回归第九章一元线性回归2021/8/22289.3.2 9.3.2 自由度的分解自由度的分解

17、自由度的分解可以表示为自由度的分解可以表示为n-1=1+n-1=1+(n-2n-2)T T= =R R+ +E E第九章一元线性回归第九章一元线性回归2021/8/22299.3.3 9.3.3 回归均方与误差均方回归均方与误差均方1SSRMSR 2nSSEMSE(9-10) (9-10) (9-11)(9-11)回归均方回归均方误差均方误差均方第九章一元线性回归第九章一元线性回归2021/8/22309.4 9.4 样本确定系数与样本相关系数样本确定系数与样本相关系数9.4.1 9.4.1 样本确定系数样本确定系数SSTOSSESSTOSSESSTOSSTOSSRr12(9-12) (9-1

18、2) 注注:Y:Y的总变差中能被的总变差中能被X X解释的那部分所占的比率解释的那部分所占的比率第九章一元线性回归第九章一元线性回归2021/8/22319.4.1 9.4.1 样本确定系数样本确定系数r r2 2的取值范围的取值范围102 r样本的全部观察值都落在样本的全部观察值都落在所拟和的回归直线上所拟和的回归直线上 SSE=0SSE=0, r r2 2=1 =1 当当X X与与Y Y无关,无关,Y Y的变差完的变差完全由于随机因素引起,全由于随机因素引起,此时,此时,SSR=0SSR=0 r r2 2=0 =0 第九章一元线性回归第九章一元线性回归2021/8/22329.4.2 9.

19、4.2 样本相关系数样本相关系数样本相关系数样本相关系数2rrniiniiniiiYYXXYYXXr12121)()()(注注:r:r与与b b1 1的分母均为正,分子相同的分母均为正,分子相同, ,故故r r与与b b1 1有相同的符号。有相同的符号。 第九章一元线性回归第九章一元线性回归2021/8/22339.4.2 9.4.2 样本相关系数样本相关系数 不同不同r r值所表示的相关程度值所表示的相关程度第九章一元线性回归第九章一元线性回归2021/8/22349.4.2 9.4.2 样本相关系数样本相关系数r r的取值情况的取值情况 情况一情况一图图9-69-6第九章一元线性回归第九章

20、一元线性回归2021/8/22359.4.2 9.4.2 样本相关系数样本相关系数情况二情况二图图9-79-7第九章一元线性回归第九章一元线性回归2021/8/22369.4.2 9.4.2 样本相关系数样本相关系数情况三情况三图图9-89-8第九章一元线性回归第九章一元线性回归2021/8/22379.4.2 9.4.2 样本相关系数样本相关系数情况四情况四图图9-99-9第九章一元线性回归第九章一元线性回归2021/8/22389.5 9.5 一元线性回归显著性检验一元线性回归显著性检验在回归函数在回归函数E(Y)=E(Y)=0 0+1 1X X中,如果中,如果1 1=0=0,则对于,则对

21、于X X的一切水的一切水平平E(Y)=E(Y)=0 0,说明,说明Y Y的变化与的变化与X X的变化无关,因而,我们不能的变化无关,因而,我们不能通过通过X X去预测去预测Y Y。所以,对模型。所以,对模型Y Yi i=0 0+1 1X Xi i+i i 检验检验1 1=0=0是是否成立,等价于检验否成立,等价于检验Y Y与与X X之间是否存在线性关系。之间是否存在线性关系。 第九章一元线性回归第九章一元线性回归2021/8/22399.5.1 b9.5.1 b1 1的抽样分布的抽样分布为了检验为了检验1 1=0=0是否成立,需要构造一是否成立,需要构造一个合适的统计量,因此,首先讨论个合适的

22、统计量,因此,首先讨论b b1 1的抽样分布。的抽样分布。第九章一元线性回归第九章一元线性回归2021/8/22409.5.1 b9.5.1 b1 1的抽样分布的抽样分布b b1 1是观测值是观测值Y Yi i的线的线性组合性组合 Y Yi i服从正态分布且服从正态分布且相互独立相互独立 b b1 1也服从正态分布也服从正态分布 第九章一元线性回归第九章一元线性回归2021/8/22419.5.1 b9.5.1 b1 1的抽样分布的抽样分布以下可以证明以下可以证明niiXXb12212)()(b b1 1的方差的方差第九章一元线性回归第九章一元线性回归2021/8/22429.5.1 b9.5

23、.1 b1 1的抽样分布的抽样分布证明:证明:因为因为 niiiYCb11且且Y Yi i相互独立,其中相互独立,其中 niiiiXXXXC12)(niiniiiniiiXXYCYCb1221221212)()()()(所以,所以,b b1 1服从服从 )(,(1221niiXXN第九章一元线性回归第九章一元线性回归2021/8/22439.5.2 F 9.5.2 F 检验检验在一元线性回归中,为了检验在一元线性回归中,为了检验Y Y对于对于X X线性线性关系的统计显著性,对关系的统计显著性,对1 1进行进行F F检验检验1 1)提出假设:)提出假设:H H0 0:1 1=0=0,H H1 1

24、:1 100。 2 2) 构造并计算统计量构造并计算统计量:ERfSSEfSSRF 3 3)查)查F F分布临界值表,得临界值分布临界值表,得临界值)2, 1 (nF4 4)比较:)比较: 接受接受H H0 0,认为,认为Y Y与与X X不存在一元线性关系。不存在一元线性关系。) 2, 1 (nFF第九章一元线性回归第九章一元线性回归2021/8/22449.5.2 F 9.5.2 F 检验检验若若F F )2, 1(nF拒绝拒绝H H0 0,认为,认为Y Y与与X X存在一元线性关系。存在一元线性关系。 表表9-1 9-1 方差分析表方差分析表第九章一元线性回归第九章一元线性回归2021/8

25、/22459.5.39.5.3 t t 检验检验 1 1)提出假设)提出假设 H H0 0: : H H1 1: : 01012 2)构造并计算统计量)构造并计算统计量 步步 骤:骤:)(11bsbt 21)()(XXMSEbsi3 3)查)查t t分布临界值表分布临界值表 得临界值得临界值 )2(2/nt第九章一元线性回归第九章一元线性回归2021/8/22469.5.39.5.3 t t 检验检验4 4)比较)比较若若 ,接受,接受H H0 0 t)2(2/nt若若 ,拒绝,拒绝H H0 0 t)2(2/nt第九章一元线性回归第九章一元线性回归2021/8/22479.5.4 9.5.4

26、利用样本相关系数进行统计检验利用样本相关系数进行统计检验 步步 骤:骤:1 1)提出假设)提出假设 H H0 0: : =0 =0H H1 1: : 02 2)计算简单相关系数)计算简单相关系数r r 3 3)查)查相关系数相关系数临界值表临界值表 得临界值得临界值 )2( nr是总体是总体Y Y与与X X的线性的线性相关系数相关系数第九章一元线性回归第九章一元线性回归2021/8/22489.5.4 9.5.4 利用样本相关系数进行统计检验利用样本相关系数进行统计检验4 4)比较)比较若若 ,接受,接受H H0 0 rr若若 ,拒绝,拒绝H H0 0 rr第九章一元线性回归第九章一元线性回归

27、2021/8/2249例题例题 某市欲对货运总量与工业总产值的数量关系进行研究,某市欲对货运总量与工业总产值的数量关系进行研究,以便通过工业总产值预测货运总量。现将以便通过工业总产值预测货运总量。现将2001-20102001-2010年年的数据,列入下表:的数据,列入下表: 画出相应的统计图,根据这些数据建立相应回归方程。画出相应的统计图,根据这些数据建立相应回归方程。 计算说明工业总产值与货运总量之间是否线性相关及计算说明工业总产值与货运总量之间是否线性相关及相关程度。相关程度。 对所求得的回归方程进行线性显著性检验。对所求得的回归方程进行线性显著性检验。=0.05=0.05 对计算得出的

28、回归系数进行检验。对计算得出的回归系数进行检验。 当工业总产值为当工业总产值为500500亿元,置信度为亿元,置信度为1-=0.951-=0.95时,预时,预测货运总量测货运总量Y Y0 0的双侧置信区间。的双侧置信区间。第九章一元线性回归第九章一元线性回归2021/8/2250课堂练习课堂练习 某厂要建立产量与单位成本数量关系模型,现收集了某厂要建立产量与单位成本数量关系模型,现收集了2 2000-2011000-2011年产量与单位成本的资料,如下表:年产量与单位成本的资料,如下表: 根据这些资料说明产量与单位成本的数量关系。根据这些资料说明产量与单位成本的数量关系。 对所求得的回归方程进行线性显著性检验。对所求得的回归方程进行线性显著性检验。=0.05=0.05 对计算得出的回归系数进行检验。对计算得出的回归系数进行检验。 假设假设20122012年的计划产量为年的计划产量为28002800件,预测单位成本的件,预测单位成本的95%95%的置信区间。的置信区间。第九章一元线性回归第九章一元线性回归2021/8/22519.6 9.6 模型适合性分析模型适合性分析 在对一元线性回归模型的适合性进行分析时在对一元线性回归模型的适合性进行分析时,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论