第3章多元线性回归方法_第1页
第3章多元线性回归方法_第2页
第3章多元线性回归方法_第3页
第3章多元线性回归方法_第4页
第3章多元线性回归方法_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3章:多元线性回归方法3.1模型的设定形式及经济含义 多元线性回归模型的基本形式为 (3-2-1)设置该类模型的目的在于,测度解释变量对因变量的影响,并假定这种影响是线性的,即满足的条件。模型中的变量被称为控制变量,而且这些控制变量对因变量的影响也假定是线性的。在测度解释变量对因变量的影响时,如果模型中不引入比较充足的控制变量的话,我们很难正确估计对因变量的真实影响,而且模型也很难满足基本假定,且样本回归方程的拟合优度也会较低。所以,在实际应用研究中,一元线性回归模型很少用到。 模型中每个回归系数的经济含义可以解释为在其它因素(变量)不变的条件下,变量没变动一个单位,因变量一定会变动个单位。

2、 在一个广义的多元线性回归模型中,比如 (3-2-2)中,回归系数的经济含义就会不同。由 (3-2-3)我们可以推之的经济含义是弹性系数,可解释为在其它因素(变量)不变的条件下,变量每变动百分之一,因变量一定会变动百分之。3.2模型的估计方法及前提假定 在模型满足基本假定的条件下,用普通最小二乘法(OLS)可以得到多元线性回归模型的无偏、有效、一致性估计。估计公式用矩阵公式表达为: (3-2-4)其中: (3-2-5)3.3模型的拟合优度检验可以用定义样本决定系数,具体计算样本回归方程的拟合优度,其定义式为: (3-2-6)具体计算式为: (3-2-7)且。但在用样本决定系数衡量和比较不同的多

3、元回归方程的拟合优度时,会面临两个问题:一是,样本容量大的,TSS会增加;二是,解释变量多的,RSS会减小。所以,为使解释变量个数和样本容量不同的使用最小二乘法则估计的回归方程之间的有可比性,最好使用校正决定系数: (3-3-8)3.4模型的统计/显著性检验对单个总体参数的假设检验:t检验在这种检验中,我们需要对模型中的某个(总体)参数是否满足虚拟假设:,做出具有统计意义(即带有一定的置信度)的检验,其中为某个给定的已知数。特别是,当=0时,称为参数的显著性检验。如果拒绝,说明解释变量对被解释变量具有显著的线性影响,估计值才敢使用;反之,说明解释变量对被解释变量不具有显著的线性影响,估计值对我

4、们就没有意义。具体检验方法如下:(1) 给定虚拟假设 :;(2) 计算统计量 的数值;(3) 在给定的显著水平下(不能大于即10%,也即我们不能在置信度小于90%以下的前提下做结论),查出双尾t()分布的临界值;(4) 如果出现 的情况,检验结论为拒绝;反之,无法拒绝。 检验方法的关键是统计量 必须服从已知的分布函数。什么情况或条件下才会这样呢?这需要我们建立的模型满足如下的条件(或假定):(1) 随机抽样性。我们有一个含次观测的随机样本。这保证了误差自身的随机性,即无自相关性,。(2) 条件期望值为0。给定解释变量的任何值,误差的期望值为零。即有 这也保证了误差独立于解释变量,即模型中的解释

5、变量是外生性的,也使得。(3) 不存在完全共线性。在样本因而在总体中,没有一个解释变量是常数,解释变量之间也不存在严格的线性关系。(4) 同方差性。 (5) 正态性。误差满足 。在以上5个前提下,才可以推导出: 由此可见, 检验方法所要求的条件是极为苛刻的。对参数的一个线性组合的假设的检验需要检验的虚拟假设为 :。比如。无法直接检验。设立新参数。原虚拟假设等价于:。将代入原模型后得出新模型: (3-2-9)在模型(3-2-9)中再利用检验方法检验虚拟假设:。我们甚至还可以检验这样一个更一般的假设:t统计量为 对参数多个线性约束的假设检验:F检验需要检验的虚拟假设为 :。该假设对模型 (3-2-

6、1)施加了个排除性约束。模型 (3-2-1)在该约束下转变为如下的新模型: (3-2-10)模型(3-2-1)称为不受约束(ur)的模型,而模型(3-2-10)称为受约束(r)的模型。模型(3-2-10)也称为模型(3-2-1)的嵌套模型,或子模型。分别用OLS方法估计模型后,可以计算出如下的统计量:关键在于,不需要满足t检验所需要的假定(3),统计量F就满足:。利用已知的F分布函数,我们就可以拒绝或接受虚拟假设 :了。所以,一般来讲,F检验比t检验更先使用,用的更普遍,可信度更高。利用关系式,F统计量还可以写成:对回归模型整体显著性的检验:F检验需要检验的虚拟假设为 :。相当于前一个检验问题

7、的特例,。嵌套模型变为 。,。F统计量变为: 检验一般的线性约束需要检验的虚拟假设比如为 :。受约束模型变为: 再变形为:。F统计量只可用: 其中,。检验两个数据集的回归系数是否相等:皱(至庄)检验 虚拟假定是回归系数的真值相等。步骤如下:(1) 基于两组样本数据,进行相同设定的回归,将二者的RSS分别记为和。(2) 将两组样本数据合并,基于合并的样本数据,进行相同设定的回归,将回归的RSS记为。(3) 计算下面的F统计量: (4) 如果,拒绝原假定。非正态假定下多个线性约束的大样本假设检验:LM(拉格郎日乘数)检验F检验方法需要模型(1)中的满足正态性假定。在不满足正态性假定时,在大样本条件

8、下,可以使用LM统计量。虚拟假设依然是:。LM统计量仅要求对受约束模型的估计。具体步骤如下:()将对施加限制后的解释变量进行回归,并保留残差。即我们要进行了如下的回归估计 ()将对所有解释变量进行辅助回归,即进行如下回归估计 并得到R-平方,记为。()计算统计量 。()将与分布中适当的临界值比较。如果,就拒绝虚拟假设;否则,就不能拒绝虚拟假设。模型函数形式误设问题的一般检验:RESET如果一个多元回归模型没有正确地解释被解释变量与所观察到的解释变量之间的关系,那它就存在函数形式误设的问题。误设可以表现为两种形式:模型中遗漏了对被解释变量有系统性影响的解释变量;错误地设定了一个模型的函数形式。在

9、侦察一般的函数形式误设方面,拉姆齐(Ramsey,1969)的回归设定误差检验(regression specilfication error test , RESET)是一种常用的方法。RESET背后的思想相当简单。如果原模型(1)满足经典假定(3),那么在模型(1)中添加解释变量的非线性关系应该是不显著的。尽管这样做通常能侦察出函数形式误设,但如果原模型中有许多解释变量,它又有使用掉大量自由度的缺陷。另外,非线性关系的形式也是多种多样的。RESET则是在模型(1)中添加模型(1)的OLS拟合值的多项式,以侦察函数形式误设的一般形式。为了实施RESET,我们必须决定在一个扩大的回归模型中包括

10、多少个拟合值的函数。虽然对这个问题没有正确的答案,但在大多数应用研究中,都表明平方项和三次项很有用。令表示从模型(1)所得到的OLS估计值。考虑扩大的模型 (4)这个模型看起来有些奇怪,因为原估计的拟合值的函数现在却出作为解释变量出现。实际上,我们对模型(4)的参数估计并不感兴趣,我们只是利用这个模型来检验模型(1)是否遗漏掉了重要的非线性关系。记住,和都只是的非线性函数。 对模型(4),我们检验虚拟假设。这时,模型(4)是无约束模型,模型(1)是受约束模型。计算F统计量。需要查分布表。拒绝,模型(1)存在误设,否则,不存在误设。利用非嵌套模型检验函数形式误设寻求对函数形式误设的其他类型(比如

11、,试图决定某一解释变量究竟应以水平值形式还是对数形式出现)作出检验,需要离开经典假设检验的辖域。有可能要相对模型 (5)检验模型(1),或者把两个模型反过来。然而,它们是非嵌套的,所以我们不能仅使用标准的F检验。有两种不同的方法。一种方法由Mizon and Richard (1986)提出,构造一个综合模型,将每个模型作为一个特殊情形而包含其中,然后检验导致每个模型的约束。对于模型(1)和模型(5)而言,综合模型就是 (6)可以先检验,作为对模型(1)的检验。也可以通过对检验,作为对模型(5)的检验。另一种方法由Davison and MacKinnon (1981)提出。认为,如果模型(1

12、)是正确的,那么从模型(5)得到的拟合值在模型(1)中应该是不显著的。因此,为了检验模型(1)的正确性,首先用OLS估计模型(5)以得到拟合值,并记为。在新模型 (7)中计算的t统计量,利用t检验拒绝或接受假定。显著的t统计量就是拒绝模型(1)的证据。类似的,为了检验模型(5)的正确性,首先用OLS估计模型(1)以得到拟合值,并记为。在新模型 (8)中计算的t统计量,利用t检验拒绝或接受假定。以上两种检验方法可以用于检验任意两个具有相同的被解释变量的非嵌套模型。非嵌套检验存在一些问题。首先,不一定会出现一个明显好的模型。两个模型可能都被拒绝,也可能没有一个被拒绝。在后一种情形中,我们可以使用调

13、整的R-平方进行选择。如果两个模型都被拒绝,则有更多的工作要做。不过,重要的是知道使用这种或那种函数形式的后果,如果关键性解释变量对被解释变量的影响没有多大差异,那么使用那个模型实际上并不要紧。第二个问题是,比如说使用Davison and MacKinnon 检验拒绝了模型(5),这并不意味着模型(1)就是正确的模型。模型(5)可能会因为多种误设的函数形式而被拒绝。一个更为可能的问题是,在解释变量不同的模型之间进行比较时,如何实施非嵌套检验。一个典型的情况是,一个解释变量是,一个解释变量是。使用调整的R-平方进行比较,需要小心从事。3.5案例分析【案例5-1】现代投资分析的特征线涉及如下回归

14、方程:;其中:r表示股票或债券的收益率;表示有价证券的收益率(用市场指数表示,如标准普尔500指数);t表示时间。在投资分析中,1被称为债券的安全系数,是用来度量市场的风险程度的,即市场的发展对公司的财产有何影响。依据19561976年间240个月的数据,Fogler和Ganpathy得到IBM股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数,括号内为标准差: (0.3001) (0.0728) 请问:(1)解释回归参数的意义;(2)如何解释R2值?(3)安全系数1的证券称为不稳定证券,建立适当的零假设及备选假设,并用t检验进行检验(=5%)。 【案例5-2】现有工资和教育的回归方

15、程其中wage以小时计的工资,单位为元,educ表示受教育的年限,单位为年。请问:(1)解释各参数值的经济学意义。(2)如果被解释变量,小时工资的计量单位由元改为百元,估计的截距项和斜率项有无变化?(3)如果(只是)解释变量,教育水平的计量改为月,估计的截距项和斜率项有无变化? 【案例5-3】考虑一个工资模型:。我们关心的是,工作一年是否比的上在大学的一年?问题:如何检验该假设? 【案例5-4】考虑一个选举模型:。其中,voteA是A得到的选票,exA,exB分别是两个不同党派的候选人的竞选支出。我们关心的是,A的竞选支出是否会被B的竞选支出所抵消?请问如何检验该假设? 【案例5-5】某地区通

16、过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为:其中,Y为劳动者受教育年数,X1为该劳动者家庭中兄弟姐妹的人数,X2与X3分别为母亲与父亲受教育的年数。请问:(1)X1与X2和X3是否存在相关性?为什么?(2)X2与X3保持不变,为使预测的受教育水平减少一年,需要X1增加多少?请对X2 和X3的系数给予适当的解释。(3)如果两个劳动者都没有兄弟姐妹,但其中一个人的父母受教育年数为12和12,另一个父母受教育年数为16和16。则两人受教育的年数预期相差多少? 【案例5-6】设咖啡的需求函数为其中Y为咖啡的需求量,P1为咖啡的价格,P2为茶叶的价格,P3为白糖的价格,为消费者收入

17、。请问:(1)模型中那些参数表示自价格弹性?那些表示交叉价格弹性?那些表示收入弹性?(2)试对参数的正负符号作出判断,并说明理由。 【案例5-7】假设要求你建立一个计量经济模型来说明学校跑道上慢跑一英里或以上的人数,以便决定是否修建第二条跑道以满足所有锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:方程A:方程B:其中,Y每天慢跑者的人数,X1该天降雨的英寸数,X2=该天日照的小时数,X3该天的最高温度;X4=第二天需交学期论文的班级数。这两个方程你认为那个更合理些,为什么? 【案例5-8】考虑一个俱乐部棒球运动员的薪水模型:其中:salary年薪水,year加入俱乐部的年资,gamesyr平均每年比赛次数,bavg为平均职业击球次数,hrunsyr为平均每年本垒打次数,rbisyr每年击球跑垒得分。(1) 解释模型中各个参数的经济含义。(2) 假设我们想检验的虚拟假设是,一旦控制了俱乐部的年资和每年的比赛次数,度量球员表现的统计指标(bavg, hrunsyr和rbisyr)对薪水没有影响。请写出虚拟假设和备择假

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论