计量经济学20130412_第1页
计量经济学20130412_第2页
计量经济学20130412_第3页
计量经济学20130412_第4页
计量经济学20130412_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四讲 异方差一、 为什么要关注异方差问题?对于模型,同方差假定即:。在实践中这个假定经常被违背,即出现异方差问题。例一,在上述模型中,如果y代表消费,x代表收入,则给定收入,消费的期望值,而实际消费y将分布在这个期望值左右。对于高收入家庭,由于其可以选择高消费也可以选择低消费,因此关于实际消费量的不确定性较大;但对于低收入家庭,由于在消费上选择余地小,因此关于实际消费量的不确定性也较小。给定收入,我们可用y的方差来衡量消费的不确定性。注意到,而按照前面的分析,随着收入增加而递增,因此也是收入的增函数,而不会是一个常数。例二,在上述模型中,如果y代表班级在计量经济学考试上的平均成绩,x代表这门

2、课任课老师的授课时间。按照基本的统计学知识,大班级的平均成绩波动应该小于小班级的平均成绩波动。在这个例子中,随着班级规模的增加而递减,不会是一个常数。注意到班级规模在这里并不是模型中的解释变量。笔记:在例二中,我们不仅要注意到异方差问题,还要注意到解释变量遗漏问题。一个被遗漏的变量是学生平均能力。学生平均能力与平均成绩正相关,当授课时间与平均能力负相关时,则OLS估计平均来看将低估授课时间对平均成绩的正向作用。异方差问题是普遍的,尤其对横截面数据而言。然而如果异方差问题不会导致严重后果,那么关注这个问题的意义就不大。异方差问题到底会产生什么样的后果呢?(一) 理论意义上的后果在证明高斯-马尔科

3、夫定理时,我们仅仅在证明OLS估计量具有有效性时涉及到了同方差假定,而在证明线性、无偏性并没有用到该假定,因此异方差并不影响OLS估计量所具有的线性与无偏性这两个性质(实际上也不影响OLS估计量的一致性,一致性只涉及到高斯-马尔科夫假定一、二、三),而只影响OLS估计量的有效性。具体来说,当异方差问题存在时,在所有线性无偏估计量中,OLS估计量再也不是最有效的估计量了。换句话说,还有其他线性无偏估计量其估计精度要高于OLS估计量。直觉上如何理解这一点?注意到在进行模型估计时,如果利用的信息越多,则估计精度将越高。异方差本身是信息,如果在模型估计时利用这个信息而不是像OLS估计那样不考虑异方差信

4、息,则模型估计的有效性将提高。本章后面我们将介绍如何利用异方差信息进行模型估计。(二) 实践意义上的后果计量软件包在默认状态下总是认为同方差假定成立,进而依据一些常规公式来计算参数估计的标准误。例如,在默认状态下标准误的计算公式是,其中是对误差方差的估计。然而我们知道,在序列无关假定下,有:在同方差假定下,进而有:如果同方差假定不成立,则故试图以来估计从而达到估计的目的显然是错误的。因此,异方差问题在实践意义上的后果就是,计量软件包在默认状态下计算出的参数估计量的标准误是无意义的,进而基于这种标准误所进行的假设检验也是无意义的。笔记:当误差项具有异方差性时,误差项的方差随着脚标i 的变化而发生

5、变化。如果用去估计误差方差,这必然是误导的,因为给定样本,这个估计量的值是一个常数,其不会随着脚标i 的变化而发生变化。 (三) 哪一种后果更值得重视?就统计推断而言,实践意义上的后果是致命的,因为基于错误标准误所进行的假设检验毫无意义。我们能不能获得正确的标准误?在大样本下,这个问题可以解决,因为White(1980)证明,的一个一致估计量是,我们把称为White稳健标准误。在大样本下,我们可以基于White稳健标准误进行统计推断。笔记:1、在异方差情况下,每一个误差项可能有不同的方差,而每一个误差项又只有一个残差观测值相对应。仅仅依靠唯一的残差观测值是无法对误差项方差进行一致性估计的。然而

6、我们的目的是估计而不是估计。White(1980)发现,如果用残差的平方代替误差的方差,则是对的一致估计。2、在实际应用中,White稳健标准误往往还进行自由度调整,例如一种调整方式是。 不幸的是,在小样本下,我们再也不能利用稳健标准误了。那么当出现异方差问题时,小样本下的统计推断如何进行?一个解决办法是利用异方差信息把原模型转化为同方差模型再进行OLS估计,这一方面提高了估计精度,另一方面也使得统计推断是正确的。然而,异方差信息往往并不那么精确。例如,在例一中,我们知道是收入的增函数,但我们并不知道具体的函数形式。因此,小样本情况下异方差问题的解决是非常困难的。就估计精度而言,理论意义上的后

7、果在大样本下是不重要的。因为OLS估计量是一致估计量,当样本容量足够大时,OLS估计仍然会达到很高的精度。理论意义上的后果在小样本下是重要的。然而我们知道,提高估计精度需要利用异方差信息,而异方差信息往往并不那么精确,从而这给提高估计精度带来了挑战。总而言之,在大样本情况下,异方差问题在理论意义和实践意义上的后果是容易处理的;在小样本情况下,异方差问题才是真正的挑战。二、 发现异方差(一)图示法图示法是非正规的方法。以例一为例,我们或许得到如下的散点图: 图一 异方差情况下的散点图 在图一中,随着x的增加,y看起来越来越离散。因此我们把图一视为异方差存在的证据。笔记:1、纵坐标可以是残差;如果

8、是多元线性回归,则横坐标可以是y的拟合值。2、应该注意的是,如果第一个高斯-马尔科夫假定被违背,即模型设定有误,那么也可能出现异方差症状。例如,假定在简单线性回归模型中y是工资,x是受教育程度。如果受教育程度对工资的影响存在性别差异,则在模型中斜率参数并不是常数。此时如果对工资和受教育程度描图,则我们可能发现异方差症状。事实上在很多情况下,异方差症状被认为是模型错误设定的一个表现。如果产生异方差症状的原因是模型设定有误,那么我们首先应该要做的事情是正确设定模型,而不是基于错误设定的模型来解决异方差问题。在本讲中,当我们考虑异方差问题时,我们假定其他所有的高斯-马尔科夫假定成立,此时的异方差可以

9、称为纯粹的异方差。而模型设定有误带来的异方差症状被称为非纯粹的异方差。(二)Breusch-Pagan检验该方法假定误差项的方差是一些变量的线性函数(这些变量可以是解释变量也可以不是解释变量),即定义,则上式是一个回归模型,然而一个问题是误差项平方作为被解释变量是不可观测的。为克服这个问题,我们用残差的平方来代替误差的平方,从而得到一个可操作的回归模型即辅助回归模型:在上述回归模型基础上,我们对原假设进行假设检验,如果拒绝原假设,则我们认为存在异方差问题,反之则相反。在检验上述原假设时,被利用的统计量是拉格朗日乘数(LM)统计量:在这里,N是样本容量,是辅助回归模型的判定系数。当原假设为真时,

10、渐进服从自由度为s的卡方分布。既然提到渐进二字,于是我们知道上述检验属于大样本检验。 对于Breusch-Pagan检验,我们或许会问如下一些问题:第一,为什么不直接用F检验而是首选LM检验呢?这是因为,我们用残差的平方来代替方差从而得到辅助回归模型。当原假设为真时,的分布在大样本情况下与足够近似,而与F分布的近似却不够好。不过,利用F检验也是渐进合理的,见Wooldridge(fourth edition,p.275)。第二,为什么渐进服从自由度为s的卡方分布?这是因为:当原假设为真时,近似为零;当样本容量很大时,近似为。于是 第三,Breusch-Pagan检验假定误差项方差是一些变量的线

11、性函数。这个假定合理吗?这个假定并不一定合理,然而令人惊讶的是,即使误差项方差是一些变量的非线性函数,但Breusch-Pagan检验仍然有效(Hill,Griffiths and Lim,fourth edition,p.305)。(三)White检验Breusch-Pagan检验要求我们预先确定这些变量,而有时这是困难的。在White检验下,解释变量的水平项、平方项与交互项被用来代替这些变量。例如,假如我们要检验模型:是否存在异方差问题,则我们可以建立如下辅助回归模型:然后检验原假设。我们仍然使用LM统计量,在这。当样本容量不够大时,辅助模型中的交互项有时不得不被省略以节约自由度。不过有文

12、献指出,若White检验没有出现交叉项,则是纯粹的异方差检验,若出现了交叉项,则该检验既是异方差检验又是模型设定偏误检验,见Gujarati(fourth edition,p.414)。另外,为了解决在估计辅助回归时可能面临的自由度不足问题,Wooldridge(fourth edition,p.275)建议建立辅助模型:然后再利用LM或者F检验来检验原假设:。与Breusch-Pagan检验相比,在White检验中,误差方差到底是哪些变量的函数这样的先验信息是不需要的。这一点是White检验的优势所在。然而事物往往具有两面性,由于White检验几乎没有利用任何有关异方差的先验信息,结果导致该

13、检验的势很低,即很容易不拒绝错误的原假设。正因如此,当White检验表明不拒绝同方差的原假设时,我们应该对该结果保持足够的警惕。另一方面,当White检验表明拒绝同方差的原假设时,我们可以认为这是异方差存在的强烈证据。笔记:1、理解White检验的一个简单方法是,首先假设误差方差是解释变量的一个连续可微函数,然而函数形式未知。然后对这个函数进行二阶泰勒展开,则该函数将被近似表达为解释变量、解释变量平方及其交叉项的线性函数。2、White检验法是普适的。普适的方法往往也是粗糙的。3、一个高度近视的人没有发现一只小蚂蚁是非常可能的,然而,如果他竟然也发现了一只蚂蚁,那么那只蚂蚁很可能还不小。(四)

14、Goldfeld-Quandt检验情景一:样本可以分割为两个子样本。在每一个子样本中,误差项是同方差的,但不同子样本所对应的误差项方差可能是不同的。在此种情景下,首先建立原假设:两个子样本所对应的误差项方差相同,然后构建F统计量:在这里与分别是利用子样本1和子样本2进行回归得到的残差平方和;与分别是利用子样本1和子样本2的样本容量;是同方差情况下误差项的方差。当经典线性模型假定成立时,有:在显著水平a下,如果计算的F值大于Fa/2或者小于F1-a/2,则拒绝原假设。笔记:1、当误差项不服从正态分布或者误差项序列相关时,与并不服从卡方分布,从而所构建的F统计量并不服从F分布。因此,在利用Gold

15、feld-Quandt检验法之前,误差项是否服从正态分布和误差项是否序列无关应该先检验,如果误差项不服从正态分布或者误差项序列相关,则Goldfeld-Quandt检验无效。对于大样本而言,误差项是否服从正态分布并不重要,但误差项仍需序列无关。事实上Breusch-Pagan检验与White检验也需误差项序列无关假设成立(White稳健标准误的使用也需这个假设)。因此严格说来,误差项序列相关应该先于异方差检验进行。只有当序列相关问题得到解决后,才能进行White检验。然而在实践中,对于随机抽样的横截面数据,序列相关问题在理论上是不存在的,此时我们主要关注异方差问题。但对于时间序列数据,序列相关

16、问题就值得重视了。不过对于平稳时间序列,异方差问题在理论上是不存在的(参见本讲义第五讲)。2、在原假设为真时,与都是对的无偏、一致估计,故两者相差应该不大,因此此时F与1近似。这也解释了为何在这里的F检验是一个双尾检验。3、在构建F统计量时,一些人习惯先比较与的大小,然后把两者中较大的一个作为分子,较小的一个作为分母。在显著水平下,注意此时的拒绝域是而不是。情景二:误差方差可能是某个变量Z的函数。Goldfeld-Quandt检验的步骤是:1、对N个观测值按z升序排列,并抛弃中间的N-2N*个观测值,形成两个容量都为N*的子样本;2、就两个子样本分别进行回归,记RSS1、RSS2分别为两次回归

17、的残差平方和。3、计算RSS2/RSS1。在同方差的原假设下有:在显著水平a下,如果计算的F值大于Fa/2或者小于F1-a/2,则拒绝原假设。笔记:1、为了提高检验的势,即降低不拒绝错误原假设的概率,中间被抛弃的观测值数目约为总样本容量的3/8,以使如果存在异方差,则RSS1与RSS2的差异显得更明显。2、如果我们认为误差方差可能是某个变量Z的增函数,则上述检验就修正为单尾检验。在显著水平a下,如果计算的F值大于Fa则拒绝原假设。三、 利用异方差信息提高估计精度情景一:异方差的函数形式已知对于线性模型,假定异方差形式已知:,则原模型可转化为:现在,因此,转换后的模型满足同方差假定,于是得到所谓

18、的加权最小二乘估计量(WLS)为什么称为WLS?对转化后的模型利用OLS,即求:也即由于,因此上式不过是使加权残差的平方和最小。不难发现,越大,则相应的权重越小。WLS是广义最小二乘法(GLS)的一个特例。关于GLS可参见第五讲附录。笔记:关于WLS的直觉。是我们所关注的总体回归函数,然而我们无法确定它,因为它包含了未知的真实参数。我们的任务是,利用观测值拟合一条直线以近似总体回归函数。假设与对应的误差项其方差很大,则很可能偏离较远。从而在使残差平方和最小的过程中,点很可能造成样本回归直线与总体回归函数相去甚远。为了降低这种可能性,一个简单的办法是,在样本中删除观测值。然而,这种办法并不是好办法,因为平均来看,将落在总体回归函数上(这也解释了异方差为何不影响估计量的无偏性)。换句话说,还是具有一定的信息价值,而删除它意味着我们未充分利用信息。假设与对应的误差项其方差较小,则与相比较,在估计总体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论