计量经济学序列相关性_第1页
计量经济学序列相关性_第2页
计量经济学序列相关性_第3页
计量经济学序列相关性_第4页
计量经济学序列相关性_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量经济学序列相关性第一页,共六十四页,编辑于2023年,星期五第七章序列相关性◆学习目的通过本章的学习,你可以知道什么是序列相关性,序列相关性产生的原因是什么,序列相关性导致什么样的后果,怎样检验和处理具有序列相关性的模型。◆基本要求1)掌握序列相关性的概念、序列相关性的后果和检验方法;2)了解广义最小二乘法和广义差分法原理;3)能运用广义差分法和广义最小二乘法估计线性回归模型。第二页,共六十四页,编辑于2023年,星期五◆序列相关性及其产生原因◆

序列相关性的影响◆序列相关性的检验◆序列相关的补救第七章序列相关性第三页,共六十四页,编辑于2023年,星期五第一节序列相关性及其产生原因—、序列相关性的含义对于多元线性回归模型(7-1)在其他假设仍然成立的条件下,随机干扰项序列相关意味着如果仅存在则称为一阶序列相关或自相关(简写为AR(1)),这是常见的一种序列相关问题。(7-3)(7-2)第四页,共六十四页,编辑于2023年,星期五自相关往往可以写成如下形式:(7-4)其中称为自协方差系数或一阶自回归系数,是满足以下标准OLS假定的随机干扰项:

由于序列相关性经常出现在以时间序列数据为样本的模型中,因此,本节下面将代表不同样本点的下表i用t

表示。第五页,共六十四页,编辑于2023年,星期五二、序列相关的原因1.经济数据序列惯性2.模型设定的偏误3.滞后效应4.蛛网现象5.数据的编造第六页,共六十四页,编辑于2023年,星期五1.经济数据序列惯性

GDP、价格指数、消费等时间序列数据通常表现为周期循环。当经济衰退的谷底开始复苏时,大多数经济序列开始上升,在上升期间,序列在每一时刻的值都高于前一时刻的值。看来有一种内在的动力驱使这一势头继续下去,直至某些情况出现(如利率或税收提高)才把它拖慢下来。因此,在涉及时间序列的回归中,相继的观测值很可能是相互依赖的。比如:第七页,共六十四页,编辑于2023年,星期五2.模型设定的偏误定义:指所设定的模型“不正确”,主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例1:本来应该估计的模型为(7-5)但在进行回归时,却把模型设定为如下形式:

7-6)(丢掉了重要的解释变量)第八页,共六十四页,编辑于2023年,星期五2.模型设定的偏误定义:指所设定的模型“不正确”,主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例2:(模型函数形式有偏误)(7-7)在成本—产出研究中,如果真实的边际成本的模型为:其中Y代表边际成本,X代表产出。(7-8)但是如果建模时设立了如下回归模型:第九页,共六十四页,编辑于2023年,星期五3.滞后效应考虑一个消费支出对收入进行回归的时间序列模型,人们常常发现当期的消费支出除了依赖其他当期收入外,还依赖前期的消费支出,即回归模型为:(7-9)其中,C是消费,Y是收入。

类似(7-9)式的回归模型被称为自回归模型

由于心理上、技术上以及制度上的原因,消费者不会轻易改变其消费习惯,如果我们忽视(7-9)式中的滞后消费对当前消费的影响,那所带来的误差项就会体现出一种系统性的模式。注意:第十页,共六十四页,编辑于2023年,星期五4.蛛网现象例如:假定某农产品的供给模型为:

(7-10)假设t时期的价格Pt低于t-1时期的价格Pt-1,农民就很可能决定在时期t+1生产比t时期更少的东西。显然在这种情形中,农民由于在年度t的过量生产很可能在年度t+1消减他们的产量。诸如此类的现象,就不能期望干扰μt是随机,从而出现蛛网式的序列相关。第十一页,共六十四页,编辑于2023年,星期五5.数据的编造新生成的数据与原数据间就有了内在的联系,表现出序列相关性。例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动而引进了数据中的匀滑性,这种匀滑性本身就能使随机干扰项中出现系统性的因素,从而出现序列相关性。利用数据的内插或外推技术构造的数据也会呈现某种系统性的模式。一般经验表明,对于采用时间序列数据做样本的计量经济学模型,由于在不同样本点上解释变量意外的其他因素在时间上的连续性,带来了他们对被解释变量的影响的连续性,所以往往存在序列相关性。第十二页,共六十四页,编辑于2023年,星期五第二节序列相关性的影响1.参数估计量非有效2.随机误差项方差估计量是有偏的3.拟合优度检验R2统计量和方程显著性检验F统计量无效4.变量的显著性检验t检验统计量和相应的参数置信区间估计失去意义5.模型的预测失效第十三页,共六十四页,编辑于2023年,星期五1.参数估计量非有效

根据OLS估计中关于参数估计量的无偏性和有效性的证明过程可以看出,当计量经济学模型出现序列相关性时,其OLS参数估计量仍然具有线性无偏性,但不具有有效性。因为在有效性证明中我们利用了(7-11)即同方差和相互独立性条件。而且在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。第十四页,共六十四页,编辑于2023年,星期五为了具体说明这一点,我们回到简单的一元回归模型(7-12)为方便我们不妨假定干扰项为(7-4)所示的一阶序列相关:

(7-13)

(7-14)对于干扰项为一阶序列相关的一元回归模型采用OLS估计,如以前一样,β1的OLS估计量为:第十五页,共六十四页,编辑于2023年,星期五但给定干扰项为一阶序列相关时,的方差估计量现在为:式中为一阶序列相关时的方差。(7-16)把该式与没有干扰项自相关情形的通常公式(7-15)相比,可以看出前者等于后者加上另一与自相关系数和各期的样本协方差有关的项。

第十六页,共六十四页,编辑于2023年,星期五2.随机误差项方差估计量是有偏的在存在干扰项序列相关的情况下,随机误差方差的OLS估计量偏离了真实的随机误差项的方差。

以一元回归模型为例,在经典假设情况下,干扰项的OLS方差估计量是真实的的无偏估计,即有。但若随机误差项存在一阶序列相关

则可以证明:式中为X的相继观测值之间的样本相关系数。

第十七页,共六十四页,编辑于2023年,星期五3.拟合优度检验R2统计量和方程显著性检验F统计量无效由于在序列相关时OLS对随机误差方差估计有偏,结果基于OLS残差平方和计算出来的拟合优度检验统计量R2也失去意义,相应的方程显著性检验统计量F统计量也无效。第十八页,共六十四页,编辑于2023年,星期五4.变量的显著性检验t检验统计量和相应的参数置信区间估计失去意义用OLS法估计序列相关的模型得到的随机误差项的方差不仅是有偏的,而且这一偏误也将传递到用OLS方法得到的参数估计量的方差中来,从而使得建立在OLS参数估计量方差基础上的变量显著性检验失去意义。没有被低估,通常OLS参数估计量的方差式(7-16)即使随机误差的方差也是存在一阶序列相关时参数估计量方差的偏误估计量。

以一元回归模型为例,第十九页,共六十四页,编辑于2023年,星期五5.模型的预测失效在存在序列相关时OLS估计的随机误差项方差有偏,参数估计量方差非有效,这样回归模型的被解释变量的预测值及预测区间就不准确,预测精度降低。

被解释变量预测值区间与模型参数和随机误差的估计量的方差有关。所以,当模型出现序列相关时,它的预测功能失效。第二十页,共六十四页,编辑于2023年,星期五第三节序列相关性的检验不同的检验方法的共同思路:

序列相关性的检验方法有多种,如冯诺曼比检验法、回归检验法、D.W.检验法等。首先采用普通最小二乘法估计模型,以得到随机干扰项的近似估计量,我们用表示近似估计量:(7-19)然后通过分析这些近似估计量之间的相关性以达到判断随机干扰项是否具有序列相关性的目的。第二十一页,共六十四页,编辑于2023年,星期五序列相关性的检验方法一、图示法二、回归检验法三、杜宾—沃森检验四、拉格朗日乘子检验第二十二页,共六十四页,编辑于2023年,星期五一、图示法由于残差可以作为随机误差的估计,因此,如果存在序列相关性,反映出来,因此可以利用的变化来判断随机干扰项的序列必然会由残差项相关性,如图7-1所示。第二十三页,共六十四页,编辑于2023年,星期五二、回归检验法,(7-20)(7-21)等为解释变量,以为解释变量,以各种可能的相关变量,诸如

,建立各种方程:对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。一旦确定了模型存在序列相关性,也就同时知道了相关的形式,而且它适用于任何类型的序列相关性问题的检验。优点:第二十四页,共六十四页,编辑于2023年,星期五三、杜宾—沃森检验

D-W检验是杜宾(J.Durbin)和沃森(G.S.Watson)于1951年提出的一种检验序列自相关的方法。虽然该方法很常用,但它有一些基本假定:(1)回归含有截距项。(2)解释变量X是非随机的,或者在重复抽样中被固定的。(3)随机干扰项为一阶自回归形式:。(4)回归模型中不应把滞后应变量作为解释变量之一,即不应出现如下形式模型:(5)没有缺失数据。第二十五页,共六十四页,编辑于2023年,星期五杜宾—沃森针对原假设,即不存在一阶自相关,构造如下统计量:(7-22)因为D.W.值要从中算出,而又依赖于给定的X的值。检验,它没有唯一的临界值可以导出拒绝或和下限,且这些上下限只与因此D-W检验不同于t、F或接受原假设。但他们成功导出了临界值的上限样本容量n和解释变量的个数有关,而与解释变量的取值无关。

杜宾—沃森证明该统计量的分布与出现在给定样本中的X值有复杂的关系,其准确的抽样或概率分布很难得到;

第二十六页,共六十四页,编辑于2023年,星期五因此,在运用D-W检验时,只须计算该统计量的值,再根据样本容量n和,然后按下列准则考察和解释变量数目k查D.W.分布表,得到临界值计算得到的D.W.值,以判断模型的自相关状态:若,则存在正自相关;若,则不确定;若,则无自相关;若,则不确定;若,则存在负自相关。也就是说,当D.W.值在2附近时,模型不存在一阶自相关。第二十七页,共六十四页,编辑于2023年,星期五例7-1给定一个含有50个观测值的样本和3个解释变量,如果(a)D.W.=1.05,(b)D.W.=1.40,(c)D.W.=2.50,(d)D.W.=3.97你能对自相关的问题说些什么??第二十八页,共六十四页,编辑于2023年,星期五解:根据D-W检验判断准则可知(b)D.W.=1.40<,随机误差项存在一阶正自相关;

(d)4

=2.58<D.W.=3.97,随机误差项存在负一阶自相关。查D.W.分布表可知,当样本数为n=50,解释变量数k=3时,在5%的为1.42,为1.67。

显著性水平下D.W.统计量临界值的下界(a)D.W.=1.05<

=1.42,因此随机误差项存在正一阶自相关;

(c)4=2.58>D.W.=2.50>4=2.33,不能确定随机误差项是否存在一阶自相关;第二十九页,共六十四页,编辑于2023年,星期五在许多情况下,人们发现上限差不多就是真实的显著性界限,因而,如果D.W.的估计值落入不能确定的区域,人们可以使用以下修正的D-W检验程序。给定显著性水平α:(2)原假设为,备择假设为(1)原假设为,备择假设为如果有,则在显著性水平α上拒绝原假设H0,接受备择假设H1,也就是存在统计上显著的正相关。如果有,则在显著性水平α上拒绝原假设H0,接受备择假设H1,也就是存在统计上显著的负相关。第三十页,共六十四页,编辑于2023年,星期五在许多情况下,人们发现上限差不多就是真实的显著性界限,因而,如果D.W.的估计值落入不能确定的区域,人们可以使用以下修正的D-W检验程序。给定显著性水平α:(3)原假设为,备择假设为如果有或者则在显著性水平α上拒绝原假设H0,接受备择假设H1,也就是存在统计上显著的自相关。第三十一页,共六十四页,编辑于2023年,星期五四、拉格朗日乘子检验拉格朗日乘子检验克服了D-W检验的缺陷,适合于高阶序列相关及模型中存在滞后被解释变量的情形。它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也称为GB检验。对于模型(7-24)如果要检验随机误差项是否存在p阶序列相关:(7-25)那么检验如下受约束回归方程就是拉格朗日乘子检验:(7-26)第三十二页,共六十四页,编辑于2023年,星期五约束条件为(7-27)

如果约束条件为真,则LM统计量服从大样本下自由度为p的渐近分布:(7-28)其中np和分别为如下辅助回归方程的样本容量和可决系数:(7-29)

(7-29)中的被解释变量是对原模型(7-24)进行OLS回归后得到的残差。

第三十三页,共六十四页,编辑于2023年,星期五

p值即滞后的长度无法预先给定,因此实践操作中可从1阶、2阶…逐次相更高阶检验,并用辅助回归方程(7-29)式中各个残差项前面的参数的显著性来帮助判断序列相关的阶数。(7-29)LM检验的一个缺陷第三十四页,共六十四页,编辑于2023年,星期五例7-2假定用32个样本做Y对X(包含截距)的回归而这样的数值对应的概率p为0.0003,这是一个很低的概率。

因此我们可以拒绝辅助回归方程中原始回归残差序列的全部1到5阶滞后序列系数均为零的假设,至少有一个滞后残差序列的系数不为零。这表明原始回归的残差中至少存在1到5阶中的某一滞后的自相关,当然要确定到底是几阶序列相关还必须进一步进行4阶、3阶…等不同阶数的拉格朗日乘子检验。如果我们怀疑回归残差序列有5阶滞后相关,那么辅助回归方程中我们可以用残差对X以及残差序列的1到5阶滞后序列进行回归,假定从辅助回归方程中回归得到的拟合优度R2为0.8860。

由于原始回归中有32个样本,而辅助回归中用了5个滞后值,这样辅助等于(32-5)×0.886即等于23.382。

回归方程中仅有27个样本,因此第三十五页,共六十四页,编辑于2023年,星期五第四节序列相关的补救由于序列相关出现时OLS估计量是非有效的,因此如果回归模型被证明存在序列相关性,则应该发展新的方法来估计模型。类似于处理异方差的情况,在大样本下我们也可以用与自相关相一致的OLS回归残差的方差协方差矩阵来处理随机误差项的自相关情况,这样OLS估计也仍然是有效的,只是我们需要报告相应的自相关稳健标准差和相应的统计量,其处理方法完全类似于异方差稳健推断,这里我们不再对自相关稳健推断详细论述,我们详细介绍一般情况下处理序列相关最常用的广义最小二乘法(GLS)和广义差分法。第三十六页,共六十四页,编辑于2023年,星期五一、广义最小二乘法定义:最具有普遍意义的最小二乘法.普通最小二乘法和加权最小二乘法是它的特例。

一般情况下,对于模型(7-30)如果存在序列相关性,同时存在异方差,即有第三十七页,共六十四页,编辑于2023年,星期五显然,是一对称矩阵,因此存在一可逆矩阵,使得用左乘(7-30)式两边,得到一个新的模型(7-31)即该模型具有同方差性和随机干扰项相互独立性。因为第三十八页,共六十四页,编辑于2023年,星期五则这就是原模型(7-30)式的广义最小二乘估计量,它是无偏有效的估计量。于是,可以用普通最小二乘法估计模型(7-31)式,记参数估计量为,由上面的推导过程可知,只要知道随机干扰项的方差-协方差矩阵,就可以采用广义最小二乘法得到参数的最佳线性无偏估计量。然而若只有n个样本点,要对包括各个在内的进行估计是困难的,在实践操作中,往往通过广义差分法来实现广义最小二乘估计。+k+1个未知参数第三十九页,共六十四页,编辑于2023年,星期五二、广义差分法广义差分法需要对随机干扰项自相关系数事先给出必要的假设,可区分为两种情形:自相关系数已知和未知。1)自相关系数已知时由于干扰项是不可观测的,关于序列相关的性质往往是一种猜测遵循形如(7-4)式那样的一阶自回归方式,或实际体验。实践中,常假定(7-32)即:(7-32)式中自回归系数和随机干扰项满足(7-4)的假定。若假定(7-32)是为已知时,序列相关问题就可以圆满解决。

真实的,当自相关系数第四十页,共六十四页,编辑于2023年,星期五为说明这一点,考虑以下多元回归模型为例:(7-33)如果(7-33)在时刻t成立,则在时刻t-1也成立,因此有:(7-34)用乘(7-34)两边,得到:(7-35)第四十一页,共六十四页,编辑于2023年,星期五(7-37)其中,由于满足全部OLS假定,故可以直接对方程(7-37)进行OLS回归得到具有BLUE性质的估计量。将(7-36)式简写为用(7-33)减去(7-35)得到(7-36)第四十二页,共六十四页,编辑于2023年,星期五更一般地如果多元回归模型(7-38)中的随机干扰项存在p阶序列相关:(7-39)那么可以将原模型(7-38)式变换为(7-40)(7-40)式即为多元回归形式的广义差分模型,该模型不存在序列相关性。第四十三页,共六十四页,编辑于2023年,星期五采用OLS法估计该模型得到的参数估计量即为原模型参数的无偏有效估计量,这样处理序列相关的方法就是广义差分法。广义差分法就是前面我们讨论过的广义最小二乘法(GLS),但应注意滞后的观测值被排除了。为看清这一点,我们仍然考虑前面的一阶序列相关的情况我们用矩阵形式把上述估计过程重写一遍。对于一阶序列相关的随机误差项我们可以证明该随机干扰项的方差和协方差分别为第四十四页,共六十四页,编辑于2023年,星期五用矩阵表示为根据线性代数易知第四十五页,共六十四页,编辑于2023年,星期五从而有用左乘矩阵形式的多元回归模型

,得到(7-41)第四十六页,共六十四页,编辑于2023年,星期五然后展开(7-41)式中所有矩阵乘积,去掉展开式的第一行就得到(7-36)一样的结果。(7-41)第四十七页,共六十四页,编辑于2023年,星期五类似地对具有p阶序列相关的多元回归模型的广义差分法估计也等同于广义最小二乘估计,但我们损失了前面p个样本观测值,这一点可以从广义差分模型(7-40)式看出来。在样本规模较大而误差序列相关阶数较小时,广义差分法与广义最小二乘法的估计结果很接近。但在小样本或误差呈现较大的高阶序列相关时,观测值的损失可能会对估计结果有影响。因此在广义差分变换中,有时需弥补这一损失。这样广义差分法的估计结果就完全等同于广义最小二乘估计量。例如,在一阶序列相关情况下,对损失的第一次观测值可进行如下的

普莱斯-温斯特(Prais-Winsten)变换:第四十八页,共六十四页,编辑于2023年,星期五2)自相关系数未知时的处理尽管广义差分回归直接明了,但通常情况下我们并不知道总体模型中随机干扰项的真实自回归系数ρ是多少,故广义差分法一般难以实现。(1)一次差分法(2)根据D.W.统计量来估计ρ(3)科克伦-奥科特((Cochrane-Orcutt)迭代法(4)杜宾两步法因此我们需要另想办法来处理序列相关问题,我们介绍几种常用的方法。第四十九页,共六十四页,编辑于2023年,星期五(1)一次差分法因为自回归系数ρ介于(-1,1)之间,我们考虑极端的序列相关情况,即完全的正相关或负相关,此时ρ等于1或1。考虑简单的一元回归模型:(7-42)假定该模型中随机干扰项为完全一阶正相关,即有(7-43)第五十页,共六十四页,编辑于2023年,星期五对(7-42)进行一次差分得到即(7-44)(7-44)的差分回归方程没有截距,随机干扰项没有序列自相关,因此可以

对它采取过原点OLS回归得到的BLUE估计量,注意此时原模型中的截距就不能估计出来了。

第五十一页,共六十四页,编辑于2023年,星期五如果原模型为包含时间趋势的模型:(7-45)那么对它进行一次差分后得到(7-46)该差分模型中含有一截距,因此含有截距的一次差分模型意味着在原模型中存在一线性时间趋势项,而且一次差分模型中的截距就是原模型中时间趋势项的系数。如果是正的话,这表明原模型中Y除了受X的影响外还有一上升的趋势。第五十二页,共六十四页,编辑于2023年,星期五如果原模型中随机干扰项是完全一阶负相关的,那么一次差分处理的方法就是相反了。思考:析:要注意它是以假定ρ=1为前提的,如果随机干扰项不是完全一阶正相关,就不能进行这样的一次差分变换。第五十三页,共六十四页,编辑于2023年,星期五怎样知道假定ρ=1是否合理呢??为检验假设ρ=1,贝伦布鲁特—韦布推出如下g检验统计量:(7-47)用贝伦布鲁特-韦布(Belenblutt-Webbtest)统计量来检验。其中是原始模型的OLS残差,而是被解释变量Y的一阶差分各个解释变量X的一阶差分OLS回归得到的残差(注意无截距项)。

对进行第五十四页,共六十四页,编辑于2023年,星期五例7-3假定用32个样本做Y对X的OLS回归得到的残差平方和RSS1=204.2934,再做△Y对△X的OLS回归(注意在此回归中没有截距)得到残差平方和RSS2=28.1938。g=28.1938/204.2934=0.1377查D.W.分布表发现5%的显著性水平下31个样本和1个解释变量的D.W.值下界为1.363,上界为1.496。因此这样计算的g的数值小于D.W.统计量的下界,我们不能拒绝基于这一结果,对原模型进行一次差分后再用OLS估计是合理的。=1的原假设。第五十五页,共六十四页,编辑于2023年,星期五(2)根据D.W.统计量来估计ρ回想我们前面的D.W.统计量根据该式我们可以得到的计算表达式:(7-48)这是从所估计的D.W.统计量获得ρ的一个估计值的简易方法。第五十六页,共六十四页,编辑于2023年,星期五(7-48)由(7-48)可见,仅当d等于或接近于0时,一次差分法中假定才是对的此外当d=2时,d=4时,因此D.W.统计量为我们提供了一个估计的现成方法。

但要注意的是,(7-48)仅提供了一个估计的近似式,在小样本下未必可靠,仅在大样本下才具有最优性质。第五十七页,共六十四页,编辑于2023年,星期五一旦从(7-48)估计出,我们就可以对原模型进行广义差分变换,然后对广义差分后的模型进行OLS估计。

同样需要注意的是,由于广义差分法中用的是真实的,而我们是用来代替真实的,因此就会出现一个问题:

估计的这样估计的回归系数是否有经典回归模型中所说的最优性质呢?当用一个估计的量去代替真值时,OLS估计得到的回归系数仅是渐近有效的,就是说仅在大样本情况下才是最优的,而且通常的假设检验统计量也仅是渐近有效的。一个一般性的原则:第五十八页,共六十四页,编辑于2023年,星期五(3)科克伦-奥科特((Cochrane-Orcutt)迭代法利用估计的残差去获得关于未知的的信息。

考虑一元回归模型:(7-49)假定随机干扰项为一阶自相关,即(7-50)

第五十九页,共六十四页,编辑于2023年,星期五

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论