异方差检验方法分析.doc_第1页
异方差检验方法分析.doc_第2页
异方差检验方法分析.doc_第3页
异方差检验方法分析.doc_第4页
异方差检验方法分析.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第10讲 异方差检验10.1 同方差假定模型的假定条件 给出Var(u) 是一个对角矩阵, Var(u) = s 2I = s 2 (10.1)且u的方差协方差矩阵主对角线上的元素都是常数且相等,即每一误差项的方差都是有限的相同值(同方差假定);且非主对角线上的元素为零(非自相关假定),当这个假定不成立时,Var(u) 不再是一个纯量对角矩阵。 Var(u) = s 2 W = s 2s 2 I (10.2) 当误差向量u的方差协方差矩阵主对角线上的元素不相等时,称该随机误差系列存在异方差,即误差向量u中的元素ut 取自不同的分布总体。非主对角线上的元素表示误差项之间的协方差值。比如 W 中的 si j与s 2的乘积 ,(i j)表示与第i组和第j组观测值相对应的ui与 uj的协方差。若 W 非主对角线上的部分或全部元素都不为零,误差项就是自相关的。本章讨论异方差。以两个变量为例,同方差假定如图10.1和10.2所示。对于每一个xt值,相应ut的分布方差都是相同的。 图10.1 同方差情形 图10.2 同方差情形10.2 异方差表现与来源异方差通常有三种表现形式,(1)递增型,(2)递减型,(3)条件自回归型。递增型异方差见图10.3和10.4。图10.5为递减型异方差。图10.6为条件自回归型异方差。 图10.3 递增型异方差情形 图10.4 递增型异方差 图10.5 递减型异方差 图10.6 复杂型异方差(1) 时间序列数据和截面数据中都有可能存在异方差。(2) 经济时间序列中的异方差常为递增型异方差。金融时间序列中的异方差常表现为自回归条件异方差。无论是时间序列数据还是截面数据。递增型异方差的来源主要是因为随着解释变量值的增大,被解释变量取值的差异性增大。 10.3 异方差的后果回归参数估计量仍具有无偏性和一致性。但是回归参数估计量不再具有有效性。10.4 异方差检验10.4.1 定性分析异方差 (1) 经济变量规模差别很大时容易出现异方差。如个人收入与支出关系,投入与产出关系。 (2) 利用散点图做初步判断。 (3) 利用残差图做初步判断。 10.4.2 异方差检验(1) White检验White检验由H. White 1980年提出。Goldfeld-Quandt 检验必须先把数据按解释变量的值从小到大排序。Glejser检验通常要试拟合多个回归式。White检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一个辅助回归式构造 c2 统计量进行异方差检验。White检验的具体步骤如下。以二元回归模型为例,yt = b0 +b1 xt1 +b2 xt2 + ut (10.3)首先对上式进行OLS回归,求残差。做如下辅助回归式,= a0 +a1 xt1 +a2 xt2 + a3 xt12 +a4 xt22 + a5 xt1 xt2 + vt (10.4)即用对原回归式中的各解释变量、解释变量的平方项、交叉积项进行OLS回归。注意,上式中要保留常数项。求辅助回归式(5.10)的可决系数R2。White检验的零假设和备择假设是 H0: (5.9)式中的ut不存在异方差, H1: (5.9)式中的ut存在异方差在不存在异方差假设条件下统计量 T R 2 c 2(5) (10.5)其中T表示样本容量,R2是辅助回归式(10.4)的OLS估计式的可决系数。自由度5表示辅助回归式(10.4)中解释变量项数(注意,不计算常数项)。T R 2属于LM统计量。判别规则是若 T R 2 c2a (5), 接受H0 (ut 具有同方差)若 T R 2 c2a (5), 拒绝H0 (ut 具有异方差)(2)Glejser检验 检验 | 是否与解释变量xt存在函数关系。若有,则说明存在异方差;若无,则说明不存在异方差。通常应检验的几种形式是 | = a0 + a1 xt | = a0 + a1 xt2 | = a0 + a1, .Glejser检验的特点是:既可检验递增型异方差,也可检验递减型异方差。 一旦发现异方差,同时也就发现了异方差的具体表现形式。 计算量相对较大。当原模型含有多个解释变量值时,可以把 | 拟合成多变量回归形式。(3) 自回归条件异方差(ARCH)检验 异方差的另一种检验方法称作自回归条件异方差 (ARCH) 检验。这种检验方法不是把原回归模型的随机误差项st 2 看作是xt 的函数,而是把st 2 看作误差滞后项ut-12 , ut-22 , 的函数。ARCH是误差项二阶矩的自回归过程。恩格尔(Engle 1982)针对ARCH过程提出LM检验法。辅助回归式定义为= a0 + a1 + + a n (10.6)LM统计量定义为 ARCH = T R 2 c 2(n) 其中R 2是辅助回归式(10.6)的可决系数。在H0:a1 = = an = 0 成立条件下,ARCH渐近服从 c 2(n) 分布。ARCH检验的最常用形式是一阶自回归模型(n = 1), = a0 + a1 在这种情形下,ARCH渐近服从 c 2(1) 分布。 10.5 克服异方差的方法 (1)对模型 yt = b0 + b1 xt1 + b2 xt2 + ut (10.7)假定异方差形式是Var(ut) = (s xt1)2。(因为Var(ut) = E(ut)2,相当于认为 | = s xt)用xt1同除上式两侧得 yt / xt1 = / xt1 + b2 xt2 / xt1 + ut / xt1 , (10.8)因为Var(ut / xt1) = (1/ xt12 ) Var(ut) = (1/ xt12 ) s 2 xt12 = s 2, (10.8) 式中的随机项 (ut / xt) 是同方差的。对 (10.8) 式做OLS估计后,把回归参数的估计值代入原模型 (10.7)。对 (10.8) 式应用OLS法估计参数,求 S (ut / xt1) 2 最小。其实际意义是在求 S (ut / xt1)2 最小的过程中给相应误差项分布方差小的观测值以更大的权数。所以此法亦称为加权最小二乘法,是GLS估计法的一个特例。(2)通过对数据取对数消除异方差。图10.7 菲律宾GDP和对数的GDP 图10.8中国进出口贸易额差(1953-1998, file: pap1)和对数的中国进出口贸易额之差问题:(1)1.2E+12表示什么含义?(2)LNEXT-LNIMP为什么不能改为LN(EXT-IMP)?10.6 案例分析【案例1】(file:hete01,hete02)取1986年中国29个省市自治区农作物种植业产值yt(亿元)和农作物播种面积xt(万亩)数据研究二者之间的关系。得估计的线性模型如下, yt = -5.6610 + 0.0123 xt (10.10) (12.4) R2 = 0.85, F = 155.0, T = 29无论是从yt和xt观测值的散点图(见图10.9)还是模型的残差图(见图10.10)都可以发现数据中存在异方差。 图10.9 农作物产值yt和播种面积xt (file:hete01) 图10.10 残差图(file:hete02)(1)用White方法检验是否存在异方差。在上式回归的基础上,做White检验。得,注意:输出结果中的概率是指c2 (2)统计量取值大于8.02的概率为0.018。示意如下图。 因为TR2 = 8.02 c2a (2) = 6,所以存在异方差。(2)用Glejser方法检验是否存在异方差。下面克服异方差。对yt和xt同取对数。得两个新变量Lnyt 和Lnxt(见图10.11)。用Lnyt 对Lnxt 回归,得 Lnyt = - 4.1801 + 0.9625 Lnxt . (10.13) (16.9) R2 = 0.91, F = 285.6, (t = 1, , 29) 图10.11 Ln yt和 Ln xt 图10.12 残差图经White检验不存在异方差。因为TR2 = 2.58 c20.05 (2) = 6.0,所以不存在异方差。 (文件:Statis) 用Glejser法检验异方差用 (10.10) 式, yt = -5.6610 + 0.0123 xt, 的残差的绝对值对xt回归 | = 0.0024 xt (8.0) R2 = 0.22可见误差项的异方差形式是Var(ut) = E(ut)2 = 5.7610-6 xt2。克服异方差的方法是用xt分别除(10.10) 式两侧,得变换变量yt* = yt / xt,xt* = 1 / xt。用yt* 对xt* 回归(见图10.13),得 yt* = 0.0113 + 0.8239 xt* (10.14) (13.8) (0.8) R2 = 0.63, F = 46.1 图10.13 yt* 和 xt* 图10.14 残差图注意,回归系数0.8239没有显著性,截距项0.0113却有很强的显著性,而0.0113正是还原后模型的回归系数,所以模型通过检验。把yt* = yt / xt,xt* = 1 / xt代入上式并整理得广义最小二乘估计结果如下: yt = 0.8239 + 0.0113 xt (10.15) (0.8) (13.8) R2 = 0.63, F = 46.1由式 (10.14) 得到的残差见图10.14。经检验已不存在异方差。(10.14) 式,即 (10.15) 式中的回归参数具有最佳线性无偏特性。(10.16) 式是最小二乘估计结果。比较(10.16)和 (10.15) 式, yt = -5.6610 + 0.0123 xt (10.16)虽然0.0113和0.0123相差不多,但从估计原理分析,0.0113有比0.0123更大的可能性接近回归参数真值。经济含义是平均每一万亩耕地的农业产出值是113万元人民币。通过这个例子说明,在实际中直接用解释变量除原变量的变换方法克服异方差是可行的。附录:用EViews给序列中的数据排序。在Workfile窗口点击Proc键并选择Sort Current Page功能,将出现一个要求填写以哪一个序列为标准(基准序列)排序的对话框。填写基准序列名,并在下侧的另一个选择框中说明是按从小到大排列(Ascending),还是从大到小排列(Descending)。缺省的选择是从小到大排列。注意,这种操作是把工作文件中所有的变量都以选定的变量为标准排序。所以若希望保留原序列数据时,应先备份一个工作文件。 obs 原始数据 排序以后XYXY1907.516.31316.53.532873.217.14761.76.33313159.2125.24873.217.1445928.142.24907.516.3156834.440.281018.516.8365495.584.471235.210.0776055.270.73601.549.72812694.6101.674275.144.7891018.516.834701.344.371012770.9211.515252.537.29116542.71015495.584.471212244.3155.875928.142.24133601.549.726036.151.79148158.169.76055.270.71516564.5255.926542.71011617729.2183.656821.761.241711061.5146.796834.440.281811304.7129.637016.559.45199166.2154.288158.169.720

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论