已阅读5页,还剩65页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章误差项自相关与异方差,第一节误差项自相关及其影响第二节误差项自相关的检验第三节误差项自相关问题的处理第四节时间序列中的异方差*,2019年12月19日,山东财经大学统计学院计量经济教研室,第2页,学习本章后,您应该做到:1.理解误差项自相关的概念、产生的原因及其对回归模型的估计产生的影响;2.理解误差项自相关的检验方法和原理,能借助于eviews软件对具体模型进行检验;3.了解误差项自相关问题的补救方法,理解广义差分法的原理,掌握eviews软件的具体应用操作;4.了解时间序列数据中的异方差问题;5.理解arch模型的特点,掌握模型中arch效应的检验方法。,学习重点与难点理解误差项自相关的概念;掌握误差项自相关的检验方法和补救措施;理解时间序列模型的异方差的特殊性。,2019年12月19日,山东财经大学统计学院计量经济教研室,第3页,由于时间序列数据按照观测时间的先后排序,而对于变量采集其连续的观测结果很可能表现出内在的相关,当采集频率较高时尤其明显。经常关注股票市场或者外汇市场的人们都知道,短期内接连的上涨或下跌是常见现象。,误差项不存在自相关(序列相关)的假定在这种情况下经常被发现是不合理的。在截面数据中,由于通常假定搜集的数据是在相同时间对某一总体中的个体进行随机抽样获得的,所以没有理由认为不同观测值之间存在内在的相关关系。因而误差项自相关问题主要存在于时间序列数据中。截面数据中存在的异方差问题在时间序列数据中也有可能存在,而且还有某些特殊性。,2019年12月19日,山东财经大学统计学院计量经济教研室,第4页,第一节误差项自相关及其影响,本章我们将研究时间序列数据模型中的自相关问题。为了讨论和理解方便,按照时间序列的习惯做法,我们用t(t=0,1,2)表示时间序列数据的不同的观测点,称之为“期”,将其作为随机项或其它变量的下标,如ut表示u在第t期所取的值,ut-1表示u在第t-1期所取的值,等等。,一、自相关,在时间序列中,自相关(autocorrelation)可以理解为按一定时间顺序排列的观测序列中各观测值之间存在相关性。例如时间序列数据中和相关,则称该序列存在j阶自相关。j=1时,称之存在1阶自相关,j=2时,则为存在2阶自相关。,2019年12月19日,山东财经大学统计学院计量经济教研室,第5页,若违背这个假定,cov(ut,us)0,即u在不同观测点下的取值相关连,则称随机误差项u存在序列相关(seriescorrelation)或自相关(autocorrelation)。,在时间序列回归中,经典线性回归模型的假定ts.5和ts.,都假定随机误差项相互之间不存在序列自相关,即,cov(ut,us)=0(ts,t,s=1,2,n),自相关的程度用自相关系数表示。为了不与自回归系数混淆,本节用符号表示自相关系数。,随机误差项与滞后一期的的自相关系数为,(10.2),2019年12月19日,山东财经大学统计学院计量经济教研室,第6页,(10.2)式定义的自相关系数与普通相关系数的公式形式相同,的取值范围为。由于式中ut-1是ut滞后一期的随机误差项,因此,将上式计算的自相关系数称为一阶自相关系数。,根据自相关系数的符号可以判断自相关的状态,如果0,则ut与ut-1为正相关;如果=0,则ut与ut-1为不相关;,2019年12月19日,山东财经大学统计学院计量经济教研室,第7页,二、自相关产生的原因,(一)解释变量的遗漏或省略,自相关问题是利用时间序列数据构建结构模型(因果关系模型)时面临的主要问题。自相关产生的原因很多,主要有:,如果模型中省略了某些应该被包含到模型中的重要解释变量,会产生系统误差,这种误差存在于随机误差项中,从而带来了误差项自相关。,2019年12月19日,山东财经大学统计学院计量经济教研室,第8页,这种由于设定误差造成的自相关,在计量经济分析中经常可能发生。例如,本来应该用两个解释变量去解释y,即,(10.3),而建立模型时,模型设定为,(10.4),这样,的影响在便归入到随机误差项ut中,由于x2t在不同观测点上是相关的,就造成了ut是自相关的。,在自回归模型中,由于随机变量的动态过程没有被完整设定,也会导致误差项序列相关。例如,“真实”的模型是ar(2):,2019年12月19日,山东财经大学统计学院计量经济教研室,第9页,但我们设定的回归方程是ar(1):,显然,由于时间序列是ar(2)过程,所以,误差项肯定表现为自相关。,更为普遍的是,在建立回归模型时,总是要略去某些次要的解释变量。如果略去的解释变量有一些存在自相关,它必然在随机项中反映出来,从而使随机项具有自相关性。,2019年12月19日,山东财经大学统计学院计量经济教研室,第10页,(二)回归模型函数形式设定错误,若回归模型所采用的数学形式与所研究问题的真实关系不一致,随机误差项就可能存在自相关。例如某些商品的销售量受季节的影响。设y代表销售量,t代表时间,则y与t的真实关系是周期函数形式。如果选用了线性函数形式,其周期项就并入了误差项之中,误差项在时间上是相关的。,(三)原始数据的处理变换,在实证分析中,所用数据有的是由原始数据经过一定的变化处理得到的。例如有些季度数据来自于月度数据的平均,有些年度数据是由季度数据或者月度数据计算得到的,这种处理可能会产生系统性信息使误差项产生自相关;,2019年12月19日,山东财经大学统计学院计量经济教研室,第11页,有时数据来源于某种特殊假定前提下的推测,例如想要获得我国第五次人口普查(2000年11月1日)与第六次人口普查(2010年11月1日)之间某年的人口数据,或者第六次人口普查(2010年11月1日)之后某年如2012年的人口数据,就需要运用一些假定与技术进行推测,这些技术会带来原始数据所没有的系统性信息导致自相关。,另外,建模过程中有时需要对原序列进行变换,例如由水平形式变为一阶差分形式,原模型中使用原始数据误差项不存在自相关,而差分变换后数据的误差项就可能导致自相关的产生。,因为,尽管,但,。,2019年12月19日,山东财经大学统计学院计量经济教研室,第12页,(四)经济变量的惯性作用,大多数的经济时间序列都有一个明显的特点,就是他们的惯性。由于经济变量的惯性,使得许多经济变量前后期总是相互关联的。例如gdp、价格指数、生产、就业和失业等时间序列都呈现循环波动。在经济复苏时,大多数的经济序列数据从经济衰退的最低点逐年开始上升,这是由经济的内在规律驱动造成的。因此,在有关时间序列数据的回归中,连续的观测值很可能是自相关的。,如果被解释变量不同时期的取值是相关联的,也就是现期的取值受上期或上几期取值的影响,即存在自相关。由于被解释变量与随机项有相同的分布,被解释变量的自相关必然意味着随机项的自相关。,2019年12月19日,山东财经大学统计学院计量经济教研室,第13页,(五)误差项本身存在自相关,在许多情况下,随机因素(如洪水、瘟疫、战争、地震等)所产生的影响,常常持续很长时间。例如,严重的偶发事件(比如汶川地震、日本福岛核泄漏等)不仅对当年的生产、生活造成影响,而且也影响会持续到至少35年以后,这样自然就导致了随机误差项的自相关,这种由偶发性事件引起的自相关也称为“纯粹自相关”。,2019年12月19日,山东财经大学统计学院计量经济教研室,第14页,三、误差项自相关对回归的影响,如果模型中的随机项存在自相关,仍然采用普通最小二乘法ols,会有以下后果:,1.斜率系数依然是线性的和无偏的,即。因为参数olse的线性和无偏性不需要ut无自相关假定(假定ts.5和ts.)的支持。但olse有效性、渐进有效性需要ts.5和ts.的支持,所以自相关情况下,olse不具备有效性和渐进有效性,即不具有最小方差性。这说明,当误差项存在自相关时,olse不再是最佳线性无偏估计量(blue)。一般情况下,参数估计值的真实方差会被低估,即使大样本与于事无补。,2019年12月19日,山东财经大学统计学院计量经济教研室,第15页,用来估计随机项的方差会严重低估真实的方差,进而低估回归参数的方差公式和标准差,从而过高估计t统计量的值,夸大所估计参数的显著性,对本来不重要的解释变量可能误认为重要而被保留。这时通常的回归系统显著性的t检验将失去意义。类似地,由于误差项自相关,参数的olse是无效的,使得f检验和检验不可靠。,最小二乘估计量的方差估计是有偏的。,2019年12月19日,山东财经大学统计学院计量经济教研室,第16页,模型预测的精度决定于抽样误差和总体误差项的方差。抽样误差来自于对估计量的精度,在自相关情形下,的方差的最小二乘估计变得不可靠,由此必定加大抽样误差。同时,在自相关情形下,对的估计也会不可靠。由此可看出,影响预测精度的两大因素都因自相关的存在而加大不确定性,使预测的置信区间不可靠,从而降低了预测的精度。,3.因变量的预测精度降低。,2019年12月19日,山东财经大学统计学院计量经济教研室,第17页,第二节误差项自相关的检验,随机误差项自相关问题的实质在于随机误差项序列的前后数据具有相关性。但真实的是无法观测的,与横截面数据的异方差分析类似,由于残差可看作的估计值,我们可以利用从ols法中得到的样本残差序列来判断误差项是否自相关问题。下面介绍几种常用的自相关检验方法。,一、图示检验法,根据给定的样本数据,应用普通最小二乘法回归后,求出残差(t=1,2,n)。然后可采用两种绘图方法。,2019年12月19日,山东财经大学统计学院计量经济教研室,第18页,(一)绘制et、et-1的散点图,做出的散点图如图10-1。如果大部分散点落在、象限,如图a所示。那么et和et-1就是正相关,这表明随机项存在正的自相关;如果大部分点落在、象限,如图b所示,那么et和et-1就是负相关,这表明随机项存在负的自相关。,a误差项一阶正自相关,b误差项一阶负自相关,2019年12月19日,山东财经大学统计学院计量经济教研室,第19页,(二)按照时间顺序绘制残差et的图形,做出et(t=1,2,n)随时间t变化的图形。如果随t的变化et并不存在明显的规律性,则ut是非自相关的;如果随着t的变化et是几个正的后面跟着几个负的,呈现较长周期的循环,则et(ut)之间存在正的自相关(图a);如果随着t的变化et不断地改变符号,呈现锯齿型,则判定et之间存在负自相关,表明ut存在负自相关(图b)。,a误差项一阶正自相关,b误差项一阶负自相关,2019年12月19日,山东财经大学统计学院计量经济教研室,第20页,二、解释变量严格外生条件下,误差项一阶自相关检验,当时间序列回归方程的解释变量严格外生于误差项时(类似的方程显然不符合要求),如果总体回归模型(prf)的随机误差项之间存在一阶自相关形式,可以写成如下的误差项一阶自回归方程,记为ar(1):,ut=ut-1+vt(10.5),其中,为自回归系数,vt为满足高斯马尔科夫假定的随机误差项。,在大样本条件下,可以通过检验误差项自回归模型(10.5)的斜率系数是否为0,判断误差项是否存在自相关。一个自然而然的思路是回归系数的显著性检验。,2019年12月19日,山东财经大学统计学院计量经济教研室,第21页,步骤如下:,1.构造样本回归方程,计算出残差,2.估计对应于(10.5)的样本回归方程:,(10.6),(这个样本回归方程中也可以包括截距项,由此会对的t统计量产生些许影响,但不影响其渐进有效性),自回归系数的计算公式如下:,由于,在大样本情况下,2019年12月19日,山东财经大学统计学院计量经济教研室,第22页,所以有,其中是自相关系数的样本估计值。可以证明,是总体一阶自相关系数的一致估计量。可见,在大样本条件下,一阶自回归系数大致等于一阶自相关系数。,3.检验回归系数的统计显著性。,如果统计显著,可以认为随机误差项存在一阶自相关。方法是:,第一步,建立假设:,第二步,计算检验统计量:,如果怀疑误差项存在异方差可以使用对异方差稳健的方差计算。,2019年12月19日,山东财经大学统计学院计量经济教研室,第23页,第三步,统计推断。如果检验统计量t的绝对值大于给定显著性水平(一般是0.05)下的t检验临界值,则拒绝原假设,认为随机误差项存在一阶自相关。,这种方法无法用于隔期自相关的诊断,如季(月)度自相关(即与或的自相关)的诊断。,三、古典假定下,误差项一阶自相关的dw检验,德宾和沃森(j.durbin,g.s.watson,1951)提出了一种适用于小样本的检验序列一阶自相关的方法,被称为durbinwatson检验(dw检验)。该方法的假定条件是:,2019年12月19日,山东财经大学统计学院计量经济教研室,第24页,1.解释变量x非随机变量(固定回归元),且不含滞后被解释变量,即自变量严格外生。;2.随机误差项ut为一阶自回归形式:ut=ut-1+vt,其中,-11,为自回归系数,vt满足所有高斯马尔科夫假定。3.原回归模型必须含截距项,即只适用于有常数项的回归模型;4.无数据缺失。5.假定误差项vt服从正态分布。,2019年12月19日,山东财经大学统计学院计量经济教研室,第25页,第一步,建立假设:,第二步,估计样本回归方程:,检验步骤如下:,计算出残差,第三步,定义dw统计量为,这个统计量的分子是残差的一阶差分平方和,分母是残差平方和。由(10.7)式可得,(10.7),2019年12月19日,山东财经大学统计学院计量经济教研室,第26页,因为,所以,0dw4。,(展开dw统计量):,随着序列长度增大,dw,所以,2019年12月19日,山东财经大学统计学院计量经济教研室,第27页,也就是说,dw值越接近于2,ut的自相关性越小;dw值越接近于零,ut正自相关程度越高;dw值越接近于4,ut负自相关程度越高。,二者对应关系如下:,2019年12月19日,山东财经大学统计学院计量经济教研室,第28页,第四步,dw统计量的使用,计算出来dw统计量的值,那么dw值到底在什么样的情况下,可以判定自相关呢?德宾和瓦特森根据样本容量和解释变量的数目,在给定显著性水平下,建立了检验的下临界值与上临界值(参见附表)。,2019年12月19日,山东财经大学统计学院计量经济教研室,第29页,当dw(4dl)时,拒绝原假设h0:=0;接受备择假设h1:0,ut存在一阶负自相关。当dudw(4du)时,接受原假设h0:=0,ut不存在自相关。当dldwdu或(4du)dwdu,说明广义差分模型中已无自相关,不必再进行迭代。同时可见,样本决定系数r2、t、f统计量也均达到理想水平。,(10.25),2019年12月19日,山东财经大学统计学院计量经济教研室,第64页,对比模型(10.23)和(10.25),很明显普通最小二乘法低估了回归系数的标准误差。(原模型(10.23)中,广义差分模型(10.25)中为)。,经广义差分后样本容量会减少1个,为了保证样本数不减少,可以使用普莱斯-温斯顿变换补充第一个观测值,方法是,将其补充到广义差分变换的数据中,利用19个观测值,得到的广义差分模型为:,=345.236,=275.598,2019年12月19日,山东财经大学统计学院计量经济教研室,第65页,(10.26),对比模型(10.25)和(10.26)可发现,两者的参数估计值和各检验统计量的差别很微小,说明在本例中使用普莱斯-温斯顿变换与直接使用广义差分法的估计结果无显著差异,这是因为本例中的样本还不算太小。如果实际应用中样本较小,则两者的差异会较大。通常对于小样本,应采用普莱斯-温斯顿变换补充第一个观测值。,2019年12月19日,山东财经大学统计学院计量经济教研室,第66页,由差分方程(10.24)有,由此,我们得到最终的中国农村居民消费模型为,(10.27),由(10.27)的中国农村居民消费模型可知,中国农村居民的边际消费倾向为0.5833,即中国农民每增加收入1元,消费支出将平均增加0.5833元。,2019年12月19日,山东财经大学统计学院计量经济教研室,第67页,2.非线性回归,该运算过程可以在eviews中直接实现。在输入数据建立工作文件后,直接在命令窗口中输入并运行命令“lsycxar(1)”,软件会直接利用非线性回归方法估计下面模型中的参数。(结果见eviews软件分析),其中,ar(1)对应的系数即自回归系数的样本估计值。从模型的dw统计量看,这时自相关基本上已经消除。对应(10.22)的样本回归模型为,(10.28),估计结果与(10.27)完全相同。,2019年12月19日,山东财经大学统计学院计量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年旅行服务合同
- “一带一路”倡议背景下云南普洱茶出口的对策研究
- 虚拟物品销售合同范本
- 钢构大棚合同范本
- 锁具维修合同范本
- 黄沙水泥供货合同范本
- 2026基因检测试剂盒低温存储技术突破与成本控制报告
- 2026基因检测在宠物医疗领域的应用潜力与市场分析
- 2026危险货物海运拼箱作业标签可视化管理系统设计报告
- 2026中国骨科D打印植入物注册审批新政下产品上市加速路径报告
- 新型二次加压供水设备技术方案
- 餐饮场所消防安全培训课件
- ZXV10 M9000结构原理及维护
- 修理扫帚课件
- 2025年成都市团校入团考试题库(含答案)
- 毛绒玩具课件讲解
- 监理安全知识岗前培训课件
- 霹雳舞教学课件图片
- 特种设备管理课件
- 某市美术馆建设项目可行性研究报告
- 2025年国网湖北电力考试笔试试题(含答案)
评论
0/150
提交评论