第十一讲 自相关和面板数据_第1页
第十一讲 自相关和面板数据_第2页
第十一讲 自相关和面板数据_第3页
第十一讲 自相关和面板数据_第4页
第十一讲 自相关和面板数据_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,自相关,.,多元线性回归模型的基本经典假定,假设1随机误差项具有零均值。,假设2对于解释变量的所有观测值,随机误差项有相同的方差。,(如果违反,则出现异方差),.,假设3随机误差项彼此之间不相关,(如果违反,则出现自相关),假设4所有的解释变量Xi与随机误差项彼此之间不相关。,(遗漏变量中经常出现,会出现参数估计有偏),.,假设5解释变量Xi之间不存在精确的线形关系,即解释变量的样本观测值矩阵X是满秩矩阵,应满足关系式:rank(X)=k+1n,(如果违反,则出现多重共线性),.,假设6随机误差项服从正态分布,Y也服从正态分布。,在大样本下,这一假设可以放松为i.i.d.,假设7不太可能出现大异常值。,.,u的方差协方差矩阵,经典假设,异方差,自相关,.,异方差经常出现在截面数据中,因为在截面数据中经常会出现的情况。解决方法:异方差稳健的标准差。FGLS(可行性广义最小二乘法)自相关经常出现在时间序列数据中,因为在时间序列数据中,经常会出现的的情况。面板数据可以看作是截面数据和时间序列的集合,所以既有可能出现异方差,又有可能出现自相关。,.,截面数据的残差图,.,时间序列数据的残差图,.,.,由于经济活动通常具有某种连续性或持久性,自相关现象在时间序列中很常见。比如,相邻两年的GDP增长率、通货膨胀率。又比如,某个意外事件或新政策的效应需要逐步地随时间推移而释放出来;滞后的调整过程,比如,最优资本存量需要通过若干年的投资才能逐渐达到。,.,再比如大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。,由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。,例如,绝对收入假设下居民总消费函数模型:Ct=0+1Yt+tt=1,2,n,.,或者写成:,其中称为相关系数,.,自相关的数学形式,.,.,自相关的检验,图形法残差与X的散点图自相关图(auto-correlationcofficient)偏自相关图(partialauto-correlationcofficient),.,例题:利用B2_lutkepohl.dta数据集建立消费和收入之间的一元线性回归模型。并检验是否存在自回归,是一阶还是高阶。useB2_lutkepohl.dta,cleartssetyearregconsumincomepredicte1,resscattere1income,yline(0)ace1pace1,.,.,.,杜宾和沃特森他们成功地导出了临界值的下限dL和上限dU,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。,D.W.统计量:,.,D.W检验步骤:,(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断,.,若0D.W.dL存在正自相关dLD.W.dU不能确定dUD.W.4dU无自相关4dUD.W.4dL不能确定4dLD.W.2时不能直接应用这种“前后”比较方法。为了分析该面板数据集中的所有观测值,我们使用固定效应回归方法。,.,固定效应模型,对于特定的个体i而言,ai表示那些不随时间改变的影响因素,如个人的消费习惯、国家的社会制度、地区的特征、性别等,一般称其为“个体效应”(individualeffects)。如果把“个体效应”当作不随时间改变的固定性因素,相应的模型称为“固定效应”模型。,.,固定效应模型,.,.,对于固定效应模型,可采用虚拟变量法。基本思想:固定效应模型实质上就是在传统的线性回归模型中加入N-1个虚拟变量,使得每个截面都有自己的截距项。由于固定效应模型假设存在着“个体效应”,每个个体都有其单独的截距项。这就相当于在原方程中引入n1个虚拟变量(如果省略常数项,则引入n个虚拟变量)来代表不同的个体,获得每个个体的截据项。,.,.,例如:共有7个州,方程可以写成:,7个州的回归线斜率相同,但截距不同。第1个州的截距是:第2个州的截距是:第3个州的截距是:,.,固定效应模型的估计算法,“个休中心化”OLS算法或者组内离差估计法假设原方程为:,(式1),给定第i个个体,将(式1)两边对时间取平均可得,,(式2),.,(式1)(式2),得:,可以用OLS方法一致地估计,称为“固定效应估计量”(FixedEffectsEstimator),记为,由于主要使用了每个个体的组内离差信息,故也称为“组内估计量”(withinestimator)。,.,固定效应模型的优势和劣势,面板固定效应模型的优势是:即使个体特征ui与解释变量Xit相关,只要使用组内估计量,就可以得到一致估计,即即使存在不随时间改变的遗漏变量,也可得到无偏一致的估计。面板固定效应模型的劣势是:模型无法估计不随时间而变的变量之影响,这需要用我们后面要讲到的随机效应模型。,.,在交通事故死亡人数中的应用,由于(10.8)式中的“差分”回归只用了1982年和1988年的数据(具体讲就是这两年的差额),而(10.15)式中的固定效应回归用到了所有7年的数据,因此这两个回归是不同的。由于利用了更多的数据,因此(10.15)式中的标准误差小于(10.8)式中的标准误差。,.,固定效应模型的stata实现,usegrunfeld,clearxtsetcompanyyearxtdesxtlineinvest固定效应模型:xtreginvestmvaluekstock,fe,.,回归结果解读,1。三个R2哪个重要?2。固定效应为什么有两个F检验?3。corr(u_i,Xb)的含义。4。sigma_u、sigma_e、rho的含义。,.,1。因为固定效应模型是组内估计量(离差),因此,只有within是一个真正意义上的R2,其他两个是组间相关系数的平方。2。右侧的F统计量表示除常数项外其他解释变量的联合显著性。最后一个F检验,原假设所有U_i=0,即不存在个体效应,此时证明pooledols更有效。,首先注意:结果中的u_i不表示残差,而是表示个体效应。,.,3。corr(u_i,Xb)个体效应与解释变量的相关系数,相关系数为0或者接近于0,可以使用随机效应模型;相关系数不为0,需要使用固定效应模型。4。sigma_u:表示个体效应的标准差sigma_e:表示干扰项的标准差rho:rho=sigma_u2/(sigma_u2+sigma_e2)个体效应的波动占整个波动的比例。,.,显示每个个体截距的方法:tabcompany,gen(dum)dropdum1reginvestmvaluekstockdum*与上述方法比较一下:xi:pany结果完全一样。,.,几个常见问题,1。既然固定效应每个个体都有单独的截距项,如何获得每个个体的截距项?xi:pany即LSDV方法或者添加虚拟变量法。,.,2。面板数据格式不符合要求的处理。例如如下表格格式该如何处理?处理方法:扁平数据变长条数据的命令:reshapeuseinvest2,cleareditreshapelonginvestkstock,i(company)j(year),.,.,时间固定效应回归,其中St是只随时间改变,不随个体改变的变量,如汽车的性能。,.,只有时间效应,.,个体和时间固定效应(双向固定效应模型),固定效应模型:Yit=ai+XitB+it双向固定效应模型:Yit=ai+ft+XitB+it实际上添加了t-1个时间虚拟变量。主要反应随着时间变化的一些特征。tabyear,gen(yr)editdropyr1xtreginvestmvaluekstockyr*,fe大部分时间虚

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论