




已阅读5页,还剩49页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
面板数据回归,面板数据是同时在时间和截面上取得的二维数据。所以,面板数据(paneldata)也称时间序列截面数据(timeseriesandcrosssectiondata)或混合数据(pooldata)。,面板数据用双下标变量表示。例如Yit,i=1,2,N;t=1,2,TN表示面板数据中含有N个个体。T表示时间序列的最大长度。,对于样本点来说:,Stata中面板数据的表示,在stata中,首先使用xtset命令指定个体特征和时间特征,然后可以用xtdes命令显示面板数据的结构。usegrunfeld,clearxtsetcompanyyearxtdes,面板数据的建模方法主要有三种:固定效应回归模型随机效应回归模型混合回归模型,固定效应模型,对于特定的个体i而言,ai表示那些不随时间改变的影响因素,如个人的消费习惯、国家的社会制度、地区的特征、性别等,一般称其为“个体效应”(individualeffects)。如果把“个体效应”当作不随时间改变的固定性因素,相应的模型称为“固定效应”模型。,固定效应模型,对于固定效应模型,可采用虚拟变量法。基本思想:固定效应模型实质上就是在传统的线性回归模型中加入N-1个虚拟变量,使得每个截面都有自己的截距项。由于固定效应模型假设存在着“个体效应”,每个个体都有其单独的截距项。这就相当于在原方程中引入n1个虚拟变量(如果省略常数项,则引入n个虚拟变量)来代表不同的个体,获得每个个体的截据项。,例如:共有7个州,方程可以写成:,7个州的回归线斜率相同,但截距不同。第1个州的截距是:第2个州的截距是:第3个州的截距是:第4个州的截距是:,如何理解个体效应、个体截距项的不同以及虚拟变量的引入?我们用一份模拟的数据来分析:useexample,clearxtsetcompanyyearxtdes1。画出散点图和拟合线,并建立OLS回归方程。2。加入虚拟变量,并重新画出建立OLS回归方程。,regyx,gend1=0gend2=0replaced1=1ifid=2replaced2=1ifid=3regyxd1d2,固定效应模型的估计算法,“个休中心化”OLS算法或者组内离差估计法假设原方程为:,(式1),给定第i个个体,将(式1)两边对时间取平均可得,,(式2),(式1)(式2),得:,可以用OLS方法一致地估计,称为“固定效应估计量”(FixedEffectsEstimator),记为,由于主要使用了每个个体的组内离差信息,故也称为“组内估计量”(withinestimator)。,固定效应模型的优势和劣势,面板固定效应模型的优势是:即使个体特征ui与解释变量Xit相关,只要使用组内估计量,就可以得到一致估计,即即使存在不随时间改变的遗漏变量,也可得到无偏一致的估计。面板固定效应模型的劣势是:模型无法估计不随时间而变的变量之影响,这需要用我们后面要讲到的随机效应模型。,在交通事故死亡人数中的应用,由于(10.8)式中的“差分”回归只用了1982年和1988年的数据(具体讲就是这两年的差额),而(10.15)式中的固定效应回归用到了所有7年的数据,因此这两个回归是不同的。由于利用了更多的数据,因此(10.15)式中的标准误差小于(10.8)式中的标准误差。,固定效应模型的stata实现,usegrunfeld,clearxtsetcompanyyearxtdesxtlineinvest固定效应模型:xtreginvestmvaluekstock,fe,回归结果解读,1。三个R2哪个重要?2。固定效应为什么有两个F检验?F的自由度如何得出?3。corr(u_i,Xb)的含义。4。sigma_u、sigma_e、rho的含义。,1。因为固定效应模型是组内估计量(离差),因此,只有within是一个真正意义上的R2,其他两个是组间相关系数的平方。2。右侧的F统计量表示除常数项外其他解释变量的联合显著性。最后一个F检验,原假设所有U_i=0,即不存在个体效应,此时证明pooledols(混合回归)更有效。,首先注意:结果中的u_i不表示残差,而是表示个体效应。,3。corr(u_i,Xb)个体效应与解释变量的相关系数,相关系数为0或者接近于0,可以使用随机效应模型;相关系数不为0,需要使用固定效应模型。4。sigma_u:表示个体效应的标准差sigma_e:表示干扰项的标准差rho:rho=sigma_u2/(sigma_u2+sigma_e2)表示个体效应的波动占整个波动的比例。,拿到一份面板数据,现在我们有四种方法进行估计:1。当作一份截面数据直接估计,这称为混合OLS(pooledols)。2。利用组内离差法进行估计,这被默认为固定效应模型的一般估计方法。3。假设有i个个体,加入i-1个虚拟变量。4。为了得到每个个体具体的截距项,加入i个虚拟变量,同时省略常数项。我们用这四种方法进行估计并比较结果。,useinvest,clearxtsetcompanyyear方法1:reginvestmvaluekstockeststoreols方法2:xtreginvestmvaluekstock,feeststorepanel_1,方法3:tabcompany,gen(d)reginvestmvaluekstockd2d3d4d5eststorepanel_2方法4:reginvestmvaluekstockd1d2d3d4d5,noconseststorepanel_3esttable*,b(%6.3f)star(0.10.050.01),方法3还可以用如下简单等价的命令实现:xi:pany即LSDV方法或者添加虚拟变量法。,面板数据格式不符合要求的处理。例如如下表格格式该如何处理?处理方法:扁平数据变长条数据的命令:reshapeuseinvest2,cleareditreshapelonginvestkstock,i(company)j(year),时间固定效应回归,其中St是只随时间改变,不随个体改变的变量。,和个体固定效应能控制不随时问变化但个体间不同的变量一样,时间固定效应能控制个体间相同但随时间变化的变量。由于新车安全性能的提高是发生在全国范围内的。因此它们能够减少所有州的交通死亡事故。故把汽车安全性能视为随时间变化但对所有州都相同的遗漏变量是合理的。于是加入用St表示的汽车安全性能的效应后,得:,只有时间效应,我们暂时假设Zi不出现,方程变为:,我们的目的是在控制St条件下估计1,在上述例子中加入时间固定效应。实际上添加了t-1个时间虚拟变量。主要反映随着时间变化的一些特征。tabyear,gen(yr)editdropyr1xtreginvestmvaluekstockyr*,fe大部分时间虚拟变量显著,说明随着时间的变动,invest有不断变动的趋势。,个体和时间固定效应(双向固定效应模型),如果某些遗漏变量不随时间变化但随州变化(如对酒后驾车的文化接受度),而其他遗漏变量不随州变化但随时间变化(如国家安全标准),则在模型中同时加入个体(州)和时间效应更为恰当,我们称为双向固定效应模型。固定效应模型:Yit=ai+Xit1+it双向固定效应模型:Yit=ai+t+Xit1+it,双向固定效应模型的估计,双向固定效应模型可以通过加入n-1个个体二元变量和T-1个时间二元变量进行OLS估计,但这会使解释变量的数目变得极为庞大!所以一般我们还是采用组内离差法进行估计。方法一:可以通过先从Y和X中减去个体和时间平均值,然后估计被减后的Y关于被减后的X的多元回归方程的方法来估计X的系数。这种方法可以避免二元变量的出现。方法二:从Y,X和时间指示变量中减去个体(不是时间)均值然后估计,被减后的Y对被减后的X和被减后的时间指示变量的多元回归中的k+T个系数。,在交通死亡人数中的应用,上述形式中包含了啤洒税,47个州二元变量(州固定效应),6个年二元变量(时间固定效应)和截距项,所以这个模型的解释变量个数多达55个,这将带来大量的自由度的损失。因为时间和州二元变量和截距项的系数不是我们主要感兴趣的,所以我们在这里没有列出。比较参数发现加入时间效应后啤酒税的系数由-0.66变为-0.64,可见加入时间效应对结果影响不大。,固定效应回归假设和固定效应回归的标准误差,本章给出的标准误差是利用一般异方差稳健公式计算得到的。当T中等大小或较大时,在称为固定效应回归假设的五个假设条件下面板数据中的这些异方差稳健标准误差都是正确的。,固定效应回归假设,固定效应回归的标准误差,如果重要概念10.3中的假设5成立,则给定回归变量条件下,误差u在时间上不相关,在这种情况下如果T中等大小或较大时,则常用(异方差稳健)标准误差是正确的。如果误差自相关,则常用标准误差公式不正确。理解这一点的一种方法是同异方差做类比。在截面数据回归中,如果误差异方差,则由于同方差适用的标准误差是在同方差的错误假设下导出的,因此是不正确的。类似地,如果面板数据中的误差自相关,则由于常用标准误差是在它们没有自相关的错误假设下导出的,因此也是不正确的。,由于面板数据具有潜在异方差且在给定个休的不同时间上潜在相关时,正确的标准误差称为异方差和自相关一致的标准误差(HAC)。这种标准误差由称为群标准误差。在时间序列中使用的命令是newey在面板数据中使用的命令是xtgls,有关酒后驾车的法律规定和交通事故死亡人数,酒精税只是抑制酒后驾车的一种方法,如果某州想要打击酒后驾车,可以通过增加税收和严酷的法律来做到这一点。因此,即使在包含州和时间固定效应的模型中遗漏这些有关酒后驾车的法律也会导致啤酒税对交通死亡事故效应的OLS估计量中存在遗漏变量偏差。此外,是否开车也部分取决于司机是否有工作,同时,税收变化也反映了经济状况(如州预算赤字会增加税收)。所以遗漏州的经济状况也会导致遗漏变量偏差。,本节中我们将前面的分析推广到保持经济状况不变条件下有关酒后驾车的法律规定(包括啤酒税)对交通死亡事故效应的研究。为此,我们需要估计包含其他酒后驾车法律和州经济状况的回归变量的面板数据回归。这些结果刻画了一幅抑制酒后驾车和交通死亡事故措施引发争议的画面。这些估计值表明严厉的处罚和提高最低法定喝酒年龄对死亡率都不会产生重要作用。相反,有证据表明提高类似啤酒税这样的酒精税会减少交通死亡率。但这个效应的估计仍是不精确的。,随机效应模型,对于面板数据而言,除了我们前面讲的混合回归和固定效应模型以外,还存在另外一种模型形式:随机效应模型。为了区别固定效应模型和随机效应模型,我们把两个模型的方程分别写成:,固定效应模型,随机效应模型,两个模型看似一样,但模型形式截然不同:在固定效应模型中:作为一个随机变量(解释变量),标示模型的个体效应。而在随机效应模型中:随机误差项分成两部分,一部分是不随时间变化的误差项,另一部分是随时间变化的误差项,即其中,关于随机效应模型:1。随机效应模型将固定效应模型的个体效应归入到随机误差项中,因此更加灵活。2。固定效应模型通过组内离差的方法消除掉不随时间改变的变量,这一方面保证了模型的无偏性,另一方面模型无法估计不随时间改变的变量之影响,这在随机效应模型中可以实现。3。回归的结果是随机效应模型的所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上。,4。由于上述特性,随机效应模型比固定效应模型结果更加有效,同时,条件更加苛刻。,随机效应模型必须满足下列条件:,一般在固定效应模型中,随机效应模型:xtreginvestmvaluekstock,re回归结果解读。与固定效应模型的结果比较。,模型的筛选,至此,对于面板数据,我们至少学习了三种估计方法。1。混合回归(pooledols)。2。固定效应回归模型。3。随机效应回归模型。三种回归的结果往往不一致。当拿到一个面板数据集时,究竟该用哪种方法?,三种回归的命令:混合回归:reginvestmvaluekstock固定效应:xtreginvestmvaluekstock,fe随机效应:xtreginvestmvaluekstock,re1。混合回归还是固定效应?xtreginvestmvaluekstock,fe然后在结果中直接观测F值。,2。混合回归还是随机效应?xtreginvestmvaluekstock,rexttest0(BP检验)原假设:ai没有干扰,可以用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农资服务人员工作总结
- 传染性疾病汇报
- 糖尿病康复护理原则和方法
- 卵巢肿物诊治指南解读
- 消防安全培训及逃生课件
- 工程经营情况汇报
- 洋地黄类药物护理要点
- 护理学门诊个案
- 行政人力部季度工作总结
- 劳务员工作总结与计划
- 国有企业风险管理内控操作手册
- 缺血性卒中脑保护中国专家共识(2025)解读 3
- 2025年青海省中考道德与法治试题卷(含答案解析)
- 2025广西公需科目培训考试答案(90分)一区两地一园一通道建设人工智能时代的机遇与挑战
- 2025年检测员上岗证试题及答案
- 包装现场管理培训
- 企业安全生产体系五落实五到位规定的内容
- 肺结核心理指导健康教育
- 石家庄高速考试试题及答案
- 道路养护工程材料供应保障及进度措施
- 消除母婴三病传播培训课件
评论
0/150
提交评论