




已阅读5页,还剩79页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
面板数据模型与stata应用,1,第二讲面板数据模型与stata软件的应用,E-mail:,面板数据模型与stata应用,2,面板数据模型与stata软件的应用,一、什么是面板数据二、面板数据模型的优势三、面板模型的估计方法:FE和RE四、stata软件简介五、如何用stata估计面板模型:案例分析,面板数据模型与stata应用,3,第一讲短面板,时间维度+截面维度如我们在分析中国各省份的经济增长时,共有31个截面,每个截面都取1979-1998共20年的数据,共有620个观察值,这是一个典型的平行面板数据上市公司财务数据,研究一段时期内(1998-2008)上市公司股利的发放数额与股票账面价值之间的关系,共有2011=220个观测值强调经济理论基础、强调微观行为基础,面板数据模型与stata应用,4,面板数据模型与stata应用,5,面板数据的分类,如果面板数据T较小,而n较大,被称为“短面板”(shortpanel)。反之,如果T较大,而n较小,则被称为“长面板”(longpanel)在面板模型中,如果解释变量包含被解释变量的滞后值,则称为“动态面板”(dynamicpanel);反之,则称为“静态面板”(staticpanel)。如果在面板数据中,每个时期在样本中的个体完全一样,则称为“平衡面板数据”(balancedpanel);反之,则称为“非平衡面板数据”(unbalancedpanel)。,面板数据模型与stata应用,6,面板数据模型与stata应用,7,表11996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格),面板数据模型与stata应用,8,面板数据模型与stata应用,9,表2上市公司的投资与股票账面价值:N=20,T=4,面板数据模型与stata应用,10,面板数据模型的优点,1)可以解决遗漏变量问题:遗漏变量常常是由于不可观测的个体差异或异质性(heterogeneity)造成的,如果这种个体差异“不随时间而改变”(timeinvariant),则面板数据提供了解决遗漏变量问题的又一利器。2)提供更多个体动态行为的信息:由于面板数据同时有横截面与时间两个维度,有时它可以解决单独的截面数据或时间序列数据所不能解决的问题。3)样本容量较大:由于同时有截面维度与时间维度,通常面板数据的样本容量更大,从而提高估计精度。但面板数据也会带来一些问题。面数据通常不满足独立同分布的假定,因为同一个体在不同期的扰动项一般存在自相关。另外,面板数据的收集成本通常较高。,面板数据模型与stata应用,11,举例,交通死亡率与酒后驾车人数(一段时间内江苏省各市)其他的非观测(潜在)因素:南京与苏州汽车本身状况道路质量当地的饮酒文化单位道路的车辆密度非观测效应导致估计结果不准确,面板数据可以控制和估计非观测效应,面板数据模型与stata应用,12,面板数据模型形式:其中,i=1,2,3.N,截面标示;t=1,2,.T,时间标示;xit为k1解释变量,为k1系数列向量对于特定的个体i而言,ai表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯、地区的经济结构,法律和产权制度等,一般称其为“个体效应”(individualeffects),面板数据模型与stata应用,13,面板数据模型的误差项由两部分组成:一部分是与个体观察单位有关的,它概括了所有影响被解释变量,但不随时间变化的因素,因此,面板数据模型也常常被成为非观测效应模型;另外一部分概括了随截面随时间而变化的不可观测因素,通常被成为特异性误差或特异扰动项,面板数据模型与stata应用,14,在实践中常采用折衷策略,即假定个体的回归方程拥有相同的斜率,但可以有不同的截距项,以此来捕捉异质性。,面板数据模型与stata应用,15,由于面同一个体在不同时期的扰动项之间往往存在自相关,故应使用“聚类稳健的标准差”(cluster-robuststandarderror),而所谓“聚类”(cluster),就是由每个个体不同时期的所有观测值所组成。同一聚类(个体)的观测值允许存在相关性,而不同聚类(个体)的观测值则不相关。,面板数据模型与stata应用,16,面板数据模型与stata应用,17,面板数据模型与stata应用,18,面板数据模型与stata应用,19,面板数据模型与stata应用,20,面板数据模型与stata应用,21,面板数据模型与stata应用,22,面板数据模型与stata应用,23,面板数据模型与stata应用,24,面板数据模型与stata应用,25,动态模型y=.8y(-1)+v,样本容量分别为T=20,50,100时,各模拟2万次,面板数据模型与stata应用,26,3.面板数据模型估计方法,混合最小二乘(PooledOLS)估计(适用于混合模型)平均数(between)OLS估计(适用于混合模型和个体随机效应模型)离差变换(within)OLS估计(适用于个体固定效应回归模型)一阶差分(firstdifference)OLS估计(适用于个体固定效应模型)可行GLS(feasibleGLS)估计(适用于随机效应模型),面板数据模型与stata应用,27,面板数据模型与stata应用,28,面板数据模型与stata应用,29,面板数据模型与stata应用,30,面板数据模型与stata应用,31,面板数据模型与stata应用,32,如果在原方程中引入(n1)个虚拟变量(如果没有截距项,则引入n个虚拟变量)来代表不同的个体,则可以得到与上述离差模型同样的结果。故FE也被称为“最小二乘虚拟变量模型”(LeastSquareDummyVariableModel,LSDV)。使用LSDV的好处是可以得到对个体异质性的估计。,面板数据模型与stata应用,33,面板数据模型与stata应用,34,面板数据模型与stata应用,35,面板数据模型与stata应用,36,面板模型选择:固定效应还是随机效应,对“个体效应”的处理主要有两种方式:一种是视其为不随时间改变的固定性因素,相应的模型称为“固定效应”模型;另一种是视其为随机因素,相应的模型称为“随机效应”模型固定效应模型中的个体差异反映在每个个体都有一个特定的截距项上;随机效应模型则假设所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上,面板数据模型与stata应用,37,FE(FixedEffects)ModelRE(RandomEffects)Model其中,是截距中的随机变量部分,代表个体的随机影响,(Replacewithdummyvariables),面板数据模型与stata应用,38,固定效应模型,1、例如,在研究财政支出与经济增长的关系,运用全国的时间序列数据来检验财政支出与经济增长的关系可能存在设定误差并且受统计资料的制约,仅用时间序列资料不能够满足大样本的要求同时,由于我国不同地区的体制变革和财政政策的不断调整,造成各个地区财政支出结构随时间而不断变化面板数据(PanelData)从某种程度上克服了这一困难。考虑到中国各省份财政支出结构与经济增长的关系存在明显的地区差异,从时间序列的角度,考虑各省差异的动态性,是面板数据模型的优势,面板数据模型与stata应用,39,例如,在研究中国地区经济增长的过程中,以全国28个省区为研究对象,可以认为这28个省区几乎代表了整个总体同时假设在样本区间内,各省区的经济结构人口素质等不可观测的特质性因素是固定不变的,因此采用固定效应模型是比较合适的,面板数据模型与stata应用,40,2、而当我们研究某个县市居民的消费行为时,由于样本数相对于江苏省几千万人口是个很小的样本,此时,可以认为个体居民在个人能力、消费习惯等方面的差异是随机的,采用随机效应模型较为合适随机效应模型:RE认为个体的差异是随机的,其中非观测的个体差异效应与随机扰动项一样都是随机变量,随机效应模型,面板数据模型与stata应用,41,总结:如果把非观测效应看做是各个截面或个体特有的可估计参数,并且不随时间而变化,则模型为固定效应模型;如果把非观测效应看作随机变量,并且符合一个特定的分布,则模型为随机效应模型,面板数据模型与stata应用,42,3、在实证分析中,一般通过hausman检验判断:由于随机效应模型把个体效应设定为干扰项的一部分,所以就要求解释变量与个体效应不相关,而固定效应模型并不需要这个假设条件因此,我们可以通过检验该假设条件是否满足,如果满足,那么就应该采用随机效应模型,反之,就需要采用固定效应模型,面板数据模型与stata应用,43,Hausman检验的基本思想是:在固定效应u_i和其他解释变数不相关的原假设下,用OLS估计的固定效应模型和用GLS估计的随机效应模型的参数估计都是一致的。反之,OLS是一致的,但GLS则不是因此,在原假设下,二者的参数估计应该不会有系统的差异,我们可以基于二者参数估计的差异构造统计检验量。如果拒绝了原假设,我们就认为选择固定效应模型是比较合适的。,面板数据模型与stata应用,44,4面板数据模型检验与设定方法,4.4Hausman检验,原假设与备择假设是H0:个体效应与回归变量无关(个体随机效应回归模型)H1:个体效应与回归变量相关(个体固定效应回归模型),面板数据模型与stata应用,45,Hausman检验究竟选择固定效应模型还是随机效应模型:第一步:估计固定效应模型,存储结果quietlyxtregfatalbeertaxspirconsunrateperincK,feeststorefix第二步:估计随机效应模型,存储结果quietlyxtregfatalbeertaxspirconsunrateperincK,reeststoreran第三步:进行hausman检验hausmansetconsistseteff(setconsist为固定效应模型估计名称,seteff为随机效应模型估计名称)fixran,面板数据模型与stata应用,46,Hausman检验量为:H=(b-B)Var(b)-Var(B)-1(b-B)x2(k)Hausman统计量服从自由度为k的2分布。当H大于一定显著水平的临界值时,我们就认为模型中存在固定效应,从而选用固定效应模型,否则选用随机效应模型如果hausman检验值为负,说明的模型设定有问题,导致Hausman检验的基本假设得不到满足,遗漏变量的问题,或者某些变量是非平稳等等。在这里,零假设是随机效应成立,即个体效应和解释变量无关。,面板数据模型与stata应用,47,案例:美国公路交通死亡人数与啤酒税的关系研究以数据集traffic.dta为例,面板数据模型与stata应用,48,四、stata软件简介,STATA软件估计与应用:打开数据库:useE:ProgramFilesStata10.0绿色软件Stata10东部.dta“或者重新输入数据:edit相关系数:corgdpinvesteduscihealth简单回归:regressgdpinvestculturesci无常数:regressgdpinvestculturesci,noconstant,面板数据模型与stata应用,49,估计结果,面板数据模型与stata应用,50,回归诊断:,是否存在异方差:estathettest怀特检验:estatimtest,white回归信息检验:estatimtest是否遗漏重要解释变量:estatovtest拟合图:rvfplot单一变量的相关图:cprplotinvest,面板数据模型与stata应用,51,画图,菜单与命令结合twoway(scattergdpinvest)twoway(scattergdpinvest|lfitgdpinvest),面板数据模型与stata应用,52,基本建设支出与GDP的相关关系图,面板数据模型与stata应用,53,各省教育支出的增长趋势:1998-2006,面板数据模型与stata应用,54,Durbin-Watson统计量:estatdwatson序列相关检验:estatdurbinalt滞后阶数选择:estatdurbinalt,lags(2)条件异方差检验:estatarchlm,lags(2)可选变量的异方差检验:estatszroetergdpinvestculturesci,面板数据模型与stata应用,55,五、Stata对面板数据模型的估计,面板数据模型与stata应用,56,随机效应模型,面板数据模型与stata应用,57,Stata对面板数据模型的估计,首先对面板数据进行声明:前面是截面单元,后面是时间标识:tssetcompanyyeartssetindustryyear产生新的变量:gennewvar=human*lnrd产生滞后变量Genfiscal(2)=L2.fiscal产生差分变量Genfiscal(D)=D.fiscal,面板数据模型与stata应用,58,描述性统计:xtdes:对PanelData截面个数、时间跨度的整体描述Xtsum:分组内、组间和样本整体计算各个变量的基本统计量xttab采用列表的方式显示某个变量的分布Stata中用于估计面板模型的主要命令:xtregxtregdepvarvarlistifexp,model_typelevel(#),面板数据模型与stata应用,59,Modeltype模型beBetween-effectsestimatorfeFixed-effectsestimatorreGLSRandom-effectsestimatorpaGEEpopulation-averagedestimatormleMaximum-likelihoodRandom-effectsestimator,面板数据模型与stata应用,60,主要估计方法:xtreg:Fixed-,between-andrandom-effects,andpopulation-averagedlinearmodelsxtregar:Fixed-andrandom-effectslinearmodelswithanAR(1)disturbancextpcse:OLSorPrais-Winstenmodelswithpanel-correctedstandarderrorsxtrchh:Hildreth-Houckrandomcoefficientsmodelsxtivreg:Instrumentalvariablesandtwo-stageleastsquaresforpanel-datamodels,面板数据模型与stata应用,61,xtabond:Arellano-Bondlinear,dynamicpaneldataestimatorxttobit:Random-effectstobitmodelsxtlogit:Fixed-effects,random-effects,population-averagedlogitmodelsxtprobit:Random-effectsandpopulation-averagedprobitmodelsxtfrontier:Stochasticfrontiermodelsforpanel-dataxtrcgdpinvestcultureeduscihealthsocialadmin,beta,面板数据模型与stata应用,62,xtreg命令的应用:声明面板数据类型:tssetshengt描述性统计:xtsumgdpinvestsciadmin1.固定效应模型估计:xtreggdpinvestculturescihealthadmintechno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigmau和sigmae),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F统计量和相应的P值,本例中固定效应非常显著,面板数据模型与stata应用,63,2.随机效应模型估计:xtreggdpinvestculturescihealthadmintechno,re检验随机效应模型是否优于混合OLS模型:在进行随机效应回归之后,使用xttest0检验得到的P值为0.0000,表明随机效应模型优于混合OLS模型3.最大似然估计Ml:xtreggdpinvestculturescihealthadmintechno,mle,面板数据模型与stata应用,64,Hausman检验,Hausman检验究竟选择固定效应模型还是随机效应模型:第一步:估计固定效应模型,存储结果xtreggdpinvestculturescihealthadmintechno,feeststorefe第二步:估计随机效应模型,存储结果xtreggdpinvestculturescihealthadmintechno,reeststorere第三步:进行hausman检验hausmanfe,面板数据模型与stata应用,65,Hausman检验量为:H=(b-B)Var(b)-Var(B)-1(b-B)x2(k)Hausman统计量服从自由度为k的2分布。当H大于一定显著水平的临界值时,我们就认为模型中存在固定效应,从而选用固定效应模型,否则选用随机效应模型如果hausman检验值为负,说明的模型设定有问题,导致Hausman检验的基本假设得不到满足,遗漏变量的问题,或者某些变量是非平稳等等可以改用hausman检验的其他形式:hausmanfe,sigmaless,面板数据模型与stata应用,66,对于固定效应模型的异方差检验和序列相关检验:Xtserialgdpinvestculturescihealthadmintechno异方差检验:xtreggdpinvestculturescihealthadmintechno,fexttest3(ModifiedWaldstatisticforgroupwiseheteroskedasticityinfixedeffectmodel),面板数据模型与stata应用,67,随机效应模型的序列相关检验:xtreggdpinvestculturescihealthadmintechno,reXttest1Xttest1用于检验随机效应(单尾和双尾)、一阶序列相关以及两者的联合显著检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著,面板数据模型与stata应用,68,可以使用广义线性模型xtgls对异方差和序列相关进行修正:xtglsgdpinvestculturescihealthadmintechno,panels(hetero),修正异方差xtglsgdpinvestculturescihealthadmintechno,panels(correlated),修正依横截面而变化的异方差xtglsgd
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025中国社会科学院语言学重点实验室项目博士后招收考试参考试题及答案解析
- 2025陕西安康市民政局事业单位招聘高层次人才4人备考练习试题及答案解析
- 山西省山阴县第一中学校2025-2026学年高一上学期开学考试英语试题(含答案)
- 西游记试卷题目及答案
- 速记员基础知识培训内容课件
- 新质生产力:重要着力点解析
- 重庆高校新质生产力
- 2025福建莆田市司法局选任人民监督员50人笔试备考试题及答案解析
- 2025年全球贸易CIF与FOB国际物流清关代理专项合同
- 2025年绿色建筑节能材料采购与供应链金融风险防控合同
- 二零二五年度炉渣资源化利用项目合作协议书
- 2025-2026学年鲁科版(五四学制)(2024)初中生物六年级上册教学计划及进度表
- 2025年事业单位招聘考试综合类专业知识试卷(环境工程知识)2025年试题集
- 2025年湖南省教师招聘考试(公共基础知识)历年参考题库含答案详解(5卷)
- 施工进度计划管理制度
- 肿瘤科五年发展规划
- 2025年秋季新学期第一次班主任会议上校长讲话:肩有责心有光行有度-做一个学生心中“靠得住”的人
- 以工代赈务工协议书
- 2025年三级仓储管理员(图书管理)职业技能鉴定《理论知识》考试真题(后附答案及解析)
- 2025至2030中国电动和手动工具行业市场深度研究与战略咨询分析报告
- 0-6岁儿童心理行为发育问题预警征象筛查表条目及释义
评论
0/150
提交评论