版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十讲经典面板数据模型一、面板数据(paneldata)一维数据:时间序列数据(crosssectiondata):变量在时间维度上的数据截面数据(timeseriesdata):变量在截面空间维度上的数据)。二维数据:
面板数据(同时在时间和截面空间上取得的,也称时间序列截面数据(timeseriesandcrosssectiondata)或混合数据(pooldata)o面板数据=截面数据+时间序列数据。面板数据用双下标变量表示。例如yit,i=1,2,…,N;t=1,2,…,T■5直N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定七不变,yi.,(i=1,2,…,N)是随机变量在横截面上的N个数据;若固定i不变,y,(t=1,2,…,T)■5直个时间序列(个体)。平衡面板数据(balancedpaneldata)o非平衡面板数据(unbalancedpaneldata)。例1998-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。表1.中国部分省级地区的居民数据(不变价格,元)一居民家庭人均消费(y) 居民家庭人均收入^)地区1998|1999|2000|2001|2002一~1998|199920002001 2002AH(安徽)3777399042044495BJ(北京)6807745482068654FJ(福建)5197531555236094HB(河北)3897410443624457HLJ(黑龙江)3290359738914159JL(吉林)3478373640784282JS(江苏)4919507753185489JX(江西)32343532361339144784477051795257564160931047382739128100001123012692666565056922727984239236512051675469567859556747449442514747499853836144499942414571487852726292609160546624679373178244454542094788508855346329LN(辽宁)3918404743604654540246504968536357976597NMG(内蒙古)3128347638774171485043844780506355036039SD(山东)4169454750125160563654135850647769767668SH(上海)686681268652933610412877310770114321288313184SX(山西)3314350737944131478841574360454754026336TJ(天津)5499591761466904722171467735817388529375ZJ(浙江)623766016951796887927860853091871048611822二、面板数据模型及其作用经典面板数据模型建立在古典假定基础上的线性面板数据模型.非经典面板数据模型非平稳时间序列问题的面板数据模型(面板数据协整模型)非线性面板数据模型(如面板数据logit模型,面板数据计数模型模型)其他模型(如面板数据分位数回归模型)面板数据模型作用描述个体行为差异。PanelData能够提供更多信息、更多变化性、更少共线性、更多自由度和更高效率。反观时间序列经常受多重共线性的困扰。PanelData能够更好地研究动态调节,横截面分布看上去相对稳定但却隐藏了许多变化,PanelData由于包含较长时间,能够弄清诸如经济政策变化对经济状况的影响等问题。PanelData能更好地识别和度量纯时间序列和纯横截面数据所不能发现的影响因素。相对于纯横截面和纯时间序列数据而言,PanelData能够构造和检验更复杂的行为模型。通常,PanelData可以收集到更准确的微观单位(个人、企业、家庭)的情况。由此得到的总体数据可以消去测量误差的影响。■3
困尽管PanelData■3
困目前有关PanelData的学术专著主要有:1・Analysisofpaneldata/ChengHsiao.1986.2・Econometricanalysisofpaneldata/BadiH.Baltagi.1995.3.TheEconometricsofpaneldata:ahandbookofthetheorywithapplications/Matyas&Sevestre.1996.应用程序软件:stata、EViews。三、经典面板数据模型的参数估计不变系数模型:yit=a+8%t+uit变截距模型:?=气+8\+%(时间变截距模型?双变模型?)变系数模型:y=a+Bx+u(时间变截距模型?双变模itiiitit型?)(一)不变系数模型(混合估计模型)如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,即各回归系数不随个体或截面的变化而变化,那么就可以直接把面板数据混合在一起用普通最小二乘法(01$)估计参数,建立不变系数模型(混合估计模型)。yit= +xit+uit,i=1,2,…,N;t=1,2,…,T和不随i,t变化。称模型为混合估计模型。数据形式变为:
地区年份YX安199847703777徽199951793990省200052574204200156414495200260934784…浙199878606237江省19998530660120009187695120011048679682002118228792例以表1中15个地区1996和2002年数据建立关于消费的混合估计模型,得结果如下:输出结果1DependentVariable:Y?Method:PooledLeastSquaresVariableCoefficientStd.Errort-StatisticProb.C73.8196084.483510.8737750.3851X?0.7614650.01171065.028950.0000R-squared0.983030Meandependentvar5291.773AdjustedR-squared0.982798S.D.dependentvar1745.640S.E.ofregression228.9535Sumsquaredresid3826637.F-statistic4228.764Durbin-Watsonstat0.864366Prob(F-statistic)0.000000Includedobservations:5Numberofcross-sectionsused:15Totalpanel(balanced)observations:75y=73.82+0.76xit itit it15个省级地区的人均支出平均约占收入的76%,自发消费为73.82。(二)变截距模型(variableinterceptmodel)即自变量对因变量的效应(斜率)随个体或时间的变化而变化,而截距项却在不同的个体或时间上有所不同,此时可以建立变截距模型。按照样本数据性质的不同,具体分为固定效应模型和随机效应模型。固定效应模型(fixedeffectsregressionmodel)在面板数据散点图中,如果对于不同的裁面或不同的时间序列,模型的裁距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型。3种类型:1.个体固定效应模型时刻固定效应模型时刻个体固定效应模型下面只以个体固定效应模型为例进行介绍。个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型。y=P+Px+Pz+uit0 1it2iit其中,Z是不随时间变化的潜在变量,不可观察,但与x相i联系。上式可以变化为:y=P+P%+|3z+〃hit0 1it2iit—(P+|3z)+0x+〃0 2i1itit—CL+PX+Ui itit由于,•与每一个个体中一个确实存在(但不可观测)的变量有关,所以称为个体固定效应模型。等价于每一个个体有一个方程:y=a+x+u,i=1(对于第1个个体,或时间序列),it 1 itity2t=a2+x2t+u2t,i=2(对于第2个个体,或时间序列),…yNt=aN+xNt+uNt,i=N(对于第n个个体,或时间序列),t=1,2,…,T其中it,i=1,2,…,N;t=1,2,…,T,表示随机误差项。yit,x,i=1,2,…,N;t=1,2,…,T分别表示被解释变量和it解释变量。引入虚拟变量,口[1,如果属于第,•个个体,i=1,2,...,N。Wi一0, 其他写为:y.t= 1X>t+a1W1+a2W2+…+QNWN+%,(t=1,2,…,T)如果满足如下4个假定条件,上述面板数据模型可以用OLS方法估计:(1) E(Uitl、,%,…,如)=0。以、,%,…,%,.为条件的U的期望等于零。1 It(2) x,和u不相关。it it(3) 不同解释变量之间不存在完全共线性。Cov(uituis|xit,xis, i)=0,t ,。在固定效应模型中随机误差项uit在时间上是非自相关的。
数据结构:地年份YXDAH…DZJ安徽省199847703777100199951793990100200052574204100200156414495100200260934784100…000浙江省19987860623700119998530660100120009187695100120011048679680012002118228792001对模型进行OLS估计,全部参数估计量都是无偏的和一致的。模型的自由度是NT-N-K (k是解释变量个数)例:表1的固定效应模型EViews估计结果:输出结果2DependentVariable:Y?Method:PooledLeastSquaresDate:02/14/06Time:17:18Sample:19982002Includedobservations:5Numberofcross-sectionsused:15Totalpanel(balanced)observations:75
VariableCoefficientStd.Errort-StatisticProb.X?0.7041200.01959835.928060.0000FixedEffectsAH--C456.2010BJ--C1091.289FJ--C356.0866HB--C301.8503HLJ--C291.9486JL--C558.2303JS--C445.4530JX--C113.4984LN--C621.1425NMG--C271.5059SD--C344.3550SH--C645.5164SX--C414.0827TJ--C524.0437ZJ--C566.4419R-squared0.993390Meandependentvar5291.773
AdjustedR-squaredS.E.ofregressionDurbin-Watsonstat0.991709 S.D.dependentvar 1745.640AdjustedR-squaredS.E.ofregressionDurbin-Watsonstat158.9451 Sumsquaredresid 1490550.2.100731'广”安徽+日x1t=456.2+0.704x1t' 人 - V21=7北京+&x2t=1091.3+0.704x2t'戚=『浙江+'x15t=566.4+0.704\七北京、上海、浙江是消费函数截距(自发消费)最大的3个地区。相对于既定的面板数据样本来说,是否有必要建立个体固定效应模型可以通过约束条件的F检验完成。约束条件的F检验在同一样本数据下,记无约束样本回归方程为Y=X8+e记无约束样本回归方程的残差平方和为RSS矛无记有约束样本回归方程为Y—X。*+e*有约束样本回归方程残差平方和为RSS,约可以证明RSS约2RSS无。这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSS与RSS的差异变小。于是我们可约无以构造如下统计量:F=蹶约-&无"约前无)Rss无W无其中,df『df分别为受约束回归模型与无约束回归模型的残约无差自由度(即样本容量减去待估计参数个数)。根据数理统计学知识,当约束条件为真时,F〜F(df约-df无,df无)可以利用这个统计量检验约束条件是否成立。不变系数模型和变截距模型哪一个是受约束模型?原假设H:不同个体的模型截距项相同(建立混合估计模型)。0备择假设H:不同个体的模型截距项不同(建立个体固定效应1模型)。F统计量定义为:RSS固/(NT-N-K)F(RSS混一RSS固)/[(NT-K-1)-(NTRSS固/(NT-N-K)(RSS混-RSS)/(N-1)=RSS/(NT、N-k)固其中RSS,RSS田分别表示约束模型(混合估计模型)和非混 固约束模型(个体固定效应模型)的残差平方和。非约束模型比约束模型多了N-1个被估参数。在原假设H下,F服从自由度为(0N-1,NT-N-k)的F分布。接上例,已知RSS/3866659,RSSq1490550,k=1(3866659-1490550)/(15-1)F= 1490550/(75—15—1) =6-718F005(14,59)=1.899因为F=6.718>F005(14,59)=1.899,所以,拒绝原假设。结论是应该建立个体固定效应模型。注:如果确知对于不同的时间截面,模型的截距显著不同,但是对于不同的时间序列(个体)截距是相同的,那么应该建立时刻固定效应模型如果确知对于不同的截面、不同的时间序列(个体)模型的截距都显著地不相同,那么应该建立时刻个体效应模型,时刻个体固定效应模型就是对于不同的时间截面(时刻点)、不同个体的时间序列都有不同截距的模型。2.随机效应模型(randomeffectsmodel)在固定效应模型中采用虚拟变量的原因是解释变量的信息不够完整(无法观测)。也可以通过对误差项的分解来描述这种信息的缺失。hy= +x+uit itit其中误差项在时间上和截面上都是相关的,用3个分量表示如下:u.t=u.+Vt+w.t其中* N(0, 汶表示截面随机误差分量;vt N(0, v2)表示时间随机误差分量;wN(0, 2)表示混和随机误差分it w量。同时还假定u.,vt,wit之间互不相关,各自分别不存在截面自相关、时间自相关和混和自相关。上述模型称为随机效应模型。为了容易理解,假定模型中只存在个体随机误差项u,不存在1时间随机误差分量(V),即ty\= + x.t+(ui+wit)= +xit+%=( +u)+x+w= +x+wi ititi itit(为均值截距,u为个体截距与均值截距的差异)i这种随机效应模型又称为误差分量模型(errorcomponentmodel)o截面随机误差项*是属于第i个体的随机波动分量,与时间变化无关。随机误差项*,wit与x无关,且满足如下条件:E(u)=E(wit)=0,E(wit2)= w2,E(ui2)= 3£(可哉*)=0(包括所有的i,t,j),E(witwjs)=0(ij,ts),E(uiuj)=0,ij如果不考虑其他因素,*也可以用OLS进行估计。方法如下:地年份YXY=0L+BXeui的估计安徽省199847703777e~ah199951793990200052574204200156414495200260934784
…浙江省199878606237e~zj19998530660120009187695120011048679682002118228792Y=(a+台)+B尤ah ah ah^Y=(a+e)+B尤.但由于cov(u u)=E (u u)=E〔(u +w)・(u +w ))=var (u )it,is itis iit iis i主0,即存在误差项的系列相关,所以随机效应模型一般采用广义最小二乘法(GLS)估计参数,如果随机误差分量服从已知分布(如正态分布),模型的参数还可以用极大似然法估计。仍以表1为例,随机效应模型估计结果如下:yja+M安徽+『]x1t=(261.565-28.01)+0.734、y21=a+北京+1x2t=(261.565+439.65)+0.734、2=°。(混合估计模型,即不存在个体效应2=°。(混合估计模型,即不存在个体效应°。(个体随机效应模型,即存在效应*)七攵=a+"浙江+'x颇=(261.565+15.21)+°・734\七(注意:随机效应模型中应该含有公共截距项)检验个体随机效应的原假设与检验统计量是H°:var(ui)=*)H1:var(u)NTLM=2(t-1)T2RRS随一1^RRS混其中RSS随表示由个体随机效应模型计算的残差平方和。RSS混表示由混合估计模型计算的残差平方和。统计量11^服从1个自由度的2分布。以例1为例,用个体随机效应模型和混合模型计算的统计量的值是2=847.2115x5「52x2=847.21LM=~2x6[3866659F0.05(1)=3.84因为F=847.21>F005⑴=3.84,所以拒绝原假设,结论是应该建立个体随机效应模型。3.随机效应的检验:Wu—HausmanTest随机效应模型和固定效应模型都是变截距的模型,究竟哪一个更好些?不好一概而论,因为各有优缺点。至于在实际应用中具体采用哪一种,需要通过检验。最常用的是Wu-Hausman检验。WU-Hausman检验原理:如果cov(a.,x.)=0,随机效应模型(GLS)产生斜率系数的一致有效估计量,而固定效应模型(OLS)产生一致但无效估计量,所以应该采用随机效应模型;如果cov(ai,xi)^0,随机效应模型斜率系数的估计量非一致而固定效应模型产生一致有效估计量,所以应该采用固定效应模型。H0:cov(a^,x)=0(采用随机效应模型);H「cov(a『x)丰0(采用固定效应模型)Wald统计量:WH=(D固定"随机)[”(°固定)-”(°随机)]-1(°固定"随机)在H0下,WH〜z2(*)
在'为一个标量时,Wald统计量退化为:WH=(&固定-B随机)2W(P)-Var(P)固定 随机本例中,WH= 50.761)2 井4(0.0195982—0.011712)显著性水平0.05下,自由度为1的卡方临界值=7.88,所以,不拒绝H。;应用随机效应模型。(EV5.1以上版本给出了hausmantest 程序)CoefficientTestsFixed/RandomEffectsTesting►EstimationOutputResidualsCoefCovarianeeMatrixCoefficientTestsFixed/RandomEffectsTesting►EstimationOutputResidualsCoefCovarianeeMatrixRedundantFixedEffects-LikelihoodRatioCorrelatedRandomEffects-HausmanTest
祯亘班|Pr□匚|Object]Print]印日由巳|Frbew巳|EgtimatclDeFine[Pod忙CrossSectionIdentifiersSpreadsheet(stackeddata)...DescriptiveStatistics..CorrelatedRandomEffects-HausmanTestPoorsssjuTestcross-sectionrandomeffectsTestSummaryChi-Sq.StatisticChi-Sq.d.f.Prob.Cross-sectionrandom0.03100910.9602Cross-seclianrandomeffectstestcomparisons:Variable FixedRandom Var(Diff.)ProbX十 0.801056 0.822716 0.015131 0.8602(三)变系数模型当认为对于不同个体(或时间),解释变量的回归系数存在显著性差异时,还可以建立回归系数(包括截距系数和斜率系数)不同的面板数据模型。如果各个体(或时间)的误差项不相关,可以直接将某一个个体(或时间)作为一个独立的样本,利用OLS分别估计N个(或T个)方程。方法如下:
地年份YX人 OLS 人安徽省199847703777Y顼+8%ah ah ahah199951793990200052574204200156414495200260934784…若如果各个体(或时间)的误差项相关,需要似无相关回归(SeeminglyUnrelatedRegression,SUR)估计参数。似无相关回归(SUR)的基本思想:假定研究山东省、河南省的人均收入*与消费支出y的关系年份河南省山东省XYXY2001440035006976516020025200435476685636……..…2009120208940142001240201013200953515421354如果我们确认二者的自发消费(截距项)与边际消费倾向(斜率)均不同,即:y^a+Bx+u曰i 曰 曰曰t 曰t七象t=a豫邛豫、+u豫tU鲁和U豫满足所有古典假定,分别对两个方程做OLS是不是一个最好的选择呢?否!因为有一个条件我们没有用到:COV(u鲁t,u豫t)*0!所以最好的办法是联合估计:y=ot+otD+pX+pDt1 2t1t2D_J1,若河南tj0,若山东——a+a1 2即a=a;鲁iP=P;鲁ia豫P=P+P豫1 2X+utt年XYDu.2001440035001u12002520043541u2……1…20091202089401u920101320095351u102001697651600u10+1省河南省山东省2002766856360u10+2..…0…20091420012400u10+92010154213540u10+10由于方程中的随机项违背无序列相关假定,即COV(u,u)乂0tt+10所以参数估计应该使用GLS:1.用OLS法分别估计2个省份方程,计算和保存回归中得到的残差e;(2X10)it2.用这些残差来估计不同回归方程扰动项之间的协方差矩阵£中的各元素:£=cov(e£=cov(e,e)ij 让jtT^keet=1如2 / 1£=var(e,e)- (e2 +...+e2)11 山山 m^r 山1 山101£=cov(e,e)一一_(ee+...+ee)12 山河 10^1山1河1 山10河10
qb2qb2山62L河山b2 u河(本例中,Q是一个2X2的正定对称方阵,且0丰Ioq非主对角线上的元素不为0,说明两个省份方程随机项存在相关性,即存在SeeminglyUnrelated问题。)二 3・使用。彩(町=bQ求参数的可行广义最小二乘估计值(uFGLS)。人 一人 一人p(X01X)1XQ1Y4.重复2〜3,直到扰动项之间的协方差矩阵收敛为止。得到的估计量称为似无相关回归估计量(SURE)。SURE是一致的,并可以增加估计量的有效性(对比OLS)。尤其是在个体较少、时间较长的面板数据模型中。在下面两种情况下,SUR与分别运行OLS回归的结果相同:(1)若各方程的扰动项之间的协方差都等于0;(2)若各方程的自变量都相同,并且每个自变量的每个观测值亦相同。例利用表1,参数估计结果如下:输出结果3DependentVariable:Y?Method:PooledLeastSquaresCross-sectionSUR(PCSE)standarderrors&covariance(d.f.corrected)VariableCoefficientStd.Errort-StatisticProb.AH--C3.501315382.86000.0091450.9927BJ--C230.1863864.51820.2662600.7913FJ--C1612.139246.44976.5414500.0000HB--C-74.53229250.1053-0.2980040.7671HLJ--C561.1775319.54891.7561550.0859JL--C408.6956198.25452.0614690.0451JS--C1571.233350.25114.4860180.0000
JX--C572.9500290.93421.9693460.0551LN--C245.5651273.64910.8973720.3743NMG--C-1392.275297.3780-4.6818360.0000SD--C836.5258305.71432.7362990.0089SH--C422.75071163.3840.3633800.7180SX--C754.8215290.89092.5948610.0127TJ--C-261.5625439.7527-0.5947950.5550ZJ--C980.8890234.00454.1917520.0001AH--XAH0.7881400.07081311.129800.0000BJ--XBJ0.7880110.0832689.4635100.0000FJ--XFJ0.5404220.03184516.970400.0000HB--XHB0.7689780.04291417.919060.0000HLJ--XHLJ0.6513780.06211910.485940.0000JL--XJL0.7337260.03887218.875340.0000JS--XJS0.5434410.04971510.931190.0000JX--XJX0.6155870.05553811.084140.0000
LN--XLN0.7727190.04960015.578900.0000NMG--XNMG1.0269460.05734617.907760.0000SD--XSD0.6281300.04684613.408340.0000SH--XSH0.7236470.1009977.1650410.0000SX--XSX0.6354280.05788010.978410.0000TJ--XTJ0.7992740.05302115.074560.0000ZJ--XZJ0.6608450.02417027.341220.0000R-squared0.996057Meandependentvar5291.773AdjustedR-squared0.993516S.D.dependentvar1745.640S.E.ofregression140.5613Akaikeinfocriterion13.01834Sumsquaredre
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园教师游戏指导能力提升路径研究-基于2024年指导能力测评与提升策略
- 电气工程基础
- 浙江省2025年广播电视编辑记者、播音员主持人资格考试(广播电视基础知识)模拟试题
- 建筑幕墙结构胶老化检测评估技术指南
- 2026年四川省评标专家考试(交通类)复习题及答案
- 新闻记者考试(新闻采编实务)试题及答案(鸡西2025年)
- 【广东】2025年高考广东卷政治高考真题文档版
- 2022年1月福建省地理高中学生学业基础会考
- 2025年岳阳市云溪区事业单位集中选调工作人员考试真题及答案
- 液晶投影机企业县域市场拓展与下沉战略分析报告
- 2026年重庆烟草招聘考试试题及答案
- 2026年城管协管员业务知识考试题库及答案
- 2026年哈三中高三下学期三模语文试卷及答案
- 肠造口患者的心理支持与调适
- 河南省2026年普通高等学校对口招收中等职业学校毕业生考试机电与制造类基础课试卷
- 2025年广东省深圳市初二学业水平地生会考试题题库(答案+解析)
- 2026年度春季江西金德铅业股份有限公司校园招聘17人建设考试备考试题及答案解析
- 2025福建龙岩国信物业有限公司招聘5人笔试历年难易错考点试卷带答案解析
- 球墨铸铁管监理实施细则
- 2026中考英语时文热点:跨学科融合阅读 练习(含解析)
- 2025年全国初中应用物理竞赛试题及答案
评论
0/150
提交评论