EVIEWS用面板数据模型预测_第1页
EVIEWS用面板数据模型预测_第2页
EVIEWS用面板数据模型预测_第3页
EVIEWS用面板数据模型预测_第4页
EVIEWS用面板数据模型预测_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE177第8讲用面板数据模型预测1.面板数据定义时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据。面板数据是同时在时间和截面上取得的二维数据。面板数据也可以定义为相同截面上的个体在不同时点的重复观测数据或者称为纵向变量序列(个体)的多次测量。所以,面板数据(paneldata)也称时间序列截面数据(timeseriesandcrosssectiondata)或混合数据(pooldata)。面板数据示意图见图1。面板数据从横截面(crosssection)看,是由若干个体(entity,unit,individual)在某一时点构成的截面观测值,从纵剖面(longitudinalsection)看每个个体都是一个时间序列。图1N=15,T=50的面板数据示意图图2是1978~2005年中国各省级地区消费性支出占可支配收入比率序列图。图21978-2005年中国各省级地区消费性支出占可支配收入比率序列图(价格平减过)面板数据用双下标变量表示。例如yit,i=1,2,…,N;t=1,2,…,Ti对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变,yi.,(i=1,2,…,N)是横截面上的N个随机变量;若固定i不变,y.t,(t=1,2,…,T)是纵剖面上的一个时间序列(个体)。这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。对于面板数据yit,i=1,2,…,N;t=1,2,…,T,如果每个个体在相同的时期内都有观测值记录,则称此面板数据为平衡面板数据(balancedpaneldata)。若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平衡面板数据(unbalancedpaneldata)。案例1:1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)关系研究(file:5panel02)1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据见file:panel02。数据是7年的,每一年都有15个数据,共105组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费面板数据按个体连线见图3,按截面连线见图4。人均收入面板数据按个体连线见图5,按截面连线见图6。图315个省级地区的人均消费序列(个体)(file:5panel02)图47个人均消费横截面数据(含15个地区)(每条连线表示同一年度15个地区的消费值)图515个省级地区的人均收入序列(个体)(file:5panel02)图67个人均收入横截面数据(含15个地区)(每条连线表示同一年度15个地区的收入值)用CP表示消费,IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。图7人均消费对收入的面板数据散点图(15个时间序列叠加)图8人均消费对收入的面板数据散点图(7个截面叠加)15个地区7年人均消费对收入的面板数据散点图见图7和图8。图7中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图8中每一种符号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。为了观察得更清楚,图9给出北京和内蒙古1996-2002年消费对收入散点图。从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图10给出该15个省级地区1996和2002年的消费对收入散点图。6年之后15个地区的消费和收入都有了相应的提高。图9北京和内蒙古1996-2002年消费对收入散点图图101996和2002年15个地区的消费对收入散点图2.面板数据模型分类用面板数据建立的模型通常有3种,即混合回归模型、固定效应回归模型和随机效应回归模型。2.1混合回归模型(Pooledmodel)。如果一个面板数据模型定义为, yit=+Xit'+it,i=1,2,…,N;t=1,2,…,T(1)其中yit为被回归变量(标量),表示截距项,Xit为k1阶回归变量列向量(包括k个回归量),为k1阶回归系数列向量,it为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数和都相同。如果模型是正确设定的,解释变量与误差项不相关,即Cov(Xit,it)=0。那么无论是N,还是T,模型参数的混合最小二乘估计量(PooledOLS)都是一致估计量。2.2固定效应回归模型(fixedeffectsregressionmodel)。固定效应模型分为3种类型,即个体固定效应回归模型、时点固定效应回归模型和个体时点双固定效应回归模型。下面分别介绍。2.2.1个体固定效应回归模型(entityfixedeffectsregressionmodel)如果一个面板数据模型定义为, yit=i+Xit'+it,i=1,2,…,N;t=1,2,…,T(3)其中i是随机变量,表示对于i个个体有i个不同的截距项,且其变化与Xit有关系;Xit为k1阶回归变量列向量(包括k个回归量),为k1阶回归系数列向量,对于不同个体回归系数相同,yit为被回归变量(标量),it为误差项(标量),则称此模型为个体固定效应回归模型。个体固定效应模型(3)的强假定条件是,E(iti,Xit)=0,i=1,2,…,Ni作为随机变量描述不同个体建立的模型间的差异。因为i是不可观测的,且与可观测的解释变量Xit的变化相联系,所以称(3)式为个体固定效应回归模型。个体固定效应回归模型也可以表示为 yit=1D1+2D2+…+NDN+Xit'+it,t=1,2,…,T(4)其中Di=注意:(1)在EViews5.0输出结果中i是以一个不变的常数部分和随个体变化的部分相加而成。(2)在EViews5.0以上版本个体固定效应对话框中的回归因子选项中填不填c输出结果都会有固定常数项。个体固定效应回归模型的估计方法有多种,首先设法除去i的影响,从而保证估计量的一致性。(详见第3节,面板数据模型估计方法。)下面解释设定个体固定效应回归模型的原因。假定有面板数据模型 yit=0+1xit+2zi+it,i=1,2,…,N;t=1,2,…,T(5)其中0为常数,不随时间、截面变化;zi表示随个体变化,但不随时间变化的难以观测的变量。以案例1为例,省家庭平均人口数就是这样的一个变量。对于短期面板来说,这是一个基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。上述模型可以被解释为含有N个截距,即每个个体都对应一个不同截距的模型。令i=0+2zi,于是(5)式变为 yit=i+1xit+it,i=1,2,…,N;t=1,2,…,T(6)这正是个体固定效应回归模型形式。对于每个个体回归函数的斜率相同(都是1),截距i却因个体不同而变化。可见个体固定效应回归模型中的截距项i中包括了那些随个体变化,但不随时间变化的难以观测的变量的影响。i是一个随机变量。因为zi是不随时间变化的量,所以当对个体固定效应回归模型中的变量进行差分时,可以剔除那些随个体变化,但不随时间变化的难以观测变量的影响,即剔出i的影响。以案例1(file:5panel02)为例得到的个体固定效应模型估计结果如下:输出结果的方程形式是 =安徽+x1t=(515.6-36.3)+0.70x1t(55.0) =北京+x2t=(515.6+537.6)+0.70x2t。。。(55.0) =浙江+x15t=(515.6+198.6)+0.70x15t(55.0)R2=0.99,SSEr=2270386,t0.05(88)=1.98从结果看,北京、上海、浙江是自发消费(消费函数截距)最大的3个地区。图11EViwes5.1个体固定效应回归模型的估计结果2.2.2时点固定效应回归模型(timefixedeffectsregressionmodel)如果一个面板数据模型定义为, yit=t+Xit'+it,i=1,2,…,N(7)其中t是模型截距项,随机变量,表示对于T个截面有T个不同的截距项,且其变化与Xit有关系;yit为被回归变量(标量),it为误差项(标量),满足通常假定条件。Xit为k1阶回归变量列向量(包括k个回归变量),为k1阶回归系数列向量,则称此模型为时点固定效应回归模型。时点固定效应回归模型也可以加入虚拟变量表示为 yit=0+1W1+2W2+…+TWT+Xit'+it,i=1,2,…,N;t=1,2,…,T(8)其中Wt=设定时点固定效应回归模型的原因。假定有面板数据模型 yit=0+1xit+2zt+it,i=1,2,…,N;t=1,2,…,T(9)其中0为常数,不随时间、截面变化;zt表示随不同截面(时点)变化,但不随个体变化的难以观测的变量。以案例1为例,“全国零售物价指数”就是这样的一个变量。对于不同时点,这是一个变化的量,但是对于不同省份(个体),这是一个不变化的量。上述模型可以被解释为含有T个截距,即每个截面都对应一个不同截距的模型。令t=0+2zt,于是(9)式变为 yit=t+1xit+it,i=1,2,…,N;t=1,2,…,T(10)这正是时点固定效应回归模型形式。对于每个截面,回归函数的斜率相同(都是1),t却因截面(时点)不同而异。可见时点固定效应回归模型中的截距项t包括了那些随不同截面(时点)变化,但不随个体变化的难以观测的变量的影响。t是一个随机变量。以例1为例得到的时点固定效应模型估计结果见图11,代数式如下: =0+1996+xi1=(2.6+105.9)+0.7789xi1,t=1996 (0.04)(74.6)=0+1997+xi2=(2.6+134.1)+0.7789xi2,t=1997(0.04)(74.6)… =0+2002+xi7=(2.6-93.9)+0.7789xi7,t=2002(0.04)(74.6)R2=0.9867,SSEr=4028843,t0.05(97)=1.982.2.3个体时点固定效应回归模型(timeandentityfixedeffectsregressionmodel)如果一个面板数据模型定义为, yit=0+i+t+Xit'+it,i=1,2,…,N;t=1,2,…,T(11)其中yit为被回归变量(标量);i是随机变量,表示对于N个个体有N个不同的截距项,且其变化与Xit有关系;t是随机变量,表示对于T个截面(时点)有T个不同的截距项,且其变化与Xit有关系;Xit为k1阶回归变量列向量(包括k个回归量);为k1阶回归系数列向量;it为误差项(标量)满足通常假定(itXit,i,t)=0;则称此模型为个体时点固定效应回归模型。个体时点固定效应回归模型还可以表示为, yit=0+1D1+2D2+…+NDN+1W1+2W2+…+TWT+Xit'+it,(12)其中Di=(13)Wt=(14)如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(12)进行混合OLS估计,全部参数估计量都是不一致的。正如个体固定效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方法也可以使个体时点双固定效应回归模型得到更有效的参数估计量。以例1为例得到的截面、时点固定效应模型估计结果如下:图12EViwes5.1截面、时点双固定效应模型估计结果注意:对于第1个截面(t=1)EViwes输出结果中把(+i+1),(i=1,2,…,N)合在一起。第2,…,T个截面以此类推。输出结果如下: =0+1+1996+x1,1996=681.9-68.6-75.3+0.67x1,1996(安徽省) =0+2+1996+x2,1996=681.9+617.2-75.3+0.67x2,1996(北京市)… =0+1+1997+x1,1997=681.9-68.6+23.6+0.67x1,1997(安徽省) =0+2+1997+x2,1997=681.9+617.2+0.67x2,1997,(北京市)… =0+15+2002+x15,2002=183.39+870.42+23.6+0.67x15,2002(浙江省)R2=0.9932,SSEr=2045670,t0.05(83)=1.98回归系数为0.67,这与个体固定效应回归模型给出的估计结果0.70基本一致。在上述三种固定效应回归模型中,个体固定效应回归模型最为常用。2.3随机效应模型对于面板数据模型 yit=i+Xit'+it,i=1,2,…,N;t=1,2,…,T(15)如果i为随机变量,其分布与Xit无关;Xit为k1阶回归变量列向量(包括k个回归量),为k1阶回归系数列向量,对于不同个体回归系数相同,yit为被回归变量(标量),it为误差项(标量),这种模型称为个体随机效应回归模型(随机截距模型、随机分量模型)。其假定条件是iiid(,2)itiid(0,2)都被假定为独立同分布,但并未限定何种分布。同理也可定义时点随机效应回归模型和个体时点随机效应回归模型,但个体随机效应回归模型最为常用。这里所说的个体随机效应回归模型其实是有别于真正的随机效应回归模型。对于个体随机效应模型,E(iXit)=,则有,E(yitxit)=+Xit',对yit可以识别。所以随机效应模型参数的混合OLS估计量具有一致性,但不具有有效性。注意:术语“随机效应模型”和“固定效应模型”用得并不十分恰当,容易产生误解。其实固定效应模型应该称之为“相关效应模型”,而随机效应模型应该称之为“非相关效应模型”。因为固定效应模型和随机效应模型中的i都是随机变量。例1的个体随机效应模型估计结果如下:图13个体随机效应模型估计结果3.面板数据模型估计方法面板数据模型中的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随设定固定效应模型是否正确而变化。回归变量xit可以是时变的,也可以是非时变的。3.1混合最小二乘(PooledOLS)估计混合OLS估计方法是在时间上和截面上把NT个观测值混合在一起,然后用OLS法估计模型参数。给定混合模型 yit=+Xit'+it,i=1,2,…,N;t=1,2,…,T(19)如果模型是正确设定的,且解释变量与误差项不相关,即Cov(Xit,it)=0。那么无论是N,还是T,模型参数的混合最小二乘估计量都具有一致性。对混合模型通常采用的是混合最小二乘(PooledOLS)估计法。然而,在误差项服从独立同分布条件下由OLS法得到的方差协方差矩阵,在这里通常不会成立。因为对于每个个体i及其误差项来说通常是序列相关的。NT个相关观测值要比NT个相互独立的观测值包含的信息少。从而导致误差项的标准差常常被低估,估计量的精度被虚假夸大。如果模型存在个体固定效应,即i与Xit相关,那么对模型应用混合OLS估计方法,估计量不再具有一致性。解释如下:假定模型实为个体固定效应模型yit=i+Xit'+it,但却当作混合模型来估计参数,则模型可写为yit=+Xit'+(i-+it)=+Xit'+uit(20)其中uit=(i-+it)。因为i与Xit相关,也即uit与Xit相关,所以个体固定效应模型的参数若采用混合OLS估计,估计量不具有一致性。3.2平均数(between)OLS估计平均数OLS估计法的步骤是首先对面板数据中的每个个体求平均数,共得到N个平均数(估计值)。然后利用yit和Xit的N组观测值估计参数。以个体固定效应回归模型yit=i+Xit'+it(21)为例,首先对面板中的每个个体求平均数,从而建立模型=i+'+,i=1,2,…,N(22)其中=,=,=,i=1,2,…,N。变换上式得=+'+(i-+),i=1,2,…,N(23)上式称作平均数模型。对上式应用OLS估计,则参数估计量称作平均数OLS估计量。此条件下的样本容量为N,(T=1)。如果与(i-+)相互独立,和的平均数OLS估计量是一致估计量。平均数OLS估计法适用于短期面板的混合模型和个体随机效应模型。对于个体固定效应模型来说,由于i和Xit相关,也即i和相关,所以,回归参数的平均数OLS估计量是非一致估计量。3.3离差变换(within)OLS估计对于短期面板数据,离差变换OLS估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离差观测值,然后利用离差变换数据估计模型参数。具体步骤是,对于个体固定效应回归模型yit=i+Xit'+it(24)中的每个个体计算平均数,可得到如下模型,=i+'+其中、、的定义见(22)式。上两式相减,消去了i,得yit-=(Xit-)'+(it-)此模型称作离差变换数据模型。对上式应用OLS估计,所得的估计量称作离差变换OLS估计量。对于个体固定效应回归模型,的离差变换OLS估计量是一致估计量。如果it还满足独立同分布条件,的离差变换OLS估计量不但具有一致性而且还具有有效性。如果对固定效应i感兴趣,也可按下式估计。=-'(27)利用中心化(或离差变换)数据,计算回归参数估计量的方差协方差矩阵如下,()=[(Xit-)'(Xit-)]-1(28)其中=。个体固定效应回归模型的估计通常采用的就是离差变换(within)OLS估计法。在短期面板条件下,即便i的分布、以及i和Xit的关系都已知到,i的估计量仍不具有一致性。当个体数N不大时,可采用OLS虚拟变量估计法估计i和。离差变换OLS估计法的主要缺点是不能估计非时变回归变量构成的面板数据模型。比如Xit=Xi(非时变变量),那么有=Xi,计算离差时有Xi-=0。3.4一阶差分(firstdifference)OLS估计在短期面板条件下,一阶差分OLS估计就是对个体固定效应模型中的回归量与被回归量的差分变量构成的模型的参数进行OLS估计。具体步骤是,对个体固定效应回归模型yit=i+Xit'+it取其滞后一期关系式yit-1=i+Xit-1'+it-1上两式相减,得一阶差分模型(i被消去)yit-yit-1=(Xit-Xit-1)'+(it-it-1),i=1,2,…,N;t=1,2,…,T对上式应用OLS估计得到的的估计量称作一阶差分OLS估计量。尽管i不能被估计,的估计量是一致估计量。在T>2,it独立同分布条件下得到的的一阶差分OLS估计量不如离差变换OLS估计量有效。3.5随机效应(randomeffects)估计法(可行GLS(feasibleGLS)估计法)有个体固定效应模型yit=i+Xit'+ii,it服从独立同分布。对其作如下变换yit-=(1-)+(Xit-)'+vit(29)其中vit=(1-)i+(it-)渐近服从独立同分布,=1-,应用OLS估计,则所得估计量称为随机效应估计量或可行GLS估计量。当=0时,(29)式等同于混合OLS估计;当=1时,(29)式等同于离差变换OLS估计。对于随机效应模型,可行GLS估计量不但是一致估计量,而且是有效估计量,但对于个体固定效应模型,可行GLS估计量不是一致估计量。面板数据模型估计量的稳健统计推断。在实际的经济面板数据中,N个个体之间相互独立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。为了得到正确的统计推断,需要克服这两个因素。对于第i个个体,当N,Xi的方差协方差矩阵仍然是TT有限阶的,所以可以用以前的方法克服异方差。采用GMM方法还可以得到更有效的估计量。EViwes中对随机效应回归模型的估计采用的就是可行(feasible)GLS估计法。4.面板数据模型设定的检验方法面板数据建模的一项重要任务就是判别模型中是否存在个体固定效应。以个体随机效应模型yit=i+Xit'+it,为例,无论是固定效应还是随机效应模型,i都被看作是随机变量,并都有假定条件E(yiti,Xit)=i+Xit'下面介绍两种检验方法,F检验和Hausman检验。4.1F先介绍原理。F统计量定义为F=(30)其中SSEr表示施加约束条件后估计模型的残差平方和,SSEu表示未施加约束条件的估计模型的残差平方和,m表示约束条件个数,T表示样本容量,k表示未加约束的模型中被估参数的个数。在原假设“约束条件真实”条件下,F统计量渐近服从自由度为(m,T–k)的F分布。FF(m,T–k)以检验建立混合回归模型还是个体固定效应回归模型为例,介绍F检验的应用。建立假设H0:i=。模型中不同个体的截距相同(真实模型为混合回归模型)。H1:模型中不同个体的截距项i不同(真实模型为个体固定效应回归模型)。F统计量定义为:F==(31)其中SSEr表示约束模型,即混合估计模型的残差平方和,SSEu表示非约束模型,即个体固定效应回归模型的残差平方和。约束条件为N个。k表示公共参数个数。以案例1为例,已知SSEr=4824588,SSEu=2270386,个体数15。F====6.6(32)F0.05(15,88)=1.8因为F=6.6>F0.05(15,88)=1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型比混合回归模型更合理。以检验建立混合回归模型还是时点固定效应回归模型为例,介绍F检验的应用。建立假设H0:t=。模型中不同截面的截距相同(真实模型为混合回归模型)。H1:模型中不同截面的截距项t不同(真实模型为时点固定效应回归模型)。F统计量定义为:F==(31)其中SSEr表示约束模型,即混合估计模型的残差平方和,SSEu表示非约束模型,即时点固定效应回归模型的残差平方和。约束条件为T个。k表示公共参数个数。以案例1为例,已知SSEr=4824588,SSEu=4028843,截面个数7。F====2.7(32)F0.05(7,96)=2.1因为F=2.7>F0.05(15,88)=2.1,推翻原假设,比较上述两种模型,建立时点固定效应回归模型比混合回归模型更合理。4.2Hausman检验原假设与备择假设是H0:个体效应与回归变量无关(个体随机效应回归模型)H1:个体效应与回归变量相关(个体固定效应回归模型)例:=0.6976,s()=0.0127(个体固定效应回归模型估计结果,对应图10);=0.7246,s()=0.0106(个体随机效应回归模型估计结果,对应图13)H===14.89因为H=14.89>20.05(1)=3.8,所以模型存在个体固定效应。应该建立个体固定效应回归模型。注意:EViews5.0可以直接进行Hausman检验(见案例9)。5.面板数据建模案例分析案例1(file:5panel02):图14是混合估计对应数据的散点图。回归结果如下(EViwes输出见案例),CP=129.63+0.76IP(2.0)(79.7)图14混合估计散点图图15平均数估计散点图图15是平均值数据散点图。先对数据按个体求平均数和。然后用15组平均值数据回归,=-40.88+0.79(-0.3)(41.1)图16离差变换估计散点图图17差分估计散点图图16是离差变换数据散点图。先计算CP、IP分别对、的离差变换数据,然后用离差变换数据计算OLS回归。CPM=0.77IPM(90)图17是一阶差分数据散点图。先对CP、IP各个体作一阶差分,然后用一阶差分数据回归。DCP=0.71DIP(24)由上一节知此问题应该建立个体固定效应回归模型,所以离差变换OLS估计方法是最有效的,参数估计值0.77最可信。案例2美国公路交通事故死亡人数与啤酒税的关系研究(file:5panel01a)见StockJHandMWWatson,IntroductiontoEconometrics,AddisonWesley,2003第8章。美国每年有4万高速公路交通事故,约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。早晨13点25%的司机饮酒。饮酒司机出交通事故数是不饮酒司机的13倍。现有19821988年48个州共336组美国公路交通事故死亡人数(number)与啤酒税(beertax)的数据。图181982年数据散点图(File:5panel01a-graph01)图191988年数据散点图(File:5panel01a-graph07)1982年数据的估计结果(散点图见图18)1982=2.01+0.15beertax1982(0.15)(0.13)1988年数据的估计结果(散点图见图19)1988=1.86+0.44beertax1988(0.11)(0.13)图20混合估计共336个观测值。估计结果仍不可靠。(file:5panel01b)19821988年混合数据估计结果(散点图见图20)19821988=1.85+0.36beertax19821988(42.5)(5.9)SSE=98.75显然以上三种估计结果都不可靠(回归参数符号不对)。原因是啤酒税之外还有许多因素(如各州的路况、车型、交通立法等因素)影响交通事故死亡人数。从面板理论上说,不知混合回归模型是不是最优的模型形式。按个体固定效应回归模型估计it=2.375+…-0.66beertaxit(24.5)(-3.5)SSE=10.35用F检验判断应该建立混合回归模型还是个体固定效应回归模型。H0:i=,混合回归模型(约束截距项为同一参数)。H1:i各不相同。个体固定效应回归模型(截距项任意取值)F=(以EViwes5.0计算自由度)===50.8F0.05(48,286)=1.2因为F=50.8>F0.05(14,89)=1.2,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。按双固定效应回归模型估计it=2.37+…-0.646beertaxit(23.3)(-3.25)SSE=9.92用F检验判断应该建立混合回归模型还是个体时点双固定效应回归模型。H0:i=。t=。混合回归模型(约束截距项为同一参数)。H1:i,t各不相同。个体时点双固定效应回归模型(截距项任意取值)F=(以EViwes5.0计算自由度)===45F0.05(55,279)=1.6因为F=45>F0.05(55,279)=1.6,推翻原假设,比较上述两种模型,建立个体时点双固定效应回归模型更合理。以上两种模型回归系数的估计结果非常近似。F检验也说明,建立个体固定效应回归模型和双固定效应回归模型都要比混合回归模型合理。所以回归参数-0.66和-0.646要比混合回归模型参数0.36合理。因为差分OLS估计也是估计固定效应回归模型的一种方法,下面讨论面板差分数据得到的估计结果。利用1988年和1982年数据的差分数据得估计结果(散点图见图21)。这个估计结果在符号上也是合理的。1988-1982=-0.072-1.04(beertax1988-beertax1982)(0.065)(0.36)图21差分数据散点图(File:5panel01a-graph08)因此问题应该建立个体固定效应回归模型,所以个体固定效应估计结果-0.66应当更可信。6.面板数据模型的EViwes操作6.1用EViwes5.0建立面板数据估计模型步骤。(file:5panel02)利用(例1)1996~2002年15个省级地区城镇居民家庭年人均消费性支出和年人均收入数据(不变价格数据)介绍面板数据模型估计步骤。(1)建立混合数据库(Pool)对象。首先建立年度工作文件(19962002)。在打开工作文件窗口的基础上,点击EViwes主功能菜单上的Objects键,选NewObject功能(如图1),从而打开NewObject(新对象)选择窗(如图2)。在TypeofObject选择区选择Pool(合并数据库),并在NameofObject选择区为混合数据库起名Pool01(初始显示为Untitled)。点击图2中OK键,从而打开混合数据库(Pool)窗口。在窗口中输入15个地区的标识AH(安徽)、BJ(北京)、…、ZJ(浙江),如图3。图1图2图3(2)定义序列名并输入数据。在新建的混合数据库(Pool)窗口的工具栏中点击Sheet键(第2种路径是,点击View键,选Spreadsheet(stackeddata)功能),从而打开SeriesList(列写序列名)窗口,定义时间序列变量CP?和IP?(符号?表示与CP和IP相连的15个地区标识名)如图4。图4点击OK键,从而打开混合数据库(Pool)窗口(图5)。(点击Edit+-键,使EViwes处于可编辑状态)可以用键盘输入数据,也可以用复制和粘贴的方法输入数据。图5图5所示为以个体为序的阵列式排列(stackeddata)。点击Order+-键,还可以变换为以截面为序的阵列式排列。输入完成后的情形见图6。图6点击PanelGener可以通过公式用已有的变量生成新变量(注意:输入变量时,不要忘记带变量后缀“?”)。这是1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。数据是7年的,每一年都有15个数据,共105组观测值。用cp表示消费,ip表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。在工作文件中打开面板数据窗口,点击View键,选DescriptiveStats功能可以得到面板数据按个体计算的特征数。见图7。图7个体特征数分析选定15个cp变量数据用Show命令打开数据窗口,点击View/Graph/Line命令可得到15个cp个体的时序图。类似操作可得到15个ip个体的时序图。图815个省级地区的人均消费序列(纵剖面)图915个省级地区的人均收入序列(file:5panel02)图10人均消费对收入的面板数据散点图(7个截面叠加)6.2面板数据模型的EViwes5.0估计方法:在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选NewObject功能,从而打开NewObject(新对象)选择窗。在TypeofObject选择区选择Pool(混合数据库),点击OK键,从而打开Pool(混合数据)窗口(图11)。在窗口中输入15个地区标识(变量的后缀)AH(安徽)、BJ(北京)、…、ZJ(浙江)。图11点击Estimation键,随后弹出PooledEstimation(混合估计)对话窗(见图12)。先对PooledEstimation(混合估计)对话窗中各选项功能给以解释。EViwes5.0面板数据模型估计对话窗口如下,图12EViwes5.0面板模型估计窗口图13EViwes5.1面板模型估计窗口EViews5.1版本的面板数据模型估计(PoolEstimation)窗口(图13)分成了两个模块,Specification(设定)和Option(选择),但基本功能与早期版本无本质区别。主要选择都集中在Specification(设定)模块中。见图14。熟悉了图14中选择方法对图15对话窗不难理解。在EstimationMethod(估计方法)选项区内有三个选项框。(1)Cross-section(横跨个体)中包括None(不选),Fixed(固定),Random(随机)分别用来做非个体效应,个体固定效应和个体随机效应的设定(见图14)。(2)Period(时点)中也包括None(不选),Fixed(固定),Random(随机)三项选择分别用来进行非时点效应,时点固定效应或时点随机效应设定(见图15)。图14图15(3)Weight(权数)可以在5种加权方法中做选择(见图16)。图16在EstimationSettings(估计方法设定)区包括二种估计方法:一种为LS(最小二乘)方法,一种为TSLS(两阶段最小二乘)方法。在RegressionandAR()Terms(回归变量与AR项)选择区,若把变量填入Common(共同)框内意味着变量的效率相同,如果把变量填入Cross-sectionspecification(截面设定)框内意味着回归变量的斜率随个体不同而不同。在EViews5.0、5.1版本的随机效应模型估计结果窗口点击View键,选Fixed/RandomEffectsTesting/CorrelatedRandomEffect-HausmanTest功能,可以直接获得应该建立随机效应模型还是个体固定效应模型的Hausman检验结果。用EViwes可以估计固定效应模型(包括个体固定效应模型、时点固定效应模型和时点个体固定效应模型3种)、随机效应模型、带有AR(1)参数的模型、截面不同回归系数也不同的面板数据模型。用EViwes可以选择普通最小二乘法、加权最小二乘法(以截面模型的方差为权)、似不相关回归法估计模型参数。可以在Commoncoefficients选择窗和Crosssectionspecificcoefficients选择窗中填入AR(1)项。如果把AR(1)项填在Commoncoefficients选择窗中相当于假设模型有相同的自回归误差项,如果把AR(1)项填在Crosssectionspecificcoefficients选择窗中相当于假设模型有不同的自回归误差项。注意:如果把解释变量填入Crosssectionspecificcoefficients选择窗中,对应不同的解释变量将会得到不同的回归参数。估计过程中的缺省方法是等权(Noweighting)估计。还可以选择Crosssectionweights(按截面取权数)和SUR(似不相关回归)。3种估计方法如下:混合模型(PoolModel)工具栏中点击Estimate键,打开PooledEstimation(混合估计)窗口如图17。图17在DependentVariable(相依变量)选择窗填入CP?;在Commoncoefficients(系数相同)选择窗填入IP?;Crosssectionspecificcoefficients(截面系数不同)选择窗保持空白;在Intercept(截距项)选择窗点击Common;在Weighting(权数)选择窗点击Noweighting。点击PooledEstimation(混合估计)窗口中的OK键。得输出结果如图18。图18相应表达式是=129.6313+0.7587IPit(2.0)(79.7)R2=0.98,SSEr=4824588,t0.05(103)=1.9915个省级地区的人均支出平均占收入的76%。注意:如果从时间和截面上看模型截距都为零,就可以建立不含截距项的(=0)的混合估计模型。以二变量模型为例,建立混合估计模型如下, yit=1xit+it,i=1,2,…,N;t=1,2,…,T(2)无截距项的混合模型EViwes估计方法:在PooledEstimation(混合估计)对话框中Intercept(截距项)选择窗中选None,其余选项同上。Eviwes对面板数据混合模型采用的是混合最小二乘(PooledOLS)估计法。个体固定效应回归模型的EViwes估计方法:在EViwes的PooledEstimation对话框中Intercept选项中选Fixedeffects。其余选项同上。图19图20注意:(1)EViwes输出结果中没有给出描述个体效应的截距项相应的标准差和t值。不认为截距项是模型中的重要参数。(2)当对个体固定效应模型选择加权估计时,输出结果将给出加权估计和非加权估计两种统计量评价结果。(3)输出结果的联立方程组形式可以通过点击View选Representations功能获得。(4)点击View选WaldCoefficientTests…功能可以对模型的斜率进行Wald检验。例如c(1)=0.7。(5)点击View选Residuals/Table,Graphs,CovarianceMatrix,CorrelationMatrix功能可以分别得到按个体计算的残差序列表,残差序列图,残差序列的方差协方差矩阵,残差序列的相关系数矩阵。(6)点击Procs选MakeModel功能,将会出现估计结果的联立方程形式,进一步点击Solve键,在随后出现的对话框中可以进行动态和静态预测。(7)Eviwes对个体固定效应回归模型的估计采用的就是离差(within)OLS估计法。以个体固定效应回归模型为例介绍EViews预测方法。在个体固定效应回归估计窗口点击Proc键选makemodel功能。在打开的对话框中点击Solve键,可得到样本内每个个体的动态和静态预测序列。以其中的安徽,北京为例,预测效果很好。用19962001年数据建立的个体固定效应回归模型进行样本外1期预测的EViews操作:在个体固定效应回归估计窗口,点击Procs选MakeModel功能。点击Solve。在出现的对话框的Dynamics中选择Dynamiicsolution(动态解)。在Solutionsample对话框中输入“20022002”。点击“确定”键,得每个个体样本外1期(2002年)预测结果。其中安徽、北京、福建2002年人均消费预测值如下安徽2002年消费(cp)的预测误差是=0.02。北京2002年消费(cp)的预测误差是=0.07。福建2002年消费(cp)的预测误差是=0.03。预测效果很好。时点固定效应回归模型的EViwes估计方法:在PooledEstimation(混合估计)窗口中的DependentVariable(相依变量)选择窗填入CP?;在Commoncoefficients(系数相同)选择窗填入IP?;在Crosssectionspecificcoefficients(截面系数不同)选择窗选None;在Period选择窗选Fixed。点击确定键。图21图22个体时点双固定效应回归模型的EViwes估计方法:在PooledEstimation(混合估计)窗口中的DependentVariable(相依变量)选择窗填入CP?;在Commoncoefficients(系数相同)选择窗填入IP?;在Crosssectionspecificcoefficients(截面系数不同)选择窗选Fixed;在Period选择窗选Fixed。点击确定键。图23图24注意:结果中cross对应的是个体,period对应的是时点。随机效应模型的EViwes估计方法:在EViwes的PooledEstimation对话框中Cross-section选项中选Randomeffects。其余选项同混合估计操作。图25Eviwes对个体随机效应回归模型的估计采用的就是feasibleGLS估计法。图26相应表达式是=(345.2-2.5)+(345.2+367.0)D2+…+(345.2+106.1)D15+0.72IPit(16-13-3)(4.3)(64.4)R2=0.99,SSE=2501653其中虚拟变量D2,D3,…,D15的定义是Di=下面利用Hausman统计量检验应该建立个体随机效应回归模型还是个体固定效应回归模型。原假设与备择假设是H0:个体效应与回归变量(IPit)无关(个体随机效应回归模型)H1:个体效应与回归变量(IPit)相关(个体固定效应回归模型)设个体固定效应回归模型参数和个体随机效应回归模型参数估计量分别用和表示(表示离差OLS估计量;表示可行GLS估计量)。如果真实模型是个体随机效应回归模型,那么和都是一致估计量,两者差异应该小。如果真实模型是个体固定效应回归模型,那么是一致估计量而是非一致估计量,两者差异应该大。所以,如果两种估计结果差异小,说明可以建立个体随机效应回归模型;如果两种估计结果差异大,应该建立个体固定效应回归模型。由个体固定效应回归结果(16-13-2)式知=0.6976,s()=0.0127由个体随机效应回归结果(16-13-3)式知=0.7246,s()=0.0106H===14.89H表示Hausman统计量,因为H=14.89>20.05(1)=3.8,所以模型存在个体固定效应。应该建立个体固定效应回归模型。EViews5.0可以直接进行Hausman检验。在个体随机效应回归输出结果窗口中点击View键,选Fixed/RandomEffectsTesting/CorrelatedRandomEffect-HausmanTest功能,如图23。可以直接获得如图24的Hausman检验结果(主要结果)。图27图28CorrelatedRandomEffect-HausmanTest即是否存在个体固定效应的Hausman检验。图中第1部分给出的是Hausman检验结果。Hausman统计量的值是14.79,相对应的概率是0.0001。说明检验结果拒绝了随机效应模型原假设。应该建立个体固定效应模型。14.79与上面计算的14.89略有差别,是由于两种计算的误差不同所致。图中第2部分给出的是Hausman检验中间结果比较。0.697561是个体固定效应模型对参数的估计,0.724569是随机效应模型对参数的估计。0.000049是相应两个参数估计量的分布方差的差(Var(Diff))。综上分析,1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入问题应该建立个体固定效应回归模型。人均消费平均占人均收入的70%。随地区不同,自发消费(截距项)存在显著性差异。(5)回归系数不同的面板数据模型当认为对于不同个体,解释变量的回归系数存在显著性差异时,还可以建立回归系数不同的面板数据模型。回归系数不同的个体固定效应模型EViwes估计方法:在PooledEstimation(混合估计)窗口中的DependentVariable(相依变量)选择窗填入CP?;在Commoncoefficients(系数相同)选择窗保持空白(如果需要估计时点固定效应也可输入虚拟变量D1997,D1998,D1999,D2000,D2001,D2002);在Crosssectionspecificcoefficients(截面系数不同)选择窗填入IP?;在Intercept(截距项)选择窗中选Fixedeffects(也可以做其他选择);在Weighting(权数)选择窗点击Noweighting(也可以做其他选择)。点击PooledEstimation(混合估计)窗口中的OK键。图29图304种估计方法的输出结果。图31混合估计散点图图32混合OLS估计(Pooledregression)图33平均值OLS估计散点图图34平均值OLS估计(betweenregression)图35离差变换(within)估计散点图图36离差变换(within)OLS估计结果图37差分估计散点图图38差分OLS估计结果注意:表示箱的3条横线自下而上分别代表第25、50、75百分位数。黑点表示样本均值。阴影长度表示中位数的置信区间。案例3:怎样建立非线性面板数据模型并预测(file:5expend-zhang)全国省级地区城镇居民人均食品支出与收入的关系研究(19852005)。为均衡面板数据,包括28个省市自治区,不包括西藏、新疆和重庆市,21年共588个观测值。图1给出28个省级地区19852005年城镇居民人均食品支出的面板数据3维图。图1a28个省级地区城镇居民人均食品支出3维图(file:5expend-zhang)图1b28个省级地区城镇居民人均食品支出箱图(file:5expend-zhang)图2给出28个省级地区19852005年城镇居民人均收入的面板数据3维图。图2a28个省级地区城镇居民人均收入3维图(file:5expend-zhang)图2b28个省级地区城镇居民人均收入箱图(file:5expend-zhang)首先用混合数据把28个地区的数据混合在一起(非面板数据)分析分省城镇居民人均食品支出(food)与城镇居民人均收入(income)的关系,从而确定建立何种类型的模型最合理。28个省市自治区,21年共588组观测值。图3Food和income的混合数据散点图首先通过散点图研究。food和income的混合数据散点图如图3(file:income-food)。显然变量food和income之间存在非线性关系和异方差,建立线性模型是不合理的。但,如果不看散点图,还误以为线性模型是一个很好的回归结果。把income取成对数形式,尝试建立半对数模型。图4显示,建立半对数模型也不合理。图4Food和log(income)的混合数据散点图尝试建立全对数模型(见图5)。图5与图3、图4相比,异方差得到克服。但是可以看出,log(Food)和log(income)的关系仍然是非线性的。进一步观察log(food)和log(log(income))的散点图,如图6。log(Food)和log(log(income))存在满意的线性关系,同时,不存在异方差。所以讨论建立面板数据模型时,应该建立关于log(Food)和log(log(income))的面板数据模型。图5log(Food)和log(income)的混合数据散点图图6log(Food)和log(log(income))的散点图首先用混合数据(非面板数据)估计模型。得回归结果如下,logfood=-5.8636+6.2072log(logincome)(1)(-61.7)(137.3)R2=0.97,DW=2.0,NT=588本来总样本容量应该是NT=2131=651,但西藏、新疆、重庆的数据有缺失。图7混合数据估计结果(file:income-food,eq01)上式的导函数是=导函数不是常量,说明(1)式中人均食品支出对人均收入的弹性系数是随着城镇人均收入的增加而减小。当城镇人均收入为666元时,也即log(666)=log(income)=6.5时,依据上式计算,log(food)的弹性系数是0.955.。当城镇人均收入增长到13400元时,也即log(13400)=log(income)=9.5时,log(food)对收入的弹性系数下降到0.653。城镇人均食品支出对人均收入的弹性系数随着人均收入的提高而递减。用面板数据得混合估计结果如下。图8混合OLS估计结果(file:5expend-zhang)logfood=-5.8117+6.2072log(logincome)(2)(-61.7)(137.3)R2=0.97,DW=0.16,NT=2821=588(1)和(2)式的估计系数是完全相同的,只有DW值不同,(1)式的数据是全部按数值大小排列的,(2)式按每个个体时间序列排列的。用个体固定效应回归模型的估计结果如下:logfood=-5.5151+6.0645log(logincome)(3)(-90.1)(206.3)R2=0.989,DW=0.43,NT=2821=588图9个体固定效应估计结果(删去了输出结果的中间部分,file:5expend-lishisen)总样本容量是NT=2821=588。用F检验判断是建立混合回归模型合理,还是建立个体固定效应回归模型合理。F====32.6F0.05(28,558)=1.6因为F=32.6>F0.05(31,598)=1.6,推翻原假设,比较上述两种模型,建立个体固定效应回归模型比混合回归模型更合理。模型误差项存在自相关,通过尝试,加三个AR自回归项,得结果如下:logfood=-5.0160+5.8320log(logincome)(4)(-35.1)(86.6)R2=0.994,DW=2.1,NT-3N=2821-328=5043个自回归项使自由度减小84个。图10克服自相关的个体固定效应回归模型用F检验判断是建立混合回归模型合理,还是建立个体固定效应回归模型合理。F=====34.7F0.05(112,474)=1.1因为F=34.7>F0.05(112,474)=1.1,推翻原假设,比较混合回归模型和克服自相关的个体固定效应回归模型,结论仍然是建立个体固定效应回归模型比混合回归模型合理。以图10个体固定效应回归模型为例介绍EViews预测方法。在个体固定效应回归估计窗口点击Proc键选makemodel功能。在打开的对话框中点击Solve键,可得到样本内每个个体的动态和静态预测序列。以其中的安徽,北京为例,静态预测效果很好。用19852004年数据建立的个体固定效应回归模型进行样本外1期预测的EViews操作:在个体固定效应回归估计窗口(图10),点击Procs选MakeModel功能。点击Solve。在出现的对话框的Dynamics中选择Dynamiicsolution(动态解)。在Solutionsample对话框中输入“20052005”。点击“确定”键,得每个个体样本外1期(2005年)预测结果。其中安徽、北京、福建2005年人均消费预测值如下安徽2005年食品支出的预测误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论