免费预览已结束,剩余18页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
静态面板数据模型及其运用一、面板数据定义面板数据,简言之是时间序列和截面数据的混合。面板数据的定义严格地讲是对一组个体(如居民、家庭、企业、行业、地区和国家等)连续观察多期得到的资料。所以很多时候我们也称其为“追踪资料”。截面数据回归时间序列数据回归面板数据回归面板数据包括三个方面的信息:截面成员,时间和变量。回归分析时使用三维数据比较困难,一般要转换为二维数据,可以按照截面堆积和时间堆积的方式进行转换。近年来,由于面板数据资料的获得变得相对容易,使其应用范围也不断扩大。而关于面板数据的计量理论也几乎涉及到了以往截面分析和时间序列分析中所有可能出现的主题,如近年来发展出的面板向量自回归模型(Panel VAR)、面板单位根检验(Panel Unit Root test)、面板协整分析(Panel Cointegration)、门槛面板数据模型(Panel Threshold)等,都是在现有截面分析和时间序列分析中的热点主题的基础上发展起来的。使用面板数据建模的优点:第一,便于控制个体的异质性。面板数据表明个体、企业、地区或国家是存在异质性的,单纯的时间序列分析和横截面分析没有控制异质性,估计通常是有偏的。比如,我们在研究全国30个省份居民人均消费青岛啤酒的数量时,可以选取居民的收入、当地的啤酒价格、上一年的啤酒消费量等变量作为解释变量。但同时我们认为民族习惯、风俗文化、广告投放等因素也会显著地影响居民的啤酒消费量。对于特定的个体而言,前两种因素不会随时间的推移而有明显的的变化,通常称为个体效应。而广告的投放往往通过电视或广播,我们可以认为在不同的年份所有省份所接受的广告投放量是不同的,通常称为时间效应。这些因素往往因为难以获取数据或不易衡量而无法进入我们的模型,在截面或时间序列分析中往往会引起遗漏变量的问题。而面板数据模型的主要用途之一就在于处理这些不可观测的个体效应或时间效应。第二,面板数据包含的信息量更大,降低了变量间共线性的可能性,增加了自由度和估计的有效性。时间序列数据常常会带来变量间的共线性,例如前面提到的啤酒需求,价格和收入的时间序列数据常常存在着多重共线性。但是在面板数据中,这种共线性就会小得多,因为横截面数据为价格和收入信息加入了许多变异性(异质性),从而使估计参数更有效。第三,便于分析动态调整过程。例如,在测度失业时,横截面数据可以估计在某一时点有多少人失业,但不能很好地解释失业的持续性问题。然而,面板数据可以估计出在某一期失业人群中到下一期继续保持失业状态的人群比例。面板数据还可以很好地研究工作转换、劳动力流动、居民消费和收入变动等问题。平衡面板数据:数据是完整的,每一个时期的观测个体相等。即每期的N相等,样本数为NT。非平衡面板数据:每一时期的观测个体不再相等,有些个体消失,没有数据可供观测,即。例如,在20年中,有些厂商倒闭了。二、静态面板数据模型的分类我们一般所说的静态面板数据模型,是指解释变量中不包含被解释变量的滞后项(通常为一阶滞后项)的情形。但严格地讲,随机干扰项服从某种序列相关的模型,如AR(1),AR(2),MA(1)等,也不是静态模型。动态和静态模型在处理方法上往往有较大的差异。用静态面板数据建立的模型通常有三种,即混合模型、固定效应模型和随机效应模型。1. 混合模型(Pooled Model)如果一个面板数据模型定义为:, (1)其中为被回归变量(标量),为截距项,为阶回归变量列向量(包括个回归量),为阶回归系数列向量,为误差项(标量)。则称此模型为混合模型。混合模型的特点是无论对任何个体和截面,回归系数和都相同。如果模型是正确设定的,则解释变量与误差项不相关,即。那么无论是,还是,模型参数的混合最小二乘估计量都是一致估计量。一个研究企业投资需求的例子。样本为包括五个企业和三个变量的22个年度(1935-1954)的面板数据。混合回归模型设定为:。其中,I为总投资,M为企业前一年的市场价值(反映企业的预期利润),K为前一年末工厂存货和设备的价值(反映必要重置投资期望值)。EViwes估计方法:在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选New Object功能,从而打开New Object选择窗。在Type of Object选择区选择Pool(混合数据库),点击OK键,从而打开Pool(混合数据)窗口。在窗口中输入20个行业标识。工具栏中点击Sheet键,从而打开Series List(列写序列名)窗口,定义变量I? M? K? 点击OK键,Pool(混合或合并数据库)窗口显示面板数据。在Pool窗口的工具栏中点击Estimate键,打开Pooled Estimation(混合估计)在Dependent Variable(因变量)选择窗填入I?;在Common coefficients(系数相同)选择窗填入M? K?;Cross section specific coefficients(截面系数不同)和period specific coefficients(时点系数不同)选择窗保持空白;在Fixed and Random选择窗中的cross-secti和period选项都选择none;在Weighting(权数)选择窗点击No weighting。点击Pooled Estimation(混合估计)窗口中的OK键。2. 固定效应模型(fixed effects regression model)根据未观测变量是否与解释变量相关,将面板数据模型分为固定效应模型和随机效应模型。固定效应模型的基本假设:假设1:(误差项与解释变量的当期观察值、前期观察值以及未来观察值均不相关,也就是说模型中所有的解释变量都是严格外生的。)假设2:(同方差假定)假设3: (未观测变量与解释变量相关)根据未观测变量是否随截面或时间变化,固定效应模型分为三种类型,即个体固定效应、时点固定效应和个体时点双向固定效应。2.1 个体固定效应模型(entity fixed effects model)个体固定效应模型定义为, (2)其中是模型截距项,是随机变量,表示对于N个不同的截面有N个不同的截距。表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯、国家的社会制度等,我们一般称其为“个体效应”(individual effects)。当个体效应的变化与有关时,应用固定效应模型进行估计;当个体效应的变化与无关时,应用随机效应模型进行估计。为阶回归变量列向量,为阶回归系数列向量,对于不同个体回归系数相同(我们主要讨论变截距不变系数模型),为误差项(标量)。个体固定效应模型也可以表示为:, (3)其中,因为个体固定效应模型中,未观测变量与解释变量之间是相关的,因此得到的OLS估计是非一致的。消除的影响以保证在面板数据模型中估计的一致性就成为一种首选。消除个体的影响的方法主要有两种:一是一阶差分法,二是组内估计法。一阶差分法的缺陷:若某些解释变量的观测值不随时间变化,一阶差分法则失效。组内估计法:组内估计法利用解释变量和被解释变量偏离其时间维度均值的信息,来反映变量随时间变化的信息。组内估计法的基本原理是,先用每个变量减其组内均值,把数据中心化(entity-demeaned),然后用变换的数据估计个体固定效应模型的回归系数(不包括截距项),最后利用组内均值等式计算截距项。例:个体效应模型 (a)对(a)式两边按照时间维度求均值,得到: (b)(a)-(b)式,得到:从而消除了个体效应。以企业投资需求为例,个体固定效应模型设定为:EViwes估计方法:在Pooled Estimation对话框中,在Common coefficients(系数相同)选择窗填入M? K?;Cross section specific coefficients(截面系数不同)中填入C,在period specific coefficients(时点系数不同)选择窗保持空白;在Fixed and Random选择窗中的cross-secti选项选择fixed,在period选项选择none,其余选项同上。注意:当存在截面异方差时要选择截面加权法(cross- section weights)进行估计;当残差具有截面异方差和同步相关时,选择cross-section SUR进行估计。2.2 时点固定效应模型(time fixed effects model)时点固定效应模型定义为:, (4)其中是模型的截距项,表示对于T个时点有T个不同的截距项,且其变化与有关。为阶回归变量列向量,为阶回归系数列向量, 为误差项(标量)。时点固定效应模型也可以加入虚拟变量表示为:, (5)其中,其中为常数,不随时间、截面变化,表示随不同时点变化、但不随截面变化的未观测变量。因为时点固定效应模型中,未观测变量与解释变量之间是相关的,因此得到的OLS估计也是非一致的。因此消除的影响以保证在一个较短的面板数据模型中估计的一致性就成为一种首选。消除个体的影响的主要方法是组间估计法。组间估计的基本原理是,先用每个变量减其组间均值,把数据中心化(entity-demeaned),然后用变换的数据进行OLS估计。例:时点固定效应模型: (c)对(c)式两边按截面维度求均值,得到: (d)(c)-(d)式得到:从而消除了时点效应。另外,在模型中加入时间虚拟变量或某些特定年度虚拟变量与解释变量的交互项是刻画时点固定效应的较好做法。以企业投资需求为例,时点固定效应模型设定为:EViwes估计方法:在Pooled Estimation对话框中的Fixed and Random选择窗中的cross-secti选项选择none,在period选项选择fixed,其余选项与混合模型相同。2.3 个体时点固定效应模型(time and entity fixed effects model)个体时点固定效应模型定义为:, (6)其中是随机变量,表示对于N个不同的截面有N个不同的截距,且其变化与有关;是随机变量,表示对于T个时点有T个不同的截距项,且其变化与有关;为阶回归变量列向量,为阶回归系数列向量, 为误差项(标量)。如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(6)进行OLS估计得到的全部参数估计量都是不一致的。对于个体和时点双向固定效应,通常可以进行离差化处理,利用对进行回归,其中,。以企业投资需求为例,个体时点固定效应模型设定为:EViwes估计方法:在Pooled Estimation对话框中的Fixed and Random选择窗中的cross-secti选项和period选项都选择fixed,其余选项与混合模型相同。3. 随机效应模型(Random Effect Regression Model)随机效应模型定义为:, (7)其中是随机变量,其分布与无关;为阶回归变量列向量,为阶回归系数列向量,为误差项(标量)。同理也可定义个体随机效应模型和时点随机效应模型,但个体随机效应模型模型最为常用。对于个体随机效应模型,可以把并入误差项,将模型改写为: (8)随机效应模型可以视为固定效应模型的一个扩展,这需要在固定效应模型的基本假设1和2的基础上再增加如下假设:假设4:假设5: 假设6:(表明与相互独立)在随机效应模型中,在每个个体内部都包含着相同的个体效应,此时OLS无效,而且标准差也失真,应该采用广义最小二乘估计(GLS)。基于以上假定,我们可以写出模型的方差-协方差矩阵:其中,其具体形式为:那么,当成分方差(和)已知时,可以求出的GLS估计量:对应的方差估计量为:。然而,在实际中成分方差一般是未知的,因此需要采用可行广义最小二乘估计(FGLS),即先进行组内估计(采用固定效应模型),用估计的残差计算成分方差,得到的估计值。第二步估计混合OLS模型,利用其残差和第一步得到的即可估计出。由于组内估计量是无偏且一致的,所以我们可以利用固定效应模型的残差来估计,因为在固定效应模型的估计过程中我们已经去除了个体效应。设为固定效应模型的残差,则 (9)接着估计。设为模型(8)的残差,则=+ (10)由此可以得到=- (11)这种处理方法的依据在于只需要和的一致估计即可,至于是否无偏并不影响大样本性质。EViwes估计方法:在Pooled Estimation对话框中的Fixed and Random选择窗中的cross-secti选项选择random,在period选项选择none,在Weighting(权数)选择窗点击Generalized Least Squares, GLS),其余选项与混合模型相同。注意:术语“固定效应模型” 和“随机效应模型”用得并不十分恰当,容易产生误解。其实固定效应模型应该称之为“相关效应模型”,而随机效应模型应该称之为“非相关效应模型”,因为固定效应模型和随机效应模型中的都是随机变量。三、静态面板数据模型的设定检验根据前面的介绍,我们大体可以采用三种方法估计面板数据模型:混合OLS、固定效应模型和随机效应模型。那么如何对这三种模型进行区分和筛选呢?这就需要进行模型设定检验。1. 混合回归模型VS固定效应模型(检验固定效应)混合数据分析依赖于这样的假定,即变量之间的关系不随横截面或时间的变化而变化,这意味着X和Y之间的回归系数(截距项和斜率项)是常数。这种假定忽略了一些重要的事实,例如对不同国家或年份而言,X和Y的关系是不同的。而固定效应模型的设定是建立在如下假设基础之上的,即个体间存在显著差异。如果个体间的差异不明显,那么采用OLS对混合数据进行估计即可。检验的基本思路为,在个体效应不显著的原假设下,应当有如下关系成立: 我们可以采用F统计量来检验上述假设是否成立,其中表示有约束模型(即混合回归模型)的残差平方和,表示无约束模型(即固定效应模型)的残差平方和。约束条件为N个。T表示样本容量,k表示无约束模型中被估参数(公共参数)的个数。如果F值大于其临界值,则拒绝原假设,建立个体固定效应模型比混合固定效应模型更合理。Eviews中称多余的固定效应检验,使用F和LR两个统计量。在固定效应模型估计窗口中的View选项中选Fix/Random Effects Testing, Redundant Fixed Effects-Likelihood Ratio功能。2. 混合回归模型VS随机效应模型(检验随机效应)Breusch and Pagan(1980)基于OLS估计的残差构造LM统计量,针对如下假设来检验随机效应:零假设是误差项是独立同分布的,备择假设是存在个体随机效应。相应的检验统计量为:在原假设下,LM统计量服从一个自由度为1的卡方分布。如果拒绝原假设则表明存在随机效应。注意:该检验假设模型的设定是正确的,即与解释变量不相关。3. 固定效应模型VS随机效应模型(Hausman检验)我们可以通过检验固定效应与其他解释变量是否相关作为固定效应和随机效应模型筛选的依据。Huasman检验就是这样一个检验统计量。其基本思想是,在与其他解释变量不相关的原假设下,我们采用OLS估计固定效应模型和采用GLS估计随机效应模型得到的参数估计是无偏且一致的,但是随机效应估计却更有效。在备择假设成立下(即个体效应与解释变量相关),则固定效应模型的参数估计仍然是一致的,但随机效应模型模型估计量却不再一致。因此,在原假设下,二者的参数估计应该不会有显著的差异,我们可以基于二者参数估计的差异构造统计检验量。假设和分别为固定效应模型的OLS估计量和随机效应模型的GLS估计量,则-=+-,-, (12)基于上述Hausman检验的思想,有效估计量与它和非有效估计量之间的协方差应当为零,即(-),=,- =0 (13)由此我们可以得到:,= (14)将(14)式代入(12)式,有-=-= (15)Hausman检验基于如下Wald统计量:- - (16)其中,采用固定效应模型和随机效应模型的协方差矩阵进行计算。如果拒绝了原假设,就表明个体效应与解释变量是相关的,此时我们有两种处理办法:一是采用固定效应模型,二是采用工具变量法来处理内生性问题。4. 序列相关检验(1) 时间维度上的自相关检验零假设: ,对所有的。检验方法:伍德里奇的序列检验,用估计出来的残差对其滞后项进行回归,可以看一阶滞后项的值以观察其显著性,如果显著就是AR(1);高阶可以用F或Wald检验。(2)横截面之间的相关性检验运用Breusch and Pagan检验法(stata软件中用xttest2命令),针对较大的时间纬度和较小的横截面纬度,用来检验个体在横截面上的独立性。针对较小的时间纬度和较大的横截面纬度,可以在固定效应和随机效应估计后使用xtcsd命令进行检验。四、存在异方差的情形在前面的模型设定中,我们都做了同方差假定,即和。该假设在有些情况下并不合理,比如我们在研究不同省份的政府消费或不同规模的上市公司的收益时,一般都会认为干扰项会存在异方差。当模型中存在异方差时,在同方差假设下得到的估计量虽然仍旧是无偏且一致的,但不具有效性。此时,应该用广义最小二乘法(GLS)或FGLS对模型进行估计。这里我们放松同方差假设,介绍三种允许异方差设定的模型:固定效应模型中存在异方差;随机效应模型中和存在异方差。1. 固定效应模型中存在异方差我们首先将所有观察值进行堆叠,于是将固定效应模型用矩阵形式表示为: (17)其中,均为向量,。先定义一些有用的矩阵运算。定义,其中,为维矩阵,每个元素均为1。同时,我们定义,是维矩阵,每个元素均为;。矩阵和都具有如下性质:1)对称性、幂等性:,且2)正交性:3)和为单位矩阵:这里我们将前面的假设放松为: (18)令,为矩阵,则 (19)易于证明,因此可以在(17)式两边左乘以消除固定效应,得到 (20)其中,。干扰项的方差-协方差矩阵可以表示为: (21)于是模型(20)的GLS估计量为: (22)而的方差估计量为: (23)要获得相应的FGLS估计量,我们需要首先估计出中包含的未知参数。令,其中为模型(17)在同方差假定性的组内估计量。则我们可以得到的一致估计量:。于是,。用分别代替(22)和(23)式中的就可以得到相应的FGLS估计量。2. 随机效应模型中存在异方差模型的基本设定为: (24) (25)其中,。采用矩阵形式可表示为: (26) (27)其中,。干扰项的方差矩阵为: (28)其中,为矩阵。(28)式可以进一步表示为: (29)这里也是对角矩阵。若我们用和分别替换(29)式中的和,则可将(29)式变换为: (30)因此, 其中,为任意实数。我们对(26)式左乘 (31)得到变换后的模型为: 其中,。显然,满足同方差假设。要获得FGLS估计,需要估计和。由于存在异方差的情况下,模型(24)的组内估计量仍然是一致的,所以我们可以利用组内估计的残差来估计: (32)同时我们注意到,。而模型(24)的混合最小二乘估计也是一致的,所以我们可以利用OLS残差估计 (33)进而得到= - (34)在得到和的一致估计量和后,代入(29)式,即可得到的一致估计量。我们得到的FGLS估计量为: (35)相应的方差估计量为: (36)3. 随机效应模型中存在异方差将模型的异方差形式设定为:,此时 (37)若我们用和分别替换(29)式中的和,则可将(37)式变换为: (38)同时, (39)其中,为任意实数。因此, (40)为了获得FGLS估计量,我们可以仿照前面的处理方式,采用OLS和组内估计量的残差来估计和。令和分别为组内估计量和OLS估计的残差,则的估计式为: (41)其中,。由于,所以我们可以得到: (42)其中,进而得到N个的估计值: (43)于是我们可以利用这N个估计值的平均值得到: (44)五、STATA实现(一)基本设定1. 面板数据的导入和存储先在Excel中将面板数据以横截面(或时间)的形式堆积起来。然后在STATA中打开数据导入窗口,可直接将Excel表格中的数据复制粘贴过来。当然也可以直接在STATA的数据编辑窗口对数据进行编辑。2. 定义面板数据方法一:xtset id year方法二:tsset id year其中,变量id和year分别为截面变量和时间变量。id可以是company,industry, region或country; 时间变量可以是年度、季度或月度变量,即year, quarter, 或month。显然,通过这两个变量我们可以非常清楚地确定panel data的数据存储格式。因此,在使用STATA估计模型之前,我们必须告诉它截面变量和时间变量分别是什么,所以用命令tsset 或xtset。如tsset industry year。该命令输出的结果为:panel variable: industry, 1 to 20time variable: year, 1 to 10这里需要指出的是,由于panel data本身截面数据和时间序列二者的特性,所以对时间序列进行操作的运算同样可以应用到panel data身上。这一点在处理某些数据时显得非常方便。比如,对产出变量y,我们想产生一个新的变量lag_y,即y的一阶滞后变量,我们可以采用命令gen:gen lag_y=l.y按照这样的思路,我们还可以产生某个变量的对数、差分等。总之,凡是可以应用到时间序列上的命令,基本上都可以应用到panel data中来。(二)统计描述在正式进行模型的估计之前,我们必须对样本的基本分布特征有一个总体的了解。对于panel data而言,我们至少要知道我们的数据中有多少个截面,每个截面上有多少个观察期间,整个数据结构是平行的还是非平行的。进一步地,我们还要知道主要变量的样本均值、标准差、最大值、最小值等情况。这些都可以通过以下三个命令来完成:(1)tsset或xtset命令。该命令设定数据集为面板格式。(2)xtdes命令。该命令用于初步了解数据的大体分布状况,我们可以知道数据中包含多少个截面,每个截面最大和最小的时间跨度是多少。在某些要求使用平衡面板数据的情况下,我们可以使用该命令来诊断处理后的数据是否为平衡数据。(3)xtsum命令。该命令事实上式我们经常使用的命令summary的扩展,分组内、组间和样本整体三个层次计算各个的基本统计量。(三)面板数据模型估计STATA9.0及以上版本主要提供了如下几种面板数据模型的估计方法,如表1所示。表1 用于估计各种面板数据模型的命令1. 常用的估计命令功能xtreg固定效应估计(FE)、组间估计(between)、随机效应估计(RE)、总体平均估计(population-averaged)、最大似然估计(mle)等xtregar残差项为一阶自相关的固定效应或随机效应模型估计xtgls对随机效应模型的广义最小二乘估计(GLS)xtpcse混合回归或是经过标准差修正过的Paris-Winsten模型估计xtmixed多层混合效应回归(Multilevel mixed-effects linear regression)xtrc随机系数回归模型xtivreg二阶段工具变量估计2. 动态面板数据xtabond线性动态面板数据模型的差分广义矩估计(Difference GMM Estimator)xtdpdsys系统广义矩估计(System GMM Estimator)xtdpd线性动态面板数据模型估计3. 非线性模型xttobittobit随机效应模型xtintreg区间随机效应模型xtlogit固定、随机或总体平均logit模型xtprobit随机或总体平均probit模型xtpossion固定、随机或总体平均Possion模型xtnbreg固定、随机或总体平均负二项分布模型xtmelogit多层混合logistic回归xtmepossion多层混合Possion回归xtgee总体平均模型使用GEE估计这里我们先介绍静态面板数据模型(固定效应模型和随机效应模型)的估计方法。二者都是采用xtreg命令来估计的,差别在于选项的设定不同。表2 xtreg命令中选项的含义命令适用模型be组间效应估计fe固定效应模型估计re随机效应模型GLS估计pa总体平均模型GEE估计mle最大似然估计(四)应用实例:与发展中国家的进、出口贸易对美国制造业就业的影响。数据:美国制造业20个行业1997-2006年的面板数据(只包括个体效应不包括时点效应)。模型:这个面板数据模型包含了七个变量,其中industry和year分别表示行业的代码和观察的年份,相当于我们前面提到的截面变量和时间变量;n表示美国制造业就业人数;m表示美国制造业从发展中国家的进口渗透率;x表示美国制造业对发展中国家的出口导向率;w表示美国制造业的平均工资;y表示美国制造业的工业增加值。对这个面板数据模型的分析步骤如下:第一步,定义面板数据。命令为:tsset id year第二步,进行样本的描述统计。首先看看样本的大体分布情况,命令为:xtdes我们发现,我们的样本包含20个行业(N=20),每个行业有10年的资料(T=10, 1997-2006),整体上为面板数据。接着,我们列出样本中主要变量的基本统计量,命令为:xtsum n m x w y 。命令执行后我们发现统计结果是按照“整体”、“组间”和“组内”三个层次进行的。第三步,面板数据模型的回归分析。我们先做固定效应模型估计,命令为:xtreg n m x w y, fe估计结果分析:结果的前两行列示了模型的类别(本例中为固定效应模型)、截面变量以及估计值使用的样本数目和个体的数目。第3行到第5行显示了模型的拟合优度,分为组内、组间和样本总体三个层次。第6行和第7行分别显示了针对参数联合检验的F统计量和相应的P值,表明参数的整体显著性。第9-13行显示了解释变量的估计系数、标准差、t统计值和相应的P值以及95%置信区间。最后几行显示了固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma_u和sigma_e)、二者之间的关系(rho)。最后一行还给出了检验固定效应是否显著的F统计量和相应的P值。如何在个体固定效应模型中显示每个个体的截距项?xi:xtreg n m x w y i.id,fe或者在模型中加入虚拟变量。由于固定效应模型假设存在着个体效应,每个个体都有其单独的截距项。这就相当于在原方程中引入n-1个虚拟变量。tab id, gen (dum)drop dum1xtreg n m x w y dum*,fe我们再做随机效应模型估计,命令为:xtreg n m x w y, re可以比较一下随机效应模型的估计结果与固定效应模型的差异。第四步,模型的筛选和检验。这是模型设定过程中最为关键同时也是最难的一步,主要涉及使用混合OLS模型、固定效应模型还是随机效应模型,更进一步还可能包括序列相关和异方差的检验等问题。(1)检验个体效应的显著性。对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上是否显著。如果F统计量较大,其相应的P值较小,则表明固定效应模型优于混合OLS模型。在eviews中可以用View/Fixed/Random Effects Testing/redundant fixed effext test来实现。下面我们说明如何检验随机效应是否显著,命令为:xttest0。检验得到的chi2统计量较大,相应的P值较小,则表明随机效应非常显著,即随机效应模型也优于混合OLS模型。至于固定效应模型和随机效应模型哪个更好,则要采用Hausman检验来确定。(2)Hausman检验。具体步骤为:第一步:qui xtreg n m x w y, feest store fe第二步:qui xtreg n m x w y, reest store re第三步:hausman fe这里,qui的作用在于不把估计结果输出到屏幕上,est store的作用在于把估计结果存储到名称为fe的临时文件中。输出结果为:在Hausman test结果中,如果chi2值较大,相应的P值很小,则应拒绝原假设,进行固定效应模型估计;如果chi2值较小,相应的P值较大,则应进行随机效应模型估计。在进行Hausman检验过程中,有时我们还会得到负的chi2值。产生这个情况的主要原因是我们的模型设定有问题,导致Hausman检验的基本假设得不到满足。这时,我们最好先对模型的设定进行分析,看看是否有遗漏变量的问题,或者某些变量是非平稳的等等。在确定模型没有设定问题的情况下再进行Hausman检验,如果仍然拒绝原假设或是出现上面的问题,那么我们就认为随机效应模型的基本假设(个体效应与解释变量不相关)得不到满足。此时,需要采用工具变量法或是使用固定效应模型。STATA9.0级以上的版本,使用hausman命令中新增的sigmaless和sigmamore两个选项可以大大降低上述chi2值为负的情况出现的次数。在eviews中,hausman检验通过View/Fixed/Random Effects Testing/Correlated Random Effects - Hausman Test来实现。时间固定效应针对时间固定效应模型,我们可以做组间估计,以消除时间固定效应的影响,命令为:xtreg n m x w y, be如果要显示时点固定效应,可作如下估计:xi: xtreg n m x w y i.year, fe如果希望进一步在上述模型中加入时间效应,那么可以采用时间虚拟变量来实现。首先需要定义T-1个时间虚拟变量,命令为:tab year, gen(yr)drop yr1这里,year为样本中表示时间的变量,选项gen(yr)的作用在于产生T个年度虚拟变量,第二条命令的作用在于去掉第一个虚拟变量以避免共线性。若固定效应模型中加入时间虚拟变量,则估计命令为:xtreg n m x w y yr*, fe若随机效应模型中加入时间虚拟变量,则估计命令为:xtreg n m x w y yr*, re无论估计哪一个模型,检验时间效应是否显著的命令均为:test yr2=yr3=yr4= yr5=yr6=yr7= yr8=yr9=yr10=0这里我们假设T=10,所以共有9个时间虚拟变量。时点效应的显著性也可以通过hausman检验进行:xtreg n m x w y,feest store fe1xtreg n m x w y yr*,feest store fe2hausman fe1 fe2个体时点固定效应(双向固定效应)可以做总体平均估计:xtreg n m x w y, pa若要显示个体效应和时点效应,则估计:xi:xtreg n m x w y i.id i.year, fe序列相关和截面相关检验对于固定效应模型,我们可以采用基于差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025中铁十九局集团矿业投资有限公司招聘1人备考题库含答案详解(达标题)
- 强直性脊柱炎培训课件
- 2025年甘肃省水务投资集团有限公司招聘企业管理人员备考题库含答案详解(巩固)
- 高校竞聘考试题库及答案
- 2025年低碳生活科普知识竞赛题库附答案
- 2025福建厦门外代报关行有限公司社会招聘1人备考题库附答案详解(综合卷)
- 2025年合肥某国有企业派遣制人员招聘1人备考题库及一套参考答案详解
- 2025江苏东信人力资源有限公司招聘2人备考题库及答案详解(名师系列)
- 2025年劳动争议调解仲裁法知识竞赛题库及答案
- 2025年煤炭生产经营单位(安全生产管理人员)复审考试试题及答案
- 3套2025年发展对象考试100分试题(附全答案)
- 肥胖的危害课件
- 熟食原料配送合同范本
- 2025年江苏烟草考试题目及答案
- 基于BIM的建筑工程现场数据采集方案
- 2025年保育师考试测试题库及答案
- 一拳头一仇人一击掌一朋友-拒绝打架斗殴主题班会课件
- 2025公共基础知识试题库含答案详解(完整版)
- 2025年烟叶调制工试题及答案
- 韩国教学课件介绍
- 人保财险安全知识培训课件
评论
0/150
提交评论