Panel_Data_模型设定的新思路_张红星[1].贾彦东_.doc_第1页
Panel_Data_模型设定的新思路_张红星[1].贾彦东_.doc_第2页
Panel_Data_模型设定的新思路_张红星[1].贾彦东_.doc_第3页
Panel_Data_模型设定的新思路_张红星[1].贾彦东_.doc_第4页
Panel_Data_模型设定的新思路_张红星[1].贾彦东_.doc_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Panel Data 模型设定的新思路固定效应与随机效应的统一贾彦东1 张红星1,2 (1、西南财经大学统计学院 2、云南财贸学院计算机科学系)Abstract: The debate between fixed effect and random effect has been haunting in Panel Data analysis since its origin. Discusses afterwards which try to make the difference are clear on behalf of the involved applied researchers, but the distinction still baffles the followers. In this paper we propose a new approach to specify the panel data model which makes both fixed effect and random effect as its special cases, and also, the hierarchy among one-way and two-way is revealed clearly under our approach. The most important implication is that it is possible to proceed the analysis of panel data model in a unified framework. Keywords: Panel Data model, fixed effect, random effect, double effect, one-way model, two-way model, general model.内容提要:经典Panel Data模型研究中一直存在着固定效应与随机效应的判断与争论问题,这种模型设定形式的不准确常常导致模型参数估计的无效性以及一维(one-way)与二维(two-way)误差成分模型的混淆。在此,本文提出建立一种新的同时囊括随机与固定两种效应的误差成分一般模型,其中一维(one-way)情况的模型仅为二维(two-way)模型的特例模型,单一的随机效应或固定效应模型亦为其特殊情况的一种。在这种一般误差成分模型的基础上,我们力图将有关Panel Data 模型的讨论纳入到一个更加一般和统一的分析构架中予以研究。关键词:Panel Data 模型、方差成分一般模型、随机效应、固定效应一、引言Panel Data(又称“平行数据”或“面板数据”)是指同时融合时间和个体双重维度的数据结构。而Panel Data模型的设定和估计也均是由对时间与个体异质性结构的假设与分析出发展开的。其模型的一般形式为: 其中N为截面个数(或个体个数),T为每一个体对应的时间长度,为误差成分。由于Panel Data模型拥有能够控制与刻画个体异质性、减小变量之间的多重共线性、增大自由度、提供更多信息以及利于进行动态分析与微观个体分析等优势(Hsiao,1985,1986、Klevmarken,1989、Solon,1989),因此近年来得到了理论与应用研究者们的广泛关注,而Panel Data 模型的方法也在原有的经典模型的基础上得到了迅猛的发展。动态Panel Data模型、离散数据模型(Discrete Data)、非平衡Panel Data模型、Panel Data的离散选择模型、Panel Data的单位根检验与向量自回归模型以及因果关系检验等方面的理论成果层出不穷。然而,无论是较为经典的Panel Data 模型,还是在此基础上发展起来的其它模型,在模型设定与应用过程中依然面临着要对误差分解成分满足固定效应还是随机效应进行判断与检验的问题,加之误差成分不同的分解方式以及两种不同维度的组合搭配,使得固定与随机的检验与判断变得更加复杂与扑朔迷离。尽管Mundlak 辅助方程(Mundlak,1978)及Hausman 检验(Hausman,1978)等方法在一定程度上能够为我们的判断指明方向,但复杂的误差分解与组合结构,对异质性内涵的理解差异以及不同效应对应的估计方式与相应经济含义的各有利弊,使得固定效应与随机效应的争论一直存在着。回顾Panel Data Econometrics的发展历程后,我们发现固定与随机之争辩是与Panel Data模型的演绎紧密联系在一起的。自Gauss(1809)与Legendre(1805)提出最小二乘法的基本思想之后,人们便开始关注被刻画的共性背后存在的异质性成分了。在其后的一段时期内,众多研究均认为在未被刻画的异质性成分之中存在着可控、可比且时不变的个体固定影响成分。但由于这种固定成分的影响是个体特有的,而且可以通过增加外生变量等方式尽量减小,特别是鉴于回归方程的可估性等原因,而被正统的分析所忽略,这便是固定效应模型的最初(Nerlove,2000)。1861年,随着Airy一本天文学专著的问世,未被观察到的异质性成分中的另一种影响效应引起了人们的关注,即在真实值附近总是存在着一个除系统误差而外的固有误差成分。这种成分“在每一天内是恒定不变的,但却随不同天之间不断在变化”(Airy,1861),而且Airy从理论上证明了这种随机成分的存在性。至此,试验数据中存在的随机效应正式被提出。在此之后,Fisher(1918)在方差分析中对这两种不同的影响效应进行了较为全面的研究。然而,由于Fisher在分析中采用了方差分析以及放弃使用期望等问题,使得对其本人可能非常清晰的固定与随机效应的概念,在后来的非试验数据的计量分析中变得含糊不清。此后的众多学者便产生了在选择固定与随机的问题上的较大分歧。如Daniels(1939)、Eisenhart(1947)、Henderson(1953)、Anderson(1978)等等。Mundlak(1961),Wallace、Hussain(1969)成为了较早的固定效应的支持者,他们认为固定效应模型具有估计的优势,而且认为没有理由像随机影响模型那样假设把个体影响处理为与其他回归变量不相关。而Balestra、Nerlove(1966)却是随机误差成分模型的坚决支持者,认为我们应该总是把个体影响处理为随机的。Chamberlain(1984)的研究表明,固定效应模型是对一般模型的待验参数施加可检验的约束后得到的,我们可以通过检验这种约束条件的成立与否来决定是否选择固定效应模型。Mundlak(1978)则认为,随机效应模型是假设全部的包含个体随机影响的回归变量是外生的。而与此相对,固定效应模型是认为包含个体影响效果的变量是内生的。因此,固定效应与随机效应选择的问题即是一个检验回归变量与个体影响效应是否为外生的问题。Hausman与Taylor(1981)通过允许一部分回归变量与个体的差异性之间存在着相关关系的方式,运用Hausman类的统计量对是否存在随机效应进行了检验。在Nerlove(2000b)再一次掀起了有关随机与固定效应的争论,并提出了新的理由主张选择选择随机影响模型之后,Panel Data 模型的应用研究学者们提出了反对无条件的接受固定效应模型或随机效应模型的主张。Wooldridge(2002)认为,在微观面板数据计量模型的估计中,将无法观测到的影响成分看作是固定效应还是随机效应的讨论是不明智的。因为当我们面临着一个从较多截面随机得到的大容量样本的时候,我们通常是将无法观测到的异质性影响与解释和被解释变量一样看作是总体抽取的一个随机变量。Hsiao、Sun(2000)则认为,将固定效应或随机效应的判断作为模型设定的问题来看待和解决要远远优于对其进行单纯的假设和检验。他们提出了以密度比率(density ratio)、AIC(Akaike)准则以及斯瓦茨(Schwartz)准则来对模型设定进行检验以判断两种效应。在同时进行的蒙特卡洛模拟实验中,估计结果显示三种判断准则均能较好的对模型设定进行判断和检验,其中以斯瓦茨(Schwartz)准则的表现为最佳。针对经典Panel Data模型研究中存在的固定效应与随机效应的争论,以及由此带来的关于误差成分模型中一维(one-way)与二维(two-way)成分模型的混淆与参数估计上的偏差,本文提出建立一种新的同时囊括随机与固定两种效应的一般误差成分模型,并对其进行估计和检验。其中一维(one-way)情况的模型仅为二维(two-way)模型的特例模型,单一的随机效应或固定效应模型亦为其特殊情况的一种。在这种一般误差成分模型的基础上,本文力图将有关Panel Data 模型的讨论纳入到一个更加一般和统一的分析构架中予以研究。二、模型设定与估计在经典的Panel Data分析中,模型被设定为如下形式 见Badi H.Baltagi (2002)。尽管对初始的基本模型形式的看法上,不同的学者有所差异(如: Hsiao 1986、 2003),但模型分析的实质均是是基本相同的。: 其中,分别为截面维度与时间维度,a为截距向量,为误差成分。在一维误差分解模型中,或;在二维误差分解模型中, 。正如上文所述,无论哪种误差结构的选择均面临着较为复杂的设定检验,特别是随机与固定效应的争辩。即便是在实际的应用研究中也很难通过模型的设定予以简单的解决(Hausman,1978),而且各种检验的结果亦并未向我们表明实际情况是否与原假设一样仅为单一的一种效应,其更类似一个“指针”,即仅显示了更偏向于那种效应而已。让我们回到Gauss(1809)与Legendre(1805)提出最小二乘法的基本思想以及经典线性计量经济模型的时代,一般的回归方程如下形式: (A)其中:,为被解释变量,为解释变量(可控变量),为公共参数,而为未被进行一般性刻画的剩余部分。传统的方式通常在满足古典假定的条件下,对上述方程进行估计。但是在残余项中其实包含了丰富的信息。主要而言,可能包含可以观测而被我们忽略的变量的影响、不可观测的个体的异质性成分以及纯粹的随机误差成分等等。因此,实际上我们没有理由认为的结论必然成立。即N个个体之间除一般能够刻画的共性因素之外,必然存在着难以共通的特性成分,具体可能表现为个体残差的均值互不相等也非零。为了满足最小二乘等估计的需要,我们可以将模型改写为: (B)其中为零均值的随机变量,而此方程也是对N个个体的准确描述。但是由于该方程的不可估计,因此仅能以LS估计的系数对真实过程进行替代。即: (C)这并不是方法带来的,而是由于数据所限的最优选择。Panel Data 的引入则为更准确的刻画与控制存在的异质成分提供了条件(Hsiao,1985,1986、Klevmarken,1989)。它允许我们在另一个维度上对不可观测的异质性成分的规律性进行分析。即,当我们仅考虑一维影响情形时方程(C)为: (D)以上所述就为固定影响的引出提供了解释,然而现在的剩余项亦是仅仅满足期望为零的假设条件,而其方差仍然可能是变动的。引用Nerlove的说法,我们仅将异质性成分中可控的部分进行了分离。这也说明了随机效应分离的必要性。同样,自Airy(1861)提出并证明了随机效应的存在性开始,之后的学者均对随机效应的引入进行了说明。Hsiao(1997,2003) Hsiao (2003) “Analysis of Panel Data” p33-34.等给出了随机效应的表示: (一维) ;(二维)在这种引入随机效应的基础上,我们仍然没有理由认为的期望为零。因此同样可以进行固定效应的分解。综上所述,我们认为固定与随机效应的判断与对无法观测的异质性因素的分析和认识密切联系。从不同角度的分析均表明了固定效应存在的客观与合理。我们并不在于主张单一的固定效应,而是认为在引入随机效应的同时不应该排斥固定效应的存在。在此认识的基础上,本文认为,在模型形式设定与变量的选择基本准确的条件下,现实中异质性成分的内涵与结构是较为复杂的。它可能并不仅仅是一种效应的结果,而是多种不同影响的综合,只用一种或一部分成分来刻画并不全面准确。因此,在此我们提出并构建一种最为一般的误差成分模型,即: ; (1)其中:描述了个体维度的影响效应,描述了时间维度上的影响效应,与为反映个体差异与时间差异的标量向量, 与 则分别为反映个体与时间差异的随机成分向量。分别假设、 及 ,且 、 以及之间相互独立,与、 、 在时间与个体之间均是相互独立的。依据的数值与形式的不同,一般误差成分模型(1)对应于不同的误差模型。为了便于表述,我们首先考虑仅存在个体影响效应的模型,即一维的误差模型(one-way error component model)。(一)个体效应模型设定与估计当仅存在个体影响效应的条件下,一般模型转化为一维模型(one-way error component),其矩阵形式为: (2)为NT1向量,为NTK矩阵,, , ,、, 且 、与之间均相互独立。计算其协方差矩阵:。1、若,则方程(2)成为一维的普通固定效应模型 (3)对于(3)可直接运用哑元变量回归的方式对参数进行估计。即令 ,,对(3)同时进行Q变换得,进而可得参数估计值 具体见Greene ,Advanced econometric analysis Fourth edition , P561-562。 : 2、若,则对方程(2)的估计我们沿用Wansbeek、Kapteyn(1982,1983)的GLS的思路。通过对进行谱分解得到,其中。对(2)式进行变换,同乘得到新方程(4): (4)、。之后对(4)再进行Q变换得到: (5)其中, , , ,且 。 进而我们可以得到参数的估计值:, 。 同样,利用有效的加权估计,我们也可以得到 与的估计值( Amemiya ,1971) 。 由此我们可以看到,在一般框架下的一维误差成分模型中,我们有效的避免了固定与随机效应的争论,而是将固定效应与随机效应进行了统一,单一影响仅为其特例。(二)二维一般误差成分模型的设定与估计在以上讨论的基础之上,我们考虑包含个体与时间两个维度影响的模型如下: (6)参数性质同上,其矩阵形式为: (7)其中,, ,协方差矩阵为 。1、若,则模型化简为: (8)(8)式为时间与个体影响均为固定效应的模型。对双固定效应的估计与一维并无较大差别,改进Baltagi(2002)的方法,通过组内回归(within estimator)可得到参数估计:但对于 与 的估计与以往略有不同,可以采用包括一个全局变量(),并且去掉一个特定时间虚拟变量和一个个体虚拟变量的方法。即模型可变换为:,进而得到参数估计。 2、若,即对一般模型(6)或(7)的估计,我们同样对协方差矩阵进行谱分解得到,其中 , , 以及 。为 的特征值、为特征向量矩阵。进行变换,对(7)同乘 得到(9) (9)而 为 ,其中 , 为 ,其中 。对(9)式的估计与双固定效应模型(8)基本相同。3、由此我们可以认为,方程(6)、(7)为误差成分模型的一般形式,具体而言:(1) 若 或 , 我们得到了二维的混合影响模型: 或 (2) 若, 我们得到了二维固定效应模型: (3) 若且 或且,则我们估计的为一维的双效应模型: 或 (4) 若且, 则形成了无异质性影响的统一模型: 三、模型的异方差性由于在一般误差成分模型(6)、(7)中,存在着三个随机变量、与,因此其可能存在的异方差情况较为复杂。即可能出现、以及等情况的异方差。在此若不考虑方差的时变性,则异方差类型主要为存在个体之间异方差、存在异方差以及二者均存在异方差三种情形。对于与单独出现异方差的情况的修正,Baltagi(2001) 见Baltagi (2001) , Econometric Analysis of Panel Data , P78-80。已经有详细的讨论。对于与同时存在异方差的情形,我们依然可以按照其思路:若 、 。则协方差阵: 其中:为的对角阵。矩阵 的谱分解为:令,则 。对原方程两边同时做变换得到 即 , 即可消除异方差的影响。至此,我们在对Panel Data固定与随机效应的本质进行辨析的基础上,构建了一般误差成分模型并对其进行了估计与异方差性的初步处理。通过本文建立的这种新的同时囊括随机与固定两种效应的误差成分一般模型,我们在将有关Panel Data 模型的讨论纳入到一个更加一般和统一的分析构架中予以研究方面做出了一定的尝试。而对于一般误差成分模型的统计推断以及一般模型应用中的实际意义等问题尚有待进一步研究,其进一步工作还在进行之中。参考文献:Airy, George Biddell, On the Algebraical and Numerical Theory of Errors of Observations and theCombination of Observations, Cambridge and London: Macmillan and Co., 1861.Balestra, P., and M. Nerlove, Pooling Cross Section and Time Series Data in the Estimation of a DynamicModel: The Demand for Natural Gas, Econometrica, 34: 585-612, 1966.Baltagi, B. H., Econometric Analysis of Panel Data, New York: Wiley, 2002.Fisher, R. A., The Correlation between Relatives on the Supposition of Mendelian Inheritance,Transactions of the Royal Society of Edinburgh, 52: 399 - 433, 1918a.Fisher, R. A., Statistical Methods for Research Workers, 1st ed., Edinburgh and London: Oliver and Boyd,1925. Reprinted in Statistical Methods, Experimental Design, and Scientific Inference, Oxford:University Press, 1990.Gauss, Carl Friedrich, Theoria motus corporum celestium, Hamburg: Perthes und Besser, 1809. Translation by C. H. Davis in Theory of Motion of Heavenly Bodies, New York: Dover, 1963. Hsiao, C., Analysis of Panel Data, Cambridge: University Press, 2003.Legendre, Adrien Marie, Nouvelles mthodes pour la dtermination des orbites des comtes, Paris:Courcier, 1805.Mundlak, Y., On the Pooling of Time Series and Cross Section Data, Econometrica, 46: 69 - 85, 1978a.Nerlove, M., and P. Balestra, Formulation and Estimation of Econometric Models for Panel Data,introductory essay in Mtys and Sevestre (1996, pp. 3-22), 1996.Wallace, T. D., and A. Hussain, The Use of Error Components Models in Combining Cross Section withTime Series Data, Econometrica, 37: 55-72, 1969.Wooldridge . M., A Framework for Estimating Dynamic, Unobserved Effects Panel Data models withPossible Feedback to Future Explanatory Variables, Economics Letters, 68: 245-250, 2000.作者简历:张红星(1966-)男,汉,云南昆明市人,云南财贸学院计算机与数学学院副教授,西南财经大学统计学院数量经济学专业博士生,研究方向:计量经济建模技术、金融工程。通讯地址1: 四川成都 西南财经大学研究生部2004级博士研究生邮政编码1: 610074通讯地址2:云南昆明 云南财贸学院计科系邮政编码2: 650221联系电话:08715139539(H)S)、E-mail地址: redstar_贾彦东(1980)男,汉,吉林长春市人,西南财经大学统计学院数量经济学专业2004级博士生,研究方向:宏观经济分析、金融信息数量分析、金融工程。 通讯地址: 四川成都 西南财经大学研究生部2004级博士研究生邮政编码: 610074联系电话:13628044830E-mail地址: family_2001_1 Panel Data 模型设定的新思路* 本文受国家社会科学基金资助 (批准号:05BJY098)固定效应与随机效应的统一张红星1,2 贾彦东2(1、云南财贸学院计算机科学系 2、西南财经大学统计学院)Abstract: The debate between fixed effect and random effect has been haunting in Panel Data analysis since its origin. Discusses afterwards which try to make the difference are clear on behalf of the involved applied researchers, but the distinction still baffles the followers. In this paper we propose a new approach to specify the panel data model which makes both fixed effect and random effect as its special cases, and also, the hierarchy among one-way and two-way is revealed clearly under our approach. The most important implication is that it is possible to proceed the analysis of panel data model in a unified framework. Keywords: Panel Data model, fixed effect, random effect, double effect, one-way model, two-way model, general model.内容提要:经典Panel Data模型研究中一直存在着固定效应与随机效应的判断与争论问题,这种模型设定形式的不准确常常导致模型参数估计的无效性以及一维(one-way)与二维(two-way)误差成分模型的混淆。在此,本文提出建立一种新的同时囊括随机与固定两种效应的误差成分一般模型,其中一维(one-way)情况的模型仅为二维(two-way)模型的特例模型,单一的随机效应或固定效应模型亦为其特殊情况的一种。在这种一般误差成分模型的基础上,我们力图将有关Panel Data 模型的讨论纳入到一个更加一般和统一的分析构架中予以研究。关键词:Panel Data 模型、方差成分一般模型、随机效应、固定效应一、引言Panel Data(又称“平行数据”或“面板数据”)是指同时融合时间和个体双重维度的数据结构。而Panel Data模型的设定和估计也均是由对时间与个体异质性结构的假设与分析出发展开的。其模型的一般形式为: 其中N为截面个数(或个体个数),T为每一个体对应的时间长度,为误差成分。由于Panel Data模型拥有能够控制与刻画个体异质性、减小变量之间的多重共线性、增大自由度、提供更多信息以及利于进行动态分析与微观个体分析等优势(Hsiao,1985,1986、Klevmarken,1989、Solon,1989),因此近年来得到了理论与应用研究者们的广泛关注,而Panel Data 模型的方法也在原有的经典模型的基础上得到了迅猛的发展。动态Panel Data模型、离散数据模型(Discrete Data)、非平衡Panel Data模型、Panel Data的离散选择模型、Panel Data的单位根检验与向量自回归模型以及因果关系检验等方面的理论成果层出不穷。然而,无论是较为经典的Panel Data 模型,还是在此基础上发展起来的其它模型,在模型设定与应用过程中依然面临着要对误差分解成分满足固定效应还是随机效应进行判断与检验的问题,加之误差成分不同的分解方式以及两种不同维度的组合搭配,使得固定与随机的检验与判断变得更加复杂与扑朔迷离。尽管Mundlak 辅助方程(Mundlak,1978)及Hausman 检验(Hausman,1978)等方法在一定程度上能够为我们的判断指明方向,但复杂的误差分解与组合结构,对异质性内涵的理解差异以及不同效应对应的估计方式与相应经济含义的各有利弊,使得固定效应与随机效应的争论一直存在着。回顾Panel Data Econometrics的发展历程后,我们发现固定与随机之争辩是与Panel Data模型的演绎紧密联系在一起的。自Gauss(1809)与Legendre(1805)提出最小二乘法的基本思想之后,人们便开始关注被刻画的共性背后存在的异质性成分了。在其后的一段时期内,众多研究均认为在未被刻画的异质性成分之中存在着可控、可比且时不变的个体固定影响成分。但由于这种固定成分的影响是个体特有的,而且可以通过增加外生变量等方式尽量减小,特别是鉴于回归方程的可估性等原因,而被正统的分析所忽略,这便是固定效应模型的最初(Nerlove,2000)。1861年,随着Airy一本天文学专著的问世,未被观察到的异质性成分中的另一种影响效应引起了人们的关注,即在真实值附近总是存在着一个除系统误差而外的固有误差成分。这种成分“在每一天内是恒定不变的,但却随不同天之间不断在变化”(Airy,1861),而且Airy从理论上证明了这种随机成分的存在性。至此,试验数据中存在的随机效应正式被提出。在此之后,Fisher(1918)在方差分析中对这两种不同的影响效应进行了较为全面的研究。然而,由于Fisher在分析中采用了方差分析以及放弃使用期望等问题,使得对其本人可能非常清晰的固定与随机效应的概念,在后来的非试验数据的计量分析中变得含糊不清。此后的众多学者便产生了在选择固定与随机的问题上的较大分歧。如Daniels(1939)、Eisenhart(1947)、Henderson(1953)、Anderson(1978)等等。Mundlak(1961),Wallace、Hussain(1969)成为了较早的固定效应的支持者,他们认为固定效应模型具有估计的优势,而且认为没有理由像随机影响模型那样假设把个体影响处理为与其他回归变量不相关。而Balestra、Nerlove(1966)却是随机误差成分模型的坚决支持者,认为我们应该总是把个体影响处理为随机的。Chamberlain(1984)的研究表明,固定效应模型是对一般模型的待验参数施加可检验的约束后得到的,我们可以通过检验这种约束条件的成立与否来决定是否选择固定效应模型。Mundlak(1978)则认为,随机效应模型是假设全部的包含个体随机影响的回归变量是外生的。而与此相对,固定效应模型是认为包含个体影响效果的变量是内生的。因此,固定效应与随机效应选择的问题即是一个检验回归变量与个体影响效应是否为外生的问题。Hausman与Taylor(1981)通过允许一部分回归变量与个体的差异性之间存在着相关关系的方式,运用Hausman类的统计量对是否存在随机效应进行了检验。在Nerlove(2000b)再一次掀起了有关随机与固定效应的争论,并提出了新的理由主张选择选择随机影响模型之后,Panel Data 模型的应用研究学者们提出了反对无条件的接受固定效应模型或随机效应模型的主张。Wooldridge(2002)认为,在微观面板数据计量模型的估计中,将无法观测到的影响成分看作是固定效应还是随机效应的讨论是不明智的。因为当我们面临着一个从较多截面随机得到的大容量样本的时候,我们通常是将无法观测到的异质性影响与解释和被解释变量一样看作是总体抽取的一个随机变量。Hsiao、Sun(2000)则认为,将固定效应或随机效应的判断作为模型设定的问题来看待和解决要远远优于对其进行单纯的假设和检验。他们提出了以密度比率(density ratio)、AIC(Akaike)准则以及斯瓦茨(Schwartz)准则来对模型设定进行检验以判断两种效应。在同时进行的蒙特卡洛模拟实验中,估计结果显示三种判断准则均能较好的对模型设定进行判断和检验,其中以斯瓦茨(Schwartz)准则的表现为最佳。针对经典Panel Data模型研究中存在的固定效应与随机效应的争论,以及由此带来的关于误差成分模型中一维(one-way)与二维(two-way)成分模型的混淆与参数估计上的偏差,本文提出建立一种新的同时囊括随机与固定两种效应的一般误差成分模型,并对其进行估计和检验。其中一维(one-way)情况的模型仅为二维(two-way)模型的特例模型,单一的随机效应或固定效应模型亦为其特殊情况的一种。在这种一般误差成分模型的基础上,本文力图将有关Panel Data 模型的讨论纳入到一个更加一般和统一的分析构架中予以研究。二、模型设定与估计在经典的Panel Data分析中,模型被设定为如下形式 见Badi H.Baltagi (2002)。尽管对初始的基本模型形式的看法上,不同的学者有所差异(如: Hsiao 1986、 2003),但模型分析的实质均是是基本相同的。: 其中,分别为截面维度与时间维度,a为截距向量,为误差成分。在一维误差分解模型中,或;在二维误差分解模型中, 。正如上文所述,无论哪种误差结构的选择均面临着较为复杂的设定检验,特别是随机与固定效应的争辩。即便是在实际的应用研究中也很难通过模型的设定予以简单的解决(Hausman,1978),而且各种检验的结果亦并未向我们表明实际情况是否与原假设一样仅为单一的一种效应,其更类似一个“指针”,即仅显示了更偏向于那种效应而已。让我们回到Gauss(1809)与Legendre(1805)提出最小二乘法的基本思想以及经典线性计量经济模型的时代,一般的回归方程如下形式: (A)其中:,为被解释变量,为解释变量(可控变量),为公共参数,而为未被进行一般性刻画的剩余部分。传统的方式通常在满足古典假定的条件下,对上述方程进行估计。但是在残余项中其实包含了丰富的信息。主要而言,可能包含可以观测而被我们忽略的变量的影响、不可观测的个体的异质性成分以及纯粹的随机误差成分等等。因此,实际上我们没有理由认为的结论必然成立。即N个个体之间除一般能够刻画的共性因素之外,必然存在着难以共通的特性成分,具体可能表现为个体残差的均值互不相等也非零。为了满足最小二乘等估计的需要,我们可以将模型改写为: (B)其中为零均值的随机变量,而此方程也是对N个个体的准确描述。但是由于该方程的不可估计,因此仅能以LS估计的系数对真实过程进行替代。即: (C)这并不是方法带来的,而是由于数据所限的最优选择。Panel Data 的引入则为更准确的刻画与控制存在的异质成分提供了条件(Hsiao,1985,1986、Klevmarken,1989)。它允许我们在另一个维度上对不可观测的异质性成分的规律性进行分析。即,当我们仅考虑一维影响情形时方程(C)为: (D)以上所述就为固定影响的引出提供了解释,然而现在的剩余项亦是仅仅满足期望为零的假设条件,而其方差仍然可能是变动的。引用Nerlove的说法,我们仅将异质性成分中可控的部分进行了分离。这也说明了随机效应分离的必要性。同样,自Airy(1861)提出并证明了随机效应的存在性开始,之后的学者均对随机效应的引入进行了说明。Hsiao(1997,2003) Hsiao (2003) “Analysis of Panel Data” p33-34.等给出了随机效应的表示: (一维) ;(二维)在这种引入随机效应的基础上,我们仍然没有理由认为的期望为零。因此同样可以进行固定效应的分解。综上所述,我们认为固定与随机效应的判断与对无法观测的异质性因素的分析和认识密切联系。从不同角度的分析均表明了固定效应存在的客观与合理。我们并不在于主张单一的固定效应,而是认为在引入随机效应的同时不应该排斥固定效应的存在。在此认识的基础上,本文认为,在模型形式设定与变量的选择基本准确的条件下,现实中异质性成分的内涵与结构是较为复杂的。它可能并不仅仅是一种效应的结果,而是多种不同影响的综合,只用一种或一部分成分来刻画并不全面准确。因此,在此我们提出并构建一种最为一般的误差成分模型,即: ; (1)其中:描述了个体维度的影响效应,描述了时间维度上的影响效应,与为反映个体差异与时间差异的标量向量, 与 则分别为反映个体与时间差异的随机成分向量。分别假设、 及 ,且 、 以及之间相互独立,与、 、 在时间与个体之间均是相互独立的。依据的数值与形式的不同,一般误差成分模型(1)对应于不同的误差模型。为了便于表述,我们首先考虑仅存在个体影响效应的模型,即一维的误差模型(one-way error component model)。(一)个体效应模型设定与估计当仅存在个体影响效应的条件下,一般模型转化为一维模型(one-way error component),其矩阵形式为: (2)为NT1向量,为NTK矩阵,, , ,、, 且 、与之间均相互独立。计算其协方差矩阵:。1、若,则方程(2)成为一维的普通固定效应模型 (3)对于(3)可直接运用哑元变量回归的方式对参数进行估计。即令 ,,对(3)同时进行Q变换得,进而可得参数估计值 具体见Greene ,Advanced econometric analysis Fourth edition , P561-562。 : 2、若,则对方程(2)的估计我们沿用Wansbeek、Kapteyn(1982,1983)的GLS的思路。通过对进行谱分解得到,其中。对(2)式进行变换,同乘得到新方程(4): (4)、。之后对(4)再进行Q变换得到: (5)其中, , , ,且 。 进而我们可以得到参数的估计值:, 。 同样,利用有效的加权估计,我们也可以得到 与的估计值( Amemiya ,1971) 。 由此我们可以看到,在一般框架下的一维误差成分模型中,我们有效的避免了固定与随机效应的争论,而是将固定效应与随机效应进行了统一,单一影响仅为其特例。(二)二维一般误差成分模型的设定与估计在以上讨论的基础之上,我们考虑包含个体与时间两个维度影响的模型如下: (6)参数性质同上,其矩阵形式为: (7)其中,, ,协方差矩阵为 。1、若,则模型化简为: (8)(8)式为时间与个体影响均为固定效应的模型。对双固定效应的估计与一维并无较大差别,改进Baltagi(2002)的方法,通过组内回归(within estimator)可得到参数估计:但对于 与 的估计与以往略有不同,可以采用包括一个全局变量(),并且去掉一个特定时间虚拟变量和一个个体虚拟变量的方法。即模型可变换为:,进而得到参数估计。 2、若,即对一般模型(6)或(7)的估计,我们同样对协方差矩阵进行谱分解得到,其中 , , 以及 。为 的特征值、为特征向量矩阵。进行变换,对(7)同乘 得到(9) (9)而 为 ,其中 , 为 ,其中 。对(9)式的估计与双固定效应模型(8)基本相同。3、由此我们可以认为,方程(6)、(7)为误差成分模型的一般形式,具体而言:(5) 若 或 , 我们得到了二维的混合影响模型: 或 (6) 若, 我们得到了二维固定效应模型: (7) 若且 或且,则我们估计的为一维的双效应模型: 或 (8) 若且, 则形成了无异质性影响的统一模型: 三、模型的异方差性由于在一般误差成分模型(6)、(7)中,存在着三个随机变量、与,因此其可能存在的异方差情况较为复杂。即可能出现、以及等情况的异方差。在此若不考虑方差的时变性,则异方差类型主要为存在个体之间异方差、存在异方差以及二者均存在异方差三种情形。对于与单独出现异方差的情况的修正,Baltagi(2001) 见Baltagi (2001) , Econometric Analysis of Panel Data , P78-80。已经有详细的讨论。对于与同时存在异方差的情形,我们依然可以按照其思路:若 、 。则协方差阵: 其中:为的对角阵。矩阵 的谱分解为:令,则 。对原方程两边同时做变换得到 即 , 即可消除异方差的影响。至此,我们在对Panel Data固定与随机效应的本质进行辨析的基础上,构建了一般误差成分模型并对其进行了估计与异方差性的初步处理。通过本文建立的这种新的同时囊括随机与固定两种效应的误差成分一般模型,我们在将有关Panel Data 模型的讨论纳入到一个更加一般和统一的分析构架中予以研究方面做出了一定的尝试。而对于一般误差成分模型的统计推断以及一般模型应用中的实际意义等问题尚有待进一步研究,其进一步工作还在进行之中。参考文献:Airy, George Biddell, On the Algebraical and Numerical Theory of Errors of Observations and theCombination of Observations, Cambridge and London: Macmillan and Co., 1861.Balestra, P., and M. Nerlove, Pooling Cross Section and Time Series Data in the Estimation of a DynamicModel: The Demand for Natural Gas, Econometrica, 34: 585-612, 1966.Baltagi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论