面板数据分析方法

上传人：宾*** IP属地：江苏上传时间：2022-09-21 格式：PPTX 页数：85 大小：4.31MB 积分：80 举报 版权申诉

已阅读5页，还剩80页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、面板数据分析方法面板数据分析方法第1页面板数据分析方法第2页Baltagi Baltagi著白仲林主译面板数据分析方法第3页面板数据分析方法第4页面板数据分析方法第5页第一节面板数据基本问题第二节面板数据模型形式第三节面板数据模型预计方法面板数据分析方法第6页第一节面板数据基本问题一、面板数据定义二、面板数据分类三、面板数据特点面板数据分析方法第7页一、面板数据定义面板数据（panel data）是指由变量y关于N个不一样对象T个观察期所得到二维结构数据，记为yit，其中，i表示N个不一样对象（如国家、地域、行业、企业或消费者等，普通称之为第i个个体），t表示T个观察期。面板数据

2、分析方法第8页面板数据是二维结构数据时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到数据；截面数据是变量在固定时点一组数据。面板数据是同时在时间和截面上取得二维数据。所以，面板数据(panel data)也称作时间序列与截面混合数据(pooled time series and cross section data)。面板数据是截面上个体在不一样时点重复观察数据。面板数据分析方法第9页面板数据是二维结构数据 Panel原指对一组固定调查对象屡次观察，近年来panel data已经成为专业术语。面板数据从横截面看(cross section)，是由若干个体(entity,u

3、nit,individual)在某一时点组成截面观察值，从纵剖面(longitudinal section)看每个个体都是一个时间序列。面板数据分析方法第10页数据结构二维性时间序列数据横截面数据变量X面板数据结构面板数据分析方法第11页面板数据是二维结构数据面板数据分析方法第12页面板数据分析方法第13页面板数据分析方法第14页第一节面板数据基本问题一、面板数据定义二、面板数据分类三、面板数据特点面板数据分析方法第15页二、面板数据分类 1.短面板与长面板短面板(short panel)：时间T较小，而个体数N较大。长面板(long panel)：时间T较大，而个体数N较小。面板数据

4、分析方法第16页二、面板数据分类 2.微观面板数据与宏观面板数据微观面板数据普通指一段时期内不一样个体或者家庭调查数据，其数据中往往个体单位较多，即N较大（通常均为几百或上千）而时期数T较短（最短为两个时期，最长普通不超出20个时期）。面板数据分析方法第17页二、面板数据分类 2.微观面板数据与宏观面板数据宏观面板数据通常为一段时间内不一样国家或地域数据集合，其个体单位数量N不大（普通为7-200）而时期数T较长（普通为20-60年）。面板数据分析方法第18页二、面板数据分类 3.动态面板与静态面板在面板模型中，假如解释变量包含被解释变量滞后值，则称为“动态面板”(dynamic pan

5、el)；反之，则称为“静态面板”(static panel)。面板数据分析方法第19页二、面板数据分类 4.平衡面板数据与非平衡面板数据假如在面板数据中，每个时期在样本中个体完全一样，则称为“平衡面板数据”(balanced panel)；然而，有时一些个体数据可能缺失，或者新个体以后才加入到调查中来，在这种情况下，每个时期观察到个体不完全相同，则称为“非平衡面板数据”(unbalanced panel)。面板数据分析方法第20页第一节面板数据基本问题一、面板数据定义二、面板数据分类三、面板数据特点面板数据分析方法第21页三、面板数据特点 1.因为观察值增多，能够增加预计量抽样精度。因

6、为同时有截面维度与时间维度，通常面板数据样本容量更大，从而能够提升预计准确度。面板数据提供“愈加有信息价值数据，变量增加变异性，变量之间共线性减弱了，而且提升了自由度和有效性。面板数据分析方法第22页三、面板数据特点 2.提供更多个体动态行为信息。因为面板数据同时有横截面与时间两个维度，有时能够处理单独截面数据或时间序列数据所不能处理问题，对面板数据进行回归既能够像回归分析截面数据一样捕捉个体间差异改变，又能够研究个体随时间改变情况。面板数据分析方法第23页三、面板数据特点 2.提供更多个体动态行为信息。案例：考虑怎样区分规模效应与技术进步对企业生产效率影响。对于截面数据来说，因为没有时

7、间维度，故无法观察到技术进步。然而，对于单个企业时间序列数据来说，我们无法区分其生产效率提升终究有多少是因为规模扩大，有多少是因为技术进步。面板数据分析方法第24页三、面板数据特点 3.能够处理遗漏变量问题。遗漏变量偏差是一个普遍存在问题。即使能够用工具变量法处理，但有效工具变量经常极难找。遗漏变量经常是因为不可观察个体差异或“异质性”造成，假如这种个体差异“不随时间而改变”，则面板数据提供了处理遗漏变量问题又一利器。面板数据分析方法第25页三、面板数据特点 4.带来一些问题。（1）因为综合了两种数据类型，面板数据分析方法相对愈加复杂。（2）因为同一个体不一样时期数据普通存在自相关，样

8、本数据通常不满足独立同分布假定。（3）面板数据搜集成本通常较高，不易取得。面板数据分析方法第26页面板数据分析方法第27页图6 图7面板数据分析方法第28页File：5panel02a用原变量建模还是用对数变量建模?人均消费对收入面板数据散点图对数人均消费对收入面板数据散点图本例用对数数据研究更合理面板数据分析方法第29页图8 图9尽管两个地域水平值差异很大，但消费结构并没有太大改变。面板数据分析方法第30页第一节面板数据基本问题第二节面板数据模型形式第三节面板数据模型预计方法面板数据分析方法第31页其中：和分别表示居民消费与收入。反应不随时间改变个体上差异性（个体效应）反

9、应不随个体改变时间上差异性（时间效应）例1：居民消费行为与收入关系面板数据分析方法第32页例2. 农村居民收入分析 (14.1.3) 面板数据：多个观察对象时间序列数据所组成样本数据。反应不随个体改变时间上差异性，被称为时间效应。反应不随时间改变个体上差异性，被称为个体效应面板数据分析方法第33页第二节面板数据模型形式一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型面板数据分析方法第34页其中：为矩阵，为k个解释变量第i个个体在第t时期观察值，为矩阵。zi为不随时间而变个体特征，即。扰动项由两部分组成，被称为“复合扰动项”。个体效应模型(indi

10、vidual-specific effects model)假定样本中每个个体回归方程斜率相同，但截距项不一样。一、个体效应模型面板数据分析方法第35页复合扰动项：不可观察随机变量是代表个体异质性截距项。为随个体与时间而变扰动项。假定为独立同分布，且与不相关。个体效应模型面板数据分析方法第36页1.它表示不可观察个体特殊效应、潜在变量、不可观察异质性等。考虑到个人或者任一家庭、企业都含有很难被调查者观察到独有特征，这种特殊效应在整个时间范围内是保持不变。2.一些场所下将其视为常数，但这也是随机变量特例，即退化随机变量。对于个体效应：面板数据分析方法第37页取对数后，模型

11、变为：在这里，代表着企业不随时间改变而且不可观察到特殊效应，它表示一个企业管理才能、员工素质等。例：一个企业柯布-道格拉斯生产函数面板数据分析方法第38页1.假如与全部解释变量均不相关，则深入称之为“随机效应模型”(Random Effects Model,RE)。2.假如与某个解释变量相关，则深入称之为“固定效应模型(Fixed Effects Model,FE)。个体效应与解释变量相关性：面板数据分析方法第39页第二节面板数据模型形式一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型面板数据分析方法第40页固定效应模型形式一样与个体效应模型相同，不过在固

12、定效应模型中假定为需要预计固定参数，它能够与解释变量之间存在相关性。固定效应模型意味着存在内生解释变量。在随时间改变情况下，固定效应模型所得到第j个解释变量边际效应预计量一样是一致。然而，同随机效应模型相比，固定效应模型中存在参数过多和自由度损失过多等问题。二、固定效应模型面板数据分析方法第41页第二节面板数据模型形式一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型面板数据分析方法第42页对于随机效应模型，普通采取可行广义最小二乘法(FGLS)对其进行预计，因为被假定为随机，无须估计，所以使用随机效应模型能够一次得到全部系数估计值从而进行边际分析。不过，假如随

13、机效应模型选取不恰当所得到参数预计值将是不一致。随机效应模型形式与个体效应模型相同，在随机效应模型中假定是完全随机，即与解释变量无关。三、随机效应模型面板数据分析方法第43页第二节面板数据模型形式一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型面板数据分析方法第44页双向效应模型(two-way-effects model)也可称为双因素误差模型，它将未观察到个体效应和时间效应引入模型，是个体效应模型标准延伸。这里t仅随时间改变而不随个体改变，表示全部未包含在回归模型中发生在特定时期影响，如地震对某一时期企业生产影响。四、双向效应模型面板数据分析方法第45页双向固定

14、效应模型(Two-way FE)对于短面板数据，通常将时间效应看做固定效应，假如个体效应模型中含有时间趋势项或包含时间虚拟变量，则称之为双向固定效应模型。（1）在固定效应模型中引入时间趋势项t，它仅依时间而改变，而不依个体而变。（2）对每个时期定义一个虚拟变量，然后把(T-1)个时间虚拟变量包含在回归方程中（未包含时间虚拟变量即为基期）。面板数据分析方法第46页第一节面板数据基本问题第二节面板数据模型形式第三节面板数据模型预计方法面板数据分析方法第47页第三节面板数据模型预计方法一、混合最小二乘预计二、固定效应模型预计方法三、随机效应模型预计方法面板数据分析方法第48页一、混合最小二

15、乘预计(Pooled OLS)假定全部个体都拥有完全一样回归方程：其中，xit不包含常数项，这么，就能够直接把全部数据放在一起，像对待横截面数据那样进行OLS回归，故被称为“混合回归”(pooled OLS)。面板数据分析方法第49页人均消费对人均可支配收入弹性系数是0.9694。人均消费对人均可支配收入边际系数是0.9694 CPit /IPit对案例1人均消费CP与收入IP面板数据进行混合预计：面板数据分析方法第50页注意：1.因为面板数据特点，即使通常能够假设不一样个体之间扰动项相互独立，但同一个体在不一样时期扰动项之间往往存在自相关。此时，对标准差预计应该使用聚类稳健标准差(clust

16、er-robust standard error)，而所谓聚类就是由每个个体不一样时期全部观察值所组成。同一聚类（个体）观察值允许存在相关性，而不一样聚类（个体）观察值则不相关。面板数据分析方法第51页注意：2.混合回归基本假设是不存在个体效应。对于这个假设必须进行统计检验。因为个体效应以两种不一样形态存在（即随机效应与固定效应），所以需要分别对其进行检验。面板数据分析方法第52页第三节面板数据模型预计方法一、混合最小二乘预计二、固定效应模型预计方法三、随机效应模型预计方法面板数据分析方法第53页二、固定效应模型预计方法对于固定效应模型：因为被假定为需要预计固定参数并允许与解释变量相关，

17、所以，预计固定效应模型中系数时便能够考虑经过变换模型形式从而消除这一不可观察到个体效应。面板数据分析方法第54页二、固定效应模型预计方法（一）组内预计对于固定效应模型，给定第i个个体，将方程两边对时间取平均可得用原模型减去平均后方程，可得其离差形式：面板数据分析方法第55页二、固定效应模型预计方法定义则因为上式中已将消去，故只要与不相关，则可以用OLS一致地预计，称为“固定效应预计量”(Fixed Effects Estimator)，记为。因为其主要使用了每个个体组内离差信息，故也称为“组内预计量”(within estimator)。面板数据分析方法第56页注意：即使

18、个体特征与解释变量相关，只要使用组内预计量，就能够得到一致预计，但在作离差转换过程中，也被消掉了，故无法预计。即无法预计不随时间而变变量影响。面板数据分析方法第57页注意：另外，为了确保与不相关，则要求第i个观察值满足严格外生性，即，因为中包含了全部信息。换言之，扰动项必须与各期解释变量均不相关（而不但仅是当期解释变量），这是一个比较强假定。面板数据分析方法第58页二、固定效应模型预计方法（二）最小二乘虚拟变量模型(LSDV) 对于固定效应模型：在方程中引入(n-1)个虚拟变量（假如没有截距项，则引入n个虚拟变量）来代表不一样个体，则能够得到与上述离差模型一样结果，称为

19、“最小二乘虚拟变量模型”(Least Square Dummy Variable Model)。面板数据分析方法第59页虚拟变量回归特点使用LSDV方法所给出预计值，与我们用组内预计方法得到预计值恰好一样，而且标准误和其它主要统计量也是一样。所以，固定效应预计量能够从虚拟变量回归得到。从LSDV方法算出可决系数值通常都比较高，这是因为我们对每一横截面单位都包含了一个虚拟变量，以致能解释数据中变异大部分。面板数据分析方法第60页面板数据分析方法第61页从结果看，北京、上海、浙江是自发消费（消费函数截距）最大3个地域。面板数据分析方法第62页注意：使用LSDV方法即使能够得到对个体异质性

20、预计，不过会损失很大自由度，并在预计(n-1)个额外参数时，大量虚拟变量会加剧回归方程多重共线性问题，也不能预计非时变(time-constant)变量效应。另外，LSDV方法也不能处理内生性问题。面板数据分析方法第63页LSDV预计效果 Islam()利用蒙特卡罗模拟研究了一些关于经济增加收敛方面面板数据预计。研究发觉，假如以小样本偏差和预测误差标准方差来判断话，LSDV预计在小样本上预计结果最好，其预计效果甚至比GMM预计和工具变量(IV)预计都更加好。面板数据分析方法第64页 Islam ()对此提供一个理论解释是，GMM和IV预计在小样本上预计效果不好原因是因为，这两种方法优点都依赖

21、于回归预计中所能选择到最优权重矩阵，而这一权重在回归中可能会收到数据噪声。 LSDV预计效果面板数据分析方法第65页二、固定效应模型预计方法（三）一阶差分法对于固定效应模型，给定第i个个体，将方程两边进行一阶差分，以消去个体效应，得对上述差分形式方程使用OLS就能够得到“一阶差分预计量”，记为。面板数据分析方法第66页组内预计量与一阶差分预计量因为不再出现在差分方程中，只要扰动项一阶差分与解释变量一阶差分不相关，则是一致。此一致性条件比确保一致严格外生性假定更弱，这是主要优点。面板数据分析方法第67页组内预计量与一阶差分预计量组内预计和一阶差分都假设不可观察个体效应与解释

22、变量相关，两种预计方法在T=2时产生相同预计量和推断。当总体时期T2时，在序列不相关，独立同分布情况下，组内预计量比一阶差分预计量更有效率。所以，在实践上，主要使用，而较少用面板数据分析方法第68页第三节面板数据模型预计方法一、混合最小二乘预计二、固定效应模型预计方法三、随机效应模型预计方法面板数据分析方法第69页三、随机效应模型预计方法对于回归方程：随机效应模型假定与解释变量均不相关，故OLS是一致。然而，因为扰动项由组成，不是球型扰动项（同方差、无自相关），所以，OLS不是最有效率。面板数据分析方法第70页因为存在，同一个体不一样时期扰动项之间存在自相关，面板数据分析方

23、法第71页面板数据分析方法第72页详细来说，用OLS来预计以下“广义离差” (quasi-demeaned)模型，面板数据分析方法第73页组间预计(Between Estimator)面板数据分析方法第74页面板数据分析方法第75页终究该用固定效应还是随机效应模型？当我们在日常研究中选取模型形式时，不能确定未观察到个体效应是否与解释变量相关，因而不能恰当地在固定效应模型和随机效应模型之间进行选取。错误选取模型类型，将影响我们参数预计量等从而影响对详细问题分析。在处理面板数据时，终究该使用固定效应模型还是随机效应模型是一个根本问题。面板数据分析方法第76页Hausman检验原假设H0：与不

24、相关（模型应设定为随机效应）备择假设H1：与相关（模型设定为固定效应） Hausman检验统计量：面板数据分析方法第77页固定效应模型与随机效应模型哪个更加好一些？随机效应模型好处是节约自由度。对于从时间和截面两方面看都存在较大改变数据，随机效应模型能明确地描述出误差起源特征。固定效应模型好处是，很轻易分析任意截面数据所对应应变量与全部截面数据对应因变量均值差异程度。面板数据分析方法第78页Wooldridge() 在实际应用时，是选择固定效应模型还是选择随机效应模型？普通经验做法是，假如研究者预期建立面板数据模型推断样本空间经济关系，则模型设定为固定效应模型会更合理一些。不然，假如研究样本

人人文库> 全部分类> 行业资料 > 医学制药

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

面板数据分析方法

文档简介

温馨提示

最新文档

评论

面板数据分析方法

文档简介

温馨提示

最新文档

评论

相关文档