面板数据分析方法ppt课件_第1页
面板数据分析方法ppt课件_第2页
面板数据分析方法ppt课件_第3页
面板数据分析方法ppt课件_第4页
面板数据分析方法ppt课件_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.面板数据的分析方法、Baltagi、Baltagi翻译白仲林的主译.第1节面板数据的基本问题第2节面板数据的模型形式第3节面板数据的模型的估计方法、第1节面板数据的基本问题、第1、面板数据的定义第2、面板数据的模型的估计方法面板数据的特征点、第1、面板数据的定义面板数据(paneldata )是从变量y为n个不同对象的t个观测期间得到的二维构造数据,记为yit。 其中,I表示n个不同对象(国家、地区、行业、企业、消费者等,一般称为第I个个体),t表示t个观测期间。面板数据是二维结构数据,时间序列数据和截面数据都是一维数据。 时间序列数据是变量在时间上得到的数据,截面数据是变量固定时的数据集。 面板数据是同时获取时间和截面的二维数据。 因此,面板数据(paneldata )也称为时间序列和截面混合数据(pooledtimeserialsandcrossectiondata )。 面板数据是截面上个体在不同时刻的重复观测数据。面板数据为二维结构数据,面板元多次观测到固定调查对象组,近年来面板数据已成为专业术语。 面板数据是从横截面来看几个个体(entity、unit、individual )在某个时刻构成的截面观测值,从纵截面来看各个个体是时间序列。数据结构的二维性,时间序列数据,横断面数据,变量x的面板数据结构,面板数据是二维结构数据,第1节面板数据的基本问题是: 1,面板数据的定义2,面板数据的分类3,面板数据的特征,2,面板数据的分类,1 .短面板和长面板长屏(longpanel ) :时间t大,个体数n小。二、面板数据的分类;二、微面板数据和宏面板数据微面板数据一般指的是一段时间内不同的个体或家庭的调查数据.二、面板数据的分类;二、微面板数据和宏面板数据的宏面板数据通常是一定期间内不同国家或地区的数据集合,其个体单位数n不大(一般为7-200 ),但期间数t长(一般为20-60年)。 2、面板数据分类3 .动态面板和静态面板在面板模型中称为“动态面板”(dynamicpanel ),如果解释变量包含要解释的变量的滞后值,则称为“静态面板”(staticpanel )。 2、面板数据的分类、4 .平衡面板数据和非平衡面板数据在面板数据中,如果各时期的样本中的个体完全相同,则被称为平衡面板数据,但是有时一部分个体的数据丢失,或者新的个体参加调查在这种情况下,每个时期观测到的个体不完全相同,称为“未平衡面板”。通过第1节面板数据的基本问题、第1节面板数据的定义、面板数据的分类、面板数据的特征、第3节面板数据的特征、第1观测值的增加,能够提高估计量的采样精度。 由于存在横截面积和时间维度,面板数据的样本容量通常较大,并且可以提高估计的精度。 面板数据“提供了更有信息价值的数据,变量增加了变异,变量之间的共性减少了,自由度和有效性提高了。三、面板数据特征,二.提供更多个体动态行为信息。 由于面板数据有横断面和时间两个维度,所以有时可以解决用各个断面数据和时间序列数据无法解决的问题,可以像回归分析面板数据那样捕捉个体间的差异变化,也可以研究个体的时间变化。.三、面板数据特征,二.提供更多个体动态行为信息。 案例:考虑如何区分规模效应和技术进步对企业生产效率的影响。 截面数据没有时间维度,因此无法观测到技术的进步。 但是,各个企业的时间序列数据无法区分生产效率的提高是由规模的扩大引起的,还是由技术的进步引起的。三、面板数据特点,三.可解决变量缺失。 变量不偏不倚是一个普遍的问题。 可通过工具变量法解决,但多数情况下很难找到有效的工具变量。 缺失变量通常由于不可观测的个体差异或“异质性”而导致该个体差异“不随时间变化”时,面板数据提供解决缺失变量问题的另一个工具。三、面板数据特点,4 .带来一些问题。 (1)由于综合了两种数据类型,面板数据的分析方法比较复杂。 (2)由于同一个体不同时期的数据一般存在自相关,样本数据通常不满足独立的同一分布假设。 (3)面板数据的收集成本通常很高,很难得到。,图6图7,File:5panel02a,是用原变量模型化还是用对数变量模型化? 此外,关于人均消费者收入的面板数据的散布图对数的人均消费者收入的面板数据的散布图,本例使用对数据进行研究是合理的,图8、图9尽管两个地域的等级值之差较大,但是消费结构没有太大变化。第一节板数据的基本问题第二节板数据的模型形式第三节板数据模型的估计方法,以及各自表示居民的消费和收入。 不随时间变化的个体差异(个体效应)反映了不随个体变化的时间差异(时间效应),例1 :居民消费行为与收入的关系、例2 .农村居民收入分析、14.1.3 )、面板数据:由多个观测对象的时间序列数据构成的样本数据。 反映不随个体变化的时间差异,被称为时间效应。 反映时间上不变的个体的差异,被称为个体效应,第二节面板数据的模型格式,一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型,其中,该矩阵是k个解释变量的第I个个体在第t个时期的观测值的矩阵。 zi是不随时间变化的个体特征。 扰动项由两部分组成,称为“复合扰动项”。个体效应模型(individual-specificiceffctsmodel )假定样本中的每个个体的回归方程的斜率相同,但截距项不同。一、个体效应模型、复合干扰项:不可观测的随机变量是代表个体异质性的截距项。 随个体和时间变化的扰动项。 假定独立分布,与之无关。 表示、个体效应模型、1 .不能观测的个体特殊效应、潜在变量、不能观测的异质性等。 考虑到个人和任何家庭、企业都有调查者难以看到的独特特征,这种特殊效果在时间范围内是一定的。 2 .有时认为是常数,但这也是随机变量的特例,即退化的随机变量。 取、个人效应:对数后,模型在此表示企业不会随时间变化、不可观测的特殊效应,表示企业的管理才能、员工素质等。 例如:某企业的柯布达格拉斯生产函数:1 .如果与所有解释变量没有关系,则又称为“随机效应模型”(RandomEffectsModel,RE )。 2 .如果与某个解释变量相关,则还称为“固定效果模型”(FixedEfFEctsModel,fe )。、个体效果与说明变量的相关性:第二节面板数据的模型形式、一、个体效果模型二、固定效果模型三、随机效果模型四、双向效果模型、固定效果模型形式也与个体效果模型相同,但假定在固定效果模型中应推定的固定参数,与说明变量的相位固定效应模型意味着存在内生解释变量。 随时间变化的情况下,固定效果模型中得到的第j个解释变量的边际效果推定量也一致。 但是,与随机效应模型相比,固定效应模型存在参数过多、自由度损失过多等问题。 估计、二、固定效应模型、二节面板数据的模型形式、一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型、随机效应模型,因为一般使用可执行的广义最小二乘法(FGLS )估计并假定为随机然而,如果不适当选择随机效应模型,则可能发生的参数估计不匹配。 假设、随机效应模型格式与个体效应模型相同,在随机效应模型中完全是随机的,即与说明变量无关。三、随机效应模型、第二节面板数据的模型形式、一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型、双向效应模型(two-way-effectsmodel )也称为二元误差模型,没有观测到的个体效应和时间效应在此t只随时间变化,不随个体变化。 显示了地震给某个时期的企业生产带来的影响等,回归模型中没有包含的特定时期的影响。 对于短面板数据,双向固定效果模型(Two-wayFE )通常将时间效果看作固定效果,如果个体效果模型包含时间趋势项或时间虚拟变量,则称为双向固定效果模型。 (1)在固定效应模型中导入时间趋势项t,它只是随时间变化,不随个体变化。 (2)为每个期间定义虚拟变量,在回归公式中包含(T-1 )个时间虚拟变量(不包含的时间虚拟变量是基本期间)。第1节板数据的基本问题第2节板数据的模型形式第3节板数据模型的推定方法、第3节板数据模型的推定方法、第1、混合最小二乘推定2、固定效果模型的推定方法3、随机效果模型的推定方法、第1、混合最小二乘推定(PooledOLS ), 由于假定所有个体都具有完全相同的回归公式的xit不包含常量项,因此可以直接汇总所有数据并进行OLS回归以处理横断面数据,因此称为“混合回归”(pooledOLS )。人均消费可支配人均收入的弹性系数为0.9694。 人均消费可支配人均收入的边际系数为0.9694CPit/IPit,将案例人均消费CP与收入IP的面板数据混合估计:注意:1 .面板数据的特征,通常可假定不同个体间干扰项相互独立,但同一个体为此时,在标准偏差的推定中应该使用集群的鲁棒性的标准偏差(cluster-robuststandarderror ),由与集群每个个体不同时期的全部观测值构成。 同一簇(个体)的观测值有相关性,不同簇(个体)的观测值没有相关性。注意:2 .混合回归的基本假设是没有个体效应。 必须对这一假设进行统计验证。 个体效应以两种不同的形态存在(即随机效应和固定效应),因此需要分别进行验证。.第三节板数据模型的估计方法、一、混合最小二乘估计二、固定效果模型的估计方法、随机效果模型的估计方法、二、固定效果模型的估计方法是固定效果模型:假定需要估计的固定参数,允许与解释变量的相关性,因此在估计固定效果模型中的系数时(1)群内的估计或固定效果模型的第I个个体给出,方程两侧的时间平均可从原始模型减去平均方程式,从而得到其方差形式:2,固定效果模型的估计方法,因为定义已按上式消除这主要是使用每个个体的组内分散信息,因此也称为“组内推定量”(withinestimator )。注意:即使个体的特征与说明变量相关联,如果使用组内的估计量,也能得到一致估计,但在方差变换过程中消除,不能进行估计。 也就是说,无法估计不随时间变化的变量的影响。注意:另外,为了保证没有关系,第I个观测值满足严格的外因性,即包含所有的信息。 换句话说,摄动项必须与各期的解释变量无关(不仅是本期的解释变量)是比较强的假定。二,固定效应模型的估计方法,(二)最小二乘虚拟变量模型(LSDV )固定效应模型:在方程中引入(n-1 )个虚拟变量(如果没有截矩项,则为n个虚拟变量)代表不同个体,得到与上述方差模型相同的结果,称为“最小二乘虚拟变量模型”。虚拟变量回归的特征,用LSDV法给出的估计值,正好与我们用群内估计法得到的估计值相同,基准错误也与其他主要统计量相同。 因此,固定效果估计量可以从虚拟变量中回归。 用LSDV法计算的决定系数的值通常很高。 这是因为,由于各截面单位中包含虚拟变量,因此可以解释数据的大部分变异。 从,结果来看,北京,上海,浙江是自发消费(消费函数切片)最大的3个地区。注意:虽然LSDV方法可以获得对个体异质性的估计,但是大自由度丧失,并且如果估计(n-1 )个额外参数,则大量的虚拟变量促进了回归方程的复共线性问题,并且也不能估计时变变变量效应。 另外,LSDV法也不能解决内在性问题。 LSDV的估算效果,Islam(2000 )采用蒙特卡罗模拟研究了经济增长收敛的面板数据估算。 用小样本偏差和预测误差的标准差来判断,LSDV是小样本的估计结果最好,其估计效果优于GMM估计和工具变量(IV )估计。Islam(2000 )提供的一种理论解释是,GMM和IV较小的样本具有较差的估计效果,因为两种方法的优点都取决于可以用回归估计选择的最佳权重矩阵,这种权重有可能在回归期间遭受数据噪声。 LSDV的估计效果,二、固定效果模型的估计方法,(三)一次差分法对固定效果模型给出第I个个体,对方程的两侧进行一次差分,取消个体效果,在上述差分形式的方程式中使用OLS,则得到“一次差分估计量”。 由于、组内的估计量和一次差分估计量不再出现在差分方程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论