




已阅读5页,还剩82页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二讲面板数据模型与stata软件的应用 E mail 面板数据模型与stata软件的应用 一 什么是面板数据二 面板数据模型的优势三 面板模型的估计方法 FE和RE四 stata软件简介五 如何用stata估计面板模型 案例分析 第一讲短面板 时间维度 截面维度如我们在分析中国各省份的经济增长时 共有31个截面 每个截面都取1979 1998共20年的数据 共有620个观察值 这是一个典型的平行面板数据上市公司财务数据 研究一段时期内 1998 2008 上市公司股利的发放数额与股票账面价值之间的关系 共有20 11 220个观测值强调经济理论基础 强调微观行为基础 面板数据的分类 如果面板数据T较小 而n较大 被称为 短面板 shortpanel 反之 如果T较大 而n较小 则被称为 长面板 longpanel 在面板模型中 如果解释变量包含被解释变量的滞后值 则称为 动态面板 dynamicpanel 反之 则称为 静态面板 staticpanel 如果在面板数据中 每个时期在样本中的个体完全一样 则称为 平衡面板数据 balancedpanel 反之 则称为 非平衡面板数据 unbalancedpanel 表11996 2002年中国东北 华北 华东15个省级地区的居民家庭人均消费数据 不变价格 表2上市公司的投资与股票账面价值 N 20 T 4 面板数据模型的优点 1 可以解决遗漏变量问题 遗漏变量常常是由于不可观测的个体差异或异质性 heterogeneity 造成的 如果这种个体差异 不随时间而改变 timeinvariant 则面板数据提供了解决遗漏变量问题的又一利器 2 提供更多个体动态行为的信息 由于面板数据同时有横截面与时间两个维度 有时它可以解决单独的截面数据或时间序列数据所不能解决的问题 3 样本容量较大 由于同时有截面维度与时间维度 通常面板数据的样本容量更大 从而提高估计精度 但面板数据也会带来一些问题 面数据通常不满足独立同分布的假定 因为同一个体在不同期的扰动项一般存在自相关 另外 面板数据的收集成本通常较高 举例 交通死亡率与酒后驾车人数 一段时间内江苏省各市 其他的非观测 潜在 因素 南京与苏州汽车本身状况道路质量当地的饮酒文化单位道路的车辆密度非观测效应导致估计结果不准确 面板数据可以控制和估计非观测效应 面板数据模型形式 其中 i 1 2 3 N 截面标示 t 1 2 T 时间标示 xit为k 1解释变量 为k 1系数列向量对于特定的个体i而言 ai表示那些不随时间改变的影响因素 而这些因素在多数情况下都是无法直接观测或难以量化的 如个人的消费习惯 地区的经济结构 法律和产权制度等 一般称其为 个体效应 individualeffects 面板数据模型的误差项由两部分组成 一部分是与个体观察单位有关的 它概括了所有影响被解释变量 但不随时间变化的因素 因此 面板数据模型也常常被成为非观测效应模型 另外一部分概括了随截面随时间而变化的不可观测因素 通常被成为特异性误差或特异扰动项 在实践中常采用折衷策略 即假定个体的回归方程拥有相同的斜率 但可以有不同的截距项 以此来捕捉异质性 由于面同一个体在不同时期的扰动项之间往往存在自相关 故应使用 聚类稳健的标准差 cluster robuststandarderror 而所谓 聚类 cluster 就是由每个个体不同时期的所有观测值所组成 同一聚类 个体 的观测值允许存在相关性 而不同聚类 个体 的观测值则不相关 动态模型y 8y 1 v 样本容量分别为T 20 50 100时 各模拟2万次 3 面板数据模型估计方法 混合最小二乘 PooledOLS 估计 适用于混合模型 平均数 between OLS估计 适用于混合模型和个体随机效应模型 离差变换 within OLS估计 适用于个体固定效应回归模型 一阶差分 firstdifference OLS估计 适用于个体固定效应模型 可行GLS feasibleGLS 估计 适用于随机效应模型 如果在原方程中引入 n 1 个虚拟变量 如果没有截距项 则引入n个虚拟变量 来代表不同的个体 则可以得到与上述离差模型同样的结果 故FE也被称为 最小二乘虚拟变量模型 LeastSquareDummyVariableModel LSDV 使用LSDV的好处是可以得到对个体异质性的估计 面板模型选择 固定效应还是随机效应 对 个体效应 的处理主要有两种方式 一种是视其为不随时间改变的固定性因素 相应的模型称为 固定效应 模型 另一种是视其为随机因素 相应的模型称为 随机效应 模型固定效应模型中的个体差异反映在每个个体都有一个特定的截距项上 随机效应模型则假设所有的个体具有相同的截距项 个体的差异主要反应在随机干扰项的设定上 FE FixedEffects ModelRE RandomEffects Model其中 是截距中的随机变量部分 代表个体的随机影响 Replacewithdummyvariables 固定效应模型 1 例如 在研究财政支出与经济增长的关系 运用全国的时间序列数据来检验财政支出与经济增长的关系可能存在设定误差并且受统计资料的制约 仅用时间序列资料不能够满足大样本的要求同时 由于我国不同地区的体制变革和财政政策的不断调整 造成各个地区财政支出结构随时间而不断变化面板数据 PanelData 从某种程度上克服了这一困难 考虑到中国各省份财政支出结构与经济增长的关系存在明显的地区差异 从时间序列的角度 考虑各省差异的动态性 是面板数据模型的优势 例如 在研究中国地区经济增长的过程中 以全国28个省区为研究对象 可以认为这28个省区几乎代表了整个总体同时假设在样本区间内 各省区的经济结构人口素质等不可观测的特质性因素是固定不变的 因此采用固定效应模型是比较合适的 2 而当我们研究某个县市居民的消费行为时 由于样本数相对于江苏省几千万人口是个很小的样本 此时 可以认为个体居民在个人能力 消费习惯等方面的差异是随机的 采用随机效应模型较为合适随机效应模型 RE认为个体的差异是随机的 其中非观测的个体差异效应与随机扰动项一样都是随机变量 随机效应模型 总结 如果把非观测效应看做是各个截面或个体特有的可估计参数 并且不随时间而变化 则模型为固定效应模型 如果把非观测效应看作随机变量 并且符合一个特定的分布 则模型为随机效应模型 3 在实证分析中 一般通过hausman检验判断 由于随机效应模型把个体效应设定为干扰项的一部分 所以就要求解释变量与个体效应不相关 而固定效应模型并不需要这个假设条件因此 我们可以通过检验该假设条件是否满足 如果满足 那么就应该采用随机效应模型 反之 就需要采用固定效应模型 Hausman检验的基本思想是 在固定效应u i和其他解释变数不相关的原假设下 用OLS估计的固定效应模型和用GLS估计的随机效应模型的参数估计都是一致的 反之 OLS是一致的 但GLS则不是因此 在原假设下 二者的参数估计应该不会有系统的差异 我们可以基于二者参数估计的差异构造统计检验量 如果拒绝了原假设 我们就认为选择固定效应模型是比较合适的 4 面板数据模型检验与设定方法 4 4Hausman检验 原假设与备择假设是H0 个体效应与回归变量无关 个体随机效应回归模型 H1 个体效应与回归变量相关 个体固定效应回归模型 Hausman检验究竟选择固定效应模型还是随机效应模型 第一步 估计固定效应模型 存储结果quietlyxtregfatalbeertaxspirconsunrateperincK feeststorefix第二步 估计随机效应模型 存储结果quietlyxtregfatalbeertaxspirconsunrateperincK reeststoreran第三步 进行hausman检验hausmansetconsistseteff setconsist为固定效应模型估计名称 seteff为随机效应模型估计名称 fixran Hausman检验量为 H b B Var b Var B 1 b B x2 k Hausman统计量服从自由度为k的 2分布 当H大于一定显著水平的临界值时 我们就认为模型中存在固定效应 从而选用固定效应模型 否则选用随机效应模型如果hausman检验值为负 说明的模型设定有问题 导致Hausman检验的基本假设得不到满足 遗漏变量的问题 或者某些变量是非平稳等等 在这里 零假设是随机效应成立 即个体效应和解释变量无关 案例 美国公路交通死亡人数与啤酒税的关系研究以数据集traffic dta为例 四 stata软件简介 STATA软件估计与应用 打开数据库 use E ProgramFiles Stata10 0绿色软件 Stata10 东部 dta 或者重新输入数据 edit相关系数 corgdpinvesteduscihealth简单回归 regressgdpinvestculturesci无常数 regressgdpinvestculturesci noconstant 估计结果 回归诊断 是否存在异方差 estathettest怀特检验 estatimtest white回归信息检验 estatimtest是否遗漏重要解释变量 estatovtest拟合图 rvfplot单一变量的相关图 cprplotinvest 画图 菜单与命令结合twoway scattergdpinvest twoway scattergdpinvest lfitgdpinvest 基本建设支出与GDP的相关关系图 各省教育支出的增长趋势 1998 2006 Durbin Watson统计量 estatdwatson序列相关检验 estatdurbinalt滞后阶数选择 estatdurbinalt lags 2 条件异方差检验 estatarchlm lags 2 可选变量的异方差检验 estatszroetergdpinvestculturesci 五 Stata对面板数据模型的估计 随机效应模型 Stata对面板数据模型的估计 首先对面板数据进行声明 前面是截面单元 后面是时间标识 tssetcompanyyeartssetindustryyear产生新的变量 gennewvar human lnrd产生滞后变量Genfiscal 2 L2 fiscal产生差分变量Genfiscal D D fiscal 描述性统计 xtdes 对PanelData截面个数 时间跨度的整体描述Xtsum 分组内 组间和样本整体计算各个变量的基本统计量xttab采用列表的方式显示某个变量的分布Stata中用于估计面板模型的主要命令 xtregxtregdepvar varlist ifexp model type level Modeltype模型beBetween effectsestimatorfeFixed effectsestimatorreGLSRandom effectsestimatorpaGEEpopulation averagedestimatormleMaximum likelihoodRandom effectsestimator 主要估计方法 xtreg Fixed between andrandom effects andpopulation averagedlinearmodelsxtregar Fixed andrandom effectslinearmodelswithanAR 1 disturbancextpcse OLSorPrais Winstenmodelswithpanel correctedstandarderrorsxtrchh Hildreth Houckrandomcoefficientsmodelsxtivreg Instrumentalvariablesandtwo stageleastsquaresforpanel datamodels xtabond Arellano Bondlinear dynamicpaneldataestimatorxttobit Random effectstobitmodelsxtlogit Fixed effects random effects population averagedlogitmodelsxtprobit Random effectsandpopulation averagedprobitmodelsxtfrontier Stochasticfrontiermodelsforpanel dataxtrcgdpinvestcultureeduscihealthsocialadmin beta xtreg命令的应用 声明面板数据类型 tssetshengt描述性统计 xtsumgdpinvestsciadmin1 固定效应模型估计 xtreggdpinvestculturescihealthadmintechno fe固定效应模型中个体效应和随机干扰项的方差估计值 分别为sigmau和sigmae 二者之间的相关关系 rho 最后一行给出了检验固定效应是否显著的F统计量和相应的P值 本例中固定效应非常显著 2 随机效应模型估计 xtreggdpinvestculturescihealthadmintechno re检验随机效应模型是否优于混合OLS模型 在进行随机效应回归之后 使用xttest0检验得到的P值为0 0000 表明随机效应模型优于混合OLS模型3 最大似然估计Ml xtreggdpinvestculturescihealthadmintechno mle Hausman检验 Hausman检验究竟选择固定效应模型还是随机效应模型 第一步 估计固定效应模型 存储结果xtreggdpinvestculturescihealthadmintechno feeststorefe第二步 估计随机效应模型 存储结果xtreggdpinvestculturescihealthadmintechno reeststorere第三步 进行hausman检验hausmanfe Hausman检验量为 H b B Var b Var B 1 b B x2 k Hausman统计量服从自由度为k的 2分布 当H大于一定显著水平的临界值时 我们就认为模型中存在固定效应 从而选用固定效应模型 否则选用随机效应模型如果hausman检验值为负 说明的模型设定有问题 导致Hausman检验的基本假设得不到满足 遗漏变量的问题 或者某些变量是非平稳等等可以改用hausman检验的其他形式 hausmanfe sigmaless 对于固定效应模型的异方差检验和序列相关检验 Xtserialgdpinvestculturescihealthadmintechno异方差检验 xtreggdpinvestculturescihealthadmintechno fexttest3 ModifiedWaldstatisticforgroupwiseheteroskedasticityinfixedeffectmodel 随机效应模型的序列相关检验 xtreggdpinvestculturescihealthadmintechno reXttest1Xttest1用于检验随机效应 单尾和双尾 一阶序列相关以及两者的联合显著检验结果表明存在随机效应和序列相关 而且对随机效应和序列相关的联合检验也非常显著 可以使用广义线性模型xtgls对异方差和序列相关进行修正 xtgl
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专科理论知识培训评价课件
- 专心服务课件
- 2026届广东省广州市白云区广外外学校数学九上期末学业水平测试试题含解析
- 市场调节优缺点分析
- 产品授权代理协议10篇
- 智慧消防安全在储能行业的应用与前景
- 环保行业资金使用审计规范
- 江苏省宿迁宿豫区四校联考2026届八年级数学第一学期期末经典试题含解析
- 山东省烟台市2026届数学八年级第一学期期末综合测试试题含解析
- 邮储银行阿克苏地区阿瓦提县2025秋招笔试经济学专练及答案
- 养老院保洁培训课件
- 《生成式人工智能》 课件 第4章 Transformer模型
- 中医围手术期护理
- 装修公司投资协议书
- 大学英语四级考试大纲
- 数字技术赋能下的小学语文课堂创新实践
- 中药塌渍操作方法
- 道路工程材料第7版 课件5 水泥混凝土
- 燃气行业人力资源数字化转型-深度研究
- TSG ZF001-2006《安全阀安全技术监察规程》
- 卫星传输专业试题题库及答案
评论
0/150
提交评论