




已阅读5页,还剩58页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
面板数据回归 1 时间序列数据或截面数据都是一维数据 例如时间序列数据是变量按时间得到的数据 截面数据是变量在截面空间上的数据 面板数据是同时在时间和截面上取得的二维数据 所以 面板数据 paneldata 也称时间序列截面数据 timeseriesandcrosssectiondata 或混合数据 pooldata 2 面板数据 简言之是时间序列和截面数据的混合 严格地讲是指对一组个体 如居民 国家 公司等 连续观察多期得到的资料 所以很多时候我们也称其为 追踪资料 近年来 由于面板数据资料的获得变得相对容易 使其应用范围也不断扩大 3 1996 2002年中国15个省级地区的居民家庭人均消费数据 不变价格 例一 4 面板数据的格式 例二 5 当描述截面数据时 我们用下标表示个体 如Yi表示第i个个体的变量Y 当描述面板数据时 我们需要其他符号来同时表示个体和时期 为此我们采用双下标而不是单下标 其中第一个下标i表示个体 第二个下标t表示观测时间 于是Yit表示n个个体中第i个个体在T期中的第t个时期内变量Y的观测值 6 面板数据用双下标变量表示 例如Yit i 1 2 N t 1 2 TN表示面板数据中含有N个个体 T表示时间序列的最大长度 对于样本点来说 7 Stata中面板数据的表示 8 在stata中 首先使用xtset命令指定个体特征和时间特征 然后可以用xtdes命令显示面板数据的结构 usefatality clearxtsetstateyearxtdes 9 短面板和长面板 如果面板数据T较小 而n较大 这种面板数据被称为 短面板 shortpanel 大n小T 如fatality dta反之 如果T较大 而n较小 则被称为 长面板 longpanel 大T小n 如Grunfeld dta 10 面板数据的优势 1 可以解决遗漏变量问题 遗漏变量偏差是一个普遍存在的问题 虽然可以用工具变量法解决 但有效的工具变量常常很难找 遗漏变量常常是由于不可观测的个体差异或 异质性 heterogeneity 所造成 如果这种个体差异 不随时间而改变 timeinvariant 则面板数据提供了解决遗漏变量问题的又一利器 2 提供更多个体动态行为的信息 由于面板数据同时有截面与时间两个维度 有时它可以解决单独的截面数据或时间序列数据所不能解决的问题 11 比如 如何区分规模效应与技术进步对企业生产效率的影响 在截面数据中 由于没有时间维度 故无法观测到技术进步 然而 对于单个企业的时间序列数据来说 我们无法区分其生产效率的提高究竟有多少是由于规模扩大 有多少是由于技术进步 3 样本容量较大 由于同时有截面维度与时间维度 通常面板数据的样本容量更大 可以提高估计的精确度 12 面板数据的建模方法主要有三种 固定效应回归模型随机效应回归模型混合回归模型 13 实例 交通事故死亡人数和酒精税 14 15 由此我们就能得出增加啤酒税收会导致更多的交通事故死亡人数吗 不一定 这是因为这些回归中可能存在着巨大的遗漏变量偏差 16 影响死亡率的因素有很多 包括 1 州内驾驶的汽车质量 2 高速公路的维修情况是否良好 3 大部分驾驶的路程是在乡下还是市内 4 路上的汽车密度 5 社会文化能否接受酒后驾车等 这些因素都有可能与酒精税有关 若相关 则会导致遗漏变量偏差 一种解决这些导致遗漏变量偏差潜在根源的方法是收集这些变量的数据 并把它们加入到上式中 不幸的是 我们很难或不可能度量诸如酒后驾车的文化接受度等变量 17 解决方法 固定效应OLS回归 具有两个时期的面板数据 前后 比较 特别注意 Zi不随时间变化 18 结论 两期的变化 差分 表示的回归消除了随时间不变的不可观测变量Zi的效应 换言之 分析Y和X的变化可以控制随时间不变的变量 于是就消除了这种产生遗漏变量偏差的来源 19 20 当数据是在两个不同年份里观测得到的时候 这种 前后 分析很有效 但我们的数据集中包含7个不同年份里的观测值 即当T 2时不能直接应用这种 前后 比较方法 为了分析该面板数据集中的所有观测值 我们使用固定效应回归方法 21 固定效应模型 对于特定的个体i而言 ai表示那些不随时间改变的影响因素 如个人的消费习惯 国家的社会制度 地区的特征 性别等 一般称其为 个体效应 individualeffects 如果把 个体效应 当作不随时间改变的固定性因素 相应的模型称为 固定效应 模型 22 23 24 对于固定效应模型 可采用虚拟变量法 基本思想 固定效应模型实质上就是在传统的线性回归模型中加入N 1个虚拟变量 使得每个截面都有自己的截距项 由于固定效应模型假设存在着 个体效应 每个个体都有其单独的截距项 这就相当于在原方程中引入n 1个虚拟变量 如果省略常数项 则引入n个虚拟变量 来代表不同的个体 获得每个个体的截据项 25 26 如何理解个体效应 个体截距项的不同以及虚拟变量的引入 我们用一份模拟的数据来分析 useexample clearxtsetcompanyyearxtdes1 画出散点图和拟合线 并建立OLS回归方程 2 加入虚拟变量 并重新画出建立OLS回归方程 27 regyx 28 29 gend1 0gend2 0gend3 0replaced1 1ifid 1replaced2 1ifid 2replaced3 1ifid 3regyxd1d2 30 固定效应模型的估计算法 个休中心化 OLS算法或者组内离差估计法假设原方程为 式1 给定第i个个体 将 式1 两边对时间取平均可得 式2 31 式1 式2 得 可以用OLS方法一致地估计 称为 固定效应估计量 FixedEffectsEstimator 记为 由于主要使用了每个个体的组内离差信息 故也称为 组内估计量 withinestimator 32 固定效应模型的优势和劣势 面板固定效应模型的优势是 即使个体特征ui与解释变量Xit相关 只要使用组内估计量 就可以得到一致估计 即即使存在不随时间改变的遗漏变量 也可得到无偏一致的估计 面板固定效应模型的劣势是 模型无法估计不随时间而变的变量之影响 这需要用随机效应模型 33 在交通事故死亡人数中的应用 由于 10 8 式中的 差分 回归只用了1982年和1988年的数据 具体讲就是这两年的差额 而 10 15 式中的固定效应回归用到了所有7年的数据 因此这两个回归是不同的 由于利用了更多的数据 因此 10 15 式中的标准误差小于 10 8 式中的标准误差 34 固定效应模型的stata实现 usefatality clearxtsetstateyearxtdesxtlineFatalityRate固定效应模型 xtregFatalityRatebeertax fe 35 回归结果解读 1 三个R2哪个重要 2 固定效应为什么有两个F检验 3 corr u i Xb 的含义 4 sigma u sigma e rho的含义 36 1 因为固定效应模型是组内估计量 离差 因此 只有within是一个真正意义上的R2 其他两个是组间相关系数的平方 2 右侧的F统计量表示除常数项外其他解释变量的联合显著性 最后一个F检验 原假设所有U i 0 即不存在个体效应 不必使用固定效应模型 首先注意 结果中的u i不表示残差 而是表示个体效应 37 3 corr u i Xb 个体效应与解释变量的相关系数 相关系数为0或者接近于0 可以使用随机效应模型 相关系数不为0 需要使用固定效应模型 4 sigma u 表示个体效应的标准差sigma e 表示干扰项的标准差rho rho sigma u 2 sigma u 2 sigma e 2 个体效应的波动占整个波动的比例 38 显示每个个体截距的方法 tabstate gen dum dropdum1regFatalityRatebeertaxdum 39 例二 usegrunfeld clearxtsetcompanyyearxtdesxtlineinvest固定效应模型 xtreginvestmvaluekstock fe 40 显示每个个体截距的方法 tabcompany gen dum reginvestmvaluekstockdum noconsdropdum1reginvestmvaluekstockdum 分析每个公司的截距 41 时间固定效应回归 其中St是只随时间改变 不随个体改变的变量 和个体固定效应能控制不随时问变化但个体间不同的变量一样 时间固定效应能控制个体间相同但随时间变化的变量 由于新车安全性能的提高是发生在全国范围内的 因此它们能够减少所有州的交通死亡事故 故把汽车安全性能视为随时间变化但对所有州都相同的遗漏变量是合理的 于是加入用St表示的汽车安全性能的效应后 得 42 只有时间效应 我们暂时假设Zi不出现 方程变为 我们的目的是在控制St条件下估计 1 43 44 在上述例子中加入时间固定效应 实际上添加了t 1个时间虚拟变量 主要反映随着时间变化的一些特征 usefatality cleartabyear gen yr editdropyr1regFatalityRatebeertaxyr 几乎所有时间虚拟变量均不显著 说明FatalityRate不随时间的变动呈现变动的趋势 45 个体和时间固定效应 双向固定效应模型 如果某些遗漏变量不随时间变化但随州变化 如对酒后驾车的文化接受度 而其他遗漏变量不随州变化但随时间变化 如国家安全标准 则在模型中同时加入个体 州 和时间效应更为恰当 我们称为双向固定效应模型 固定效应模型 Yit ai Xit 1 it双向固定效应模型 Yit ai t Xit 1 it 46 47 双向固定效应模型的估计 双向固定效应模型可以通过加入n 1个个体二元变量和T 1个时间二元变量进行OLS估计 但这会使解释变量的数目变得极为庞大 所以一般我们还是采用组内离差法进行估计 方法一 可以通过先从Y和X中减去个体和时间平均值 然后估计被减后的Y关于被减后的X的多元回归方程的方法来估计X的系数 这种方法可以避免二元变量的出现 方法二 从Y X和时间指示变量中减去个体 不是时间 均值然后估计 被减后的Y对被减后的X和被减后的时间指示变量的多元回归中的k T个系数 48 在交通死亡人数中的应用 上述形式中包含了啤洒税 47个州二元变量 州固定效应 6个年二元变量 时间固定效应 和截距项 所以这个模型的解释变量个数多达55个 这将带来大量的自由度的损失 因为时间和州二元变量和截距项的系数不是我们主要感兴趣的 所以我们在这里没有列出 比较参数发现加入时间效应后啤酒税的系数由 0 66变为 0 64 可见加入时间效应对结果影响不大 49 固定效应回归假设和固定效应回归的标准误差 本章给出的标准误差是利用一般异方差稳健公式计算得到的 当T中等大小或较大时 在称为固定效应回归假设的五个假设条件下面板数据中的这些异方差稳健标准误差都是正确的 50 固定效应回归假设 51 自相关 序列相关 如果违反 则出现自相关 52 固定效应回归的标准误差 如果重要概念10 3中的假设5成立 则给定回归变量条件下 误差u在时间上不相关 在这种情况下如果T中等大小或较大时 则常用 异方差稳健 标准误差是正确的 如果误差自相关 则常用标准误差公式不正确 理解这一点的一种方法是同异方差做类比 在截面数据回归中 如果误差异方差 则由于同方差适用的标准误差是在同方差的错误假设下导出的 因此是不正确的 类似地 如果面板数据中的误差自相关 则由于常用标准误差是在它们没有自相关的错误假设下导出的 因此也是不正确的 53 由于面板数据具有潜在异方差且在给定个休的不同时间上潜在相关时 正确的标准误差称为异方差和自相关一致的标准误差 HAC 这种标准误差由称为群标准误差 在时间序列中使用的命令是newey在面板数据中使用的命令是xtgls 54 有关酒后驾车的法律规定和交通事故死亡人数 酒精税只是抑制酒后驾车的一种方法 如果某州想要打击酒后驾车 可以通过增加税收和严酷的法律来做到这一点 因此 即使在包含州和时间固定效应的模型中遗漏这些有关酒后驾车的法律也会导致啤酒税对交通死亡事故效应的OLS估计量中存在遗漏变量偏差 此外 是否开车也部分取决于司机是否有工作 同时 税收变化也反映了经济状况 如州预算赤字会增加税收 所以遗漏州的经济状况也会导致遗漏变量偏差 55 本节中我们将前面的分析推广到保持经济状况不变条件下有关酒后驾车的法律规定 包括啤酒税 对交通死亡事故效应的研究 为此 我们需要估计包含其他酒后驾车法律和州经济状况的回归变量的面板数据回归 这些结果刻画了一幅抑制酒后驾车和交通死亡事故措施引发争议的画面 这些估计值表明严厉的处罚和提高最低法定喝酒年龄对死亡率都不会产生重要作用 相反 有证据表明提高类似啤酒税这样的酒精税会减少交通死亡率 但这个效应的估计仍是不精确的 56 随机效应模型 对于面板数据而言 除了我们前面讲的混合回归和固定效应模型以外 还存在另外一种模型形式 随机效应模型 为了区别固定效应模型和随机效应模型 我们把两个模型的方程分别写成 固定效应模型 随机效应模型 57 两个模型看似一样 但模型形式截然不同 在固定效应模型中 作为一个随机变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汽车零部件生产建设项目环境影响报告书
- 肉类食品精深加工项目施工方案
- 物业管理顾问合同范本:智慧社区建设方案
- 离婚双方自愿净身出户财产分割与权益保障承诺书
- 2025年汽车参数考试题目及答案
- 2025年普通话笔试试题及答案
- 老旧厂区改造建设工程项目施工方案
- 光伏发电项目建筑工程方案
- 高强预应力混凝土管桩在支护结构中的实践应用
- 基于岗位需求的汽车类技工教育实践教学体系构建
- 2025网络设备购销合同文本
- 2024-2025学年南充市七年级下英语期末考试题(含答案和音频)
- 成都产业投资集团有限公司所属产业投资板块企业2025年招聘投资管理等岗位的考试参考试题及答案解析
- 乡镇综合行政执法队队长试用期满转正工作总结
- 2025天津医科大学眼科医院第三批招聘1人备考考试试题及答案解析
- 2025年法院书记员招聘考试笔试试题含答案
- 4.6.2.2神经调节(第二课时)课件-人教版(2024)生物八年级上册
- 银行积分培训课件
- 2.5 秋天的怀念 课件2025-2026年度统编版语文七年级上册
- CPK、PPK和SPC(X-R控制图)模板
- 2025年北京市高考英语试卷真题(含答案解析)
评论
0/150
提交评论