




已阅读5页,还剩63页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 高级计量经济学 2 第十四章面板数据计量模型 3 前面的章节讨论了如何处理横截面计量模型和时间序列计量模型 在这一章中 将讨论如何处理将横截面数据与时间序列数据结合在一起的数据 通常将这类数据叫做 面板数据 本章首先将介绍什么是面板数据 以及面板数据在数据分析中具有哪些优势 然后再介绍几种最常用的面板数据模型 混合回归模型 固定效应模型和随机效应模型 最后对固定效应模型和随机效应模型加以比较 4 第一节面板数据 一 面板数据的定义其他的名称 纵列数据 平行数据 固定调查对象数据 时间序列和横截面数据的联合 等等 按照比较权威的理解 面板数据用来描述一个总体中给定样本在一段时间的情况 并对样本中每一个样本单位都进行多重观察 这种多重观察包括对样本单位在某一个时期 时点 上多个特性进行观察 也包括对这些特性在一段时间的连续观察 通常观察将得到数据集称为面板数据 在宏观经济领域 它被广泛应用于劳动经济学 国际金融 经济增长 产业结构 技术创新 金融 税收政策等领域 在微观经济领域 它被大量应用于就业 家庭消费 企业管理 市场营销等领域 5 面板数据从横截面看 是由若干个体在某一时点构成的横截面观测值 从纵剖面看每个个体都是一个时间序列 面板数据用双下标变量表示 例如Yit i 1 2 N t 1 2 Ti对应面板数据中的不同个体 N表示面板数据中含有N个个体 t对应面板数据中不同时点 T表示时间序列的最大长度 若固定t不变 Yi i 1 2 N 是第t期横截面上的N个随机变量 若固定i不变 Y t t 1 2 T 是第i个纵剖面上的一个时间序列 个体 6 1996 2002年中国东北 华北 华东15个省级地区的居民家庭人均消费 不变价格 和人均收入 不变价格 数据见表14 1和表14 2 人均消费和人均收入两个面板数据都是平衡面板数据 各有15个地区 两个面板的数据都是7年的 每年都有15个数据 共105组观测值 7 表14 11999 2002年中国东北 华北 华东15个省级地区的居民家庭人均消费数据 不变价格 8 表14 21999 2002年中国东北 华北 华东15个省级地区的居民家庭人均收入数据 不变价格 9 二 面板数据模型的优点 1 与截面数据模型比较 面板数据模型控制了不可观测经济变量所引起的OLS估计的偏差 使得模型设定更合理 模型参数的样本估计量更准确 2 与时间序列模型相比较 面板数据模型扩大了样本量 提供了更多有效信息 更多变化性 更少共线性 更多自由度 降低了经济变量间的多重共线性 提高了估计量的有效性 3 面板数据能更好地识别和度量时间序列数据或截面数据不可发觉的潜在因素对被解释变量的影响 4 相对于纯横截面和纯时间序列数据而言 面板数据有利于建立和检验更复杂的行为模型 10 5 有效样本容量不足一直是经济计量方法应用时面临的难题 而面板数据可以有效解决样本容量不足的问题 6 动态面板数据模型能够更准确地反映经济变量的动态调整 而且通过滞后期因变量能够间接反映潜在因素对当期自变量的影响 7 微观面板数据能够收集到更准确的微观单位 个体 企业 家庭 省市区 的数据 可以降低由此得到的宏观统计数据测量误差的影响 8 宏观面板数据可以用来研究经济合作组织内各成员单位的协同效应 因此 面板数据的计量经济分析的研究具有重要的理论意义和应用价值 11 三 面板数据模型类型 在面板数据建立过程中 不但可以建立线性模型 还可以建立非线性模型 不仅可以建立静态计量模型 还可以建立动态计量模型 线性的静态模型的形式主要包括六大类 1 截距项和解释变量的系数都不变的混合估计模型 2 截距项变化但是解释变量的系数不变的固定效应模型和随机效应模型 3 截距项和解释变量的系数都改变的确定系数面板数据模型和随机系数面板数据模型 4 以及特别适用于微观面板数据的平均个体或平均时间的平均回归模型 12 5 线性的动态面板数据模型通常包括含有因变量的滞后项的动态面板数据 以及将VAR推广到面板数据的PaneldataVAR P VAR 6 利用面板数据模型还可以建立联立方程模型和多种带测量误差形式的模型 非线性的面板数据模型包括 1 离散面板数据模型和非平衡面板数据模型 2 受限因变量的模型 Logit和Probit模型 3 生存模型以及点过程模型时间跨度较长的时间序列的出现 为面板数据分析提供了两个重要的研究方向 面板数据序列的稳定性及数据序列的长期均衡性 即面板数据研究的热点领域面板单位根检验和面板协整检验 13 混合回归模型的特点是对任何个体和截面 回归系数 和都相同 可以直接把面板数据混合在一起用普通最小二乘法 OLS 估计参数 如果模型是正确设定的 解释变量与误差项不相关 即Cov Xit it 0 那么无论是N 还是T 模型参数的混合最小二乘估计量 PooledOLS 都是一致估计量 14 四 混合回归模型 Pooledmodel 如果从时间上看 不同个体之间不存在显著性差异 从截面上看 不同截面之间也不穿在显著性差异 即不存在显著的随时间或者是个体变化的效应 那么就可以利用如下模型i 1 2 N t 1 2 T k 1 2 K其中Yit为被被解释变量 表示截距项 Xkit为解释变量 k为相应的回归系数 为误差项 标量 则称此模型为混合回归模型 15 第二节固定效应模型 FixedEffectsModel 如果自变量对因变量的效应不随个体和时间变化 并且解释因变量的信息不够完整 即自变量中遗漏了一些影响因变量的不可观测的且随个体或时间变化的潜在因素时 可以加入虚拟变量以反映潜在因素对因变量的影响 通常称此种模型为固定效应模型 固定效应模型的特点是 对于不同的时间序列 或不同的横截面 模型的自变量的系数保持不变 截距项随个体 或时点 变化而改变 固定效应模型可分为3种类型 即个体固定效应模型 时点固定效应模型和个体时点固定效应模型 16 一 个体固定效应模型 如果对于不同的时间序列 个体 截距项是不同的 但对于不同的横截面 模型的截距项没有显著变化 那么就应该建立个体固定效应模型 其模型的一般形式如下 Yit和Xkit i 1 2 N t 1 2 T k 1 2 K 分别表示因变量和自变量 it i 1 2 N t 1 2 T 表示随机误差项 17 用虚拟变量表示为 写成矩阵形式如下 其中 18 进一步简化 可写为 其中 19 1 最小二乘虚拟变量 LSDV 估计面板数据模型用OLS方法估计时应满足如下5个假定条件 20 当模型满足上述假定条件时 则模型 是一个包含N个虚拟变量 禁止了共同的截距项 的多元线性回归模型 用最小二乘法估计模型的系数 可以得到系数的最佳线性无偏估计量 21 22 2 离差 within OLS估计 在实际应用时 利用LSDV估计法估计个体固定效应模型 引入N个虚拟变量 就容易陷入虚拟变量陷阱 当N较大的时候 由于引入的虚拟变量过多 消耗了许多自由度 导致需要的虚拟变量系数过多 使得估计过程变得非常复杂 于是 出于估计的简便性 通常采用一种名为离差OLS估计的方法来替代最小二乘虚拟变量估计 23 为了说明离差OLS的原理 先定义两个有用的算子 容易验证 P Q为幂等矩阵 且PQ O 24 以Q左乘公式 得QY QXB QU 其中 25 这样在模型中截距项和虚拟变量就消失了 变形后的模型用最小二乘法得到离差OLS估计量用OLS法估计混合回归模型和个体固定效应模型中 结果是一样的 但用个体固定效应模型估计 可以减少被估参数个数 并且得到的的估计参数也具有一致性 进而得到模型的参数 26 如果想估计确定性的个体效应 则必须做出假定 则此时 估计量 的方差阵为 27 三 个体固定效应的检验 面板数据模型设定形式的多样性 如何确定面板数据的模型形式就显得非常重要 对于混合回归模型和个体固定效应来说 两者最大的不同在于截距项的约束性不同 即混合回归模型的截距项全部相同 约束性较强 个体效应的截距项随着个体的变化而变化 约束性较弱 于是 相对于混合回归模型模型来说 是否有必要建立个体固定效应模型可以通过对残差平方和进行方差分析 构造F检验来完成 原假设H0 不同个体的模型截距项相同 应建立混合估计模型 备择假设H1 不同个体的模型截距项不同 应建立个体固定效应模型 28 F统计量定义为其中SSEr USSu分别表示约束模型 混合估计模型 和非约束模型 个体固定效应模型 的残差平方和 非约束模型比约束模型多了N 1个被估计参数 混合估计模型给出公共截距项 本例中所谓的约束 主要是指对于截距项设定形式的约束 在给定的显著性水平下 计算F统计量 与F分布表中相应临界值进行比较 如果拒绝了原假设 则倾向于建立个体固定效应模型 否则就倾向于建立混合回归模型 29 四 时点固定效应模型 时点固定效应模型就是对于不同的截面 时点 有不同截距的模型 如果确定对于不同的截面 模型的截距显著不同 但是对于不同的时间序列 个体 截距是相同的 那么应该建立时点固定效应模型 表示如下Yit Xkit分别表示被解释变量和解释变量 it表示随机误差项 30 用虚拟变量表示为如果满足上述模型假定条件 可对时点固定效应模型进行OLS估计 全部参数估计量都具有无偏性和一致性 其中 31 五 个体时点固定效应模型 个体时点固定效应模型就是对于不同的时间序列 个体 不同的截面 时点 都有不同截距的模型 如果确知对于不同的时间序列 个体 不同的截面模型的截距都显著地不相同 那么应该建立个体时点固定效应模型 表示如下uit 表示随机误差项 Yit Xit分别表示被解释变量和解释变量 i 1 2 N t 1 2 T 如果满足上述模型假定条件 对模型进行OLS估计 全部参数估计量都是无偏的和一致的 32 第三节随机效应模型 RandomEffectsModel 一 随机效应的概念在固定效应模型中采用虚拟变量的原因是解释被解释变量的信息不够完整 但是固定效应模型中包含了许多虚拟变量 减少了模型估计的自由度 使得建立模型的代价非常高昂 实际应用中 固定效应模型的随机误差项难以满足模型的基本假设 易于导致参数的非有效估计 随机效应模型可以用来弥补这些不足 33 基本的想法是假定误差项在时间序列 个体 上和截面上都是相关的 因而可以将随机误差项分解为3个分量 表示如下uit i t wit其中 i N 0 2 表示个体随机误差分量 t N 0 2 表示截面随机误差分量 wit N 0 w2 表示混和随机误差分量 同时还假定 i t wit之间互不相关 各自分别不存在截面自相关 时间自相关和混和自相关 34 随机效应模型的基本形式 一般把上式称为双分量误差分解模型或者是个体时点随机效应模型 如果模型中只存在个体随机误差分量 i而不存在时间随机误差分量 则称为个体随机效应模型 如果只存在时间随机误差分量 t而不存在个体随机误差分量 i 则称为时点随机效应模型 实际中 个体随机效应最常用 随机效应模型和固定效应模型比较 相当于把固定效应模型中的截距项看成两个随机变量 一个是个体随机误差项 i 一个是截面随机误差项 t 如果这两个随机误差项都服从正态分布 对模型估计时就能够节省自由度 因为此条件下只需要估计两个随机误差项的均值和方差 35 二 个体随机效应模型 个体随机效应模型的基本形式 个体随机误差项 i是属于第i个体的随机误差 并在整个时间范围内 t 1 2 T 保持不变 随机误差项ui wit应满足如下条件 36 实质上可理解为 样本中的N个个体是取自某个体数量很大的总体 该总体截距项的均值为 而样本中第i个体的截距项对 的偏离为 i 这样单个个体截距项的差异都体现在误差项uit中 37 38 39 三 随机效应模型的估计 假定要估计的模型形式为 40 估计的步骤 41 42 三 个体随机效应模型设定检验 43 44 第四节固定效应模型和随机效应模型的比较 一 Hausman检验对同一参数的两个估计量差异的显著性检验称作Hausman检验 简称H检验 H检验由Hausman于1978年提出 是在Durbin 1914 和Wu 1973 研究的基础上发展起来的 所以H检验也称作Wu Hausman检验和Durbin Wu Hausman检验 45 46 47 二 两种模型的比较 48 第十五章二元选择摸型 49 如果回归模型的解释变量中含有定性变量 则可以用虚拟变量处理之 在实际经济问题中 被解释变量也可能是定性变量 如通过一系列解释变量的观测值观察人们对某项动议的态度 某件事情的成功和失败等 当被解释变量为定性变量时怎样建立模型呢 这就是要介绍的二元选择模型或多元选择模型 统称离散选择模型 这里主要介绍Tobit 线性概率 模型 Probit 概率单位 模型和Logit模型 50 第一节Tobit 线性概率 模型 Tobit模型的形式如下 yi xi ui 15 1 其中u为随机误差项 xi为定量解释变量 yi为二元选择变量 此模型由JamesTobin1958年提出 因此得名 如利息税 机动车的费改税问题等 设 51 52 以pi 0 2 0 05xi为例 说明xi每增加一个单位 则采用第一种选择的概率增加0 05 53 Tobit模型误差的分布 54 上两式说明 误差项的期望为零 方差具有异方差 当pi接近0或1时 ui具有较小的方差 当pi接近1 2时 ui具有较大的方差 所以Tobit模型 15 1 回归系数的OLS估计量具有无偏性和一致性 但不具有有效性 假设用模型 15 4 进行预测 当预测值落在 0 1 区间之内 即xi取值在 4 24 之内 时 则没有什么问题 但当预测值落在 0 1 区间之外时 则会暴露出该模型的严重缺点 因为概率的取值范围是 0 1 所以此时必须强令预测值 概率值 相应等于0或1 55 然而这样做是有问题的 假设预测某个事件发生的概率等于1 但是实际中该事件可能根本不会发生 反之 预测某个事件发生的概率等于0 但是实际中该事件却可能发生了 虽然估计过程是无偏的 但是由估计过程得出的预测结果却是有偏的 56 由于线性概率模型的上述缺点 希望能找到一种变换方法 1 使解释变量xi所对应的所有预测值 概率值 都落在 0 1 之间 2 同时对于所有的xi 当xi增加时 希望yi也单调增加或单调减少 显然累积概率分布函数F z 能满足这样的要求 采用累积正态概率分布函数的模型称作Probit模型 用正态分布的累积概率作为Probit模型的预测概率 另外logistic函数也能满足这样的要求 采用logistic函数的模型称作logit模型 57 累积正态概率分布曲线logistic曲线 58 第二节Probit 概率单位 模型 59 第三节logit模型 60 Probit曲线和logit曲线很相似 两条曲线都是在pi 0 5处有拐点 但logit曲线在两个尾部要比Probit曲线厚 利用 15 6 和 15 7 式得到的概率值 61 Probit曲线 logit曲线比较示意图logit曲线计算上也比较方便 所以Logit模型比Probit模型更常用 62 63 由上式知回归方程的因变量是对数的某个具体选择的机会比 logit模型的一个重要优点是把在 0 1 区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比问题 logit累积概率分布函数的斜率在pi 0 5时最大 在累积分布两个尾端的斜率逐渐减小 说明相对于pi 0 5附近的解释变量xi的变化对概率的变化影响较大 而相对于pi接近0和1附近的xi值的变化对概率的变化影响较小 64 使用极大似然法估计Logit模型参数 首先分析含有两个参数 和 的随机试验 假设被估计的模型如下在样本中pi是观测不到的 相对于xi的值 只
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 校园防病安全知识培训课件
- 北仑驾校理论知识培训课件
- 护理常规应聘考试试题及答案
- 精力集中测试题及答案
- 沙盘模拟考试试题及答案
- 小学杠杆面试题及答案
- 普通话语音考试题及答案
- 人类恐惧测试题及答案
- 乐理一级考试题及答案
- 林州入学面试题及答案
- 2025年上海市中考招生考试数学真题试卷(真题+答案)
- 预防残疾知识讲座课件
- 浪漫七夕领证活动方案
- 大型活动策划组织与执行合同
- 2025年广东省中考英语试题卷(含答案解析)
- 肾病综合征患者饮食与液体平衡管理:核心原则、临床策略与患者教育
- 培训机构教师如何做续费转介绍
- 基底节区出血护理查房
- 景区客诉处理课件
- CVC的护理及常见并发症
- WMT8-2022二手乘用车出口质量要求
评论
0/150
提交评论