S8章__虚拟变量模型.ppt_第1页
S8章__虚拟变量模型.ppt_第2页
S8章__虚拟变量模型.ppt_第3页
S8章__虚拟变量模型.ppt_第4页
S8章__虚拟变量模型.ppt_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本章将主要介绍经典单方程计量经济学模型中引入虚拟变量的问题 第八章虚拟变量模型 在前面几章中 主要介绍了经典线性回归模型及其在若干基本假定下的估计问题 并分析了一个或多个假定不满足时所产生的后果及其可能的改进措施 然而上述方法还不能解决经济生活中遇到的全部问题 如何考察某一突发事件 性别 季节 受教育程度等对经济行为带来的影响 例如 第八章虚拟变量模型 学习目的 了解虚拟变量 虚拟变量模型的概念 掌握虚拟变量设置的原则和引入模型的方法 基本要求 1 认识到虚拟变量是建立计量经济学模型经常会遇到的问题 2 了解虚拟变量 虚拟变量模型的概念 3 掌握虚拟变量设置的原则 虚拟变量模型的建模方法及应用 虚拟变量 虚拟变量模型 第八章虚拟变量模型 第一节虚拟变量 虚拟变量的引入 虚拟变量的设置原则 一 虚拟变量 为什么要引入 虚拟变量 如商品需求量 价格 收入 产量等 许多经济变量是可以定量度量的或者说是可以直接观测的 但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测 如职业 性别对收入的影响 战争 自然灾害对GDP的影响 季节对某些产品 如冷饮 销售的影响等 为了能够在模型中反映这些因素的影响 并提高模型的精度 需要将它们人为地 量化 这种 量化 通常是通过引入 虚拟变量 来完成的 这种用两个相异数字来表示对被解释变量有重要影响而自身又没有观测数值的一类变量 称为虚拟变量 dummyvariables 虚拟变量也称为哑变量或定性变量 虚拟变量的特点是 1 虚拟变量是对经济变化有重要影响的不可测变量 2 虚拟变量是赋值变量 一般根据这些因素的属性类型 构造只取 0 或 1 的人工变量 通常称为虚拟变量 记为D 这是为了便于计算而把定性因素这样数量化的 所以虚拟变量的数值只表示变量的性质而不表示变量的数值 基础类型和肯定类型取值为1 一般地 在虚拟变量的设置中 比较类型和否定类型取值为0 例如 1 表示性别的虚拟变量可取为 2 表示文化程度的虚拟变量可取为 3 表示地区的虚拟变量可取为 4 表示消费心理的虚拟变量可取为 5 表示天气变化的虚拟变量可取为 二 虚拟变量模型 同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型 在模型中 虚拟变量可作为解释变量 也可作为被解释变量 但主要是用作解释变量 其中 例如 三 虚拟变量的引入 虚拟变量作为解释变量引入模型有两种基本方式 加法方式和乘法方式 1 加法方式 上述职工薪金模型 8 1 中性别虚拟变量的引入就采取了加法方式 女职工的平均薪金为 男职工的平均薪金为 从几何意义上看 图8 1 图8 1男女职工平均薪金示意图 则两个函数有相同的斜率 但有不同的截距 例如 在截面数据基础上 考虑个人保健支出对个人收入和教育水平的回归 教育水平考虑三个层次 高中以下 高中 大学及其以上 这时需要引入两个虚拟变量 模型可设定如下 8 2 高中以下 E Yi Xi D1i 0 D2i 0 0 1Xi 高中 大学及其以上 E Yi Xi D1i 1 D2i 0 0 2 1Xi E Yi Xi D1i 0 D2i 1 0 3 1Xi 图8 2不同教育程度人员保健支出示意图 还可将多个虚拟变量引入模型中以考察多种 定性 因素的影响 例如 在职工薪金模型 8 1 的例子中 再引入学历的虚拟变量 则职工薪金的回归模型可设计如下 于是 不同性别 不同学历职工的平均薪金分别由下面各式给出 女职工本科以下学历的平均薪金 男职工本科以下学历的平均薪金 女职工本科以上学历的平均薪金 男职工本科以上学历的平均薪金 E Yi Xi D1i 0 D2i 0 0 1Xi E Yi Xi D1i 1 D2i 0 0 2 1Xi E Yi Xi D1i 0 D2i 1 0 3 1Xi E Yi Xi D1i 1 D2i 1 0 2 3 1Xi 2 乘法方式 斜率的变化 例如 根据消费理论 消费水平C主要取决于收入水平X 但在一个较长的时期 人们的消费倾向会发生变化 尤其是在自然灾害 战争等反常年份 消费倾向往往出现变化 这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察 则消费模型可建立如下 8 4 这里 虚拟变量Dt以与Xt相乘的方式引入了模型中 从而可用来考察消费倾向的变化 在E t 0的假定下 上述模型所表示的函数可化为 正常年份 反常年份 图8 3不同年份消费倾向示意图 如果在模型中同时使用加法和乘法两种方式引入虚拟变量 则回归线的截距和斜率都会改变 例如 显然在式 8 5 中 同时使用加法和乘法两种方式引入了虚拟变量 在E t 0的假定下 上述模型所表示的函数可化为 改革开放以前 E Yt Xt Dt 0 0 1Xt 改革开放以后 则其几何图形如图8 4所示 E Yt Xt Dt 1 0 1 1 2 Xt 3 临界指标的虚拟变量的引入 在经济发生转折时 可通过建立临界指标的虚拟变量模型来反映 例如 进口消费品数量Y主要取决于国民收入X的多少 中国在改革开放前后 Y对X的回归关系明显不同 则进口消费品的回归模型可建立如下 8 6 如果用OLS法得到该模型的回归方程为 8 7 则两个时期进口消费品函数分别为 当t t 1979时 当t t 1979时 几何图形如图8 5所示 图8 5转折期回归示意图 4 数值变量作为虚拟变量引入 有些变量虽然是数量变量 即可以获得实际观测值 但在某些特定情况下把它选取为虚拟变量则是方便的 以虚变量引入计量经济学模型更加合理 譬如年龄因素虽然可以用数字计量 但如果将年龄作为资料分组的特征 则可将年龄选作虚拟变量 例如 家庭教育经费支出不仅取决于其收入 而且与年龄因素有关 按年龄划分为三个年龄组 6 18岁年龄组 中小学教育 19 22岁年龄组 大学教育 其它年龄组 于是设定虚拟变量 则家庭教育经费支出模型可设定为 8 8 其中 Yi是第i个家庭的教育经费支出 Xi是第i个家庭的收人 虚拟变量D1i D2i分别表示第i家庭中是否有6 18岁和19 22岁的成员 5 虚拟变量交互效应分析 当分析解释变量对变量的影响时 大多数情形只是分析了解释变量自身变动对被解释变量的影响作用 而没有深入分析解释变量间的相互作用对被解释变量影响 前面讨论的分析两个定性变量对被解释变量影响的虚拟变量模型中 暗含着一个假定 两个定性变量是分别独立地影响被解释变量的 但是在实际经济活动中 两个定性变量对被解释变量的影响可能存在一定的交互作用 即一个解释变量的边际效应有时可能要依赖于另一个解释变量 为描述这种交互作用 可以把两个虚拟变量的乘积以加法形式引入模型 考虑下列模型 其中 Yi为农副产品生产总收益 Xi为农副产品生产投入 D1i为油菜籽生产虚拟变量 D2i为养蜂生产虚拟变量 这里 例如 显然 8 9 式描述了是否发展油菜籽生产与是否发展养蜂生产的差异对农副产品总收益的影响 虚拟解释变量D1i和D2i是以加法形式引入的 那么暗含着假定 油菜籽生产和养蜂生产是分别独立地影响农副产品生产总收益 但是 在发展油菜籽生产时 同时也发展养蜂生产 所取得的农副产品生产总收益可能会高于不发展养蜂生产的情况 即在是否发展油菜籽生产与养蜂生产的虚拟变量D1i和D2i之间 很可能存在着一定的交互作用 且这种交互影响对被解释变量 农副产品生产总收益会有影响 为描述虚拟变量交互作用对被解释变量的效应 在 8 9 式中以加法形式引入两个虚拟解释变量的乘积 即 1 基础类型 不发展油菜籽生产 也不发展养蜂生产时农副产品生产平均总收益 2 比较类型 同时发展油菜籽生产和养蜂生产时 农副产品生产平均总收益 1为是否发展油菜籽生产对农副产品生产总收益的截距差异系数 2为是否发展养蜂生产对农副产品生产总收益的截距差异系数 3为同时发展油菜籽生产和养蜂生产时对农副产品生产总收益的交互效应系数 0 3组成截距水平 其中 关于交互效应是否存在 可借助于交互效应虚拟解释变量系数的显著性检验来加以判断 如果t检验表明交互效应D1iD2i在统计意义上显著时 说明交互效应对Yi存在显著影响 四 虚拟变量的设置原则 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1 即如果定性变量有m个类别 则只在模型中引入m 1个虚拟变量 例如 已知冷饮的销售量Y除受k个定量变量Xi的影响外 还受一个定性变量季节即春 夏 秋 冬四季变化的影响 要考察该四季的影响 只需引入三个虚拟变量即可 则冷饮销售量的模型为 8 13 在上述模型中 若再引入第四个虚拟变量 则冷饮销售模型变量为 8 14 其矩阵形式为 8 15 如果只取六个观测值 其中春季与夏季取了两次 秋 冬各取到一次观测值 则其中 所谓的 虚拟变量陷阱 第二节虚拟被解释变量 当虚拟变量作为被解释变量时 其作用是对某一经济现象或活动进行 是 与 否 的判断或决策 研究是否购买商品住房 是否参加人寿或财产保险 是否能按期偿还贷款 新产品在市场上是否畅销 对某一改革措施所持的态度等 例如 例如 假定我们要从一个截面样本度量汽车所有权的决定因素 某些人有汽车 而其他人没有 假定这种所有权函数的决定因素是收入和职业 则可设定模型为 8 16 其中 Xi表示收入 显然 这个模型中被解释变量是一个虚拟变量 特征 被研究的对象 即被解释变量 在受到多种因素影响时 其取值只有两种状态 是 与 否 二元型响应 现象 如何处理二元型响应被解释变量模型的估计 推断问题 一 线性概率模型 LPM 二 Logit模型 一 线性概率模型 LPM 1 什么是线性概率模型 其中 Xi为住户的收入 Yi为一虚拟变量 表示住户购买商品住房的情况 问题 我们前面讨论的回归分析主要是研究E Yi Xi 0 1Xi的问题 即研究条件均值轨迹的问题 而在上述模型中 被解释变量是某种属性发生与否的状况 怎样把被解释变量某种属性发生与否的概率问题同条件均值的轨迹研究联系起来 另外 若概率问题与条件均值轨迹能够联系起来的话 那么 我们所讨论的线性回归分析会出现什么问题 由于E i 0 由 8 17 另外 设Y有下列分布 P Yi 1 pi P Yi 0 1 pi 根据数学期望的定义 注意到事件Y 1是在给定收入X的条件下发生的 因此E Yi E Yi Xi 于是有 表明购买商品用房的概率是收入的线性函数 像 8 17 式那样 以虚拟变量作为被解释变量的模型的条件期望实际上等于随机变量Yi取值为1的条件概率 即当住户的收入水平为X时 其购买商品住房的概率可表示成X的线性函数 故 8 17 式也被称为线性概率模型 LPM 显然 只要得到 8 17 式中 0和 1的估计量后 就可以估计出不同收入水平住户购买商品住房的概率 2 线性概率模型的估计 从形式上看 8 17 式与普通的线性计量经济模型相似 是否能够运用OLS法直接对其进行估计呢 答案是否定的 因为直接采用OLS法对 8 17 式那样的模型进行估计 将会遇到一些特殊的问题 使得估计结果失去了合理的经济解释 因而需要寻求相应的处理方法 问题 1 随机扰动项 i的非正态性 在线性概率模型中 因为 显然 关于 i的正态性假设不再成立 直接运用OLS法对线性概率模型进行估计 对参数的估计不会产生太大影响 说明 2 随机扰动项 i的异方差性 Var i E i E i 2 E i2 1 0 1Xi 2pi 0 1Xi 2 1 pi 1 0 1Xi 2 0 1Xi 0 1Xi 2 1 0 1Xi 0 1Xi 1 0 1Xi pi 1 pi 8 22 Yi 1时 P i 1 0 1Xi pi Yi 0时 P i 0 1Xi 1 pi 根据方差的定义得 根据Yi的概率分布 有 这里利用了式 8 20 Var i pi 1 pi 8 22 8 22 式表明 当 i满足E i 0和E i j 0 i j 时 i是异方差的 这时利用OLS法所得的LPM的估计量不再具有最小方差的特性 且各参数估计量的标准差也不可信 也就是说 LPM参数的OLS法估计量虽仍为线性无偏估计量 但不是最佳估计量 怎样消除异方差性的影响 思考 可利用第六章中有关修正异方差的方法 可用加权最小二乘法修正异方差 提示 根据前面的讨论 已知LPM中 i的方差是Yi条件期望的函数 故选择权重 i的一种方法为 8 23 对 8 17 式作变换 有 8 24 在实践中为了估计 i 进而估计LPM模型 可采取以下步骤 3 不满足0 E Yi Xi 1的约束 在线性概率模型中 E Yi Xi 表示在给定X的条件下 事件Y发生的概率 解决这一问题的二类方法是 3 非线性概率模型 应当指出的是 虽然我们可以采用WLS解决异方差性问题 增大样本容量减轻非正态性问题 通过约束迫使所估计的事件Y发生的概率落入0 1 但LPM与经济意义的要求不符 随着X的变化 X对pi的 边际效应 保持不变 因此 表现概率平均变化比较理想的模型应当具有这样的特征 1 概率pi P Yi 1 Xi 随X的变化而变化 但永远不超出0 1区间 2 随着Xi pi 0 Xi pi 1 符合这些特征的函数可用图8 6形象地刻画 图8 6的模型满足0 E Yi Xi 1以及pi是Xi非线性函数的假设 呈现出S型的曲线特征 因此可以设法找到符合这种S型曲线特征的函数形式来作为二元型响应计量经济模型的设定形式 原则上 任何适当的 连续的 定义在实轴上的概率分布都将满足上述两个条件 对于连续随机变量来说 密度函数的积分代表概率的大小 也就是说 连续随机变量的 累积 分布函数 CDF 可以满足上述两个要求 通常选择逻辑斯蒂和正态分布的累积分布函数去设定非线性概率模型 当选用逻辑斯蒂分布时 就生成了Logit模型 二 Logit模型 1 Logit模型 对数单位模型 的基本概念 当选择用逻辑斯蒂分布函数 logisticdistribution 去设定二元型响应计量经济模型时 有 其特征 1 zi 时 pi 1 zi 时 pi 0 zi 0时 pi 0 5 2 它有一个拐点 在拐点之前 随zi或Xi增大 pi的增长速度越来越快 在拐点之后 随zi或Xi增大 pi的增长速度越来越慢 逐渐趋近于1 考虑到在估计中便利 我们采用以下变换 8 26 式中 比率pi 1 pi 通常称为机会比率 即所研究的事件 或属性 发生 的概率与 没发生 的概率之比 机会比率的对数Li ln pi 1 pi 称为对数单位 这里的对数单位Li不仅是Xi的线性函数 而且也是 的线性函数 所以 8 26 式也称为Logit模型 由于pi不仅对Xi是非线性关系 而且对 0和 1也是非线性关系 不能直接运用OLS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论