第七章 虚拟变量回归模型.ppt_第1页
第七章 虚拟变量回归模型.ppt_第2页
第七章 虚拟变量回归模型.ppt_第3页
第七章 虚拟变量回归模型.ppt_第4页
第七章 虚拟变量回归模型.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量经济学基础与应用 DummyVariableRegressionModels chapterseven 第七章虚拟变量回归模型 第一节虚拟变量的性质 如何量化定性变量 这种 量化 通常是通过引入 虚拟变量 来完成的 根据这些因素的属性类型 构造只取 0 或 1 的人为变量 通常称为虚拟变量 dummyvariables 记为D 例如 反映性别的虚拟变量可取为 1 男D 0 女 第二节解释变量均为定性变量的模型 方差分析模型 ANOVA analysis of variancemodels 回归模型中解释变量都是虚拟变量的模型例如 一个以性别为虚拟变量考察高校教授薪金的模型其中 Yi为高校教授的薪金Di 1 若是男性 Di 0 若是女性 第二节解释变量均为定性变量的模型 在该模型中 如果仍假定ui满足经典线性回归模型的假定 则女教授的薪金期望为 男教授的薪金期望为 取值为0的一类称为基准类 基础类 参照类或比较类称为差别截距系数 differentialinterceptcoefficient 它表明取值为1的类别与基准类截距的差别 类别对应变量贡献的差异 例子一表10 2 精要 Foodexpenditureinrelationtoafter taxincomeandsex 例子一表10 2 精要 食品支出对性别虚拟变量的回归结果 男性 0 例子一表10 2 精要 食品支出对性别虚拟变量的回归结果 女性 0 虚拟变量的性质 虚拟变量陷阱 虚拟变量的个数须按以下原则确定 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1即如果某一定性变量有m个类别 只在模型中引入m 1个虚拟变量违背这一原则会陷入虚拟变量陷阱 dummyvariabletrap 导致多重共线性问题 例如 性别 男 女两个类别 m 2 地区 东部 中部 西部三个类别 m 3 ANOVA模型例二 表10 4 精要 ANOVA模型例二 表10 4 精要 建立如下ANOVA模型 其中 ANOVA模型例二 表10 4 精要 模型估计结果 ANOVA模型例二 表10 4 精要 theoverallconclusionisthat statisticallythemeansalariesofpublicschoolteachersintheWestandtheNortheastandNorthCentralareaboutthesame butthemeansalaryofteachersintheSouthisstatisticallysignificantlylowerbyabout 3265 回归结果总体上反馈了如下结论 西部地区与东北中北部地区公立学校的教师平均薪水在统计上意义上无差别 但南部教师的平均薪水在统计上显著低于前两者大约 3265 第三节解释变量包含一个定量变量 一个两分定性变量的模型 ANOVA模型常见于社会学 心理学 教育学和市场调研等领域中 在经济学中并不那么常见 在大多数经济研究中 典型的情形是 一个回归模型既含有一些定量的又含有一些定性的解释变量 兼含有定量和定性变量的回归模型叫做协方差分析 ANCOVA analysisofcovariance 模型 第三节解释变量包含一个定量变量 一个两分定性变量的模型 在例一中加入定量变量税后收入 构成ANCOVA模型 例三 前面例子得到结果 例子一 食品支出对性别虚拟变量的回归结果 男性 0 回忆 第三节解释变量包含一个定量变量 一个两分定性变量的模型 例一中利用ANOVA模型存在模型设定错误 在税后收入不变情况下 男性平均食品消费支出为 1506 244 女性为 1506 244 228 9868 不考虑性别差异 则边际食品消费倾向为0 058982根据回归结果 女性平均食品消费支出 男性平均食品消费支出 图10 2 精要 Foodexpenditureinrelationtoafter taxincome 第四节解释变量包含一个定量变量 一个多分定性变量的模型 例二中加入定量变量学生平均教育消费 如下 例四 前面ANOVA模型例二结果 模型估计结果 回忆 图10 3 精要 Averageannualsalary AAS andperpupilspending PPS 西部或南部 东北 中北部 第五节解释变量包含一个定量变量 多个定性变量的模型 推广到解释变量不止一个定性变量的情况 例五 其中 Y 小时工资X 教育 受教育年限 D2 1 女性 0 男性 D3 1 非白种人和非西班牙人 0 其他 回归结果 第五节解释变量包含一个定量变量 多个定性变量的模型 交互影响问题如此设置导致类似问题 假定男性的平均小时工资比女性高 但与种族无关 与现实不符 考虑交互影响的模型 例六 称为交互影响虚拟变量 第五节解释变量包含一个定量变量 多个定性变量的模型 考虑交互影响的模型估计结果 例六 所有虚拟变量相加 1 964 表明非白种 非西班牙女性的工资偏低约1 96 介于单独性别差异和单独种族差异之间 第五节解释变量包含一个定量变量 多个定性变量的模型 模型的一般化 多定量变量和多定性变量混合 例七表10 5 精要 AggregatecontributionsU S politicalparties 1982 第六节比较两个回归 如何分析定量变量与定性变量的交互影响 截距可能不同 斜率也可能不同 男性平均食品支出 Di 0 的条件期望为 女性平均食品支出 Di 1 的条件期望为 称为差别斜率系数 也称斜率飘移 slopedrifter 当截距与斜率发生变化时 则需要同时引入加法与乘法形式的虚拟变量 例子考察1990年前后的中国居民的总储蓄 收入关系是否已发生变化 下表中给出了中国1979 2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据 一个例子 一个例子 以Y为储蓄 X为收入 可令 1990年前 Yi 1 2Xi 1ii 1 2 n11990年后 Yi 1 2Xi 2ii 1 2 n2则有可能出现下述四种情况中的一种 1 1 1 且 2 2 即两个回归相同 称为一致回归 CoincidentRegressions 2 1 1 但 2 2 即两个回归的差异仅在其截距 称为平行回归 ParallelRegressions 3 1 1 但 2 2 即两个回归的差异仅在其斜率 称为共点回归 ConcurrentRegressions 4 1 1 且 2 2 即两个回归完全不同 称为相异回归 DissimilarRegressions 一个例子 从分段函数及其比较说起 四种可能性模型图10 4 精要 一致回归 共点回归 平行回归 相异回归 这一问题也可通过引入乘法形式的虚拟变量来解决 将n1与n2次观察值合并 并用以估计以下回归 Di为引入的虚拟变量 于是有 可分别表示1990年后期与前期的储蓄函数 一个例子 虚拟变量的作用 在统计检验中 如果 4 0的假设被拒绝 则说明两个时期中储蓄函数的斜率不同 具体的回归结果为 6 11 22 89 4 33 2 55 由 3与 4的t检验可知 参数显著地不等于0 强烈示出两个时期的回归是相异回归回到分段函数形式也可以 各自储蓄函数分别为 1990年前 1990年后 0 9836 一个例子 是那种模型关系 表10 6 精要 加入定性变量和定量变量交互影响的回归结果 例八 前面模型得到结果 例三 回忆 例九表10 7 精要 Personalsavingsanddisposablepersonalincome UnitedStates 1970 1995 例九利用虚拟变量评价定性变量影响 美国经济的实际状况分析1982年之间的经济萧条 及其萧条后时期 检验时期差异模型如下 虚拟变量DUM 0 1970 1981 1 1982 1995 例九表10 8 精要 Regressionresultsofsavings incomerelations 例九利用虚拟变量评价定性变量影响 不考虑1982年经济衰退对储蓄 收入关系影响1982年之间的经济萧条 及其萧条后时期 估计模型如下 两模型在整个时期的边际储蓄倾向上存在显著差异1970 1981 0 0803321982 1995 0 080332 0 06469 0 015642 比较两个回归的另一种方法 邹检验 StructuralChange 经济形势突变内部因素 经济萧条 战争爆发政策变化 固定汇率变为浮动汇率 计划经济向市场经济转轨 政权 政府更迭如何发现模型中确实发生了结构性变化 模型的结构稳定性回归系数在不同的时间期间有显著的差异邹检验 Chowtest Chow检验的假定Chow检验的步骤 比较两个回归的另一种方法 邹检验 邹检验的假定两段时期的回归误差项独立分布邹检验的步骤步骤1 估计全样本 获得残差平方和RSS 记为S1 其自由度为 n1 n2 k k为估计的参数个数步骤2 分别估计两段时期模型 获得残差平方和 分别记为S2和S3 自由度分别为 n1 k 和 n2 k 令S4 S2 S3 其自由度为 n1 n2 2k 步骤3 求得S5 S1 S4步骤4 比较两个回归的另一种方法 邹检验 回到例九 储蓄 收入关系查F表 自由度为2和22的1 临界F值为7 72 虚拟变量法相对于邹检验的优势 工作量小只需做一个回归 便可得多个方程可用于检验各种假设截距 斜率可明确告知什么导致了结构化变化提高了估计的精度数据混合 自由度增加 第七节虚拟变量在季节分析中的作用 时间序列的季节模式时间序列可能包含的四种成分 季节成分 周期成分 趋势成分和随机成分 例如 下图为工业生产总值 名义值 季度序列 例十表10 9 精要 Actual forecastandseasonally adjustedrefrigeratorsales UnitedStates 1978 1985 例十图10 5 精要 Salesofrefrigerators UnitedStates 1978 1 1985 4 例十图10 5 精要 考虑季节模式的模型 例十图10 5 精要 如何利用虚拟变量进行季节调整 步骤1 加入季节变量进行回归 得到估计值步骤2 提取回归模型残差 即步骤3 残差 均值得到经季节调整后序列 第八节应变量为虚拟变量模型 线性概率模型 linearprobabilitymodel LPM 应变量为两分变量 是或不是举个例子 房贷申请成功与否与年收入关系 表示申请到了贷款 表示没有 建立以下模型模型的斜率不再表示单位X变动引起Y的变动可以解释为给定X下 事件的发生概率 例十一表10 10 精要 Linearprobabilitymodelofmortgageappli

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论