计量经济学 第八章 虚拟变量回归.ppt_第1页
计量经济学 第八章 虚拟变量回归.ppt_第2页
计量经济学 第八章 虚拟变量回归.ppt_第3页
计量经济学 第八章 虚拟变量回归.ppt_第4页
计量经济学 第八章 虚拟变量回归.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第八章虚拟变量回归,2,8.1虚拟变量简介,在进行回归分析时,因变量不仅受到一些定量变量(如收入、产量、价格、成本)的影响,而且还受到一些定性变量(如性别、学历、季节)的影响。,比如说在其他因素相同的情况下,具有硕士文凭的人通常能比本科文凭的人获得更高的收入;在一家公司,从事相同工作的男性获得的收入有时也比女性高。诸如学历、性别等等这些定性的变量确实影响着个人的收入(因变量),而且应该被包含在自变量的行列中。,从这一章开始引入定性变量作为自变量,从而使线性回归模型作为一种及其灵活的工具,可以处理经验研究中许多实际的问题,3,由于这些定性变量通常指某一性质或属性的出现或不出现,比如男性或女性、大学学历或专科学历等,因此量化这些变量的方法就是构造一个取值为0或1的人为变量,可以用0表示某种属性不出现,1表示某种属性出现。这种人为设定的变量就称作虚拟变量(DummyVariable),大学毕业0其他,男性0女性,夏季0其他季节,学历,性别,季节,企业规模,大型企业0其他,户口,城镇0农村,4,8.1.2虚拟变量的引入方式,1.加法模型:仅仅反映定性变量对截距的影响。,这个模型和前面的回归模型没有什么太大的差异,只不过用一个虚拟变量D代替了X。这个模型能使我们发现性别是否会造成公司职员薪水差异,这里假定了其他变量如年龄、学历等都相同,而且随机误差项也服从线性回归模型的基本假定。,5,从上面可以看出,截距系数给出了女职员的平均年薪,而斜率系数反映了男职员和女职员平均年薪的差异。按照普通线性回归模型来估计上面的模型,如果斜率系数能通过显著性检验,就表明这个公司在员工的薪水方面似乎存在性别歧视。,6,右表给出了按性别划分的10名公司职员的年薪数据,对应于模型8.1的回归结果如下,(7.4392),由于虚拟变量通过了t检验,表明该公司的男女职员平均年薪存在差异,女职员的平均年薪为18000元,而男职员的平均年薪为21280元(18000+3280),7,研究一个虚拟变量的模型在实际运用中并不常见,更多的情况是模型中即含有一些定量变量,也含有一些虚拟变量。可以把模型8.1改为,男性0女性,工龄,年薪,8,2.乘法模型:反映定性变量对斜率的影响,收入,支出,以家庭消费支出为例,假设随着家庭收入支出的增加,家庭中有无适龄子女也对边际消费倾向产生影响。,收入,以家庭消费支出为例,假设随着家庭收入支出的增加,家庭中有无适龄子女也对边际消费倾向产生影响。,9,3.一般形式:在回归模型中同时以加法和乘法模型引入虚拟变量,在实际运用中,有时没有办法确定定性变量的影响类型,此时可以使用一般形式引入虚拟变量,然后再用t检验判断估计参数是否能通过显著性检验,最终确定虚拟变量的具体引入方式。,10,课本P125页例7中数据建立的我国城镇居民彩电消费模型,(9.03),(8.32),(-6.59),模型的估计参数都通过了显著性检验,说明我国城镇居民中高收入和低收入家庭对彩电的消费需求,在截距和斜率上都存在明显差异。,11,8.1.3虚拟变量引入原则,1.如果一个定性变量有m个类别,那么只能引入m-1个虚拟变量。这样做是为了避免虚拟变量之间产生完全多重共线性问题。,在上面的例子中,性别有两个类别,因而只引入了一个虚拟变量,如果不遵守这个原则,引入两个虚拟变量,就会产生多重共线性,掉进所谓的“虚拟变量陷阱”。假设在原模型中设定两个虚拟变量:,12,有5个样本数据,3名男职员,2名女职员,那么数据矩阵如下,在完全共线性条件下,没有办法得到三个参数唯一解。,13,在模型中,如何分配虚拟变量是任意的。,或者,14,2.如果有m定性变量,每个变量只有两个类型,那么可以引入m个虚拟变量。,农村低收入家庭,农村高收入家庭,城市低收入家庭,城市高收入家庭,比如在研究居民消费函数的时候,考虑到城乡差距和收入差距,消费函数可以表示为:,15,8.2虚拟变量的作用,一、调整季节(月度)波动,在使用季节和月度数据建立回归模型时,经常存在季节波动,使用虚拟变量也可以反映季节或月度因素的影响。例如在利用季度数据对某公司消费Y和收入X进行回归分析时,在夏季(第三季度)发半年奖或冬季(第一季度)发年终奖时,收入会显得异乎寻常的高,此时为了消除季节变动的影响,可以用加法模式引入季度虚拟变量,16,例:美国制造业利润-销售额模型分析,17,18,利用上表中数据,建立回归模型如下,由于只有第二个季度的虚拟变量通过参数的显著性检验,为此可以重新设置模型和虚拟变量,19,20,重新建立回归模型,有下面的结果,由于第二季度的虚拟变量通过参数的显著性检验,表明第二季度制造业利润-销售额数据和其他三个季度确实存在显著差异。,21,二、检验回归模型的稳定性,利用不同的样本数据估计同一形式的计量经济模型,可能会有不同的结果,若估计的参数之间存在显著差异,那么模型结构是不稳定的;反之模型是稳定的。,使用虚拟变量检验回归模型的稳定性,有下面两个用途:,1、分析回归模型结构对样本变化的敏感性;,2、比较、分析两个或多个回归模型的差异情况,即分析模型结构是否发生了变化,如我国改革开放前后经济发生了很大变化,利用前后两个时期的数据建立相关的宏观计量模型,就可能存在较大的差异。,22,设前后两个时期的回归模型分别为,如果引入虚拟变量,那么回归模型可以变为,23,24,25,已知19461963年英国个人储蓄和收入数据(单位:百万英镑),其中:19461954战后重建时期19551963重建后时期,26,为了研究重建前后两个时期模型是否存在差异,利用表中数据估计混合回归模型,有下面的结果,(-3.2594),(1.6315),(3.1701),回归结果表明,级差截距和级差斜率都通过了显著性检验,重建前后两个时期的回归差异显著。,27,重建时期:,重建后时期:,-0.2663,-1.7502,收入,储蓄,28,3、分段线性回归,其基本形式为,在研究某些经济问题时,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论