第十章 虚拟变量.doc_第1页
第十章 虚拟变量.doc_第2页
第十章 虚拟变量.doc_第3页
第十章 虚拟变量.doc_第4页
第十章 虚拟变量.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章 虚拟变量一个例子:工资方程个人薪资收入(earnings)受到多种因素的影响,人们特别感兴趣的两个主要因素是受教育程度 (years of education) 和工作经验(years of experience)。为区别这两个因素对工资报酬的影响,就需要一个多元回归模型。经济学家在设定工资模型时,一般认为因变量使用工资的对数比工资本身更贴近高斯马尔科夫假定。其模型的一个形式为 其中,、和 分别表示工资、受教育程度和工作经验。用OLS估计该模型得 代表工作经验相同的情况下,受教育程度()对工资对数()的边际影响。或者理解为受教育年限增加1年,工资的百分比变化是工资对受教育程度的弹性;代表受教育程度不变的情况下,工作经验()对工资对数()的边际影响。通过对工资的分析发现,受教育程度和工作经验的影响因人而异。一般认为性别歧视在一定程度上是存在的。性别歧视是否存在?若存在,如何研究男性与女性的报酬差异?为此,可以引入一个特殊的变量对观测对象进行分组。这个特殊的变量就是虚拟变量。 一. 虚拟变量的概念虚拟变量(dummy variable)又称为双值变量,取值0或1,用以反映观测对象是否具有某种性质或属性,习惯上用D表示。在计量经济模型中引入虚拟变量,可以扩展模型的应用范围,使模型能更准确反映真实情况。二. 虚拟变量作为自变量(一) 自变量中只有虚拟变量性别()与收入()的关系,可用模型 ,是虚拟变量, 若经过检验,是显著的,即,说明性别对收入有明显影响。(二) 自变量中既有量变量又有质变量所谓质变量就是我们在统计学中所说的品质标志,反映观察对象的某种性质或属性。在使用中,为处理方便,用数字代替质变量的值;量变量是统计学中所说的数量标志,就是我们通常意义的变量。1. 质变量只影响模型的截距某些特殊事件对消费的影响,可能只影响模型的截距。消费模型为, 、分别表示消费和收入。 特殊年份只影响模型截距而不影响斜率时,可直接引入一个虚拟变量,表现特殊年份的影响,模型改写成 ,其中 。用反映了特殊年份与正常年份的平均消费差异。若模型满足经典假定,可用OLS法估计,得 如果对检验是显著的,也就证实了特殊年份与正常年份的平均消费是有差异的。 工资模型: 令表示对数工资,工资模型可写为 假设性别只影响截距,引入虚拟变量,且 则模型改写为 如果可以通过显著性检验,就证实了报酬是受性别影响的。2. 质变量对截距和斜率都产生影响如果特殊事件不但影响模型的截距,同时对斜率也产生影响,模型就应改写为 , 若模型满足经典假定,可用OLS法估计,得 在这里,我们用虚拟变量把特殊年份和正常年份的影响统一到一个模型中。用表示特殊年份与正常年份平均消费的截距差异,表示斜率的差异。并且可用OLS法将参数统一估出,但条件是特殊年份的模型与正常年份的模型,方差应相同。(三)虚拟变量陷阱问题 引入虚拟变量时要注意这些变量之间以及与其它变量间要保持无多重共线性。在研究带有季节性的问题或研究对象需要分类情况等,在引入虚拟变量时要格外小心,避免落入虚拟变量陷阱。例如,某商品的销售量明显受到季节的影响,假定销售函数模型为 为把季节变动的影响反映在模型中,引入四个虚拟变量 , 则模型可改写为 但此时四个虚拟变量之间有 ,这就出现了多重共线性,我们称这种情况是虚拟变量陷阱。为避免落入陷阱,可改变虚拟变量引入的方式或改变模型的形式。第一种处理方法:在上例中,只引入四个虚拟变量中的三个 , 此时,就表示第一季度,模型可写为 第二种处理方法:也可改变原模型的形式,去掉模型中的常数项,保留全部虚拟变量,模型为 (四)折线回归 有时回归问题呈现折线形式。例如,通常认为工业增长率的变化会引起通货膨胀率的变化,假定两者之间呈线性关系。当工业增长率(x)达到一定水平时,通货膨胀率(y)的变化率发生改变且变大。以为界限,若工业增长率(x)低于时,认为经济增长是温和的;超过则认为经济过热。在两侧直线的斜率不同,形成折线,此时可引入虚拟变量以表现这种变化,模型表示为 , 其中 若满足经典假定,用OLS 法估计,得 经过检验,若显著,则折线模型成立。 (五)在模型结构稳定性建模中的应用 可以利用虚拟变量研究所建模型的稳定性。模型的稳定性是指对于同一问题利用不同时期(或不同空间)的数据分别建立的模型之间无显著差异。利用模型的稳定性可以发现所研究的现象其变化规律在不同的时期(或不同的空间)是否发生改变。 假设利用总体的两个(不同时期)样本,对同一问题建立模型,模型分别为样本1: 样本2: 虚拟变量: 研究模型 (*)将sample 1和sample2 的数据合并后估计(*)式,并对和的参数进行显著性检验,四种可能结果:重合回归、平行回归、汇合回归及相异回归。重合回归说明模型是稳定的,其他三种情况都是不稳定。例10.1.1 书238页三. 虚拟变量作为因变量的情况(一)线性概率模型1.模型设置:除了自变量可使用虚拟变量,在很多问题中虚拟变量也可作为因变量使用。例如用虚拟变量描述微观个体的某种选择、特征或属性等。此时模型称为定性选择模型,其中最简单的是因变量只取0或1两个值,且与解释变量呈线性形式,称为线性概率模型(LPM)。大学毕业生是否读研的例子,模型为 其中,第i个学生拿到学士学位后三年内是否读研用虚拟变量表示 表示第i个学生大学的平均成绩;(单位:千元)表示其家庭年收入。 是随机干扰项,且。此时,有,可看作是在给定和的条件期望(在给定和下,的平均取值),所以是取1的平均概率。线性概率模型也由此得名。这里理应满足。2.模型分析:假定模型的回归结果为对于每个观测值,我们可以通过上式计算对应的因变量的拟合值(或预测值)。在通常OLS意义下,的含义是:平均而言,可以预期的因变量的值。但在本例中这样解释就不太适合。假定某学生的是3.5,为5万元,的拟合值为。由于因变量只能取0或1两个值,所以0.8被看作是该学生读研的可能性或读研的概率的估计值。要说明的是,这种概率不是我们能观察到的,我们只能观测到读研或不读研的决定。另外,模型中斜率系数的含义也有所不同。在常规回归中,斜率系数表示在其他解释变量不变的条件下,该解释变量的单位变动引起因变量的变化。而在线性概率模型中,斜率系数表示在其他解释变量不变的情况下,该解释变量的单位变动引起因变量等于1的概率的变动。(二)线性概率模型不满足回归经典假定 设模型,其中 ,且 1.随机项不服从正态分布 这实际上是两点分布。 2.模型具有异方差性 这里,是的概率。因为,而服从01分布,所以有 异方差的处理方法:由于可以用来估计,所以可用来估计。对原模型作变换,用乘模型中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论