浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)_第1页
浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)_第2页
浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)_第3页
浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)_第4页
浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学习内容与要求 本章主要介绍因变量受定性因素影响时如何分析的问题。 要求通过本章学习掌握虚拟变量的基本含义,以及在模型中的运用,熟悉同时含有虚拟变量和定性变量的模型。第五章第五章 虚拟变量虚拟变量(Dummy VariableDummy Variable)第五章第五章 虚拟变量虚拟变量主要内容5.1 5.1 虚拟变量(定性变量)的定义、作用和取值虚拟变量(定性变量)的定义、作用和取值5.2 5.2 虚拟变量的设置虚拟变量的设置5.3 5.3 两分定性变量模型两分定性变量模型5.4 5.4 多分定性变量模型多分定性变量模型5.5 5.5 多个定性变量模型多个定性变量模型5.6 5.6 同时含有虚

2、拟变量和定量变量的模型同时含有虚拟变量和定量变量的模型5.75.7虚拟变量虚拟变量 EViews应用举例应用举例回归分析中因变量影响因素定量因素定性因素虚拟变量虚拟变量具有数量特征,能够赋予具体数值的变量不具有数量特征,只是表明事物的某种属性属性第五章第五章 虚拟变量虚拟变量5.1 5.1 虚拟变量(定性变量)的定义、作用和取值虚拟变量(定性变量)的定义、作用和取值1.虚拟变量(哑变量、属性变量、双值变量、类型变量)的定义指反映定性因素变化的变量。既可作因变量,也可作解释变量。本章主要讨论虚拟变量为自变量虚拟变量为自变量的情形。2引入虚拟变量的作用引入虚拟变量的作用,在于将定性因素或属性因素对

3、因变量的影响数量化。 (1)可以描述和测量定性(或属性)因素的影响; (2)能够正确反映经济变量之间的相互关系,提高模型的精度; (3)便于处理异常数据。设置虚拟变量 (即将异常数据作为一个特殊的定性因素)。例如:第五章第五章 虚拟变量虚拟变量5.1 5.1 虚拟变量(定性变量)的定义、作用和取值虚拟变量(定性变量)的定义、作用和取值属性状态人工变量取值具有某种属性1不具有某种属性0解决思路:人工构造变量人工构造变量:将定性变量量化,取值仅为1和0的人工变量,通常用D表示,使其能与定量变量一样可以在回归模型中应用。解决办法:第五章第五章 虚拟变量虚拟变量5.1 5.1 虚拟变量(定性变量)的定

4、义、作用和取值虚拟变量(定性变量)的定义、作用和取值例如例如: (1 1)表示性别的虚拟变量可取为)表示性别的虚拟变量可取为D1= 1 男性男性 0 女性女性(2 2)表示文化程度的虚拟变量可取)表示文化程度的虚拟变量可取为为D2= 1 本科及以上学历本科及以上学历 0 本科以下学历本科以下学历(3 3)表示地区的虚拟变量可取)表示地区的虚拟变量可取为为D3= 1 城市城市 0 农村农村(4 4)表示消费心理的虚拟变量可取)表示消费心理的虚拟变量可取为为D4= 1 喜欢某种商品喜欢某种商品 0 不喜欢某种商品不喜欢某种商品(5 5)表示天气变化的虚拟变量可取)表示天气变化的虚拟变量可取为为D5

5、= 0 雨天雨天 1 晴天晴天第五章第五章 虚拟变量虚拟变量5.1 5.1 虚拟变量(定性变量)的定义、作用和取值虚拟变量(定性变量)的定义、作用和取值第五章第五章 虚拟变量虚拟变量5.2 5.2 虚拟变量的设置虚拟变量的设置5 5.2.1 .2.1 虚拟变量的陷阱虚拟变量的陷阱虚拟变量之间产生多重共线性虚拟变量之间产生多重共线性设置设置不当不当第五章第五章 虚拟变量虚拟变量5.2 5.2 虚拟变量的设置虚拟变量的设置举例:考查季节因素对美国制造业的销售量的影响。由于季节有四个水平,因此需引入三个虚拟变量,设冬季为基础类型变量,Yi为销售量,模型为: 1 春季 1 夏季 1 秋季 D1= ,D

6、2= ,D3= 0 其他 0 其他 0 其他第五章第五章 虚拟变量虚拟变量5.2 5.2 虚拟变量的设置虚拟变量的设置当D1=D2=D3=0时,就表示冬季。如果引入四个虚拟变量,即 1 春季 1 夏季 D1= ,D2= , 0 其他 0 其他 1 秋季 1 冬季 D3= ,D4= 0 其他 0 其他模型变为,此时,D1+D2+D3+D4=1,陷入虚拟变量陷阱。11223344ityDDDDu第五章第五章 虚拟变量虚拟变量5.2 5.2 虚拟变量的设置虚拟变量的设置5 5.2.2 .2.2 虚拟变量的设置规则虚拟变量的设置规则在模型中,有截距项有截距项,若每一定性因素有m个水平属性(或类型),则

7、模型中只能引入m-1个虚拟变量。无截距项无截距项,则引入m个虚拟变量。举例1:公司职员的年薪与工龄(x)和受教育程度(D)有关。若将受教育程度简单分为大学毕业于非大学毕业。根据规则,应引入一个虚拟变量D。 1,大学毕业 D= 0,其他年薪模型为:01ttttyxDu第五章第五章 虚拟变量虚拟变量5.2 5.2 虚拟变量的设置虚拟变量的设置举例2 公司职员的年薪与工龄(x)和学历(D)有关。学历分为大专以下、本科生、研究生三个水平。为了反映学历对职工年薪的影响,可引入两个虚拟变量: 1 本科 1 研究生 D1= , D2= 0 其他 0 其他年薪模型为:01 11122ttyxDDu第五章第五章

8、 虚拟变量虚拟变量5.2 5.2 虚拟变量的设置虚拟变量的设置8.2.3 8.2.3 虚拟变量的取值方法虚拟变量的取值方法“1 1”表示具有某种属性或特征,为比较类型、肯表示具有某种属性或特征,为比较类型、肯定类型。定类型。 “0 0”表示不具有某种属性或特征,为基础类型、表示不具有某种属性或特征,为基础类型、否定类型。否定类型。第五章第五章 虚拟变量虚拟变量5.3 5.3 两分定性变量模型两分定性变量模型两分定性变量模型两分定性变量模型指所研究的定性变量只有两种性质。举例:分析某公司员工的性别对薪水的影响:假设WAGE为薪水,DUMMY为性别,取1为男性,取0为女性。设立回归方程: WAGE

9、=+DUMMY+第五章第五章 虚拟变量虚拟变量5.3 5.3 两分定性变量模型两分定性变量模型VariableCoefficientStd.Errort-StatisticProbDUMMY568.2274168.22083.3778680.0015C1518.696122.537312.393740.0000EViews的输出结果为:经验回归方程为: WAGE=1518.696+568.2274DUMMY第五章第五章 虚拟变量虚拟变量5.3 5.3 两分定性变量模型两分定性变量模型由于 只有0.195343,故模型整体的拟合优度很差,但是对于只含有虚拟变量的模型,重要的是观察自变量的性质是否

10、影响到因变量。由于DUMMY的p值为0.0015,意味着在1%的显著性水平下,可以接受DUMMY之前的系数不为0。2R第五章第五章 虚拟变量虚拟变量5.3 5.3 两分定性变量模型两分定性变量模型观察性别差异对薪酬的影响:对于男性员工,平均薪水E(Yi/Di=1)+=2086.9234对于女性员工,平均薪水E(Yi/Di=0)=1518.696两者相差,即568.2274。第五章第五章 虚拟变量虚拟变量5.4 5.4 多分定性变量模型多分定性变量模型多分定性变量的含义模型中定性变量含有两个以上水平属性或类型。在模型中只有一个虚拟变量是不够的,需要两个或两个以上的虚拟变量添加到模型中去。第五章第

11、五章 虚拟变量虚拟变量5.4 5.4 多分定性变量模型多分定性变量模型举例:前面例子中,公司职员的年薪与工龄(x)和学历(D)有关。学历分为大专以下、本科生、研究生三个水平。为了反映学历对职工年薪的影响,可引入两个虚拟变量: 1 本科 1 研究生 D1= , D2= 0 其他 0 其他年薪模型为:01 11122ttyxDDu第五章第五章 虚拟变量虚拟变量5.4 5.4 多分定性变量模型多分定性变量模型如果一个员工是本科学历,则D1=1,D2=0;如果一个员工是研究生学历,则D1=0,D2=1;如果一个员工没有接受大学教育,则D1=0,D2=0。此时:E(Yi/D1=0,D2=0)= 表示没有

12、大学学历的员工的平均薪水E(Yi/D1=1,D2=0)=+1 表示有本科学历的员工的平均薪水E(Yi/D1=0,D2=1)=+2 表示有研究生学历的员工的平均薪水第五章第五章 虚拟变量虚拟变量5.5 5.5 多个定性变量模型多个定性变量模型一个模型中,可能不只需要一个定性变量,而是包括若干个定性变量若干个定性变量,并且每个虚拟变量可能不止一个性质。举例:考察教授的薪金决定因素,假定涉及的定性变量为性别和肤色,设教授的薪金为Yi,则模型为: 1 男性 1 白人 D1= , D2= 0 女性 0 黑人1122itYDDu第五章第五章 虚拟变量虚拟变量5.5 5.5 多个定性变量模型多个定性变量模型

13、此时,E(Yi/D1=0,D2=0)= 表示黑人女教授的平均薪金E(Yi/D1=1,D2=0)=+1 表示黑人男教授的平均薪金E(Yi/D1=0,D2=1)=+2 表示白人女教授的平均薪金E(Yi/D1=1,D2=1)=+2 表示白人男教授的平均薪金通过1与2的显著性检验,判断性别和种族歧视是否影响工资薪酬。第五章第五章 虚拟变量虚拟变量5.5 5.5 多个定性变量模型多个定性变量模型举例:考察某家公司49名员工的薪金和性别的数据。其中,WAGE为工资,RACE为人种,RACE值取1表示为白人,0表示其他人种;CLERICAL为工作性质,取1为公司职员,取0位其他;GENDER为性别,取1为男

14、性,取0为女性。模型为:WAGE=+1RACE+2CLERICAL+3GENDER+uT第五章第五章 虚拟变量虚拟变量5.5 5.5 多个定性变量模型多个定性变量模型VariableCoefficientStd.Errort-StatisticProbRACE561.1595160.38153.4989030.0011GENDER117.6163191.32230.6147550.5418CLERICAL-796.5342210.4523- 3.7848690.0005C1706.833177.51719.6150360.0000根据样本数据的EViews回归结果如下:数据显示,RACE、CL

15、ERICAL的p值在1%的显著性水平下,工作性质和肤色在这家公司员工的薪酬差异中能起到很好的解释作用。但GENDER这一变量的参数的显著性不强,可以认为该家企业薪酬上不存在性别歧视。第五章第五章 虚拟变量虚拟变量5.6 5.6 同时含有虚拟变量和定量变量的模型同时含有虚拟变量和定量变量的模型虚拟变量模型的定义同时含有一般解释变量与虚拟变量的模型称为同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(虚拟变量模型或者方差分析(analysis-of analysis-of variance: ANOVAvariance: ANOVA)模型。)模型。两种变量同时出现在模型中,需要谨慎

16、对待每个变量对回归总体作用的影响。一个以性别为虚拟变量来考察职工薪金的模型如下:一个以性别为虚拟变量来考察职工薪金的模型如下:i012iiiYXD其中其中例如:例如: iY为职工的薪金;为职工的薪金;iX单击此处添加备注为职工工龄为职工工龄;iD=1代表男性代表男性iD=0 代表女性代表女性l 构造构造虚拟变量模型的两种基本方式:虚拟变量模型的两种基本方式: 加法方式加法方式所设定的计量经济模型中加入适当的虚拟变量,此时虚拟变量与其他解释变量在设定模型中是相加关系。其作用是改变了设定模型的截距水平其作用是改变了设定模型的截距水平。 乘法方式乘法方式在所设定的计量经济模型中,将虚拟解释变量与其他

17、解释变量相乘作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数调整设定模型斜率系数的目的。第五章第五章 虚拟变量虚拟变量5.6 5.6 同时含有虚拟变量和定量变量的模型同时含有虚拟变量和定量变量的模型l1. 1. 加法方式加法方式l上述职工薪金模型中性别虚拟变量的引入就采取了加法方式,上述职工薪金模型中性别虚拟变量的引入就采取了加法方式, l女职工的平均薪金为:女职工的平均薪金为:l男职工的平均薪金为:男职工的平均薪金为:t01tttybb xaDu , yx年薪,工作年限ttt1t0E y x ,D0bb xttt10tEby x ,D1bax 0tuEl在该模型中,如仍假定在该模型

18、中,如仍假定,则则:女性男性01D,第五章第五章 虚拟变量虚拟变量5.6 5.6 同时含有虚拟变量和定量变量的模型同时含有虚拟变量和定量变量的模型l从从几何意义几何意义上看上看 男女职工平均薪金示意图男女职工平均薪金示意图l 则两个函数有相同的斜率,但有不同的截距。则两个函数有相同的斜率,但有不同的截距。l假定假定 ,0al这意味着,男女职工平均薪金对工龄的变化率这意味着,男女职工平均薪金对工龄的变化率 是一样的,但两者的平均薪金水平相差是一样的,但两者的平均薪金水平相差 。aal 可以通过传统的回归检验,对可以通过传统的回归检验,对 的统计显著性进行检验,以的统计显著性进行检验,以判断男女职

19、工的平均薪金水平是否显著差异。判断男女职工的平均薪金水平是否显著差异。a第五章第五章 虚拟变量虚拟变量5.6 5.6 同时含有虚拟变量和定量变量的模型同时含有虚拟变量和定量变量的模型l2 2、乘法方式、乘法方式许多情况下:往往是斜率就有变化,许多情况下:往往是斜率就有变化,或斜率、截距同时发或斜率、截距同时发生变化生变化。斜率的变化可通过以乘法的方式引入虚拟变量来测度。斜率的变化可通过以乘法的方式引入虚拟变量来测度。l例:例:根据消费理论,消费水平根据消费理论,消费水平C C主要取决于收入水平主要取决于收入水平Y Y,但在一,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾个较长的

20、时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。的变化可通过在收入的系数中引入虚拟变量来考察。l在所设定的计量经济模型中,将虚拟解释变量与其他解释变虚拟解释变量与其他解释变量相乘作为新的解释变量出现在模型量相乘作为新的解释变量出现在模型中,以达到其调整设定模达到其调整设定模型斜率系数的目的型斜率系数的目的。l乘法形式引入虚拟解释变量的主要作用:两个回归模型之间的比较;提高模型对现实经济现象的描述精度。 第五章第五章 虚拟变量虚拟变量5.6 5.

21、6 同时含有虚拟变量和定量变量的模型同时含有虚拟变量和定量变量的模型例:随着收入水平的提高,家庭教育费用支出的边际消费倾向可能会发生变化。为了反映定性因素对斜率的影响,可以用乘法方式引入虚拟变量,将家庭教育费用支出函数取成:虚拟变量对斜率的影响 第五章第五章 虚拟变量虚拟变量5.6 5.6 同时含有虚拟变量和定量变量的模型同时含有虚拟变量和定量变量的模型1(ba)1b斜率差异tttttXDXC210l这里,虚拟变量这里,虚拟变量D以与以与X相乘的方式引入了模型中,从而相乘的方式引入了模型中,从而可用来考察消费倾向的变化。可用来考察消费倾向的变化。l如,设如,设01tD反常年份正常年份消费模型可建立如下:消费模型可建立如下:第五章第五章 虚拟变量虚拟变量5.6 5.6 同时含有虚拟变量和定量变量的模型同时含有虚拟变量和定量变量的模型l假定假定E( t)= 0,上述模型所表示的函数可化为上述模型所表示的函数可化为:l 正常年份:正常年份:ttttXDXCE)() 1,|(210l 反常年份:反常年份:ttttXDXCE10)0,|(第五章第五章 虚拟变量虚拟变量5.6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论