计量经济学课件:计量虚拟变量模型_第1页
计量经济学课件:计量虚拟变量模型_第2页
计量经济学课件:计量虚拟变量模型_第3页
计量经济学课件:计量虚拟变量模型_第4页
计量经济学课件:计量虚拟变量模型_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章第九章 虚拟变量模型虚拟变量模型一、虚拟变量的基本含义一、虚拟变量的基本含义二、虚拟变量的设置原则二、虚拟变量的设置原则三、虚拟变量的引入三、虚拟变量的引入一、虚拟变量的基本含义一、虚拟变量的基本含义 许多经济变量是可以定量度量可以定量度量的,如:如:商品需求量、价格、收入、产量等。 但也有一些影响经济变量的因素无法定量度量无法定量度量,如:如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。 这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构

2、造只取“0”或“1”的人工变量,通常称为虚拟变量虚拟变量(dummy variables),记为D。例如,例如,反映文化程度的虚拟变量可取为:反映文化程度的虚拟变量可取为:非本科学历本科学历01Dt反映性别的虚拟变量可取为:反映性别的虚拟变量可取为:女男01Dt (1)将定性因素(或属性因素)对应变量的影响数量化,)将定性因素(或属性因素)对应变量的影响数量化,当虚拟变量值取当虚拟变量值取“1”时,表明质的影响发生作用,即代表时,表明质的影响发生作用,即代表某种属性因素存在或某种定性因素发生作用;取某种属性因素存在或某种定性因素发生作用;取“0”时时 (2)引入虚拟变量后,相当于把不同属性类型

3、的样本合)引入虚拟变量后,相当于把不同属性类型的样本合并,即相当于扩大样本容量,从而提高模型精度。并,即相当于扩大样本容量,从而提高模型精度。 (3)分离异常因素的影响。)分离异常因素的影响。 虚拟变量的作用:虚拟变量的作用:例如,例如,一个以性别为虚拟变量考察企业职工薪金的模型:一个以性别为虚拟变量考察企业职工薪金的模型:iiiiDXY210其中:其中:Yi为企业职工的薪金(千元),为企业职工的薪金(千元),Xi为工龄为工龄99. 0R)57. 8()45.38()61.93(tD33. 1X37. 197.17Y2女男01Di表明表明:当性别变量为常数时,工:当性别变量为常数时,工龄每增加

4、一年,平均年薪增加龄每增加一年,平均年薪增加1370元,当工龄保持不变时,男元,当工龄保持不变时,男性的平均年薪比女性多性的平均年薪比女性多1330元,元,性别对薪金的影响是显著的。性别对薪金的影响是显著的。 女性平均年薪:女性平均年薪:男性平均年薪:男性平均年薪:X37. 197.17YX37. 130.19X37. 1)33. 197.17(Y二、虚拟变量的设置原则二、虚拟变量的设置原则例:例:已知冷饮的销售量已知冷饮的销售量Y除受除受k种定量变量种定量变量Xk的影响外,还受的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只春、夏、秋、冬四季变化的影响,要考察该四季的影响,

5、只需引入三个虚拟变量即可:需引入三个虚拟变量即可:011tD其他春季012tD其他夏季013tD其他秋季虚拟变量的个数须按以下原则确定:虚拟变量的个数须按以下原则确定:(1)若定性因素有)若定性因素有m个相互排斥的类型或属性,只能引个相互排斥的类型或属性,只能引入入(m-1)个虚拟变量,否则会陷入个虚拟变量,否则会陷入“虚拟变量陷阱虚拟变量陷阱”,产,产生完全共线性。生完全共线性。(当无截距项时,应引入(当无截距项时,应引入m个虚拟变量)个虚拟变量)则冷饮销售量的模型为:则冷饮销售量的模型为:在上述模型中,若再引入第四个虚拟变量在上述模型中,若再引入第四个虚拟变量ttttktkttDDDXXY

6、332211110014tD其他冬季则冷饮销售模型变量为:则冷饮销售模型变量为:tttttktkttDDDDXXY44332211110其矩阵其矩阵形式为:形式为:011tD其他春季012tD其他夏季013tD其他秋季U)DX(Yk104321 如果只取六个观测值,其中春季与夏季取了两次,秋、如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的:冬各取到一次观测值,则式中的: 显然,(X D)中的第1列可表示成后4列的线性组合,从而(X D)不满秩,参数无法唯一求出。 这就是所谓的这就是所谓的“虚拟变量陷阱虚拟变量陷阱”,应避免。k104321014tD其他冬季011t

7、D其他春季012tD其他夏季013tD其他秋季0001XX10010XX11000XX10100XX10010XX10001XX1)DX(6k165k154k143k132k121k1134231210DDDXYXYX)(YX)(YX)(Y10140130120冬:秋:夏:春:其他春季01D1其他夏季01D2其他秋季01D3冬季秋季夏季春季0321DDXY210XYX)3(YX)2(YX)(Y10120120120冬:秋:夏:春:?二、虚拟变量的设置原则二、虚拟变量的设置原则虚拟变量的个数须按以下原则确定:虚拟变量的个数须按以下原则确定:(1)若定性因素有)若定性因素有m个相互排斥的类型或属性

8、,只能引个相互排斥的类型或属性,只能引入入(m-1)个虚拟变量,否则会陷入个虚拟变量,否则会陷入“虚拟变量陷阱虚拟变量陷阱”,产,产生完全共线性。生完全共线性。(当无截距项时,应引入(当无截距项时,应引入m个虚拟变量)个虚拟变量)(2)一般情况,虚拟变量取)一般情况,虚拟变量取“0”值代表比较的基准。值代表比较的基准。(3)虚拟变量在单一方程中,可以作为解释变量,也)虚拟变量在单一方程中,可以作为解释变量,也可以作为应变量。可以作为应变量。例如,引入政府经济政策的变动对应变量的影响:例如,引入政府经济政策的变动对应变量的影响:政策不变政策变动01Dt三、虚拟变量的引入三、虚拟变量的引入 虚拟变

9、量做为解释变量引入模型有两种基本方式:加法方式加法方式和乘法方式乘法方式。iiiiXDXYE10)0,|( 企业男职工的平均薪金为:企业男职工的平均薪金为:iiiiXDXYE120)() 1,|( 上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。 在该模型中,如果仍假定E(i)=0,则 1 1、加法方式、加法方式iiiiDXY210 企业女职工的平均薪金为:企业女职工的平均薪金为:女男01Di几何意义:几何意义: 假定20,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差2。 可以通过传统的回归检验,对2的统计显著性进行检验

10、,以判断企业男女职工的平均薪金水平是否有显著差异。 2称为截距差异系数称为截距差异系数。 年薪 Y 男职工 女职工 工龄 X02iiiiDXY210在在E( i)=0 的初始假定下,高中以下、高中、大学及其以上的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:教育水平下个人保健支出的函数: 高中以下:高中以下:iiiXDDXYE1021)0, 0,|( 高中:高中:iiiXDDXYE12021)()0, 1,|( 大学及其以上:大学及其以上:iiiXDDXYE13021)() 1, 0,|( 假定假定 3 2,其几何意义:其几何意义: 大学教育保健 高中教育支出低于高中教

11、育收入iiiDDXY231210 又例又例:在横截面数据基础上,考虑个人保健支出对个人收:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平(分三个层次)的回归。入和教育水平(分三个层次)的回归。其他高中01D1其他大学及以上01D2 大学教育保健 高中教育支出低于高中教育收入在在E( i)=0 的初始假定下,高中以下、高中、大学及其以上的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:教育水平下个人保健支出的函数: 高中以下:高中以下:iiiXDDXYE1021)0, 0,|( 高中:高中:iiiXDDXYE12021)()0, 1,|( 大学及其以上:大学及其以

12、上:iiiXDDXYE13021)() 1, 0,|( 假定假定 3 2,其几何意义:其几何意义:99. 0R)13. 1 ()40. 0()73.11()77. 4(tD45. 0D07. 0X17. 029. 1Y221表明表明:高中、大学及以:高中、大学及以上教育水平的保健支出上教育水平的保健支出与高中以下的没有显著与高中以下的没有显著差异。差异。iiiDDXY231210 又例又例:在横截面数据基础上,考虑个人保健支出对个人收:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平(分三个层次)的回归。入和教育水平(分三个层次)的回归。其他高中01D1其他大学及以上01D2 还可将多

13、个虚拟变量引入模型中以考察还可将多个虚拟变量引入模型中以考察多种多种“定性定性”因素的影响。因素的影响。女职工本科以下学历的平均薪金:女职工本科以下学历的平均薪金:iiiXDDXYE13021)() 1, 0,|(女职工本科以上学历的平均薪金:女职工本科以上学历的平均薪金:iiiXDDXYE132021)() 1, 1,|(iiiXDDXYE1021)0, 0,|(iiiXDDXYE12021)()0, 1,|(于是,不同性别、不同学历职工的平均薪金分别为:于是,不同性别、不同学历职工的平均薪金分别为:男职工本科以下学历的平均薪金:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金:男

14、职工本科以上学历的平均薪金:iiiDDXY231210本科以下本科及以上01D2女男01D1如如薪金薪金模型:模型: 2 2、乘法方式、乘法方式 加法方式引入虚拟变量,考察:截距的不同截距的不同, 许多情况下:往往是斜率就有变化,或斜率、截或斜率、截距同时发生变化距同时发生变化。 斜率的变化可通过以乘法的方式引入虚拟变量来斜率的变化可通过以乘法的方式引入虚拟变量来测度测度。 例如,例如,根据消费理论,收入决定消费。但是,农村居民和城镇居民的边际消费倾向往往是不同的。这种消费倾向的不同可通过在消费函数中引入虚拟变量来考察。城镇居民农村居民01iDiiiiiXDXC210iiiiXDXCE)()

15、1,|(210iiiiXDXCE10) 0,|(农村居民:城镇居民: 例如,例如,根据消费理论,收入决定消费。但是,在自然灾害、战争等反常年份,消费倾向往往发生变化。这种消费倾向的变化可通过在消费函数中引入虚拟变量来考察。tttttXDXC210ttttXDXCE)() 1,|(210ttttXDXCE10)0,|(反常年份正常年份01tD 2称为斜率差异系数称为斜率差异系数 例如,例如,根据消费理论,收入决定消费。但是,从某一个时点开始,消费倾向发生变化。这种消费倾向的变化也可通过在消费函数中引入虚拟变量来考察。tttttXDXC210ttttXDXCE)() 1,|(210ttttXDXC

16、E10)0,|(*01ttttDtt*时前时前t*时后时后 对于一元模型,有两组样本,则有可能出现下述四种情况中的一种:(1) 1= 1 ,且 2= 2 ,即两个回归相同,称为重合回归重合回归( (Coincident Regressions) );(2) 11 ,但 2= 2 ,即两个回归的差异仅在其截距,称为平行回归平行回归(Parallel Regressions);(3) 1= 1 ,但 22 ,即两个回归的差异仅在其斜率,称为汇合回归汇合回归(Concurrent Regressions);(4) 11 ,且 22 ,即两个回归完全不同,称为相异回相异回归归(Dissimilar R

17、egressions)。 当截距与斜率发生变化时,则需要同时引入加法当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。与乘法形式的虚拟变量。样本样本1 1:Y Yi i= 1 1+ +2 2X Xi i+ + 1i1i i i=1,2,1,2, ,n n1 1样本样本2 2:Y Yi i= 1 1+ + 2 2X Xi i+ + 2i2i i i=1,2,1,2, ,n n2 2对于类似是否存在结构变化的问题,可通过以加法对于类似是否存在结构变化的问题,可通过以加法和乘法形式引入虚拟变量来解决。和乘法形式引入虚拟变量来解决。例例5.1.1以以中国中国2007年各个地区城镇居民家庭

18、人均可支配收入与人年各个地区城镇居民家庭人均可支配收入与人均生活消费支出,以及农村居民家庭人均纯收入与人均生活消费均生活消费支出,以及农村居民家庭人均纯收入与人均生活消费支出的相关数据,建立居民消费函数模型。支出的相关数据,建立居民消费函数模型。建立虚拟变量模型,考察农村居民与城镇居民边际消费倾向是否建立虚拟变量模型,考察农村居民与城镇居民边际消费倾向是否有差异。有差异。iiiiiiXDDXY)(431010iD农村居民城镇居民农村居民:农村居民:Y Yi i= 1 1+ +2 2X Xi i+ + 1i1i i i=1,2,1,2, ,n n1 1城镇居民:城镇居民:Y Yi i= 1 1+

19、 + 2 2X Xi i+ + 2i2i i i=1,2,1,2, ,n n2 2将将n1与与n2次观察值合并,并用以估计以下回归:次观察值合并,并用以估计以下回归:估计得到估计得到)49. 0()62. 0()61.26()23. 1 (tXD0275. 0D14.271X692. 033.450Yiiiii由变量显著性检验得到:由变量显著性检验得到:2007年农村居民与城镇居民的边际消费年农村居民与城镇居民的边际消费倾向并无显著差异,他们有着共同的消费函数。倾向并无显著差异,他们有着共同的消费函数。 共同的消费共同的消费函数为:函数为:)31.55()95. 1 (tX7059. 039.

20、253Yii将将n1与与n2次观察值合次观察值合并后重新回归得到。并后重新回归得到。 例如,以1978-2009年的数据为样本,以GDP作为解释变量,建立居民消费函数。根据分析,1992年前后,自发消费和消费率都可能发生变化。年及以后年前920921tD通过统计检验,判断两个时期中消费函数的截距和斜率是否发生变化。2009,1978)(3210tGDPDDGDPCtttttt 3 3、临界指标的虚拟变量的引入、临界指标的虚拟变量的引入 在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。 例如,例如,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不

21、同。 这时,可以t*=1979年为转折期为转折期,以1979年的国民收入Xt*为临界值为临界值,设如下虚拟变量:01tD*tttt则进口消费品的回归模型可建立如下:则进口消费品的回归模型可建立如下:ttttttDXXXY)(*210 OLS法得:法得:则两时期进口消费品函数分别为:tttttDXXXY)(*210当tt*=1979年,ttXY10当tt*=1979年,titXXY)()(21*2001tD*tttt*tXX0XX1D例,为激励销售人员,按其销售额例,为激励销售人员,按其销售额计励,销售额在目标水平之上或以计励,销售额在目标水平之上或以下,计提奖励方法不同下,计提奖励方法不同tt

22、ttttDXXXY)(*210当当XXt*时,时,ttXY10当当X Xt*时,时,titXXY)()(21*20*t*ttXX0XX1DttttttDXXXY)(*210有转折,并且是连续的。有转折,并且是连续的。01Dt当当Dt =1时,时,ttt3t2t10t)XD(DXYt3120tX)()(Yt10tXY考察是否有结构变化。考察是否有结构变化。比较:比较:具有某种属性,或某年后具有某种属性,或某年后不具有某种属性,或某年前不具有某种属性,或某年前当当Dt =0时,时,为研究大城市一些定性变量对电影业票价的影响,某研究者得到为研究大城市一些定性变量对电影业票价的影响,某研究者得到2003年某地的下述估计的回归模型年某地的下述估计的回归模型王文博王文博P210961. 0R)76. 4()28. 2()99. 1 ()32

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论