第九章 含虚拟变量的回归模型_第1页
第九章 含虚拟变量的回归模型_第2页
第九章 含虚拟变量的回归模型_第3页
第九章 含虚拟变量的回归模型_第4页
第九章 含虚拟变量的回归模型_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章 含虚拟变量的回归模型目前为止,在已学习的线性回归模型中,解释变量X都是定量变量。但有时候,解释变量是定性变量。9.1 虚拟变量的性质通常在回归分析中,应变量不仅受一些定量变量的影响,还受一些定性变量的影响(性别、种族、肤色、宗教、民族、罢工、政团关系、婚姻状况)。如:美国黑人的收入比相应的白人的收入低。女学生的S.A.T.的数学平均分数比相应的男生低。定性变量通常表明了具备或不具备某种性质,比如,男性或女性,黑人或白人,佛教徒或非佛教徒,本国公民或非本国公民。把定性因素“定量化”的一个方法是建立人工变量,并赋值0和1,0表示变量不具备某种属性,1表示变量具备某种属性,该变量称为虚拟变量

2、(dummy variable),用符号D表示。虚拟变量一样可用于回归分析,一个回归模型的解释变量可以仅仅是虚拟变量,称为方差分析模型( ANOVA )。Yi = B1 + B2Di + ui ( 9 - 1 )其中Y = 初职年薪Di =1,大学毕业=0,非大学毕业假定随机扰动项满足古典线性回归模型的基本假定,根据模型( 9 - 1 )得到:非大学毕业生的初职年薪的期望为:E(YiDi=0) = B1 + B2( 0 ) = B1 ( 9 - 2 )大学毕业生的初职年薪的期望为:E(YiDi=1) = B1+B2( 1 ) = B1+B2 ( 9 - 3 )可以看出:截距B1表示非大学毕业生

3、的平均初职年薪,“斜率”系数B2表明大学毕业生的平均初职年薪与非大学生的差距是多少;(B1+B2)表示大学毕业生的平均初职年薪。零假设:大学教育没有任何益处(即B2=0),可根据t检验值判定b2是否是统计显著的。例9.1 大学毕业生和非大学毕业生的初职年薪模型( 9-1 ) OLS回归结果如下:Yi = 18.00 + 3.28Di ( 9 - 4 )se = (0.31) (0.44) t = (57.74 ) (7.444) p值= ( 0.000 ) (0.000)r2=0.8737估计的非大学毕业生的平均初职年薪为18000美元(=b1),大学毕业生的平均初职年薪为21280美元(b1

4、+b2)。根据括号中的t值,很容易验证b2是统计显著的,表明非大学毕业生和大学毕业生的初职年薪有差距。图9-1描绘了回归结果,回归函数是一个分段函数。在社会学、心理学、教育学领域,ANOVA模型用得很广泛,而经济学中很少。在许多经济研究中,回归模型中的解释变量有些是定量的,有些是定性的,称为协方差模型( ANCOVA )。9.2 包含一个定量变量,一个定性变量的回归模型Yi=B1 + B2Di + B3Xi + ui ( 9 - 6 )其中 Yi 公司职员的年薪Xi 工龄Di =1,女职员=0,男职员模型( 9 - 6 )包含了一个定量的变量X(工龄)和一个定性变量(性别)。假定E(ui) =

5、 0,则,男职员平均年薪:E (YiXi,Di= 0) = B1 + B3Xi ( 9 - 7 )女职员平均年薪:E (YiXi,Di= 1) = (B1 + B2) + B3Xi ( 9 - 8 )图9 - 2描绘了这两种不同的情况。(假定B1> 0 )模型( 9 - 6 )表明男、女职员的平均年薪对工龄的函数具有相同的斜率(B3),但截距不同。即男职员的平均年薪水平与女职员不同(多了B2),但男、女职员平均年薪对工龄的变化率相同。零假设:回归方程( 9 - 7 )和( 9 - 8 )有相同的截距(也即没有性别歧视)。再根据t检验结果判定b2的统计显著性。考虑:能否引入关于性别的两个虚

6、拟变量?模型( 9 - 6 )可写为:Yi=B1 + B2Xi + B3D1i + B4D2i + ui ( 9 - 9 )D1i =1, 男职员=0, 女职员D2i =1, 女职员=0, 男职员无法估计模型( 9 - 9 ),因为D1i与D2i存在完全共线性(即完全的线性关系)。很容易验证: D1= ( 1-D2)或D2= 1D1,也即D1,D2完全共线性。避免完全共线性问题的一般规则是:如果一个定性的变量有m类,则要引进(m-1 )个虚拟变量。如果不遵循这个规则,就会陷入虚拟变量陷阱(dummy variable trap),也即完全多重共线性情形。虚拟变量的赋值是任意的。例子中令D= 1

7、,代表女职员,D= 0,代表男职员;赋值可根据习惯而定。赋值为0的一类常称为基准类,对比类;(共同的)截距B1是基准类的截距。同样,对于基准类的选择也是根据研究目的而定的。虚拟变量D的系数称为差别截距系数,表明了取值为1的类的截距值与基准类截距值的差距。例9.3:职员年薪与工龄、性别的关系。得到的OLS回归结果如下:Yi = 17.969 + 1.3707Xi + 3.3336Di ( 9 - 10 )Se = (0.191 9) (0.035 6) (0.155 4) t= (93.612 0) (38.454) (21.455) r2=0.9933当性别变量为常量时,平均年薪将增加1371

8、美元。当工龄变量保持不变时,男职员的平均年薪比女职员多3334美元。虽然男女职员平均年薪对工龄有相同的年增长率,但由于虚拟变量的系数是显著的,因此两类职员的平均年薪不同。根据( 9 - 10 )的回归结果,可以推出男女职员的平均年薪函数:女职员平均年薪:Yi = 17.969 + 1.3707Xi ( 9 - 11 a )男职员平均年薪:Yi = (17.969+3.333 6) + 1.370 7Xi ( 9 - 11 b )=21.302 6+1.3707Xi9.3 虚拟变量有多种分类的情况要做个人假期旅游的年支出对其收入与受教育水平的回归。假定教育水平有如下几等:1.未达到中学水平,2.

9、中学水平,3.大学水平。根据虚拟变量的个数应比变量的分类数少一个的规则,引入两个虚拟变量来表示三种不同的教育水平。假定教育水平不同的三个群体有相同的斜率,但截距不同,用下面的模型: Yi = B1 + B2D2i + B3D3i + B4Xi + ui ( 9 - 1 3 )式中Yi 用于假期旅游的年支出Xi 年收入D2i =1, 中学教育=0, 其他 D3i =1, 大学教育=0, 其他注意:在对虚拟变量的赋值中,将“未达到中学水平”视为基准类。因此,截距B1代表了这一类的截距。差别截距B2,B3表明了其他两类的截距与基准类的截距的差距有多大。假定E(u) = 0,从( 9 - 13 )的回

10、归结果可得:未达到中学水平的平均旅游支出:E(YiD2= 0,D3= 0,Xi) =B1+B4Xi ( 9 - 14 )中学水平的平均旅游支出:E(YiD2= 1,D3= 0,Xi) = (B1+B2) + B4Xi ( 9 - 15 )大学毕业的平均旅游支出:E(YiD2= 0,D3= 1,Xi) = (B1+B3) +B4Xi ( 9 - 16 )对模型( 9 - 1 3 )估计之后,根据t检验的结果,很容易验证差别截距B2,B3各自均是统计显著的。例9.5:旅游支出与收入和教育的关系根据表9 - 3的数据,得到的回归结果:Yi = -1.2860 + 0.1722Xi - 0.0680D

11、2i + 0.4472D3iSe = (0.2694) (0.0147) (0.1708) (0.3956) (9-17)t= (-4.7738) (11.7280) (-0.3982) (1.1304) p值= (0.000) (0.000) (0.3490) (0.1412)R2= 0.9965注:当D2=D3= 0,观察值表示了未中学毕业。回归结果表明,在其他条件不变时,随着收入的增加,比如说收入增加一美元,平均的旅游支出将增加17美分。由于在5%的显著水平下,两个虚拟变量均是统计不显著的,因而在收入不变时,受教育水平对平均旅游支出没有显著影响。9.4 包含一个定量变量,两个定性变量的回

12、归模型回到公司职员年薪( 9 . 6 )一例中,但是现在假定除了工龄、性别以外,肤色也是一个重要的决定因素。为了简便,假定肤色有两种,白种和非白种。可将模型( 9 - 6 )重写为:Yi = B1 + B2D2i + B3D3i + B4Xi + ui ( 9 - 1 8 )式中Yi年薪Xi工龄D2i =1, 男职员=0, 非男职员D3i =1, 白种=0, 非白种假定E(ui) = 0,则根据模型( 9 - 1 8 )得到不同的平均年薪函数如下:非白种女职员平均年薪:E(YiD2= 0,D3= 0,Xi) =B1 + B4Xi ( 9 - 1 9 )非白种男职员平均年薪:E(YiD2= 1,D3= 0,Xi) = (B1+B2) + B4Xi ( 9 -

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论