CH8 虚拟变量模型.ppt_第1页
CH8 虚拟变量模型.ppt_第2页
CH8 虚拟变量模型.ppt_第3页
CH8 虚拟变量模型.ppt_第4页
CH8 虚拟变量模型.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量经济学理论方法述评由郭存智、杜艳军、李春姬主编。本章主要介绍电子教案。虚拟变量被引入到经典的单方程计量经济模型中。在此基础上,对建立单方程计量经济模型的方法进行了简要总结和讨论。第八章虚拟变量模型。在前几章中,主要介绍了经典线性回归模型及其在一些基本假设下的估计,并分析了当一个或多个假设不满足时的后果和可能的改进措施。然而,上述方法不能解决经济生活中遇到的所有问题。如何调查紧急情况的影响、性别、季节、教育程度等。经济行为?例如,第八章虚拟变量模型,学习目的,理解虚拟变量和虚拟变量模型的概念,掌握虚拟变量的设置原则和引入模型的方法。基本要求:1)认识到虚拟变量是建立计量经济模型的常见问题;2)理解虚拟变量和虚拟变量模型的概念;3)掌握虚拟变量的设置原则、建模方法和虚拟变量模型的应用。虚拟变量,虚拟变量模型,第8章虚拟变量模型,第1节虚拟变量,虚拟变量的介绍,虚拟变量的设置原则,首先,虚拟变量,为什么要介绍“虚拟变量”?如商品需求、价格、收入、产出等。许多经济变量可以定量测量或直接观察,但也有一些影响经济变量的因素不能定量测量或直接观察,如职业和性别对收入的影响,战争和自然灾害对国内生产总值的影响,以及季节对某些产品(如冷饮)销售的影响。为了在模型中反映这些因素的影响并提高模型的准确性,它们需要被人为地“量化”,这通常是通过引入“虚拟变量”来实现的。这种变量用两个不同的数字来表示一种变量,这种变量对所解释的变量有重要的影响,但它本身没有观察到的值,称为dummyvariables。虚拟变量也称为虚拟变量或定性变量。虚拟变量的特点是:1 .虚拟变量是对经济变化有重要影响的不可预测的变量。2。虚拟变量是赋值变量。通常,根据这些因素的属性类型,构造仅取“0”或“1”的人工变量,通常称为虚拟变量并表示为D。这是为了以这种方式量化定性因素以便于计算,因此虚拟变量的值仅代表变量的性质,而不代表变量的值。基本类型和正类型值为1;通常,在虚拟变量的设置中,比较类型和负类型取值为0。例如,1)表示性别的虚拟变量,2)表示教育水平的虚拟变量,3)表示地区的虚拟变量,4)表示消费者心理的虚拟变量,5)表示天气变化的虚拟变量,以及2)虚拟变量模型。包含一般解释变量和虚拟变量的模型称为虚拟变量模型。在模型中,虚拟变量可以用作解释变量,也可以用作解释变量,但主要用作解释变量。将虚拟变量作为解释变量引入模型有两种基本方法:加法和乘法。此外,在上述员工薪酬模型(8-1)中引入性别虚拟变量,采用加法方法,女性员工平均薪酬为:男性员工平均薪酬为:从几何角度(图8-1)看,图8-1男女员工平均薪酬示意图显示两个函数斜率相同但截距不同。根据横截面数据,考虑个人健康支出对个人收入和教育水平的回归。教育水平分为三个层次:高中、高中、大学及以上,此时需要引入两个虚拟变量:模型可设置如下:(8-2),高中及以下:E(易|Xi,D1i=0,D2i=0)=0 1Xi,高中:大学及以上:E(易|Xi,D1i=1,D2i=0)=(0 2) 1Xi,E(易|Xi,D1i=0,D2i=1)=(0 3) 也可以在模型中引入多个虚拟变量来研究各种“定性”因素的影响。例如,在雇员工资模型(8-1)的例子中,引入了教育背景的虚拟变量,然后雇员工资的回归模型可以设计如下:因此,不同性别和教育背景的雇员的平均工资分别由以下类型给出:具有本科以下教育背景的女性雇员的平均工资;本科以下学历男性员工的平均工资;本科以上学历女性员工平均工资;本科以上学历男性员工平均工资:E(易|Xi,D1i=0,D2i=0)=0 1Xi,E(易|Xi,D1i=1,D2i=0)=(0 2) 1Xi,E(易|Xi,D1i=0,D2i=1)=(0 3) 1Xi,E(易|Xi,D1i=1,D2i=1)=(0 2 3) 1Xi,2。乘法,斜率变化,例如:根据消费理论然而,在很长一段时间内,人们的消费倾向会发生变化,特别是在自然灾害和战争等异常年份。这种消费趋势的变化可以通过在收入系数中引入虚拟变量来检验。消费模型可以建立如下:(8-4),这里,虚拟变量Dt通过乘以Xt引入模型,从而可以用来考察消费趋势的变化。在假设E(t)=0的情况下,上述模型所表达的函数可以简化为:正常年份:异常年份:图8-3不同年份的消费趋势图。如果通过加法和乘法在模型中引入虚拟变量,回归线的截距和斜率将会改变。例如:显然,在等式(8-5)中,虚拟变量以两种方式引入:加法和乘法。在假设E(t)=0的情况下,上述模型所表示的函数可以简化为:改革开放前,E(Yt|Xt,Dt=0)=0 1Xt,改革开放后,其几何图形如图8-4所示。E(Yt|Xt,DT=1)=(01)(12)Xt,3。为关键指标引入虚拟变量可以通过在经济转向时为关键指标建立虚拟变量模型来体现。例如,进口消费品的数量y主要取决于国民收入的总量x。改革开放前后,y与x的回归关系明显不同。则进口消费品的回归模型可以建立如下:(8-6)。如果用OLS方法得到的模型的回归方程是、(8-7),那么这两个时期进口消费品的函数分别是,当t t *=1979时,当tt*=1979时,几何图形如图8-5所示,过渡期的回归图如图8-5和图4所示。数值变量作为虚拟变量引入。虽然有些变量是定量变量,但实际的观察值是可以得到的,但在某些特定的情况下,选择它作为虚拟变量是很方便的,并且虚拟变量被引入到测量中。例如,虽然年龄因素可以用数字来测量,但是如果年龄作为数据分组的特征,年龄可以被选为虚拟变量。家庭教育支出不仅取决于他们的收入,还取决于他们的年龄。根据年龄,它分为三个年龄组:6-18岁年龄组(初等和中等教育);19-22岁年龄组(大学教育);其他年龄组。因此,设定虚拟变量,家庭教育支出模型可设定为(8-8),其中易为第一家庭的教育支出;Xi是第一家庭的收入;虚拟变量D1i和D2i分别表示I族中是否有6-18岁和19-22岁的成员。5.虚拟变量交互效应分析。在分析解释变量对变量的影响时,大多数情况下只分析解释变量的变化对解释变量的影响,而没有深入分析解释变量之间的相互作用对解释变量的影响。在前面讨论的分析两个定性变量对解释变量的影响的虚拟变量模型中,有一个隐含的假设:两个定性变量独立地影响解释变量,但在实际经济活动中,两个定性变量对解释变量的影响可能有一定的相互作用,即一个解释变量的边际效应有时可能取决于另一个解释变量。为了描述这种相互作用,两个虚拟变量的乘积可以以加法的形式引入到模型中。考虑下面的模型,其中易是农副产品的总产量,是农副产品的投入,D1i是油菜生产的虚拟变量,D2i是养蜂生产的虚拟变量。这里,例如:显然,(8-9)描述了油菜籽生产是否发展和养蜂生产是否发展的差异对农副产品总收入的影响。虚拟解释变量D1i和D2i以加法的形式引入,这意味着假设油菜籽产量和养蜂产量分别独立地影响农副产品的总产量。然而,在发展油菜籽生产的同时,养蜂生产也在发展,农副产品生产的总收入可能高于不养蜂生产的总收入。也就是说,是否发展油菜生产和养蜂生产的虚拟变量D1i和D2i之间可能存在一定的交互作用,这种交互作用将对被解释的变量农副产品生产总收入产生影响。为了描述虚拟变量相互作用对解释变量的影响,在公式(8-9)中以加法的形式引入了两个虚拟解释变量的乘积,即:(1)基本型:油菜生产不发达或养蜂生产不发达时农副产品生产的平均总收入,(2)比较型:油菜生产和养蜂生产同时发展时农副产品生产的平均总收入, 1是油菜生产是否发展与农副产品生产总收入的截距差系数; 2是养蜂业是否发展与农副产品总收入的截距差系数。3是油菜生产和养蜂生产对农副产品总产量的交互作用系数。0 3构成截距水平。交互效应的存在可以通过交互效应虚拟解释变量系数的显著性检验来判断。如果t检验表明交互作用效应D1iD2i在统计学上显著,则表明交互作用效应对易有显著影响。4、虚拟变量的设置原则,每个特定变量所需的虚拟变量数比定性变量的类别数少1个,也就是说,如果定性变量有m个类别,只有m-1个虚拟变量被引入模型。例如,众所周知,冷饮的销售量y不仅受k个数量变量Xi的影响,还受一个质量变量即春、夏、秋、冬的季节变化的影响。为了研究四季的影响,只需要引入三个虚拟变量:冷饮销售量的模型是、和(8-13)。在上述模型中,如果引入第四个虚拟变量,冷饮销售模型的变量为、(8-14),其矩阵形式为(8-15)。如果只取6个观测值,其中2个在春季和夏季,1个在秋季和冬季,那么,第2节中所谓的“虚拟变量陷阱”是指虚拟解释变量。当虚拟变量被用作解释变量时,它的功能是对经济现象或活动做出“是”和“否”的判断或决定。研究是否购买商品房,是否参加人寿保险或财产保险,是否按期偿还贷款,新产品是否在市场上畅销,对改革措施的态度等。假设我们想从横截面样本中测量汽车拥有量的决定因素。有些人有车,而有些人没有。假设所有权函数的决定因素是收入和职业,模型可以设置为:(8-16),其中Xi代表收入,并且是显而易见的,“二元响应”现象,如何处理二元响应解释变量模型的估计、推断问题?一,线性概率模型(LPM),二,Logit模型,一,线性概率模型(LPM),1。什么是线性概率模型,其中Xi是家庭收入;易是一个虚拟变量,它表示家庭购买商品房的情况。问题:我们前面讨论的回归分析主要研究的是E(易|Xi)=0 1Xi的问题,即条件均值的轨迹问题。在上述模型中,解释的变量是某个属性的出现或不出现。如何将解释变量的某个属性出现或不出现的概率与条件均值的轨迹联系起来?此外,如果概率问题可以与条件平均轨迹联系起来,在我们讨论的线性回归分析中会出现什么问题?因为E(i)=0,从(8-17),此外,假设Y有如下分布:P(Yi=1)=pi,P(Yi=0)=1-pi,根据数学期望的定义,注意事件Y=1发生在给定收入x的条件下,所以E(Yi)=E(Yi|Xi),所以有,表明购买商品房的概率是收入的线性函数。与(8-17)类似,以虚拟变量作为解释变量的模型的条件期望实际上等于随机变量Yi取值为1的条件概率。也就是说,当家庭收入水平为x时,购买商品房的概率可以表示为x的线性函数,因此等式(8-17)也称为线性概率模型(LPM)。显然,只要我们得到(8-17)中0和1的估计,我们就可以估计不同收入水平的家庭购买商品房的概率。线性概率模型的估计在形式上类似于普通的线性经济计量模型,可以用OLS方法直接估计吗?答案是否定的,因为直接用OLS方法估算公式(8-17)的模型,会遇到一些特殊问题,使得估算结果失去了合理的经济解释,因而需要寻求相应的处理方法。(1)随机扰动项i的非正态性在线性概率模型中,因为关于i的正态性假设显然不再有效。OLS方法直接用于估计线性概率模型,对参数估计影响不大。描述:(2)随机扰动项i的异方差,var(I)=eI-e(I)2=e(I2)=(1-0-1 x1)2pi(-0-1 x1)2(1-pi)=(1-0-1 x1)2(01 x1)(-0-1 x1)2(1-0-1 x1)=(01 x1)(1-0-1 x1)=pi(1-pi,Var(i)=pi(1-pi)(8-22),(8-22)公式表明,当i满足E(i)=0且E(ij)=0(ij)时,i是异方差的。在这种情况下,由OLS方法得到的LPM估计量不再具有最小方差的特性,并且各参数估计量的标准差不可信。换句话说,LPM参数的OLS估计仍然是线性无偏估计,但它不是最好的估计。如何消除异方差的影响?我们可以使用第六章中的校正异方差的方法和加权最小二乘法来校正异方差。根据前面的讨论,可知i的方差是易条件所期望的函数,因此选择权重i的一种方法是、(8-23),并对公式(8-17)进行了变换。有,(8-24)。在实际中,为了估计i并进一步估计LPM模型,可以采取以下步骤:(3)不满足0E(Yi|Xi)1的约束,并且E(Yi|Xi)表示线性概率模型中给定x条件下事件y发生的概率。解决这个问题的两种方法是:3 .非线性概率模型。需要指出的是,尽管我们可以用WLS来解决异方差问题,增加样本量来减少非正态问题,并通过约束迫使事件Y发生的估计概率落入01,但LPM并不满足经济意义的要求:随

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论