第八章 虚拟变量模型ppt课件_第1页
第八章 虚拟变量模型ppt课件_第2页
第八章 虚拟变量模型ppt课件_第3页
第八章 虚拟变量模型ppt课件_第4页
第八章 虚拟变量模型ppt课件_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,项目8 虚拟变量模型,计量经济学原理与应用,【学习目标】,1知识目标:虚拟变量的含义;虚拟变量作为自变量的方差分析模型、协方差模型;虚拟变量作为因变量的离散选择模型包括线性概率模型;二元概率模型及其参数估计;二元逻辑模型及其参数估计。 2能力目标:理解虚拟变量的含义;了解虚拟变量分别作为自变量、因变量的模型建立,包括方差分析模型、协方差模型、线性概率模型;掌握二元概率模型及其参数估计;掌握二元逻辑模型及其参数估计。,某旅行社为了提高旅游业务收入,希望通过建立个人旅游支出模型,找出影响个人旅游支出的关键因素,从而作出针对性的旅游宣传。 根据实际经济理论,个人的旅游支出往往与个人的收入、职业、受

2、教育程度、性别等有密切关系,其中职业、教育、性别因素不是我们前面章节常用的定量变量,而是定性变量。职业有教师、工程师、银行职员等,教育程度可以分为大学教育和非大学教育,同样性别因素可以考虑是男是女。将这样的定性变量作为自变量考虑进旅游支出模型,模型如何建立?有怎样的结果和意义?,在运输经济学中,我们想要预测某人在上下班时是否选择坐公交,这个结果与个人的收入、职业、上班地点与居住处之间的距离、公交费用等诸多因素有关。那么此时我们建立的模型因变量是只有两个可能值的定性变量,即选择坐公交和其他交通工具。对于这样的模型又该如何建立?,第一节:虚拟变量模型概述,前面我们研究的计量模型无论是因变量还是自变

3、量均为定量变量,是可以被度量的变量,例如收益率、面积、收入、成本、价格等。但是实际运用中所研究的问题往往涉及很多不可被度量的定性变量,比如性别、职业、国籍、受教育程度、健康情况等。这些定性变量可能是某些问题的影响因素,如工薪族的收入常与职业、教育等有关。另外,一些定性变量也可能是需要预测研究的问题,如高中生是否继续接受高等教育;贷款人的贷款申请能否被允许;大学毕业生是否回家乡工作;一项科学研究能否成功等。这些定性变量同定量变量一样可以作为模型的因变量与自变量,本章我们将考虑这种类型模型的建立与参数估计问题。,一、虚拟变量的含义,一个定性变量,它的可能值只有两个,也就是说出现或不出现某种属性。

4、如性别是男性或女性;受过高等教育或没有接受高等教育;职业是教师或非教师;已婚或未婚;健康或不健康等。如果要将这样的变量加入到计量模型中,首先需要人为地量化定性变量。一般地,用1表示出现某种属性,用0表示没有出现该属性。如对于性别变量,用1表示男性,用0表示女性;或者用1表示受过高等教育,用0表示没有接受高等教育。 那么,像这样取值只为0、1的变量称为虚拟变量或哑变量,并用符号表示,从而与常用符号区别开。我们把赋值为0的一类称为基准类。需要注意的是虚拟变量的赋值是人为的、任意的,根据人们的习惯而定。如前所提到的性别变量,也可以用1表示女性,用0表示男性。,那么对于某些具有大于两个可能值的定性变量

5、,又该如何量化呢?如职业变量的可能取值为教师、工程师或其他职业。这样的多分类定性变量在加入计量模型前,同样需要量化成虚拟变量。但不同的是一个多分类定性变量需要引入多个虚拟变量,引入的虚拟变量个数要比多分类定性变量的分类个数少一。即一个具有个属性的定性变量,需要引入个虚拟变量。如果引入个虚拟变量,这些虚拟变量之间将会产生完全多重共线性。如票选结果有三种分类:赞同、不赞同、弃权,此时需量化成两个虚拟变量,分别为: 变量以弃权为基准类。,【相关链接】构造虚拟变量Eviews6.0软件操作步骤(附图):1、输入变量名和样本数据如下图,其中包括性别变量“sex”和月收入变量“income”。,2、根据s

6、ex变量构造虚拟变量d1,用1表示男性“male”,0表示女性“female”。在命令窗口中输入:series d1=(sex=male),点击回车键,得到虚拟变量d1。,3、根据income变量构造虚拟变量d2,用1表示月收入大于等于10000元的高收入者,0表示月收入小于10000元的中低收入者。在命令窗口中输入:series d2=(sex=male),点击回车键,得到虚拟变量d1。,二、虚拟变量作为自变量,在实际经济模型中,因变量不仅会受到定量变量的影响,同时也会受到定性变量的影响。如个人的月支出水平往往受到月收入、性别、职业、婚姻状况等因素的影响,其中月收入为定量变量,性别、职业、婚

7、姻状况为定性变量。可见这些定性变量也是影响因变量的重要因素,所以我们有必要将其量化成虚拟变量后加入到模型中。在回归分析模型中,我们假设模型自变量为非随机变量。而虚拟变量的取值为0、1,说明虚拟变量是非随机变量。因此,对于自变量中含有一个或多个虚拟变量的回归模型,回归系数的普通最小二乘估计法以及模型检验方法同样适用。,下面我们建立含有虚拟变量为自变量的回归模型。,1.方差分析模型(ANOVA模型) 在回归分析中,虚拟变量与定量变量一样可以作为模型的回归元。一个回归模型的自变量只有虚拟变量,这样的模型称为方差分析模型(analysis of variance,ANOVA)。为说明方差分析模型,我们

8、看下面一个只含有一个虚拟变量的ANOVA模型,含有多个虚拟变量的ANOVA模型原理相似不再赘述。,其中 为个人月支出; ; 为随机误差项且 未婚者的月期望支出为: 已婚者的月期望支出为:,从上述的结果可以得知,模型截距 表示未婚者的月平均支出,斜率系数 表示未婚者与已婚者的月平均支出差距, 表示已婚者的月平均支出。并可用t检验法检验的 显著性。,根据表格数据建立模型,结果为:,由回归结果可知,未婚者的月平均支出估计值为3.2167千元,已婚者的月平均支出估计值为6.4167千元。 另外,我们从表格数据中能够得出,未婚者的实际月平均支出为3.1267千元,已婚者的实际月平均支出为6.4167千元

9、。 可见模型估计出的个人月平均支出与实际相同。 接下来考察检验结果,系数是统计显著的,说明婚姻变量对个人月支出水平有显著影响,已婚者与未婚者的个月支出水平有较显著的差距。而实际上也确实如此,已婚者要承担起自己及家庭的开支,月支出较大;而大部分未婚者只需担负自己的开支,月支出相对较少。,2.协方差模型(ANCOVA模型),方差分析模型在心理学、社会行为学、市场研究等领域较常见,但在实际经济学模型中,自变量往往既含有定量变量,也包含定性变量。我们将自变量中同时包含定性变量和定量变量的回归模型称为协方差模型(analysis of covariance,ANCOVA)。,下面给出含有一个定量变量和一

10、个定性变量的协方差模型,含有多个定量和定性变量的协方差模型原理相似不再赘述。,其中 表示大学生月话费支出, 表示月生活费支出; ; 表示模型随机误差项且 。,则根据模型有: 非独生大学生月话费支出期望值为: 独生大学生月话费支出期望值为: 模型表明,大学生中独生子女与非独生子女的月平均话费支出不同,但是月平均话费对月生活费支出的变化率相同( )。,如图8.1所示,大学生中独生子女和非独生子女的月平均话费支出对月生活费支出的函数具有相同的斜率,即大学生的月平均话费支出对生活费支出的变化率相同。同时,根据模型的回归结果可知,当大学生独生情况变量为常量时,月生活费每增加100元,月平均话费将增加6.

11、0391元。另外,当月生活费支出变量保持不变时,独生大学生月平均话费比非独生大学生多16.7937元。模型检验结果显示参数估计量是统计显著的,说明独生大学生与非独生大学生的月平均话费支出不同。,三、虚拟变量作为因变量,到目前为止,我们主要讨论了以定量变量为自变量的计量模型。但是在实际应用中经常会遇到很多决策问题,比如人们上下班的交通工具是选择步行、坐公交、自驾还是其他工具;某天的天气是晴朗、阴天、雨天还是其他;某项医学研究能否成功;人们对某一项建议是持赞成、不赞成还是中立的态度;大学生毕业是否会选择自主创业等。这些情况下,如果想要做出决策,就需要以定性变量作为因变量来建立计量模型,才能判断出最

12、终结果。我们称这样的模型为离散选择模型。定性变量作为因变量可以是只有二值的虚拟变量也可以是多分类的定性变量。以虚拟变量为因变量的模型称为二元选择模型。以多分类定性变量为因变量的模型称为多元选择模型。本章我们主要讨论二元选择模型。二元选择模型的建立可以由三种方法解决,分别为线性概率模型(LPM模型)、二元概率模型(Probit模型)和二元逻辑模型(Logit模型)。下面我们先介绍下较为简单的线性概率模型。,1.线性概率模型(LPM模型) 以虚拟变量为因变量的线性回归模型称为线性概率模型(linear probability model,LPM)。模型的基本形式为: (8.1.1) 其中 为虚拟变

13、量,为模型随机误差项且 。于是有, (8.1.2) 记 为所有自变量 接下来,记 为事件“ ”发生的概率;则 为事件“ ”发生的概率。那么变量 的概率分布有: 表8.3 的概率分布,根据期望的定义有, (8.1.3) 由式(8.1.2)和(8.1.3)可得, 上式可以解释为:在给定所有自变量 的条件下,条件期望 等于事件“ ”发生的条件概率。截距项 表示每个自变量 时,事件“ ”发生的概率。斜率系数 表明在其他因素不变的情况下,自变量 每增加一个单位,事件“ ”发生的概率将增加。,运用普通最小二乘估计法,得到线性概率模型的估计方程写成: 那么利用上述估计方程得到的预测值 就是“ ”发生的概率预测值。估计量 度量了由 的单位变化而引起的“ ”发生的概率变化预测值。,2. 线性概率模型存在的问题,虽然线性概率模型可以较容易地得到,并且模型的结果能够为我们提供有价值的信息。但是线性概率模型也存在一些问题。下面我们对这些问题进行说明 . (1)随机误差项的异方差性根据LPM模型(8.1.2),随机误差项可写成:,(2)不适用的拟合优度 LPM模型因变量的取值不是0就是1,也就是说 Y 值会落在 X 轴或直线 上,那么此时这些 Y 值的散点将很难接近落在同一条直线上。从而LPM模型的估计方程拟合优

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论