《虚拟解释变量模型》PPT课件_第1页
《虚拟解释变量模型》PPT课件_第2页
《虚拟解释变量模型》PPT课件_第3页
《虚拟解释变量模型》PPT课件_第4页
《虚拟解释变量模型》PPT课件_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020/5/21,1,第八章虚拟解释变量模型单一方程模型的专门问题(1),Econometrics,2020/5/21,2,问题的提出,建国后中国城镇居民家庭的储蓄函数研究数据来源:根据19522002年人均收入和人均储蓄的数据资料(以1952年的物价水平为100),建立储蓄模型:,该模型是否合理?,怎么比较?,2020/5/21,3,在回归模型中,目前所遇的所有变量均为定量变量(可直接测度、数值性),例如GDP,工资,收入、受教育年数,销售额等。在实际建模中,一些定性变量的影响也是不可忽视的。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等也是值得考虑的影响因素,但这些因素共同的特征是定性描述的。问题是,依据现有的回归分析知识,如何对非定量因素进行回归分析?以及为什么对定性因素要采用回归分析?,一般性的描述,2020/5/21,4,虚拟变量虚拟解释变量回归案列分析,本章讨论,2020/5/21,5,一、虚拟变量的基本概念前面讨论的数量因素(变量)可以直接度量,但质的因素(如:性别、职业、文化程度、所有制形式等定性因素)不能直接度量。为了在模型中反映这些属性因素的影响,人们采取了构造人工变量的方法当某种属性存在时人工变量的取值为1,当某种属性不存在时人工变量的取值为0。虚拟变量:取值为0和1的人工变量。(哑变量、双值变量、定性变量、二元型变量等,DorDum),第一节虚拟变量,2020/5/21,6,二、虚拟变量的设置原则,1、在含有截矩项的模型中,定性因素有m个相互排斥的类型或特征,模型中只能引入(m-1)个虚拟变量,否则会陷入“虚拟变量陷阱”,产生完全共线;例1:居民住房消费支出Y、居民可支配收入X的模型:为了将“城镇居民“、”农村居民“对Y的影响反映模型中,设,2020/5/21,7,则模型(1)为,若引入m=2个虚拟变量,则模型(2)为:,任一家庭都有:D1i+D2i=1,即D1i=1-D2i(完全共线)。,2020/5/21,8,例2:虚拟变量,2020/5/21,9,2、虚拟变量取“0”或“1”应从分析问题的目的出发予以界定(多以“0”代表基础类);讨论:虚拟变量的取值可否为“1”或“2”,甚至“3”、“4”、“5”?,二、虚拟变量的设置原则(续),2020/5/21,10,3、虚拟变量在单一方程中,可以作为解释变量,也可以作为被解释变量。虚拟被解释变量的研究是当前计量经济学研究的前沿领域,如MacFadden、Heckmen等人的微观计量经济学研究,大量涉及到虚拟被解释变量的分析。本课程只是讨论虚拟解释变量的问题,包括如何在回归模型引入虚拟解释变量(包括加法形式和乘法形式)、以及不同方式引入虚拟解释变量后的作用。,2020/5/21,11,TheBankofSwedenPrizeinEconomicSciencesinMemoryofAlfredNobel2000forhisdevelopmentoftheoryandmethodsforanalyzingselectivesamples”,JamesJHeckmanUSA,2020/5/21,12,TheBankofSwedenPrizeinEconomicSciencesinMemoryofAlfredNobel2000forhisdevelopmentoftheoryandmethodsforanalyzingdiscretechoice,DanielLMcFaddenUSA,2020/5/21,13,与麦克法登教授在林岛欢迎宴会上合影,2020/5/21,14,三、引入虚拟变量的作用,1、分离异常因素的影响如观察我国社会总产值的时间趋势,须考虑三年自然灾害这一特殊因素的影响2、检验不同属性类型对因变量的作用3、提高模型的精度引入虚拟变量后,相当于把不同属性类型的样本合并,即相当于扩大了样本容量,从而可提高模型的精度,2020/5/21,15,第二节虚拟解释变量回归,加法类型一个定性解释变量一个定量和一个两种属性定性解释变量一个定量和一个多种属性定性解释变量一个定量和多个定性变量解释变量乘法类型结构变化的检验交互效应分析分段线性回归,2020/5/21,16,一、加法类型,设定的虚拟变量以相加的形式出现(四类),作用是改变了截距项。(截距变动模型)1、一个定性解释变量以居民收入为例:,2020/5/21,17,2、一个定量和一个两种属性定性解释变量,X,Y,whoswho?,2020/5/21,18,3、一个定量和一个多种属性定性解释变量,2020/5/21,19,季节的颜色?,X,Y,2020/5/21,20,Eviews的实现,需要建立虚拟变量!,2020/5/21,21,4、一个定量和多个定性变量解释变量例:不同人群组的衣着消费函数模型Xi收入水平;Yi年服装消费支出,请同学们自己写出不同人群组具体的消费函数模型?,2020/5/21,22,二、乘法类型,将虚拟变量与其他解释变量相乘作为新的解释变量引入模型。作用:关于两个回归模型的比较;因素间的交互影响的分析;提高模型对现实经济现象的描述精度。,2020/5/21,23,1、回归模型的比较通过对模型的参数检验,可以检验模型是否有不同的结构。即定性变量D的引入,是否影响不同类型(属性)模型的平均水平(截距项)?定性变量D的引入,是否影响不同类型(属性)模型的相对变化(斜率系数)?例如:城镇居民家庭与农村居民家庭的消费函数不仅在截距上有差异,边际消费倾向可能也会有所不同。模型可以记为,2020/5/21,24,其中:Yi为消费水平;Xi为收入水平。,则D=1:则D=0:,城镇、农村居民家庭的消费行为完全一样(截距和斜率系数相等)城镇、农村居民家庭的消费函数是截距变动模型(截距不相等)城镇、农村居民家庭的消费函数是斜率变动模型(斜率系数不相等)城镇、农村居民家庭的消费函数是截距和斜率变动模型(截距、斜率不等),通过对上述两个模型的截距、斜率系数检验(比较),可以判断我们讨论的模型属于以下几种类型:,2020/5/21,25,一般:,分别回归,有以下四种情况:,2020/5/21,26,例:改革开放前、后(平均)“储蓄收入”模型:,加法方式引入D:为了区别改革开放前、后储蓄起点的情况(即两模型的截距变化),乘法方式引入D:为了区别改革开放前、后“储蓄“关于”收入”的相对变化情况(即两模型的斜率系数变化),2020/5/21,27,2、交互效应的分析前面仅讨论了解释变量X对被解释变量Y的影响作用;没有分析解释变量间的相互作用对被解释变量Y的影响作用。,例如,不同人群组的衣着消费函数,2020/5/21,28,(1)式以加法形式引入,暗含假设:性别虚拟变量D2的截距差异效应对于两种教育水平而言是常数.(如女性年均服装支出高于男性,性别差异在年均服装支出上产生了效应。但该效应的大小与女性的文化教育水平无关,因为没有表示大专以上学历女性的变量)。同理:教育水平虚拟变量D3的截距差异效应对于性别而言也是常数。为了反映交互效应,将(1)变为:,2020/5/21,29,大专以上的女性:,其他女性:,大专以上的男性:,其他男性:,如何检验交互效应是否存在?,若拒绝原假设,即交互效应对Y产生了影响(应该引入模型),2020/5/21,30,3、分段回归分析例:设Y表示奖金、X表示销售额。当销售额低于X*时,奖金与销售额呈线性关系;当销售额高于X*时,奖金与销售额呈更加陡峭的线性关系。如图:,Y,X*X,.,2020/5/21,31,2020/5/21,32,中国城镇居民家庭的储蓄函数,根据我国城镇居民家庭19552002年人均收入和人均储蓄的数据资料(以1955年的物价水平为100),建立储蓄模型:,用最小二乘法得估计结果为:,模型隐含着一个重要假定,我国城镇居民家庭的储蓄行为在1955年至2002年期间是不变的。假定未必能够成立,因为,与居民储蓄有关的许多重要因素在1979年以后发生了明显变化,主要表现为:,2020/5/21,33,1)在经济体制改革之前,我国居民的收入一直在低水平上徘徊,大多数居民家庭的收入仅能维持温饱,因而平均储蓄倾向很低,积蓄很少;1979年之后,我国居民的收入水平迅速提高,与此同时,居民储蓄也在大幅增长。前后两个时期,我国居民的储蓄行为有显著差异;,2)在改革开放前的大多数年份,我国的消费品市场存在严重短缺的现象。消费者既使有钱也难以买到所需的商品,而不得不把钱暂时存起来。因此,这一时期储蓄带有“非自愿”的性质;而在1979年之后,消费品市场日趋丰富,消费者储蓄的主要目的之一是购买高档耐用消费品,储蓄不再具有“被迫”性质。,2020/5/21,34,为了验证城镇居民储蓄行为的变化,建立如下截距和斜率同时变动模型:,用最小二乘法得:,t(2.18)(8.1)(3.9)(-9.2),2020/5/21,35,1979年以前:1979年以后:,估计结果表明:1979年之前,我国城镇居民的边际储蓄倾向仅为0.004,即收入增加一元储蓄平均增加4厘;而在19791985年期间,城镇居民边际储蓄倾向高达0.256。,2020/5/21,36,第三节案例分析,为了考察改革开放以来中国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表居民储蓄(),以国民总收入GNI代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系,并建立相应的计量经济学模型。,2020/5/21,37,表8.1国民总收入与居民储蓄存款单位:亿元,数据来源:中国统计年鉴2004,中国统计出版社。表中“城乡居民人民币储蓄存款年增加额”为年鉴数值,与用年底余额计算的数值有差异。,2020/5/21,38,表8.1国民总收入与居民储蓄存款(续)单位:亿元,2020/5/21,39,为了研究19782003年期间城乡居民储蓄存款随收入的变化规律是否有变化,考证城乡居民储蓄存款、国民总收入随时间的变化情况,如下图所示:,2020/5/21,40,从上图中,尚无法得到居民的储蓄行为发生明显改变的详尽信息。若取居民储蓄的增量(),并作时序图(见左下图):,2020/5/21,41,从居民储蓄增量图(上页左图)可以看出,城乡居民的储蓄行为表现出了明显的阶段特征:在1996年和2000年有两个明显的转折点。再从城乡居民储蓄存款增量与国民总收入之间关系的散布图看(见上页右图),也呈现出了相同的阶段性特征。,2020/5/21,42,为了分析居民储蓄行为在1996年前后和2000年前后三个阶段的数量关系,引入虚拟变量和。和的选择,是以1996、2000年两个转折点作为依据,并设定了如下以加法和乘法两种方式同时引入虚拟变量的的模型:其中:,2020/5/21,43,对上式进行回归后,有:,2020/5/21,44,即有:由于各个系数的t检验均大于2,表明各解释变量的系数显著地不等于0,居民人民币储蓄存款年增加额的回归模型分别为:,2020/5/21,45,这表明三个时期居民储蓄增加额的回归方程在统计意义上确实是不相同的。1996年以前收入每增加1亿元,居民储蓄存款的平均增加0.1445亿元;在2000年以后,则为0.4133亿元,已发生了很大变化。,2020/5/21,46,上述模型与城乡居民储蓄存款与国民总收入之间的散布图是吻合的,与当时中国的实际经济运行状况也是相符的。需要指出的是,在上述建模过程中,主要是从教学的目的出发运用虚拟变量法则,没有考虑通货膨胀因素。而在实证分析中,储蓄函数还应当考虑通货膨胀因素。,2020/5/21,47,1.虚拟变量是人工构造的取值为0和1的作为属性变量代表的变量。2.虚拟变量个数的设置有一定规则:在有截距项的模型中,若定性因素有个相互排斥的类型,只能引入个虚拟变量,否则会陷入所谓“虚拟变量陷阱”,产生完全的多重共线性。,第八章小结,2020/5/21,48,3.在计量经济模型中,加入虚拟解释变量的途径有两种基本类型:一是加法类型;二是乘法类型。以加法方式引入虚拟变量改变的是模型的截距;以乘法方式引入虚拟变量改变的是模型的斜率。4.解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量的回归,称为方差分析模型。,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论