计量经济学——虚拟解释变量模型ppt课件_第1页
计量经济学——虚拟解释变量模型ppt课件_第2页
计量经济学——虚拟解释变量模型ppt课件_第3页
计量经济学——虚拟解释变量模型ppt课件_第4页
计量经济学——虚拟解释变量模型ppt课件_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、。1、计量经济学虚拟解释变量模型,计量经济学模型中除了数量因素外,还有质量因素,包括解释变量的质量因素和解释变量的质量因素。如果要解释的变量是定性因素,则主要是逻辑回归所涉及的内容。本章讨论了一系列问题,例如当解释变量是定性的时,如何估计参数。在计量经济学分析中,经常遇到的情况是,模型的解释变量不仅受到收入、产出、价格、成本、需求和投资等数量变量的影响,而且还受到战争、自然灾害、国际环境、季节变化和政府经济政策变化等质量变量的影响。如果不考虑这些质量变量的影响,建立一个经济计量模型显然是不合适的。因此,在建立计量经济模型时,应同时考虑数量变量和质量变量。然而,质量变量不同于数量变量。数量变量可

2、以用预定尺度上的不同数值来表示,而质量变量只能用属性和类型的不同具体形式来表示。嘿。例如,4,性别可以表示为男性或女性;种族可以表现为白人和非白人;宗教信仰可以表现为信徒和非信徒;政府的经济政策可以表现在改革开放前后等等。显然,这种不同的具体形式不能直接引入计量经济模型。然而,由于这种变量通常以质量、属性和种类的形式出现或不出现,我们可以根据质量变量的这一特性对其进行量化。假设质量变量的属性显示为1,而不是显示为0,这样的变量称为虚拟变量。当然,哪种情况被视为0,哪种情况被视为1取决于研究情况。0和1只是一个符号,这并不意味着它们有高和低的含义。我们可以将男性设为1或0,结果是一样的。这样,定

3、量质量变量可以被引入到计量经济模型中,用于进一步的数学处理。应该指出的是,虚拟变量主要用于表示定性因素,但在某些情况下也可用于表示定量因素。例如,在建立储蓄函数时,“收入”显然是一个重要的解释变量。虽然它是一个“数量”因素,但为了方便起见,它也可以表示为一个虚拟变量。虚拟解释变量模型的设置引入了不同的虚拟变量,因为定性因素的数量和这些因素的特征的数量不同。第二部分,虚拟解释变量的设置。9。以最简单的虚拟变量模型为例。如果只有一个定性因素,并且这个因素只有两个特征,那么只需要在回归模型中引入一个虚拟变量。如果它包含多个定性因素,自然会引入多个虚拟变量。如果只有一个定性因素并且有m个特征,那么如果

4、它包含截距项,就应该引入m-1个虚拟变量;如果没有截距项,则应引入m个虚拟变量,这是虚拟变量的设置原则。截距变化模型和斜率变化模型,(1)具有虚拟变量的截距变化模型从最简单的例子开始,假设只有一个定性因素影响解释变量的变化,并且该因素只有两个特征,因此此时只需要引入一个虚拟变量。假设有一个居民消费样本,包括正常年份和非正常年份(亚洲金融危机或非典的影响),并计划使用这些数据来估计消费函数。由于正常年份和非正常年份居民消费水平存在明显差异,一些外部影响是一个重要的解释变量。虚拟变量用于表示该定性因素,消费函数为、其中,易=居民消费水平,=居民收入水平,d为虚拟变量。我们用D=1表示正常年份,用D

5、=0表示异常年份,(8.1),式(8.1)可以写成(8.3)、(8.2)。15,(。它们有相同的斜率,但截距不同。1的t检验。如果1与0显著不同,我们认为正常和异常年份的消费行为差异是明显的。如果1 0,正常年份居民消费水平高于异常年份。用最小二乘法来估计公式(8.1),我们可以得到(8.4)。17,通过示例8.1,我们可以找出虚拟变量模型的一些特征。1.哪些定性因素的特征可以用“1”任意设定。我们一般认为“1”代表某些特征,但没有具体规定。在上面的例子中,也可以指定D=1是异常年份,而D=0必须是正常年份。在这种情况下,正常年份和异常年份的消费函数为。18,分别为。如果我们画图表,结果还是一

6、样的。此时, 1 0,异常年线低于正常年线,意味着异常年的消费水平低于正常年。由虚拟变量D=0表示的特征或状态通常称为基本类型。在与其他特征或状态进行比较的意义上,基本类型是比较的基础。在公式(8.2)和(8.3)中,异常年份是基本类型,而在公式(8.5)和(8.6)中,正常年份是基本类型。模型中的系数0是基本类型的截距项,称为公共截距项;系数1称为微分截距系数,是指当d为1时,截距系数与地基类型截距系数之差。如果一个回归模型有一个截距项,并且这个定性因素有两个特征,也就是说,它被分为两类,那么我们只需要引入一个虚拟变量。如我们的示例8.1所示。如果一个回归方程有一个截距项,只有一个定性因素影

7、响解释变量,并且它有m个特征,我们将引入m-1个虚拟变量;如果在回归方程中没有截距项,那么应该有与这个定性因素的特征一样多的虚拟变量,这是使用虚拟变量的原则。如果虚拟变量设置不当,最小二乘法将没有解,这称为虚拟变量陷阱。嘿。22,下面是用线性代数的知识来说明这一点。在8.1相同的情况下,引入两个虚拟变量分别讨论有截距和无截距的情况。(1)对于具有截距项的情况,如果我们设置两个虚拟变量,则回归模型为、(8.7)。23,公式(8.7)也可以表示为,其中显然下列等式成立。(8.8)、(8.9)。24和公式(8.9)表明在模型(8.8)中存在完全多重共线性,即原始模型(8.7),这将导致没有最小二乘估

8、计的解。我们称这种情况为虚拟变量陷阱。因此,如果存在一个截距项,那么引入与定性因素特征一样多的虚拟变量是不可行的。(2)如果我们假设两个虚拟变量、很明显,模型(8.10)中的解释变量D1、D2和X之间不存在完全多重共线性。一般最小二乘法可用于估计方程(8.10)的参数。(8.10)、(26)、(2)坡度变化模型在实际问题中,单独的坡度变化情况一般较少,这是指变化率的变化,即弹性。例如,城市家庭和农村家庭的消费函数在边际消费倾向(斜率)上可能不同,假设它们的消费函数在截距上没有不同。嘿。27、则回归模型可以写成、(8.11),其中,易=第一家庭的消费水平,=第一家庭的收入水平、28、公式(8.1

9、1)可以表示为,(8.12) (8.13)。然而,许多定性因素往往有两个以上的特点。例如,世界各国可以分为发达国家、发展中国家和不发达国家。中国的少数民族有很多差异,所以当我们把少数民族作为虚拟变量时,不能简单地把他们分为汉族和非汉族;季节因素是我们最常见的定性因素,它有四个特点。根据前面的原则,我们应该引入三个虚拟变量。例如,我们使用季度数据来研究各种商品在不同季节的消费是否存在差异。该模型可建立如下:(8.14),其中Yt=季度消费,Xt=季度收入。对于四个季度,我们引入了三个虚拟变量:32岁。这里,第四个四分之一是基本类型,它的截距项是0。其他三个四分之一的截距项分别是0 1、0 2和0

10、 3。1、 2和 3代表由季节变化引起的消费差异。四个季度的回归模型分别为(8.15)、(8.16)、(8.17)、(8.18)。截距和斜率同时改变。在大多数情况下,定性因素不仅影响回归模型的截距,还会改变模型。例如,城镇居民和农村居民的消费函数不仅斜率不同,而且截距也可能不一致。同时考虑这两个问题,我们可以得到回归方程。35、(8.19),其中易=第一家庭的消费水平,=第一家庭的收入水平、36、1和3分别代表城镇。公式(8.19)可表示为,(8.20) (8.21)。我们通常通过t检验来判断它们之间是否有差异。1.如果10,30,则它是截距和斜率同时变化的模型;2.如果10,3=0,则为截距

11、变化模型;3.如果1=0,3=0,这意味着城市家庭和农村家庭有相同的消费模式。4.如果1=0,30,这是一个斜率变化模型,在现实中并不常见。下面,以中国农村和城市的消费样本为例,实际实现了虚拟变量模型从建模到检验再到参数估计最后得出结论的全过程。例8.2现有数据是1955年至1985年中国城镇家庭的人均收入和储蓄。根据经验,即先验信息,通过一些检验,我们发现储蓄和收入之间有很强的相关性,收入的变化会引起储蓄的变化。假设它们之间存在线性关系,我们可以建立如下储蓄模型,其中St=人均储蓄,Xt=人均收入,t=年(t=1955,1956,1985)。(8.22)。40,以1955年为基期,将该期的价

12、格水平设为100,然后分别扣除和中包含的价格上涨因素。用最小二乘法对公式(8.22)进行了估计,得到,R2=0.833,DW=0.398,(8.22)。41,和模型(8.23)包含了中国城市家庭的储蓄行为从1955年到1985年保持不变的假设。事实上,这种假设是不可行的,因为十一届三中全会以后,居民收入大幅增加,1979年以后,许多与居民储蓄有关的重要因素发生了明显变化。改革开放前,我国居民的收入水平只能维持温饱水平,根本不可能有多少储蓄;1979年以后,我国居民的收入水平大大提高,同时居民的储蓄也大大增加。由此可以看出,1979年前后两个时期的边际储蓄倾向存在显著差异。在改革开放前的大部分时

13、间里,中国的消费市场经常供不应求,许多商品需要国家发布计划目标,居民用票购买。常见的问题是,顾客即使有钱也很难买到他们需要的商品,所以他们不得不存钱。此时,储蓄是非自愿的。然而,1979年以后,材料逐渐丰富,在商品买卖中取消了对票的限制。消费者储蓄的主要目的之一是购买高级耐用消费品,储蓄不再是“被迫的”。为了验证城市居民储蓄行为是否发生显著变化,可以建立截距和斜率同时变化的模型。(8.24),其中St和Xt仍然代表人均储蓄和人均收入,d是虚拟变量。46,并且通过用最小二乘法估计方程(8.24),我们可以得到(8.25),47,其中参数估计值下面括号中的数字是统计值。显然,1979年前后储蓄模型

14、的截距和斜率存在明显差异。等式(8.25)可以写成两个等式,(8.26) (8.27)。48岁。从上述模型可以看出,1979年以前,中国城镇居民的边际储蓄倾向仅为0.004,即收入增加了1元,平均储蓄增加了4%;从1979年到1985年,城市居民的边际储蓄倾向增加到0.256。嘿。49,然而,公式(8.23)中获得的边际储蓄倾向是0.17。显然,公式(8.23)不能代表改革开放前城镇居民的消费行为,也不能正确描述1979年后城镇居民储蓄与收入的关系。从模型的拟合可以看出,引入虚拟变量可以提高估计效果。公式(8.23)中的随机误差项具有正自相关(DW=0.398),拟合优度效果不是很好(R2=0

15、.833)。引入虚拟变量后,模型消除了自相关(DW=1.67),判断系数也上升到0.967。因此,有必要引入虚拟变量。多定性因素的虚拟变量模型。我们讨论的回归模型只包括一个定性因素,但在许多情况下,通常有两个以上的定性因素影响回归模型的解释变量。例如,在调查居民的食物消费行为时,可以考虑的定性因素包括居民的性别、民族、教育水平、地理区域等。再比如,除了收入水平,冰淇凌的消费也会受到季节、地域等定性因素的影响。这些定性因素不仅会改变模型的截距和斜率,还会相互影响。例如,高收入和低收入居民的家用电器消费差异会随着季节的不同而变化。为了方便起见,我们建立了以下简单的食物消费模型。在公式(8.28)中

16、,Ct和At分别代表居民食物消费和居民收入,D1、D2、D3、D4和D5是虚拟变量,分别代表性别因素、年龄因素和教育背景因素。性别因素只有两个特征,男性和女性,并设置了一个虚拟变量D1。年龄分为三个层次:25岁以下、25至50岁和50岁以上。有两个虚拟变量D2和D3。教育水平分为三个层次,初中以下,高中及高中以上,有两个虚拟变量D4和D5。在模型中,虚拟变量之间也有乘积,并考虑了截距项的各种变化。嘿。56,Di有不同的取值和不同的截距,如:等都是类推。6和7是性别和年龄的相互影响系数。通常的统计测试方法用于测试各种可能的情况。例如,如果1统计显示性别是一个定性因素,它将明显影响食物消费。同时,2具有统计学意义,表明25岁以下居民与其他年龄段居民的食物消费存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论