计量经济学(第六版)课件 第六章 非经典截面数据计量经济学模型_第1页
计量经济学(第六版)课件 第六章 非经典截面数据计量经济学模型_第2页
计量经济学(第六版)课件 第六章 非经典截面数据计量经济学模型_第3页
计量经济学(第六版)课件 第六章 非经典截面数据计量经济学模型_第4页
计量经济学(第六版)课件 第六章 非经典截面数据计量经济学模型_第5页
已阅读5页,还剩125页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章

非经典截面数据计量经济学模型

说明非经典截面数据计量经济学模型主要包括:将被解释变量抽样由完全随机扩展为受到限制的受限被解释变量模型(ModelwithLimitedDependentVariable)。包括:选择性样本模型(SelectiveSamplesModel)持续时间被解释变量模型(ModelforDurationData)将被解释变量是连续的扩展为离散的离散被解释变量模型(ModelwithDiscreteDependentVariable)。包括:离散选择模型(DiscreteChoiceModel)计数数据模型(ModelforCountData)将单一截面的样本扩展为多个截面的面板数据模型(PanelData)。非经典截面数据计量经济学模型也被称为微观计量经济学模型研究对象:家庭、个人、企业等微观主体的行为;微观主体具有异质性。数据特征:截面数据、面板数据;微观数据的来源主要不是统计,而是调查;表征家庭、个人等微观主体行为的数据经常是离散的;样本选择和观测值的赋值经常是受到限制的;样本数量大。§6.1选择性样本计量经济学模型

一、经济生活中的选择性样本问题二、“截断”问题的计量经济学模型三、“归并”问题的计量经济学模型一、社会经济生活中的选择性样本问题

1、“截断”(truncation)问题

不能从全部截面个体,而只能从一部分个体中随机抽取被解释变量的样本观测值。分为两种情况:一是,所抽取的部分个体的观测值都大于或者小于某个确定值,即出现“掐头”或者“去尾”的现象,与其它个体的观测值相比较,存在明显的“截断点”。二是,所抽取的样本观测值来自于具有某些特征的部分个体,但是样本观测值的大小与其它个体的观测值相比较,并不存在明显的“截断点”。样本选择受到限制。2、“归并”

(censoring)问题

将被解释变量的处于某一范围的样本观测值都用一个相同的值代替。经常出现在“检查”、“调查”活动中,因此也称为“检查”(censoring)问题。需求函数模型中用实际消费量作为需求量的观测值,如果存在供给限制,就出现“归并”问题。被解释变量观测值存在最高和最低的限制。例如考试成绩,最高100,最低0,出现“归并”问题。被解释变量样本观测值受到限制。二、“截断”数据计量经济学模型

1、思路如果一个单方程计量经济学模型,只能从“掐头”或者“去尾”的连续区间随机抽取被解释变量的样本观测值,那么很显然,抽取每一个样本观测值的概率以及抽取一组样本观测值的联合概率,与被解释变量的样本观测值不受限制的情况是不同的。如果能够知道在这种情况下抽取一组样本观测值的联合概率函数,那么就可以通过该函数极大化求得模型的参数估计量。2、截断分布

α为随机变量ξ分布范围内的一个常数如果ξ服从均匀分布U(a,b),但是它只能在(c,b)内取得样本观测值,那么对应有概率密度函数则为Φ是标准正态分布累积分布函数如果

ξ服从正态分布:N(μ,σ2),则

3、截断被解释变量数据模型的最大似然估计

其中:反米尔斯比率(inverseMillsratio)其中:求解该1阶极值条件,即可以得到模型的参数估计量。由于这是一个复杂的非线性问题,需要采用迭代方法求解,例如牛顿法。4、演示例题—农村居民消费模型根据对农民消费行为的分析,发现农民的消费水平(Y)既取决于来自于农业生产经营的持久收入(X1),也受到来自于从事非农生产的瞬时收入(X2)的影响。现有某地区50户农户的人均消费、人均持久收入和人均瞬时收入的样本观测值,试图建立该地区农民消费模型。样本观测值样本不受限制的OLS估计选择截断数据ML估计将样本视为不受限制的随机抽取

与OLS估计结果相同将样本视为人均消费大于1500元的范围内随机抽取将样本视为在人均消费大于1500元、小于6000元的范围内随机抽取比较3种假设下的对数似然函数值可见,随着截断区间的缩小,抽取同一个样本的概率增大,致使对数似然函数值增大。5、为什么截断被解释变量数据模型不能采用普通最小二乘估计

对于截断被解释变量数据计量经济学模型,如果仍然把它看作为经典的线性模型,采用OLS估计,会产生什么样的结果?因为Yi只能在大于a的范围内取得观测值,那么可证明Yi的条件均值为:由于被解释变量数据的截断问题,使得原模型变换为包含一个非线性项模型。如果采用OLS直接估计原模型:实际上忽略了一个非线性项;忽略了随机误差项实际上的异方差性。这就造成参数估计量的偏误,而且如果不了解解释变量的分布,要估计该偏误的严重性也是很困难的。6、一点说明如果对截断被解释变量数据计量经济学模型采用最大似然估计,必须首先求得“截断分布”,为此,必须存在明确的“截断点”。在实际的截断数据模型中,这个条件经常不能被满足,诸如利用上市公司为样本研究全部企业的行为,就不存在明确的被解释变量的“截断点”。关于这类模型的估计,Heckman于1979年提出了两步修正法(参见相关资料)。三、“归并”数据计量经济学模型

1、思路以一种简单的情况为例,讨论“归并”问题的计量经济学模型。即假设被解释变量服从正态分布,其样本观测值以0为界,凡小于0的都归并为0,大于0的则取实际值。如果以Y*表示原始被解释变量,以Y表示归并后的被解释变量,那么则有:单方程线性“归并”问题的计量经济学模型为:如果能够得到Yi的概率密度函数,那么就可以方便地采用最大似然法估计模型,这就是研究这类问题的思路。由于该模型是由Tobin于1958年最早提出的,所以也称为Tobit模型。2、“归并”变量的正态分布

由于原始被解释变量Y*服从正态分布则3、归并被解释变量数据模型的最大似然估计

该似然函数由两部分组成,一部分对应于没有限制的观测值,是经典回归部分;一部分对应于受到限制的观测值。这是一个非标准的似然函数,它实际上是离散分布与连续分布的混合。如果样本观测值不是以0为界,而是以某一个数值a为界,则有

估计原理与方法相同。4、演示例题将3个5800视为归并数据选择归并估计比较不受限制和归并假设下的对数似然函数值可见,将样本中3个5800元的观测值视为<=5800元的归并时,抽取该观测值的概率显著增大,致使模型估计的对数似然函数值显著增大。

5、归并被解释变量模型最大似然估计的条件

构造归并数据似然函数时是以一个基本假设为条件的,即假设归并数据中不可观测的部分和可观测的部分具有相同的分布,例如都服从正态分布。如果这一条件得不到满足,就不能得到似然函数,最大似然估计将遇到困难。这时,Heckman两步估计是一种合适的估计方法。

§6.2二元离散选择模型

一、二元离散选择模型的经济背景二、二元离散选择模型三、二元Probit模型及其参数估计四、二元Logit模型及其参数估计五、二元离散选择模型的检验说明离散被解释变量数据计量经济学模型(ModelswithDiscreteDependentVariables)和离散选择模型(DCM,DiscreteChoiceModel)的区别。二元选择模型(BinaryChoiceModel)和多元选择模型(MultipleChoiceModel)。本节只介绍二元选择模型。离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究。1962年,Warner首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。70、80年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。模型的估计方法主要发展于80年代初期。一、社会经济生活中的二元选择问题研究选择结果与影响因素之间的关系。选择结果:0、1影响选择结果的因素包括两部分:决策者的属性和备选方案的属性。两种方案的选择由决策者的属性和备选方案的属性共同决定。例如,选择利用公共交通工具还是私人交通工具,取决于两类因素。一类是公共交通工具和私人交通工具所具有的属性,诸如速度、耗费时间、成本等;一类是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。单个方案的取舍一般由决策者的属性决定。例如,对某种商品的购买决策问题。决定购买与否,取决于两类因素。一类是该商品本身所具有的属性,诸如性能、价格等;一类是消费者个体所具有的属性,诸如收入水平、对该商品的偏好程度等。对于所有的决策者,商品本身所具有的属性是相同的,在模型中一般不予体现。二、二元离散选择模型1、原始模型对于二元选择问题,可以建立如下计量经济学模型。其中Y为观测值为1和0的决策被解释变量;X为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。

称为线性概率模型(linearprobabilitymodel,LPM)左右端矛盾仍假设,则令于是另一方面由于存在这两方面的问题,主要是模型左右端矛盾问题,导致:原始模型不能作为实际研究二元选择问题的模型。需要将原始模型变换为效用模型。一般教科书称为潜变量模型(LatentVariableModel)。这是离散选择模型的关键。

具有异方差性

2、效用模型

作为研究对象的二元选择模型第i个个体选择1的效用第i个个体选择0的效用显然有:注意:在效应模型中,被解释变量是不可观测的潜变量,人们能够得到的观测值仍然是选择结果,即1和0。很显然,如果不可观测的U1>U0,即对应于观测值为1,因为该个体选择公共交通工具的效用大于选择私人交通工具的效用,他当然要选择公共交通工具;相反,如果不可观测的U1≤U0,即对应于观测值为0,因为该个体选择公共交通工具的效用小于选择私人交通工具的效用,他当然要选择私人交通工具。OLS不能用于效用模型的估计。三、二元离散选择模型的参数估计1、极大似然估计

欲使得效用模型可以采用ML估计,就必须为随机误差项选择一种特定的概率分布。两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元选择模型—Probit模型和Logit模型。最大似然函数及其估计过程如下:标准正态分布或逻辑分布的对称性似然函数

在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。

1阶极值条件对数似然函数2、二元Probit离散选择模型及其参数估计将效用模型(潜变量模型)的随机干扰项设定为服从标准正态分布。则该二元离散选择模型称为Probit模型。累积分布函数密度函数重复观测值不可以得到情况下二元Probit离散选择模型的参数估计

求解该方程组,可以得到模型参数估计量(通过软件,迭代法求解)。这里所谓“重复观测值不可以得到”,是指对每个决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。3、二元logit离散选择模型及其参数估计将效用模型(潜变量模型)的随机干扰项设定为服从逻辑(logistic)分布。则该二元离散选择模型称为Logit模型。累积分布函数密度函数重复观测值不可以得到情况下二元logit离散选择模型的参数估计

求解该方程组,可以得到模型参数估计量(通过软件,迭代法求解)。四、案例:贷款决策模型分析与建模:某商业银行从历史贷款客户中随机抽取78个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(X1)和“市场竞争地位等级”(X2),对它们贷款的结果(Y)采用二元离散变量,1表示贷款成功,0表示贷款失败。目的是研究Y与X1、X2之间的关系,并为正确贷款决策提供支持。样本观测值选择Probit模型对异方差采用稳健标准误的White修正

估计结果输出的估计结果该方程表示:当X1和X2已知时,代入方程,可以计算贷款成功的概率Y。例如:

将表中第19个样本观测值X1=15、x2=-1代入方程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于0.1326552的累积正态分布为0.5517,于是,Y的预测值:Y=1-0.5517=0.4483,即对应于该客户,贷款成功的概率为0.4483。正确解读该结果十分重要讨论:能否说“当市场竞争地位等级提高1,给该企业贷款成功的概率提高5.062”?不能。为什么?能否说“对于不同的企业,当市场竞争地位等级都提高1,给这些企业贷款成功的概率所提高的幅度是相同的”?不能。为什么?模拟预测预测应用:如果有一个新客户,根据客户资料,计算的“商业信用支持度”(X1)和“市场竞争地位等级”(X2),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。选择Logit模型

利用该方程,当X1和X2已知时,可以计算贷款成功的概率Y。例如:将第1个样观测值X1=125、X=-2代入方程右边,计算括号内的值为60.7749;查逻辑分布表,对应于60.7749的累积逻辑分布为1.0;于是,Y的预测值YF=1-1.0=0,即对应于该客户,贷款成功的概率为0。

将第19个样本观测值X1=15、X2=-1代入方程右边,计算括号内的值为0.24226;查逻辑分布表,对应于0.24226的累积逻辑分布为0.5600;于是,Y的预测值YF=1-0.5600=0.4400,即对应于该客户,贷款成功的概率为0.4400。五、二元离散选择模型的检验1、拟合检验P:样本观测值中被解释变量等于1的比例。

L0:模型中所有解释变量的系数都为0时的似然函数值。R2=1,即L=1,完全拟合。

R2=0,所有解释变量完全不显著,完全不拟合。伪R2(pseudoR-squared)或麦克法登R2(McFaddenR-squared)LnL=-1.639954LnL0=-52.80224R2=0.96892、总体显著性检验

例中,lnL=-1.639954,lnL0=-52.80224,

则LR=102.3246,而临界值χ20.01(2)=9.21。可见,在0.01的显著水平上,该模型拒绝总体不显著的零假设。

3、异方差性检验截面数据样本,容易存在异方差性。假定异方差结构为:

采用LM检验将解释变量分为两类,Z为只与个体特征有关的变量。显然异方差与这些变量相关。将异方差检验问题变为一个约束检验问题由于一般都存在异方差,不检验,直接采用White修正进行估计(如上例所示)4、回代检验概率阈值朴素选择:p=0.5(1、0的样本相当时)先验选择:p=(选1的样本数/全部样本)(全样本时)最优阈值:犯第一类错误最小原则如果按照朴素原则,例中,除了2个样本外,所有样本都通过了回代检验。没有通过回代检验的2个样本中,第19个样本的选择结果为1,回代算得的选择1的概率为0.4472;第45个样本的选择结果为0,回代算得的选择1的概率0.5498。但是,该例中,选择1和选择0的样本数目分别为32和46,差异较大,不适合采用该方法。

如果按照先验方法,即以全部样本中选择1的样本所占的比例为临界值。例中,选择1的样本的比例为0.41。以此为临界值,只有第45个样本不能通过检验。但是,该方法适合于以全部个体作为样本的情况,而该例中的78个样本仅是贷款客户的极少部分,所以也不适合采用该方法。如果按照最优方法,即以“犯第一类错误最小”为原则确定临界值的方法。在例中,如果以0.50为临界值,则有2个样本发生“弃真”,即犯第一类错误;如果以0.41为临界值,则发生“弃真”的样本只有1个。所以以0.41作为临界值比较合适。

§6.3面板数据模型

一、面板数据模型概述二、固定效应模型三、随机效应模型四、模型的设定检验说明面板数据(PanelData)也被翻译为平行数据、综列数据、时空数据指在时间序列上取多个截面,在每个截面上同时选取相同的个体作为样本,由这些样本观测值所构成的数据。面板数据计量经济学模型近20多年来计量经济学模型理论方法的重要发展之一;已经形成了与截面数据模型相对应的完整的模型体系;具有很好的应用价值。本节将它作为经典截面数据的一种扩展,介绍最简单、常用的固定效应面板数据模型(PanelDataModelswithFixed-Effects)。面板数据模型的发展20世纪60年代将PanelData引入计量经济学模型,只是将面板数据作为一组混合数据(PooledData)样本用以估计经典的计量经济学模型。面板数据模型理论方法的发展和应用研究的开展主要发生在20世纪80-90年代。进入21世纪,PanelData模型理论方法研究已经成为理论计量经济学最活跃的领域。目前,PanelData模型已经成为应用最为广泛的计量经济学模型。一、面板数据模型概述1、经济分析中的PanelData问题

只利用截面数据或者只利用时间序列数据不能满足分析目的的需要。例如,如果分析生产成本问题例如,分析外商直接投资对我国各个地区经济增长的影响2、计量经济学模型方法中的PanelData问题

充分利用尽可能多的样本信息,是任何一项计量经济学应用研究必须遵循的基本原则。计量经济学模型方法的核心是依据样本信息估计总体参数.采用PanelData比单纯采用横截面数据或时间序列数据会使得模型分析更加有效.PanelData计量经济学模型理论正是基于样本信息的充分利用而发展的。

在具体模型方法方面,采用PanelData比单纯采用横截面数据或时间序列数据也有许多优势。可以显著地增加自由度,使得统计推断更加有效;可以降低变量之间的共线性,使得参数估计量更具有效性;可以有助于从不同的经济理论出发建立的互相竞争的模型中识别出正确的模型;可以减少甚至消除模型估计偏差;等等。当然,由于数据维度已由1维扩展到了2维,模型的数据处理、计算以及表达方式要复杂得多⒊经典面板数据模型的类型

设定模型时,往往会有一些观测不到的与个体有关的变量。如果这些观测不到而被遗漏的变量与模型中保留的变量存在相关性,则会由于内生性问题而带来估计的偏误。固定效应(Fixedeffect)模型是将这些观测不到的“个体”因素综合在模型的截距项上,即以截距项的差异来刻画“个体”的差异,并估计模型。

如果这些未观测的变量与模型中保留的变量不相关,则将它们综合在随机干扰项上,再通过适当的方法进行模型估计,以此类方法估计的模型被称为随机效应(Randomeffect)模型。固定效应模型与随机效应模型由于经济活动中,那些未观测到的因素与模型中已有的变量具有一定程度的相关性是更常见的现象,因此,采用固定效应模型的估计方法就成为经验分析中最为常用的模型估计方式。

本节主要介绍面板数据模型估计的基本框架。

一个包含观测不到的不随时间而改变的某些“个体”特征的面板数据模型,其形式为:

混合模型:

不区分时间与个体维度而将所有数据混合在一起直接进行OLS回归,这时模型式称为混合模型(pooledmodel),对混合模型的OLS估计也称为混合最小二乘估计(PooledOLS,POLS)

在固定效应模型或随机效应模型的估计中,往往通过引入时间虚拟变量的方式分离出时间效应的影响。

(3)根据个体的数量与时间的长度,面板数据又分为短面板(shortpanel)与长面板(longpanel),二、固定效应模型

1、最小二乘虚拟变量(LSDV)模型及其参数估计

记向量形式的模型为:矩阵形式:

该模型通常被称为最小二乘虚拟变量(LSDV)模型。此模型可以当作具有(n+k)个参数的多元回归,参数可由普通最小二乘法进行估计:

2、固定效应模型的组内估计法

矩阵形式:

案例:作为演示,以中国2020~2023年31个省区的城镇居民家庭人均可支配收入(X)为解释变量,以城镇居民家庭人均消费支出(Y)为被解释变量,考察城镇居民在2020-2023年间的边际消费倾向。打开Eviews,建立新工作文件输入选择建立新的数据文件(通过NewObject中的group(命名为data))模型估计:输入ycx后,选择PanelOptions选择“Cross-section”中的Fixed查看“个体固定效应”:点击View\Fixed\RandomEffects

\Cross-sectionEffects个体固定效应:双向固定效应:在PanelOptions标签中的Cross-section与Period中都选择Fixed三、随机效应模型

为了得到参数的有效估计,对随机效应模型往往采用广义最小二乘法(GLS)。1、随机效应模型的广义最小二乘估计进一步假设u的零均值、同方差性:

可证明:

记模型的矩阵形式为:一般地:则有:于是有GLS估计:

参见《计量经济学(第六版)学习指南与练习》,计量软件自动完成上述过程在Effectsspecification栏中选择“Cross-section”中的Random2、随机效用模型的拟差分估计

随机效用模型的广义最小二乘估计(GLS)可等价地写成对如下拟差分变换后的模型的OLS估计。其中

例中,未

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论