




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第18章 离散选择模型和受限因变量模型18.1概述在经典计量经济学模型中,被解释变量通常被假定为连续变量,但在现实的经济决策中经常面临许多选择问题。在这样的决策问题中,或者选择问题中,人们必须对可供选择的方案作出选择。通常被解释变量是连续的变量,但此时的因变量只取有限多个离散的值。例如:人们对交通工具的选择,是选择坐轻轨、地铁还是公共汽车;某大型企业是否合并另一企业;对某一方案的建议持强烈反对、反对、中立、支持和强烈支持5种态度,可以分别用0,1,2,3和4表示。以这样的选择结果作为被解释变量建立的计量经济学模型,称为离散被解释变量数据计量经济学模型(models with discrete dependent variables),或称为离散选择模型(DCM,discrete choice model)。如果被解释变量只能有两种选择,称为二元选择模型(binary choice model);如果被解释变量有多种选择,称为多元选择模型(multiple choice model)。20世纪70和80年代,离散选择模型普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。在实际中,还会经常遇到因变量受到某种限制的情况,这种情况下,取得样本数据来自总体的一个子集,可能不能完全反映总体。例如,小时工资、住房价格和名义利率都必须大于零。这时需要建立的经济计量模型称为受限因变量模型(limited dependent variable model)。这两类模型经常用于调查数据的分析中。本章将讨论三类模型及其估计方法和软件操作。一是定性(观测值为离散的或者表示排序);二是截取或者截断问题;三是观测值为整数值的计数模型。18.2二元因变量模型在这个模型中,被解释变量只取两个值,可以是代表某件事发生与否的虚拟变量,也可以是两个决策中选一个,称为二元因变量模型。例如:对样本个体是否就业的研究,个体的年龄、教育背景、种族、婚姻状况以及其他可观测的特征,作为解释变量,目的是研究个体这些特征对个体就业概率的研究。或者对某商品的购买与否,取决于两类因素:一类是该商品具有的属性,诸如用途、价格等;一类是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。从大量的统计中,可以发现选择的结果与影响因素之间具有一定的因果关系。揭示这一因果关系并用于预测研究,对于制定商品销售方案无疑是十分重要的,这就需要建立计量经济学模型来研究这些变量之间的关系。18.2.1二元选择模型形式假设中二元因变量y取0和1两个值,对y和x间不能建一个简单的线性回归模型,因为模型的条件均值对残差设了一个不合理的约束条件。而且简单回归模型中的y的拟合值没有被限制在0和1之间。为了处理二元因变量模型的特别要求,我们必须设定专门的模型。假设观测值取1的概率为: (18.2.1)其中F是连续的、严格递增的函数,其取值在0和1之间。本章讨论时采用最简单的线性函数形式,而在Eviews中也可以处理非线性的函数形式。F函数的类型决定了二元因变量模型的类别,即有: (18.2.2)给定这样的设定后,可以用极大似然法对模型的参数进行估计。对数似然函数如下: (18.2.3)由于极大似然函数的条件就是非线性的,因此需要进行迭代运算才能得到参数的估计值。首先对二元变量模型设定一个潜在解释变量,假设这有一个不可观测的潜在变量与的线性关系如下: (18.2.4)其中:是随机干扰项,由是否超过临界值来决定因变量的观测值取值。则和关系有: (18.2.5)这里临界值设为0,但是只要x包含常数项,临界值的选择就是不相关的。然后: (18.2.6)其中:是的累积分布函数。根据F分布函数类型,常见模型有Probit模型(标准正态分布)、Logit模型(逻辑分布)和Gompit模型(极值分布)。一般地,由于二元因变量模型仅仅是一件事发生与否,那么y的两个数值便不重要了。不过,Eviews需要对y的两个值进行编码。这个约束条件产生很多优点。第一,变量按这种方式进行编码暗示了y的期望值简单就是y=1的概率: (18.2.7)这也为二元因变量模型提供了另一种解释,即条件均值的设定。接下来我们可以将二元因变量模型写为如下的回归模型: (18.2.8)其中:是残差项,代表二元变量y对条件均值的分离,然后有: (18.2.9) (18.2.10)根据残差分布函数不同,常见模型有Probit模型(标准正态分布)、Logit模型(逻辑分布)和Gompit模型(极值分布)。则有:Probit模型:,其中是标准正态分布累积分布函数。Logit模型:,同样是基于逻辑分布的累积分布函数。Gompit模型:,基于Type-I极值分布的累积分布函数。18.2.2二元选择模型的Eviews估计1)模型的估计(1)模型估计估计二元选择模型,从主菜单中选择Object/New Object,并从该菜单中选择Equation选项。从出现的Equation Specification对话框中,选择Binary估计方法。在二元选择模型设定中包括两部分。首先,在Equation Specification区域内,键入二元因变量的名字,随后键入一系列回归项。然后,在Binary estimation method中选择Probit、Logit和Extreme value三种中的一种估计方法,即三种误差项分布函数。例如,使用probit模型对重庆市政府农技推广供给影响因素的研究中,将农技推广服务的供需状况y划分为“有贡献”和“没有贡献”两个层次,具体取值设置为,农技推广供给“没有贡献”或贡献“较小”取0,“有贡献”取1,政府农技推广工作人员的文化水平、所在地区、员工职位以及年龄等对农技推广供给的影响。其中文化水平有4个层次,高中以下、高中、专科、本科以上,3个虚拟变量,即学历为高中,EDU1取值为1,同样专科EDU2和本科以上EDU3的取值;地区area为主城区,取值为1,不是主城区取值0;政府工作人员的职务级别分3个层次,中高级管理者、基层管理者和一般工作人员,对该指标设2个虚拟变量,职务级别为中高级管理者,duty1取值为1,否则取0,职务级别为基层管理者,duty2取值为1,否则取0;年龄age则直接使用年龄的数字。先建一个工作文件夹,点击主菜单上File/New/workfiles, 在Workfile structure type中选择Unstructured/Undated,Data range输入样本的相关信息,具体如下图:图18.2.1然后依次输入数据序列,图18.2.2再点击主菜单上Quick/Estimate Eqution,进行估计设置:图18.2.3设定好模型后,点击“确定”。Eviews6.0的估计结果如下:图18.2.4参数估计结果的上半部分包括估计方法(ML极大似然估计)和估计中所使用的样本的基本信息,也包括达到收敛要求的迭代次数,和计算系数协方差矩阵所使用方法的信息。在下面显示的是系数的估计、渐近的标准误差、z统计量和相应的概率值及相关统计量。二元选择模型的解释变量的估计系数不能被解释成对解释变量的边际影响,只能从系数的符号来判断因变量取值的概率有多大。则解释变量x对条件概率的边际效应为: (18.2.11)其中是相对于F的密度函数。注意用f对所有回归项的值对系数加权,改变的直接效应通过系数的符号来反映,正的表示增加能增加相应事件发生的概率;而负的值则表示增加将减小相应事件发生的概率。本例中age的系数估计值为正,说明政府工作人员年龄越大,农业科技推广有贡献的概率越大,体现了年龄增加对农业科技推广的供给产生了正向的作用。参数估计结果的下半部分包括常用的描述性统计量,其中有均值和因变量的标准偏离,回归的标准差和残差平方和。标准差和残差平方和也用常用的方式计算的: (18.2.12)另外,在回归结果中还提供了几种似然函数统计量:Log likelihood是对数似然函数的最大值。Avg.log likelihood是用观察的个数N去除以对数似然函数,即对数似然函数的平均值。Restr.log likelihood是除了常数以外所有系数被限制为0时的极大似然函数。LR统计量检验除了常数以外所有系数都是0的假设,用-2-计算的。这类似于线性回归模型中的F统计量,测试模型整体的显著性。Probability(LR stat)是LR的检验统计量的P值。在零假设下,LR的检验统计量近似服从自由度等于检验下的约束变量的个数的分布。McFadden R-squared是用1-/计算的似然比率指标,这里是有约束时的似然函数,它是同线性回归模型中的R2是类似的,它总是介于0和1之间。(2)估计的相关选项在用迭代法求极大似然函数的最大值时,可以在Options选项中设定估计算法与迭代限制。单击Options按钮,打开Options对话框如图:图18.2.5Options对话框有如下的几项设置:稳健标准差(Robust Standard Errors)对于二元选择模型,Eviews6.0与5.0一样允许使用准一极大似然函数(Huber/White)或广义的线性模型(GLM)方法估计标准误差(具体理论见计数模型后)。点击Robust Covariances复选框,并从两种方法中选一种。当使用选项估计二元选择模型时,公式输出的顶部将显示用于计算系数协方差矩阵的方法。初始值(Sarting cofficient values)。和其他步骤一样,Eviews允许指定初始值。在Options对话框中,从对话框中下拉菜单中选一项。可以使用Eviews默认值,或者选择默认值的多少倍,零系数,或用户提供的值。如果使用后者,应在工作文件的系数向量C中输入数值,然后在对话框中选择User supplied。Eviews默认值是使用经验运算法则而选择出来的,适用于二元选择模型的每一种类型。估计法则。在Optimization algorithm一栏中选择估计的运算法则。默认地Eviews使用quadratic hill-climbing方法得到参数估计。这种运算法则使用对数似然分析二次导数的矩阵形成迭代和技术的估计的系数协方差矩阵。还有另外两种不同估计发展,Newton-raphson也使用二次导数,BHHH使用一次导数,既确定迭代更新,又确定协方差矩阵估计。2)拟合优度检验与经典模型的变量显著性检验一样,二元选择模型的变量显著性检验,可以通过极大似然估计时给出的z统计量检验系数的显著性。还可以利用Wald统计量、LR统计量(最大似然比)和LM统计量(拉格朗日乘子)对模型进行检验。这里主要介绍对二元因变量模型的特殊检验,即拟合优度检验。Eviews提供了两种检验方法分别由Hosmer-Lemeshow(1989)和Andrews(1998a,1988b)提出的。这些检验的基本思想是比较群的拟合的期望值和实际值,如果差异很大,则拒绝模型,认为模型数据拟合度不高。(1)Hosmer-Lemeshow检验该检验将数据分成J个组,即有j=1,2,J,而组j的观测值个数为nj。通过y=1的预测概率得到组的观测值,在组j里定义观测值为1的个数和预测值平均值: (18.2.13) (18.2.14)Hosmer-Lemeshow检验统计量可由下式计算: (18.2.15)HL统计量的分布是未知的,但是从Hosmer和Lemeshow(1989)扩展的模拟试验中得到的证据表明,当模型被正确设定时,该统计量的分布大约是自由度为(J-2)x2分布。注意这些发现是在J接近n时的模拟得到的。(2)Andrews检验该检验将数据分成J个组,即有j=1,2,J,是按任何序列或序列表达式得到每个组的观测值。因为因变量是二元变量,任何观测值都会落入2J个单元,并且任何个体观测值都可能丢失。Andrews(1988a,1988b)将实际观测值数目的2J个向量同模型预测的值进行比较,形成了二次方程,然后发现如果模型被正确设定,这二次方程近似服从卡方分布。通过该二次方程形式的加权矩阵选择方式,Andrews提出了三种检验。通过了Andrews描述的辅助回归,Eviews可对该检验计算。简单说,就是是阶矩阵,每个元素为。其中,当观测值i属于组j,并且,则指示函数取值1;否则取0(为避免异常,丢掉了组中y=0的列)。B是阶矩阵,表示解释变量的贡献。从回归和B每列包括常数,得到R2,Andrews检验统计量是n倍R2。在原假设为模型被正确设定下,则有nR2近似服从自由度为J的卡方分布。(3)具体软件操作Eviews提供了两种检验方法分别由Hosmer-Lemeshow(1989)和Andrews(1998a,1988b)提出的。在进行拟合优度检验时,点击View/Goodness-of-Fit Test,然后进行该检验的相关设定。图18.2.6首先,决定分组变量,你可以点击Predicted risk(Hosmer-Lemeshow test)选择Hosmer-Lemeshow检验的分组变量,或者在Series or series expression填入用来分组的序列名或表达式。其次,需要设定分组规划。Eviews允许基于区间或分为数的分组变量进行分组。假如采用很少的区间进行分组,则应选择Distinct values进行分组。这时Eviews为每个区间形成一个单独的组。一般,Eviews分组区间最多达到100个。假如分组序列超过了这个值,Eviews将出现错误信息。如果分组变量有许多区间,则应选择Quantiles,在编辑区域填入需要设定的分位组的数目。统计量要求每组观察值数不能太少,分组中应考虑到这一点,不应把组数设定得太多。具体的设定如下图:图18.2.7然后点击OK,就得到拟合优度检验的结果:图18.2.8结果中,Quantiles of Risk显示了每十分位数的预测概率的最高值和最低值,还显示了每组中观测值的实际个数和期望个数,以及每组对于总的H-L统计量的贡献值。H-L值很大时,说明在那个十分位数组的实际值和预测值差异很大。在表格的底端,同时显示了H-L和Andrews检验统计量,还显示了卡方统计值。H-L统计量的相伴概率值越大,Andrews统计量的则越小。因为按拟合值分组时也落在Andrews检验结构里,所以也显示该检验统计量的值,从其相伴概率(0.0529)分析,拒绝原假设,即认为模型拟合精度不是很高。3)预测和产生残差除了一般方程的估计过程外,Eviews允许对因变量和线性指标进行预测,或者计算与二元因变量模型相关的各种残差。(1)预测从方程工具栏选择Procs/Forecast(Fitted Probability/Index),然后单击想要预测的对象。既可以进行拟合概率,也可以计算指标的拟合值。像其他方法一样,可以选择预测样本,显示预测图。如果解释变量向量包括二元因变量的滞后值,选择Dynamic选项预测,Eviews使用拟合值得到预测值;而选择Static命令,将使用实际的(滞后的)得到预测值。图18.2.9例如上面对概率进行预测,点击OK,得到预测结果:图18.2.8(2)残差的产生也可以通过点击Procs/Make Residual Series,得到三种类型的残差:普通残差: (18.2.16)标准残差: (18.2.17)广义残差: (18.2.18)其中,是拟合概率值,分布函数和密度函数由具体的设定决定。可用这些残差做类似于一般模型的检验,即LM检验。18.3排序选择模型在实际经济生活中,除了二元选择模型之外,经常还会遇到多元离散选择问题。一类问题是将选择的对象按照某种规则进行排队,由决策者从中选择。例如:一个人购买某类商品,将可以选择的商品按照质量进行排队,以0,1,2等序号进行表示。另一类问题是决策者对同一个选择的对象的偏好程度。例如:不同的消费者对同一商品的偏好是不同的,如十分喜欢、喜欢、无所谓、一般厌恶、十分厌恶,以0,1,2,3,4表示。还有就是同一决策者面对多项选择,而这些选择之间没有排序的,这就称为多元选择问题。前两类都是属于排序选择问题。对于排序选择问题建立的模型,我们称之为排序的多元选择模型。18.3.1排序变量模型形式与二元选择模型类似,排序选择模型我们也设有一个潜在的变量,是无法观测的,而可观测的,设有0,1,2,M等M+1个取值。潜在变量与解释变量存在以下的线性关系: (18.3.1)其中:是独立同分布的随机干扰项,和的关系如下: (18.3.2)在y中选来代表分类的实际值是完全随意的,这并不重要。但所有排序的设定就暗示了,如果,则有。设的累积分布函数为,观测y的每个值的概率为: (18.3.3)同二元选择模型一样,排序选择模型也选用极大似然估计。并且门限值c和系数通过极大似然函数都可以得到估计: (18.3.4)其中,是指示函数,当排序选择项与概率所指代的事一样时,该指示函数取值1,反之取0。在Eviews一般用二阶导数来的到参数和系数估计的方差矩阵。如果已知的分布函数和密度函数的表达式及样本值,就可以求解这个方程,从而得到极大似然估计量。并且同二元选择模型的变量显著性检验一样,可以通过极大似然估计时给出的z统计量检验排序选择模型的系数的显著性。还可以利用Wald统计量、LR统计量(最大似然比)和LM统计量(拉格朗日乘子)对模型进行检验。其分布函数的类型决定了排序选择模型的类型,常用的排序选择模型类型有Probit类型、Logit类型和Extreme类型。18.3.2排序因变量模型软件估计1)模型的估计估计排序因变量模型,从主菜单中选择Object/New Object,并从该菜单中选择Equation选项。从出现的Equation Specification对话框中,选择ORDERED估计方法。在排序因变量模型设定中包括两部分。首先,在Equation Specification区域内,键入因变量的名字,随后键入一系列回归项。排序估计也只支持列表形式的设定,不用输入一个明确的方程。然后选择Probit、Logit和Extreme value三种误差分布中的一种,单击OK按钮即可。例如,在调查执政者的支持率的民意测验中,由于执政者执行了对某一收入阶层有利政策而使得不同收入的人对其支持不同,所以收入成为决定人们是否支持的因素。通过调查取得了市民收入(INC)与支持与否(Y)的数据 易丹辉.数据分析与Eviews应用.北京:中国统计出版社,2002,228。,其中如果选民支持则Y取值为0,中立取1,不支持去2。方程设定对话框如图:图18.3.1这里有两点要注意:首先,Eviews不能把常数项和门限值区分开,因此在变量列表中设定的常数项会被忽略,即有没有常数项都是等价的。其次,Eviews要求因变量是整数,否则将会出现错误信息,并且估计也将会停止。然而,由于我们可以在表达式中使用round、floor或ceil函数自动将一个非整数序列转化成整数序列,因此这并不是一个很严格的限制。估计结果如下:图18.3.2估计结果中,表头包含了通常的标题信息,包括假定的误差分布,估计样本,迭代和收敛信息,y的排序选择值的个数和计算系数协方差矩阵的方法。在标题之下就是系数的估计和渐近的标准误差、相应的z统计量及概率值。排序回归模型的系数估计的解释也是不一样的(参见Greene(1997)或者Johnston和DiNardo(1997)。当变化时,落在排序点上概率改变的方向与的符号一致。比如,本例中y=0的概率变化与系数的符号是相反的方向,而y=2概率变化的方向与系数的方向一致,而中间的排序值的概率变化方向由下式给出: (18.3.5)其中,k取除了最大值和最小值外的中间任何值。事先,没法确认这些项的符号的。本例中回归系数为正,表明收入越高,潜在变量取值越大,从而因变量y的取值也越大,即有y取2的概率越大,即不支持的可能性越大。估计结果的下面Limit Points,是参数c的估计值以及相关标准误差和概率值。另外就是一些估计常用的统计量。2)排序模型的预测由于排序因变量模型的因变量代表的是种类或等级数据,所以不能从估计排序因变量模型中直接进行预测。然而,Eviews可以对每个种类相关的概率进行预测。为了预测这个概率,首先必须创建一个模型。选Procs/Make Model,打开一个包含方程系统的没有标题的模型窗口,并且每个方程代表每个排序值的概率值。图18.3.3然后单击窗口方程栏的Solve按钮。图18.3.4其他按Eviews默认设定,然后点击“确定”,得到如下结果:图18.3.5预测的序列在workfile里面已经出现了,我们可以打开每个序列得到预测值。图18.3.6因变量y的拟合线性指标序列被命名为i_Y_0,拟合值落在第一类中的拟合概率被命名为Y_0_0的序列中,落在第二类中的拟合概率命名为Y_1_0的序列中,落在第三类中的拟合概率命名为Y_2_0序列中,等等。注意,每一个观测值,落在每个种类中的拟合概率相加值为1。若在Solution Scenarios&output选择Scenario 1,则其得到的预测结果将以末尾“_1”形式保存,但每个种类拟合概率值不变。3)产生残差序列对于排序因变量模型,残差序列只有广义残差,是关于假定单位变量的对数似然函数的标准分离。这些残差被定义与模型解释变量不相关(具体参见Chesher和Irish(1987),和Gourieroux,Monfort,Renault and Trognon(1987),并且可以用于多种的检验。选择View/Make Residual Series产生广义残差序列,输入一个名字或用默认的名字,然后单击OK按钮。图18.3.7一个排序模型的广义残差由下式给出: (18.3.6)其中:,点击OK,得到残差序列:图18.3.818.4受限因变量模型在现实经济生活中,有时候会遇到因变量是连续的,但受到某种限制,即因变量的观测值是来自总体的一个子集,这样并不能完全反映总体的实际特征,那么通过这样的样本来推断总体的特征就需要建立受限因变量模型(limited dependent variable model)。经济生活中的受限被解释变量问题很多。本节主要讨论两类。首先是“截断”问题,即“掐头”或者“去尾”。即不能在全部个体中抽取因变量的样本观测值,而只能从大于或小于某个数的范围内抽取样本的观测值。例如研究与收入有关的问题,收入作为被解释变量,理论上收入应该是从零到正无穷,但实际问题中由于各种客观条件的限制,只能获得处在某个范围内的样本观测值。这就是一个截断问题。另一个是截取问题。即将某个范围的样本观测值归入某个值内。本节开始先介绍截取模型。18.4.1 截取回归模型某些实际问题中,将被解释变量的处于某一范围的样本观察值都用一个相同的值代替,这称之为“截取”问题。这类问题经常出现在“检查”、“调查”活动中,因此也被称为“检查”问题。例如,在调查数据中,关于某一特定收入水平的数据为了保密,没有上限;或许消费者对耐用品的消费需求可以认为是调查数据为正的模型。假设被解释变量服从正态分布,其样本观察值以0为界,凡小于0的都归并为0,大于0的则取实际值。1)截取回归模型形式同前面离散变量模型一样,受限考虑对潜在变量的回归模型: (18.4.1)其中是比例参数,在截取回归模型和截断回归模型中相同的,将同参数一起估计。当误差项服从正态分布时,规范的截取回归模型也叫Tobit模型,其观测数据y可由下式得到: (18.4.2)换句话说,所有的负值都被编码为0。我们称这些数据在0处进行了左截取(检查)。注意这与截断回归模型不同,截断回归模型中所有的负值都从样本中丢掉了。一般地,在Eviews里允许在任意临界点进行左截取和右截取,因此有: (18.4.3)其中:和是常数值,代表截取点。如果没有左截取,则可以设。如果没有右截取,则可以设。而规范的Tobit模型是具有和的一个特例。参数和通过最大化对数似然函数得到估计值: (18.4.4)其中f和F分别是误差项的密度函数和累积分布函数。2)截取回归模型软件估计(1)模型的估计对审查(截取)回归模型的估计,从主菜单中点击Quick/Estimate Equation,打开Equation Estimation对话框,从该对话框中,选择CENSORED-Censored or Truncated Data(including Tobit)。审查(截取)回归模型和截断回归模型对话框出现了。例如,研究已婚妇女的年度劳动供给,审查其年龄、受教育程度、幼年子女数量对工作小时数的影响 EViews 6.0 Example Files,Quantitative Micro Software。方程估计设定如下:图18.4.1在Equation specification编辑区域里面输入审查因变量,及一系列回归项或者该方程的清晰的表达式,在我们案例里面输入的是hrs c age edu kid1。然后,在Normal,Logisti,Extreme value三种分布中选择一种作为误差项的分布,还需要在Dependent Variable Censoring Points一栏提供关于被检查因变量的临界点的信息。临界点可以是数值、表达式、序列,还可以是空的。这时需考虑两种情形:一是临界点对所有个体都是已知的。二是,当进行截取时,临界点只对具体截取观测值的个体是已知的。临界点对所有个体都是已知的你应该按照要求在左截取编辑域和右截取编辑域输入表达式。注意,假如让编辑域空着,Eviews将假设没有观测值的截取类型。例如,规范的Tobit模型数据是在0处进行左截取的,没有右截取。这时可这样设定:左编辑域:0右编辑域:空着而一般的左边和右边都有截取的由下式设定:左编辑域:1000右编辑域:2000Eviews允许更一般的截取点设定,截取点已知,但在观测值之间不同。简单地在适当的编辑区域输入包含截取点的序列名字。临界点通过潜在变量产生并且只对被审查的观测值个体已知在一些情况下,假设临界值对于一些个体是未知的(和不是对所有的观测值都是可观测到的),此时可以通过设置虚拟变量(审查指示变量)来审查数据。Eviews提供了另外一种数据审查方法来适应这种形式。简单地,在估计对话框中选择Field is zero/one indicator of censoring命令,然后在合适的编辑区域输入审查指示变量的序列表达式。对应于审查指示变量值为1的观测值要进行审查处理,而值为0的观测值不进行审查。如果变量scens是一个代表审查的指示变量,可以选择Field is zero/one indicator of censoring设置,并在编辑区域输入:左编辑域:空着右编辑域:scens如果数据在左边和右边都需要审查的话,对于每种形式的审查使用单独的审查指示变量:左编辑域:rencs右编辑域:scens这时rencs也是审查指示变量。例如,规范的Tobit模型数据是在0处进行左截取的,没有右截取。这时可这样设定:左编辑域:0右编辑域:空着完成模型的设定后,单击OK。Eviews将会使用合适的迭代步骤估计模型的参数,估计结果如下:图18.4.2该结果顶部显示了常用的标题信息,包括误差分布的假定,估计样本,估计方法和迭代至收敛需要次数。Eviews也提供了审查设定的相关信息,假如模型是规范的tobit模型,Eviews在结果中显示了Tobit,并且对于所有审查模型,Eviews都会显示详细的左审查或右审查。在标题下面是系数的常用估计结果,包括近似标准误差、z统计量、显著性水平。像其他受限因变量模型一样,系数估计的结果没有一个对边际效应的直接解释。在审查回归模型中,xij的改变有两种效应,一是对y均值的效应,一是对可观测值y的概率的效应(具体参见McDonald and Moffitt,1980)。本例估计结果中,年龄与工作时间显著负相关,表明年龄越大,平均工作时间越短;受教育程度与工作时间显著正相关,说明受教育程度越高,平均工作时间越长;幼年子女数量与工作时间显著负相关,说明幼年子女越多,平均工作时间越短。另外,Eviews还报告了名为SCALE的估计,它是比例系数的估计值。使用已知的分布函数的方差假定,可以这个比例系数估计残差的标准差。例如:对于极值分布模型,估计的scale有个值为0.446,表示残差项的标准差为。同二元因变量模型和排序模型一样,Eviews报告了因变量的常用统计和似然统计量。在表格底端回归统计量使用观测值的残差计算的。(2)产生残差序列同二元因变量模型一样,选择Proc/Make Residual Series,然后选择审查回归模型残差三种形式的一种,每种残差类型定义为:普通残差: (18.4.5)标准残差: (18.4.6)广义残差: (18.4.7)(3)预测Eviews提供了预测因变量期望,或预测潜在变量期望的选项。从方程工具栏中选择Proc/Forecast,打开预测对话框。为了预测因变量的期望,应该选择Expected dependent variable,并输入一个序列名称用于保存输出结果。为了预测潜在变量的期望,则选择Index-Expected latent variable,并输入一个序列的名称用于保存输入结果。潜在变量期望有下面式子计算:其中:是Euler-Mascheroni常数(约等于0.5772156649)。因变量期望可由下式计算:(18.4.8)18.4.2截断问题回归模型所谓“截断分布”,是完整分布的一部分,指“截断随机变量”的分布。与截取回归模型相近的模型是另一个截断回归模型,该模型假设无论因变量掉一个临界值之下,还是超过另一个临界值时都不能得到其观测值。这样的情况经常发生,比如对低收入家庭的收入函数进行研究时,排除收入高于一个临界值的观测值。1)一般二限制截断回归模型可写为: (18.4.9)其中:当时,观测值。如果没有低值截断值,我们可以设。如果没有上端截断值,则可以设。与这些数据相关的对数似然函数为: (18.4.10)使用标准迭代法,最大化似然函数,便可得到参数和。2)截断回归模型Eviews估计(1)模型估计截断回归模型同前面的审查(截取)回归模型的Eviews估计一样,从主菜单中点击Quick/Estimate Equation,打开Equation Estimation对话框,从该对话框中,选择CENSORED-Censored or Truncated Data(including Tobit)。审查(截取)回归模型和截断回归模型对话框出现了。所有设定跟截取回归模型一样,只需选择Truncated sample选项估计截断模型。图18.4.3然后点击确定,就得到估计结果:图18.4.4结果中没有显示截取观测值的个数,并在表头那里表明了是截断回归模型样本。这有两点需注意:首先,由于似然函数没有另外定义,截断估计只对截断点已知的模型进行估计。如果用指标指定截断点,Eviews将给出错误信息,指出这种设定无效。第二,如果一些因变量的值在截断点之外,Eviews将会发出错误信息。而且Eviews将自动排除掉严格等于截断点的所有观测值。例如,如果指定零为左截断点,但有观测值低于零,Eviews将会发出错误信息,并将排除严格等于零的任何观测值。(2)产生残差序列同审查回归模型一样,选择Proc/Make Residual Series,然后选择残差三种形式的一种,每种残差类型定义为:普通残差: (18.4.11)标准残差: (18.4.12)广义残差:(18.4.13)(3)预测Eviews提供了预测因变量期望,或预测潜在变量期望的选项。从方程工具栏中选择Proc/Forecast,打开预测对话框。为了预测因变量的期望,应该选择Expected dependent variable,并输入一个序列名称用于保存输出结果。为了预测潜在变量的期望,则选择Index-Expected latent variable,并输入一个序列的名称用于保存输入结果。潜在变量期望有下面式子计算:其中:是Euler-Mascheroni常数(约等于0.5772156649)。因变量期望可由下式计算: (18.4.14)截断回归模型中因变量的期望值是审查回归模型的期望值中间项的第一部分。两个期望值的不同,反映在对待落在区间之外的潜在观测值的方式不同。在审查回归模型中,那些观测值包括样本中,并计入期望值。而在截断回归模型中,在区间外的数据没有进行观测,并不用于期望值的计算。18.5计数模型在实际应用中,我们应该根据要研究的变量的数据类型选择合适的模型。当因变量表示事件发生的数目,是离散的整数,即为计数变量,并且数值较小,取零的个数多,而解释变量多为定性变量时,应该考虑应用计数模型(count models)。例如,一个公司提出申请的专利的数目,以及在一个固定的时间间隔内的失业人员的数目。在计数模型中应用较广泛的为泊松模型。因变量的条件均值受回归变量制约,模型一般形式为: (18.5.1)18.5.1模型估计设定从主菜单中点击Quick/Estimate Equation,打开Equation Estimation对话框,从该对话框中,选择COUNT-Integer count data,对话框如下。图18.5.1例如,本例研究轮船发生事故的次数与轮船的类型的关系易丹辉.数据分析与Eviews应用.北京:中国统计出版社,2002,240。因变量y表示平均每月轮船发生事故数。解释变量是轮船类型,有5种,分别用x1-x5表示,在方程设定处填入因变量和自变量或提供一个具体表达式。解释变量的列表是为因变量条件均值设定的一个详细说明。第二,如需要,可点击Options,改变Eviews默认地估计法则,收敛标准,初始值,计算系数协方差的方法。最后,在计数模型的估计方法中选一个,具体每种方法的详情在后面讨论。1)泊松模型的形式与参数估计设每个观测值都来自一个服从参数为的泊松分布的总体 (18.5.2)对于泊松模型(poisson model),给定时的条件密度是泊松分布: (18.5.3)其中:是非负整数的随机变量,参数的极大似然估计量(MLE)通过最大化如下的对数似然函数来得到: (18.5.4)倘若条件均值函数被正确的指定,且的条件分布为泊松分布,则极大似然估计量是一致的、有效的,且服从渐近正态分布。则方差矩阵的一致性估计为: (18.5.6)其中:泊松分布假定的约束条件在经验应用中经常不成立。最重要约束条件是条件均值和条件方差的相等: (18.5.6)如果这一条件被拒绝,模型就被错误设定。而在其他计数模型估计方法中,它们均放松了这一约束条件。这里要注意泊松估计量也可以被解释成准一极大似然估计量。这种结果的含义在下面讨论。在前面方程设定对话框中选择Poisson(ML and QML),然后点击确定,就得到如下的估计结果:图18.5.2轮船类型中x3、x4、x5的系数均显著为负,说明使用这三种类型的轮船不会使事故发生的可能性增加;x2的系数为正,则使用这种类型的轮船发生事故的可能性更大。2)负二项式模型的形式与参数估计除了泊松模型外,另外常用的模型是使用一个负二项式(negative binomial)分布的似然函数极大化来估计模型的参数。负二项式分布的对数似然函数如下: (18.5.7)其中:是和条件均值参数一起估计的参数。负二项分布的极大似然估计的一致性和有效性要求y的条件分布是服从负二项分布。Eviews估计的对数,在结果中以“SHAPE”参数对该参数估计结果显示,并用信息矩阵的逆来计算标准误差。当数据过度分散时,经常使用负二项分布(数据过度分散检验在后面详细论述)。这样条件方差大于条件均值,因下面的矩条件成立: (18.5.8) (18.5.9)所以,测量了条件方差超过条件均值的程度。在软件操作中,只需点击Negative Binomial(ML),然后得到估计结果如下:图18.5.33)准一极大似然估计如果因变量的分布不能被假定为泊松分布,那么就要在其他分布假定之下执行准一极大似然估计(quasi-maximum likelihood,QML)。即使分布被错误假定,这些准一极大似然估计量也能产生一个条件均值被正确设定的参数的一致估计。这些极大似然估计的结果类似于普通回归模型的结果,计算潜在误差分布不是正态分布,正常的极大似然估计量也是一致的。在普通最小二乘法中,对一致性的要求就是条件均值被正确设定。因而对于这些QML模型,对一致性的要求是条件均值被正确设定。除非y的条件分布被正确指定,否则用信息矩阵的逆计算估计的标准误差将不是一致性的。然而,即使该分布没有被正确设定,可以对稳健标准差进行估计,以便我们能进行有效的推理。Eviews在Options里提供了两种计算稳健标准误差的方法,在Robust Covariances选择。即Huber/White来计算准一极大似然估计的标准误差,而GLM选项计算对过度分散修正后的标准误差。具体详情见后面讨论。关于QML估计的进一步的细节参见Gourieroux,Monfort,和Trognon(1984a,1984b) Courieroux,C.,A.Monfort,and C.Trobnon.Pseudo-Maximum Likelihood Methods:Theory.Econometrica,1984,52:681700Gourieroux, C.,A.Monfort,and C.Trobnon.Pseudo-Maximum Likelihood Methods:Applications to Poisson Models.Econometrica,1984,52:701720。Wooldridge(1990) Wooldridge,Jeffrey M.Quasi-Likelihood Methods for Count Data.In:M.Hashem Pesaran and P.Schmidt ed.Hanbook of Applied Econometric,Volun2,Malden,MA:Blackwell,1990.352406介绍了在估计计数模型参数时QML方法的使用。也可参见关于广义线性模型(McCullagh 和Melder,1989) McCullagh,P. and J.A.Nelder.Generalized Linear Models,2nd Editiion.London:Chapman&Hall,1989扩展的相关文献。(1)泊松准一极大似然估计如果条件均值被正确设定,泊松极大似然估计也是服从其他分布类型的数据的准一极大似然估计,它将产生参数的一致估计量。默认地,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能制造2025研发成果独占权保护及商业秘密协议
- 茶叶加工企业年度技能提升培训服务合同
- 2025年公立医院医护人员职业行为规范及风险预防服务合同
- 2025年草原生态保护与草场租赁综合管理服务合同
- 2025年冷链物流货物中转与全程温控服务合同
- 2025年文化旅游项目合作协议:景区开发与品牌营销
- 2025年度企业知识产权保护合同范本:创新成果权益保障手册
- 2025年度智能家居装修一体化服务合同
- 2025年绿色环保车辆挂靠销售服务合作协议范本
- 2025年度市政道路绿化工程承包安全责任协议书
- 2024年度软件即服务(SaaS)平台租赁合同3篇
- 网络攻防原理与技术 第3版 教案 -第12讲 网络防火墙
- 2024年新课标培训2022年小学英语新课标学习培训课件
- 2024小学语文教学及说课课件:二年级上册《田家四季歌》
- 2024至2030年中国聚脲涂料行业市场发展调研及投资前景分析报告
- 1.1 鸦片战争 课件 2024-2025学年统编版八年级历史上册
- 2024至2030年中国演播室行业市场调查研究及发展战略规划报告
- DB11∕T 420-2019 电梯安装、改造、重大修理和维护保养自检规则
- 国旗台施工合同
- 总代理授权书
- 医疗器械售后服务能力证明资料模板
评论
0/150
提交评论