《计量经济分析方法与建模》课件第二版 第07章  离散因变量和受限因变量模型_第1页
《计量经济分析方法与建模》课件第二版 第07章  离散因变量和受限因变量模型_第2页
《计量经济分析方法与建模》课件第二版 第07章  离散因变量和受限因变量模型_第3页
《计量经济分析方法与建模》课件第二版 第07章  离散因变量和受限因变量模型_第4页
《计量经济分析方法与建模》课件第二版 第07章  离散因变量和受限因变量模型_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章第七章 离散因变量和受限因变量模型离散因变量和受限因变量模型 通常的经济计量模型都假定因变量是连续的,但是在 现实的经济决策中经常面临许多选择问题。人们需要在可 供选择的有限多个方案中作出选择,与通常被解释变量是 连续变量的假设相反,此时因变量只取有限多个离散的值 。例如,人们对交通工具的选择:地铁、公共汽车或出租 车;投资决策中,是投资股票还是房地产。以这样的决策 结果作为被解释变量建立的计量经济模型,称为离散被解 释变量数据计量经济学模型(models with discrete dependent variables),或者称为离散选择模型(discrete choice model, DCM)。 1 在实际中,还会经常遇到因变量受到某种限制的情况 ,这种情况下,取得的样本数据来自总体的一个子集,可 能不能完全反映总体。这时需要建立的经济计量模型称为 受限因变量模型(limited dependent variable model)。这 两类模型经常用于调查数据的分析中。 2 7.1 7.1 二元选择模型二元选择模型 在离散选择模型中,最简单的情形是在两个可供选择的 方案中选择其一,此时被解释变量只取两个值,称为二元选 择模型(binary choice model)。在实际生活中,我们经常 遇到二元选择问题。例如,在买车与不买车的选择中,买车 记为1,不买记为0。是否买车与两类因素有关系:一类是车 本身所具有的属性,如价格、型号等;另一类是决策者所具 有的属性如收入水平、对车的偏好程度等。如果我们要研究 是否买车与收入之间的关系,即研究具有某一收入水平的个 体买车的可能性。因此,二元选择模型的目的是研究具有给 定特征的个体作某种而不作另一种选择的概率。 3 为了深刻地理解二元选择模型,首先从最简单的线性概率 模型开始讨论。线性概率模型的回归形式为: (7.1.1) 其中:N是样本容量;k是解释变量个数;xj为第j个个体特征 的取值。例如,x1表示收入;x2表示汽车的价格;x3表示消费 者的偏好等。设 yi 表示取值为0和1的离散型随机变量: 式(7.1.1)中ui为相互独立且均值为0的随机扰动项。 7.1.17.1.1 线性概率模型及二元选择模型的形式线性概率模型及二元选择模型的形式 4 令pi = P ( yi =1) ,那么 1 - pi = P ( yi =0) ,于是 (7.1.2) 又因为E(ui ) = 0 ,所以 E(yi ) = xi,xi =(x1i , x2i , xki ), =(1 , 2 , k ),从而有下面的等式: (7.1.3) 5 式(7.1.3)只有当xi 的取值在(0,1)之间时才成立,否则就会 产生矛盾,而在实际应用时很可能超出这个范围。因此,线性 概率模型常常写成下面的形式: (7.1.4) 此时就可以把因变量看成是一个概率。 那么扰动项的方差为: (7.1.5) 或 (7.1.6) 6 由此可以看出,误差项具有异方差性。异方差性使得参 数估计不再是有效的,修正异方差的一个方法就是使用加权 最小二乘估计。但是加权最小二乘法无法保证预测值在 (0,1)之内,这是线性概率模型一个严重的弱点。由于上述问 题,我们考虑对线性概率模型进行一些变换,由此得到下面 要讨论的模型。 假设有一个未被观察到的潜在变量yi*,它与xi之间具有 线性关系,即 (7.1.7) 其中: ui*是扰动项。yi和yi*的关系如下: (7.1.8) 7 yi*大于临界值0时,yi =1;小于等于0时,yi =0。这里把 临界值选为0,但事实上只要xi包含有常数项,临界值的选择 就是无关的,所以不妨设为0。这样 (7.1.9) 其中:F是ui*的分布函数,要求它是一个连续函数,并且是 单调递增的。因此,原始的回归模型可以看成如下的一个回 归模型: (7.1.10) 即yi关于它的条件均值的一个回归。 8 分布函数的类型决定了二元选择模型的类型,根据分布函 数F的不同,二元选择模型可以有不同的类型,常用的二元选择 模型如表7.1所示: 表表7.1 7.1 常用的二元选择模型常用的二元选择模型 ui*对应的分布分布函数F 相应的二元选择模型 标准正态分布Probit 模型 逻辑分布Logit 模型 极值分布Extreme模型 9 二元选择模型一般采用极大似然估计。似然函数为 (7.1.11) 即 (7.1.12) 对数似然函数为 (7.1.13) 7.1.2 7.1.2 二元选择模型的估计问题二元选择模型的估计问题 10 对数似然函数的一阶条件为 (7.1.14) 其中:fi 表示概率密度函数。那么如果已知分布函数和密度 函数的表达式及样本值,求解该方程组,就可以得到参数的 极大似然估计量。例如,将上述3种分布函数和密度函数代 入式(7.1.14)就可以得到3种模型的参数极大似然估计。但是 式(7.1.14) 通常是非线性的,需用迭代法进行求解。 二元选择模型中估计的系数不能被解释成对因变量的边 际影响,只能从符号上判断。如果为正,表明解释变量越大 ,因变量取1的概率越大;反之,如果系数为负,表明相应 的概率将越小。 11 例例7.1 7.1 二元选择模型实例二元选择模型实例 考虑Greene 给出的斯佩克特和马泽欧(1980)的 例子,在例子中分析了某种教学方法对成绩的有效性 。因变量(GRADE)代表在接受新教学方法后成绩 是否改善,如果改善为1,未改善为0。解释变量( PSI)代表是否接受新教学方法,如果接受为1,不接 受为0。还有对新教学方法量度的其他解释变量:平 均分数(GPA)和测验得分(TUCE),来分析新的 教学方法的效果。 12 (1 1)模型的估计)模型的估计 估计二元选择模型,从Equation Specification对话框中 ,选择Binary估计方法。在二元模型的设定中分为两部分。 首先,在Equation Specification区域中,键入二元因变量的 名字,随后键入一列回归项。由于二元变量估计只支持列表 形式的设定,所以不能输入公式。然后,在Binary estimation method中选择Probit,Logit,Extreme value选择 三种估计方法的一种。以例7.1为例,对话框如图7.2所示。 13 图图7.2 7.2 二元选择模型估计对话框二元选择模型估计对话框 14 例7.1的估计输出结果如下: 15 参数估计结果的上半部分包含与一般的回归结 果类似的基本信息,标题包含关于估计方法(ML表 示极大似然估计)和估计中所使用的样本的基本信 息,也包括达到收敛要求的迭代次数。和计算系数 协方差矩阵所使用方法的信息。在其下面显示的是 系数的估计、渐近的标准误差、z-统计量和相应的 概率值及各种有关统计量。 16 在回归结果中还提供几种似然函数: log likelihood是对数似然函数的最大值L(b),b是 未知参数 的估计值。 Avg. log likelihood 是用观察值的个数N去除以对 数似然函数L(b) ,即对数似然函数的平均值。 Restr. Log likelihood是除了常数以外所有系数被 限制为0时的极大似然函数L(b) 。 LR统计量检验除了常数以外所有系数都是0的假设 ,这类似于线性回归模型中的统计量,测试模型整体的显 著性。圆括号中的数字表示自由度,它是该测试下约束变 量的个数。 17 Probability(LR stat)是LR检验统计量的P值 。在零假设下,LR检验统计量近似服从于自由度等于检 验下约束变量的个数的2分布。 McFadden R-squared是计算似然比率指标,正 像它的名字所表示的,它同线性回归模型中的R2是类似 的。它具有总是介于0和1之间的性质。 18 利用式(7.1.10),分布函数采用标准正态分布,即Probit模型 ,例7.1计算结果为 (7.1.15) z = (-2.93) (2.34) (0.62) (2.39) 利用式(7.1.15)的Probit模型的系数,本例按如下公式给出新 教学法对学习成绩影响的概率, 当PSI = 0时: (7.1.19) 当PSI = 1时: (7.1.20) 式中测验得分TUCE取均值(21.938),平均分数GPA是按从 小到大重新排序后的序列。 19 图图7.1 7.1 新教学法对学习成绩影响的概率新教学法对学习成绩影响的概率 20 (2 2) 估计选项估计选项 因为我们是用迭代法求极大似然函数的最大值,所 以Option选项可以从估计选项中设定估计算法与迭代 限制。单击Options按钮,打开对话框如图7.3所示。 图图7.3 Options7.3 Options对话框对话框 21 Option对话框有以下几项设置: 稳健标准差稳健标准差 (Robust Standard Errors) 对二元因变 量模型而言,EViews允许使用准-极大似然函数( Huber/White)或广义的线性模型(GLM)方法估计标准 误差。察看Robust Covariance对话框,并从两种方法中选 择一种。 初始值初始值 EViews的默认值是使用经验运算法则而选 择出来的,适用于二元选择模型的每一种类型。 估计法则估计法则 在Optimization algorithm 一栏中选择估 计的运算法则。默认地,EViews使用quadratic hill- climbing方法得到参数估计。这种运算法则使用对数似然分 析二次导数的矩阵来形成迭代和计算估计的系数协方差矩 阵。还有另外两种不同的估计法则,Newton-Raphson也使 用二次导数,BHHH使用一次导数,既确定迭代更新,又 确定协方差矩阵估计。 22 (3 3)预测)预测 从方程工具栏选择Procs/Forecast(Fitted Probability /Index),然后单击想要预测的对象。既可以计算拟合概 率, ,也可以计算指标 的拟合值。 像其他方法一样,可以选择预测样本,显示预测图。 如果解释变量向量xt包括二元因变量yt的滞后值,选择 Dynamic选项预测,EViews使用拟合值 得到预测值; 而选择Static选项,将使用实际的(滞后的)yt-1得到预测 值。 对于这种估计方法,无论预测评价还是预测标准误差 通常都无法自动计算。后者能够通过使用View/ Covariance Matrix显示的系数方差矩阵,或者使用 covariance函数来计算。 23 可以在各种方式上使用拟合指标,举个例子,计算解 释变量的边际影响。计算预测拟合的指标 ,并用序列 xb中保存这个结果。然后生成序列dnorm(-xb)、 dlogistic(-xb)、dextreme(-xb),可以与估计的系数j 相乘,提供一个yi的期望值对xi的第j个分量的导数的估计 。 (7.5.1) 24 (4 4)产生残差序列)产生残差序列 通过Procs/Make Reidual Series选项产生下面三种残差 类型中的一种类型。 表表7.6 7.6 残差类型残差类型 普通残差(Ordinary) 标准化残差 (Standardized) 广义残差(Generalized) 25 7.2 7.2 排序选择模型排序选择模型 当因变量不止是两种选择时,就要用到多元选择模型 (multiple choice model)。多元离散选择问题普遍存在于 经济生活中。例如: (1) 一个人面临多种职业选择,将可供选择的职业排 队,用0,1,2,3表示。影响选择的因素有不同职业的 收入、发展前景和个人偏好等; (2) 同一种商品,不同的消费者对其偏好不同。例如 ,十分喜欢、一般喜欢、无所谓、一般厌恶和十分厌恶 ,分别用0,1,2,3,4表示。而影响消费者偏好的因素 有商品的价格、性能、收入及对商品的需求程度等; (3) 一个人选择上班时所采用的方式自己开车, 乘出租车,乘公共汽车,还是骑自行车。 26 上述3个例子代表了多元选择问题的不同类型。 前两个例子属于排序选择问题,所谓“排序”是指 在各个选择项之间有一定的顺序或级别种类。而第3 个例子只是同一个决策者面临多种选择,多种选择 之间没有排序,不属于排序选择问题。与一般的多 元选择模型不同,排序选择问题需要建立排序选择 模型(ordered choice model)。下面我们主要介绍排 序选择模型。 27 与二元选择模型类似,设有一个潜在变量 yi*,是不可观 测的,可观测的是 yi ,设 yi 有0,1,2,M等M+1个取值 。 (7.2.1) 其中:ui*是独立同分布的随机变量,yi 可以通过 yi*按下式得 到 (7.2.2) 28 设ui*的分布函数为F(x),可以得到如下的概率 (7.2.3) 和二元选择模型一样,根据分布函数F(x)的不同可以有 3种常见的模型:Probit模型、Logit模型和Extreme value模 型。仍然采用极大似然方法估计参数,需要指出的是,M个 临界值c1, c2, , cM 事先也是不确定的,所以也作为参数和 回归系数一起估计。 29 例例7.2 7.2 排序模型的实例排序模型的实例 在调查执政者的支持率的民意测验中,由于执 政者执行了对某一收入阶层有利的政策而使得不同 收入的人对其支持不同,所以收入成为决定人们是 否支持的因素。通过调查取得了市民收入(INC)与支 持与否(Y)的数据,其中如果选民支持则Yi取0,中立 取1,不支持取2。我们选取24个样本进行排序选择 模型分析。 30 1 1 模型的估计模型的估计 与二元选择模型类似,从主菜单中选择Objects/New Object,并从该菜单中选择Equation选项。从Equation Specification对话框,选择估计方法ORDERED,标准估计 对话框将会改变以匹配这种设定。在Equation Specification区域,键入排序因变量的名字,其后列出回 归项。排序估计也只支持列表形式的设定,不用输入一 个明确的方程。然后选择Normal,Logist,Extreme Value三种误差分布中的一种,单击OK按钮即可。对话 框如图7.4所示。 31 图图7.4 7.4 排序模型的输入对话框排序模型的输入对话框 32 例7.2估计结果如下: 33 有两点需要指出:首先,EViews不能把常数项和临界 值区分开,因此在变量列表中设定的常数项会被忽略,即 有无常数项都是等价的。其次,EViews要求因变量是整数 ,否则将会出现错误信息,并且估计将会停止。然而,由 于我们能够在表达式中使用 round、floor 或 ceil函 数自动将一个非整数序列转化成整数序列,因此这并不是 一个很严格的限制。 估计收敛后,EViews将会在方程窗口显示估计结果。 表头包含通常的标题信息,包括假定的误差分布、估计样 本、迭代和收敛信息、y的排序选择值的个数和计算系数 协方差矩阵的方法。在标题信息之下是系数估计和渐近的 标准误差、相应的z-统计量及概率值。然后,还给出了临 界值LIMIT_1:C(2),LIMIT_2:C(3)的估计及相应的统计 量。 34 2. 2. 常用的两个过程常用的两个过程 Make Ordered Limit Vector产生一个临界值向量c ,此向量被命名为LIMITS01,如果该名称已被使用,则 命名为LIMITS02,以此类推。 Make Ordered Limit Covariance Matrix产生临界 值向量c的估计值的协方差矩阵。命名为VLIMITS01,如 果该名称已被使用,则命名为VLIMITS02,以此类推。 35 3. 3. 预测预测 因为排序选择模型的因变量代表种类或等级数据 ,所以不能从估计排序模型中直接预测。选择Procs/ Make Model,打开一个包含方程系统的没有标题的 模型窗口,单击模型窗口方程栏的Solve按钮。例7.2 因变量 y 的拟合线性指标 序列被命名为i_Y_0, 拟和值落在第一类中的拟合概率被命名为Y_0_0的序 列,落在第二类中的拟合概率命名为Y_1_0的序列中 ,落在第三类中的拟合概率命名为Y_2_0的序列中, 等等。注意对每一个观察值,落在每个种类中的拟合 概率相加值为1。 表7.7中Y_0_0,Y_1_0,Y_2_0分别是支持、中立 、不支持的概率,Y,INC是实际样本。 36 4 4产生残差序列产生残差序列 选择Proc/Make Residual Series产生广义残差序列,输 入一个名字或用默认的名字,然后单击OK按钮。一个排序 模型的广义残差由下式给出: (7.5.2) 其中:c0 = - ,cM+1 = 。 37 7.3 7.3 受限因变量模型受限因变量模型 现实的经济生活中,有时会遇到这样的问题,因变量 是连续的,但是受到某种限制,也就是说所得到的因变量 的观测值来源于总体的一个受限制的子集,并不能完全反 映总体的实际特征,那么通过这样的样本观测值来推断总 体的特征就需要建立受限因变量模型(limited dependent variable models)。本节研究两类受限因变量模型,即审查 回归模型(censored regression models)和截断回归模型 (truncated regression models)。 38 7.3.1 7.3.1 审查回归模型审查回归模型 1 1模型的形式模型的形式 考虑下面的潜在因变量回归模型 (7.3.1) 其中: 是比例系数;y*是潜在变量。被观察的数据 y 与潜 在变量 y* 的关系如下: (7.3.2) 39 换句话说,yi*的所有负值被定义为0值。我们称这些数据 在0处进行了左截取(审查)(left censored)。而不是把观 测不到的 yi* 的所有负值简单地从样本中除掉。此模型称为规 范的审查回归模型,也称为Tobit模型。 更一般地,可以在任意有限点的左边和右边截取(审查 ),即 (7.3.3) 其中: , 代表截取(审查)点,是常数值。如果没有左截 取(审查)点,可以设为 。如果没有右截取(审查)点, 可以设为 。规范的Tobit模型是具有 和 的 一个特例。 40 2 2审查回归模型的极大似然估计审查回归模型的极大似然估计 与前边介绍的几个模型类似,可以采用极大似然法估计 审查回归模型的参数,对数似然函数为 (7.3.4) 求式(7.3.4)的最大值即可得参数 , 的估计。这里f , F分别 是u的密度函数和分布函数。 41 特别地,对于Tobit模型,设uN(0,1),这时对数似然 函数为 (7.3.5) 式(7.3.5)是由两部分组成的。第一部分对应没有限制的观测 值,与经典回归的表达式是相同的;第二部分对应于受限制 的观测值。因此,此似然函数是离散分布与连续分布的混合 。将似然函数最大化就可以得到参数的极大似然估计。 42 例例7.3 7.3 审查模型的实例审查模型的实例 本例研究已婚妇女工作时间问题,共有50个调查数据 ,来自于美国国势调查局U.S.Bureau of the Census(Current Population Survey, 1993),其中y 表示已 婚妇女工作时间, x1 x4分别表示已婚妇女的未成年子女 个数、年龄、受教育的年限和丈夫的收入。只要已婚妇女 没有提供工作时间,就将工作时间作零对待,符合审查回 归模型的特点。 43 7.3.2 7.3.2 截断回归模型截断回归模型 截断问题,形象地说就是掐头或者去尾。即在很多实际 问题中,不能从全部个体中抽取因变量的样本观测值,而只 能从大于或小于某个数的范围内抽取样本的观测值,此时需 要建立截断因变量模型。例如,在研究与收入有关的问题时 ,收入作为被解释变量。从理论上讲,收入应该是从零到正 无穷,但实际中由于各种客观条件的限制,只能获得处在某 个范围内的样本观测值。这就是一个截断问题。截断回归模 型的形式如下: (7.3.7) 其中:yi 只有在 时才能取得样本观测值, , 为两个常数。 对于截断回归模型,仍然可以采用极大似然法估计模型 的参数,只不过此时极大似然估计的密度函数是条件密度。 44 7.5.3 7.5.3 估计估计审查回归审查回归模型模型 1.1.模型的估计模型的估计 为估计审查模型,打开Equation对话框,从Equation Specification对话框所列估计方法中选择CENSORED估计 方法。在Equation Specification区域,输入被审查的因变 量的名字及一系列回归项。审查回归模型的估计只支持列 表形式的设定(图7.5)。 45 图图7.5 7.5 审查模型的估计对话框审查模型的估计对话框 46 在三种分布中选择一种作为误差项的分布,EViews提供 三种可供选择的分布(表7.8)。 表表7.8 7.8 误差项的分布误差项的分布 Standard normal Logistic Extreme value (欧拉常数 ) 还需要在Dependent Variable Censoring Points一栏提供 关于被检查因变量的临界点的信息。临界点可以是数值、表 达式、序列,还可以是空的。有两种情况需要考虑: 临界点对于所有个体都是已知的; 临界点只对具有审查观察值的个体是已知的。 47 (1 1)临界点对所有个体都已知)临界点对所有个体都已知 按照要求在编辑栏的左编辑区(Left)和右编辑区( Right)输入临界点表达式。注意如果在编辑区域留下空白, EViews将假定该种类型的观测值没有被审查。 例如,在规范的Tobit模型中,数据在0值左边审查,在0 值右边不被审查。这种情况可以被指定为: 左编辑区: 0 右编辑区: blank 而一般的左边和右边审查由下式给出: 左编辑区: 右编辑区: EViews也允许更一般的设定,这时审查点已知,但在观 察值之间有所不同。简单地在适当的编辑区域输入包含审查 点的序列名字。 48 (2 2)临界点通过潜在变量产生并且只对被审查的观测值)临界点通过潜在变量产生并且只对被审查的观测值 个体已知个体已知 在一些情况下,假设临界点对于一些个体( 和 不是 对所有的观察值都是可观察到的)是未知的,此时可以通过 设置0-1虚拟变量(审查指示变量)来审查数据。EViews提 供了另外一种数据审查的方法来适应这种形式。简单地,在 估计对话框中选择Field is zero/one indicator of censoring选 项,然后在合适的编辑区域输入审查指示变量的序列名。对 应于审查指示变量值为1的观察值要进行审查处理,而值为0 的观察值不进行审查。 49 例如,假定我们有个人失业时间的观察值,但其中的一些 观察值反映的是在取得样本时仍然继续失业的情况,这些观察 值可以看作在报告值的右边审查。如果变量rcens是一个代表审 查的指示变量,可以选择Field is zero/one indicator of censoring设置,并在编辑区域输入: 左编辑区: blank 右编辑区: rcens 如果数据在左边和右边都需要审查的话,对于每种形式的 审查使用单独的审查指示变量: 左编辑区: lcens 右编辑区: rcens 这里,lcens也是审查指示变量。完成模型的指定后,单击OK 。EViews将会使用合适的迭代步骤估计模型的参数。 50 例7.3的估计结果如下: 51 2 2模型的预测与产生残差模型的预测与产生残差 EViews提供了预测因变量期望 E (y | x, , ) 的选项, 或预测潜在变量期望 E (y*| x, , ) 的选项。从工具栏选择 Forecast打开预测对话框。为了预测因变量的期望,应该 选择Expected dependent variable,并输入一个序列名称用 于保存输出结果。为了预测潜在变量的期望,单击Index- Expected latent variable,并输入一个序列的名称用于保存 输出结果。潜在变量的期望 E (y*| x, , ) 可以从如下关系 中得到: (7.5.3) 通过选择Procs/Make Residual Series,并从残差的3种 类型中进行一种,可以产生审查模型的残差序列。审查模 型的残差也有3种类型,与前述类似。 52 3 3 估计截断回归模型估计截断回归模型 估计一个截断回归模型和估计一个审查模型遵循同样的 步骤,从主菜单中选择Quick/Estimate Equation,并在 Equation Specification 对话框中,选择CENSORED估计方法 。出现估计审查和截断回归模型对话框。在Equation Specification区域键入截断因变量的名称和回归项的列表,并 从三种分布中选择一种作为误差项的分布。选择Truncated sample选项估计截断模型。 有几点需要补充说明: 首先,截断估计只对截断点已知的模型进行估计。如果 用指标指定截断点,EViews将会给出错误信息,指出这种选 择是无效的。 其次,如果有一些因变量的值在截断点之外,EViews将 会发出错误信息。而且,EViews将会自动排除掉严格等于截 断点的所有观察值。例如,如果指定零作为左截断点,如果 有观察值低于零,EViews将会发出错误信息,并将排除严格 等于零的任何观察值。 53 在实际应用中,我们应该根据要研究的变量的数据类 型选择合适的模型。当因变量 y 表示事件发生的数目,是离 散的整数,即为计数变量,并且数值较小,取零的个数多, 而解释变量多为定性变量时,应该考虑应用计数模型( count models)。例如,一个公司提出申请的专利的数目, 以及在一个固定的时间间隔内的失业人员的数目。在计数模 型中应用较广泛的为泊松模型。 7.4 7.4 计数模型计数模型 54 7.4.1 7.4.1 泊松模型的形式与参数估计泊松模型的形式与参数估计 设每个观测值 yi 都来自一个服从参数为m(xi ,) 的泊松分 布的总体, (7.4.1) 对于泊松模型(poisson model),给定 xi 时 yi 的条件密度是 泊松分布: (7.4.2) 由泊松分布的特点, (7.4.3) 参数 的极大似然估计量(MLE)通过最大化如下的对 数似然函数来得到: (7.4.4) 55 倘若条件均值函数被正确的指定且的条件分布为泊 松分布,则极大似然估计量是一致的、有效的、且服从 渐近正态分布。 泊松假定的约束条件在经验应用中经常不成立。最 重要的约束条件是式(7.4.3)中的条件均值和条件方差 相等。如果这一条件被拒绝,模型就被错误设定。这里 要注意泊松估计量也可以被解释成准极大似然估计量。 这种结果的含义在下面讨论。 56 7.4.2 7.4.2 负二项式模型的形式与参数估计负二项式模型的形式与参数估计 对泊松模型的常用替代是使用一个负二项式(negative binomial)分布的似然函数极大化来估计模型的参数。负二项 式分布的对数似然函数如下: (7.4.5) 其中:2 是和参数 一起估计的参数。当数据过度分散时, 经常使用负二项式分布,这样条件方差大于条件均值,由于 下面的矩条件成立: (7.4.6) (7.4.7) 因此, 2 测量了条件方差超过条件均值的程度。57 7.4.3 7.4.3 准准- -极大似然估计极大似然估计 如果因变量的分布不能被假定为泊松分布,那么就要在 其他分布假定之下执行准-极大似然估计(quasi-maximum likelihood, QML)。即使分布被错误假定,这些准-极大似 然估计量也能产生一个条件均值被正确设定的参数的一致估 计,即对于这些QML模型,对一致性的要求是条件均值被正 确设定。 关于QML估计的进一步的细节参见Gourieroux, Monfort,和Trognon(1984a,1984b)。Wooldridge(1990) 介绍了在估计计数模型参数时QML方法的使用。也可参见关 于广义线性模型(McCullagh和Nelder,1989)的扩展的相关 文献。 58 1. 1. 泊松准泊松准- -极大似然估计极大似然估计 如果条件均值被正确设定,泊松极大似然估计也是 服从其他分布类型的数据的准-极大似然估计。它将产生 参数 的一致估计量。 59 2. 2. 指数准指数准- -极大似然估计极大似然估计 指数分布的对数似然函数如下: (7.4.8) 和其他QML估计量一样,倘若 m(xi ,) 被正确指定, 即使 y 的条件分布不是指数分布,指数分布的准-极大似然 估计仍是一致的。 60 3. 3. 正态准正态准- -极大似然估计极大似然估计 正态分布的似然函数如下: (7.4.9) 对于固定的 2和正确设定的m(xi ,),即使分布不是正 态的,正态分布的对数极大似然函数仍提供了一致的估计。 61 4. 4. 负二项式准负二项式准- -极大似然估计极大似然估计 最大化式(7.3.12)所表示的负二项式分布的对数似 然函

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论