6.2 二元离散选择模型_第1页
6.2 二元离散选择模型_第2页
6.2 二元离散选择模型_第3页
6.2 二元离散选择模型_第4页
6.2 二元离散选择模型_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

§6.2二元离散选择模型

一、二元离散选择模型的经济背景二、二元离散选择模型三、二元Probit模型及其参数估计四、二元Logit模型及其参数估计五、二元离散选择模型的检验说明离散被解释变量数据计量经济学模型(ModelswithDiscreteDependentVariables)和离散选择模型(DCM,DiscreteChoiceModel)的区别。二元选择模型(BinaryChoiceModel)和多元选择模型(MultipleChoiceModel)。本节只介绍二元选择模型。离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究。1962年,Warner首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。70、80年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。模型的估计方法主要发展于80年代初期。一、社会经济生活中的二元选择问题研究选择结果与影响因素之间的关系。选择结果:0、1影响选择结果的因素包括两部分:决策者的属性和备选方案的属性。两种方案的选择由决策者的属性和备选方案的属性共同决定。例如,选择利用公共交通工具还是私人交通工具,取决于两类因素。一类是公共交通工具和私人交通工具所具有的属性,诸如速度、耗费时间、成本等;一类是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。单个方案的取舍一般由决策者的属性决定。例如,对某种商品的购买决策问题。决定购买与否,取决于两类因素。一类是该商品本身所具有的属性,诸如性能、价格等;一类是消费者个体所具有的属性,诸如收入水平、对该商品的偏好程度等。对于所有的决策者,商品本身所具有的属性是相同的,在模型中一般不予体现。二、二元离散选择模型1、原始模型对于二元选择问题,可以建立如下计量经济学模型。其中Y为观测值为1和0的决策被解释变量;X为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。

称为线性概率模型(linearprobabilitymodel,LPM)左右端矛盾仍假设,则令于是另一方面由于存在这两方面的问题,主要是模型左右端矛盾问题,导致:原始模型不能作为实际研究二元选择问题的模型。需要将原始模型变换为效用模型。一般教科书称为潜变量模型(LatentVariableModel)。这是离散选择模型的关键。

具有异方差性

2、效用模型

作为研究对象的二元选择模型第i个个体选择1的效用第i个个体选择0的效用显然有:注意:在效应模型中,被解释变量是不可观测的潜变量,人们能够得到的观测值仍然是选择结果,即1和0。很显然,如果不可观测的U1>U0,即对应于观测值为1,因为该个体选择公共交通工具的效用大于选择私人交通工具的效用,他当然要选择公共交通工具;相反,如果不可观测的U1≤U0,即对应于观测值为0,因为该个体选择公共交通工具的效用小于选择私人交通工具的效用,他当然要选择私人交通工具。OLS不能用于效用模型的估计。三、二元离散选择模型的参数估计1、极大似然估计

欲使得效用模型可以采用ML估计,就必须为随机误差项选择一种特定的概率分布。两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元选择模型—Probit模型和Logit模型。最大似然函数及其估计过程如下:标准正态分布或逻辑分布的对称性似然函数

在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。

1阶极值条件对数似然函数2、二元Probit离散选择模型及其参数估计将效用模型(潜变量模型)的随机干扰项设定为服从标准正态分布。则该二元离散选择模型称为Probit模型。累积分布函数密度函数重复观测值不可以得到情况下二元Probit离散选择模型的参数估计

求解该方程组,可以得到模型参数估计量(通过软件,迭代法求解)。这里所谓“重复观测值不可以得到”,是指对每个决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。3、二元logit离散选择模型及其参数估计将效用模型(潜变量模型)的随机干扰项设定为服从逻辑(logistic)分布。则该二元离散选择模型称为Logit模型。累积分布函数密度函数重复观测值不可以得到情况下二元logit离散选择模型的参数估计

求解该方程组,可以得到模型参数估计量(通过软件,迭代法求解)。四、案例:贷款决策模型分析与建模:某商业银行从历史贷款客户中随机抽取78个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(X1)和“市场竞争地位等级”(X2),对它们贷款的结果(Y)采用二元离散变量,1表示贷款成功,0表示贷款失败。目的是研究Y与X1、X2之间的关系,并为正确贷款决策提供支持。样本观测值选择Probit模型对异方差采用稳健标准误的White修正

估计结果输出的估计结果该方程表示:当X1和X2已知时,代入方程,可以计算贷款成功的概率Y。例如:

将表中第19个样本观测值X1=15、x2=-1代入方程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于0.1326552的累积正态分布为0.5517,于是,Y的预测值:Y=1-0.5517=0.4483,即对应于该客户,贷款成功的概率为0.4483。正确解读该结果十分重要讨论:能否说“当市场竞争地位等级提高1,给该企业贷款成功的概率提高5.062”?不能。为什么?能否说“对于不同的企业,当市场竞争地位等级都提高1,给这些企业贷款成功的概率所提高的幅度是相同的”?不能。为什么?模拟预测预测应用:如果有一个新客户,根据客户资料,计算的“商业信用支持度”(X1)和“市场竞争地位等级”(X2),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。选择Logit模型

利用该方程,当X1和X2已知时,可以计算贷款成功的概率Y。例如:将第1个样观测值X1=125、X=-2代入方程右边,计算括号内的值为60.7749;查逻辑分布表,对应于60.7749的累积逻辑分布为1.0;于是,Y的预测值YF=1-1.0=0,即对应于该客户,贷款成功的概率为0。

将第19个样本观测值X1=15、X2=-1代入方程右边,计算括号内的值为0.24226;查逻辑分布表,对应于0.24226的累积逻辑分布为0.5600;于是,Y的预测值YF=1-0.5600=0.4400,即对应于该客户,贷款成功的概率为0.4400。五、二元离散选择模型的检验1、拟合检验P:样本观测值中被解释变量等于1的比例。

L0:模型中所有解释变量的系数都为0时的似然函数值。R2=1,即L=1,完全拟合。

R2=0,所有解释变量完全不显著,完全不拟合。伪R2(pseudoR-squared)或麦克法登R2(McFaddenR-squared)LnL=-1.639954LnL0=-52.80224R2=0.96892、总体显著性检验

例中,lnL=-1.639954,lnL0=-52.80224,

则LR=102.3246,而临界值χ20.01(2)=9.21。可见,在0.01的显著水平上,该模型拒绝总体不显著的零假设。

3、异方差性检验截面数据样本,容易存在异方差性。假定异方差结构为:

采用LM检验将解释变量分为两类,Z为只与个体特征有关的变量。显然异方差与这些变量相关。将异方差检验问题变为一个约束检验问题由于一般都存在异方差,不检验,直接采用White修正进行估计(如上例所示)4、回代检验概率阈值朴素选择:p=0.5(1、0的样本相当时)先验选择:p=(选1的样本数/全部样本)(全样本时)最优阈值:犯第一类错误最小原则如果按照朴素原则,例中,除了2个样本外,所有样本都通过了回代检验。没有通过回代检验的2个样本中,第19个样本的选择结果为1,回代算得的选择1的概率为0.4472;第45个样本的选择结果为0,回代算得的选择1的概率0.5498。但是,该例中,选择1和选择0的样本数目分别为32和46,差异较大,不适合采用该方法。

如果按照先验方法,即以全部样本中选择1的样本所占的比例为临界值。例中,选择1的样本的比例为0.41。以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论