离散选择模型_第1页
离散选择模型_第2页
离散选择模型_第3页
离散选择模型_第4页
离散选择模型_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章离散选择模型在初级计量经济学里,我们已经学习了解释变量是虚拟变量的情况,除此之外,在实际问题中,存在需要人们对决策与选择行为的分析与研究,这就是被解释变量为虚拟变量的情况。我们把被解释变量是虚拟变量的线性回归模型称为离散选择模型,一类模型的估计与应用。。第一节模型的基础与对应的现象在研究社会经济现象时,常常遇见一些特殊的被解释变量,其表现是选择与决策最值查数据只有存款一万元以上的帐户,这时就不能以此代表所有居民储蓄的情况,这种数据称为截断数据。这两种数据所建立的模型称为受限被解释变量模型。有的时候,就把高出分数线和低于分数线划分为了两类。下面是几个离散数据的例子。仅有家庭收入、房屋价格,还有房屋的所在环境、人们的购买心理等,所以人们购买住房的心理价位很难观测到,但我们可以观察到是否购买了住房,即发展潜力等诸多因素的权衡。员工跳槽的成本与收益是多少,我们无法知道,但我们可以观察到员工是否跳槽,即察到投票者的行为只有三种,即研究投票者投什么票的可能性,即P(Y=j),j=1,2,3。从上述被解释变量所取的离散数据看,如果变量只有两个选择,则建立的模型为散选择模型。选择问题,可以建立如下计量经济模型。设家庭购买住房的选择主要受到家庭的收入水平,则用如下模型表示iiYY01概率1-ppE(Y|X)=+X=p(5-1)i12iii给定X下,事件(家庭购买住房)将发生的条件概率为P(Y=1X),亦即家庭选择购iii。我们称这一关系式为线性概率函数。对线性概率函数直接运用OLS(1)随机误差项的非正态性表估计,会存在以下困难。现表明u服从两点分布。而在经典计量经济学中,假定u服从正态分布。ii(2)u的异方差性。事实上,根据u服从两点分布iiiuiiiiii(3)利用加权最小二乘法修正异方差ui计线性概率模型时,用作为p的估计来计算权iiiiiiiii但要比较好地解决这类问题,只能考虑采用新的估计方法,这就是将要介绍的由上述介绍可知,对于线性概率模型来说,存在一些问题,有的问题尽管可以用方法加以弥补,但并不完善和理想。(2)在线性概率模型中,对于不满足0≤E(YX)≤1的情况,用人工的方法处iiiiii(3)经济意义也不能很好地得到体现。在线性概率模型E(Y|X)=+X=pi12iPYX变化而线性变化,但这与实际情况通常不符。例如购买i住房,通常收入很高或很低,对于购买住房的可能性都不会有太大的影响,而当收入增加很快时,对购买住房的影响将会很大。所以,购买住房的可能性与收入之间并不性关系,有可能是一种非线性关系。二分性质的模型。(1)随着X的减小,p趋近0的速度会越来越慢;反过来随着X的增大,p接iiiiiiiiip与X的这种非线性iiii多种分布函数(Cox,1970)来表示。但最常用的是Logistic分布函数和标准正态分(3)Logistic分布函数设p=F(z)=1=1(5-2)ii1+e-zi1+e-(1+2Xi)Z=+X。并且在该表达式中,有如下变动规律,i12i当Z+时,p1;ii当Z-时,p0;ii1当Z=0时,p=。ii2(4)Logit模型之比。称(5-3)式为Logit模型。pi(2)ln(p)对X为线性函数。1-pi(3)当ln(p)为正的时候,意味着随着X的增加,选择1的可能性也增大了。1-pi当ln(p)为负的时候,随着X的增加,选择1的可能性将减小。换言之,当机会比pi(1)Logit模型为非线性模型,尽管等式右端看上去是线性形式,而普通回归模(2)线性回归模型研究被解释变量Y的均值E(Y|X)与解释变量X之间的依存关ii系,而Logistic分布函数研究的是事件发生的概率P(Y=1|X)与解释变量X的依存ii(3)线性回归模型中包含随机误差项u,对u的要求是要满足基本假定,而iiLogistic分布函数没有出现随机误差项,对模型没有这样的要求。或者说要求样本分布与总体分布具有同一性,而对线性回归模型一般情况下并无这样为了估计Logit模型,除了X外,我们还应有ln(p)的数值。由于p只取值为i1pii法。法可通过市场调查获得分组或重复数据资料,用相对频数=作为p的估计。以inii购买住房为例,将购买住房的情况分组,假设第i组共有n个家庭,收入为X,其中ii有r个家庭已购买住房,其余未购买。则收入为X的家庭,购买住房的频率为ii将其作为p的估计,并代入对数机会比,有i回归函数为性回归模型选择参数估计,使被解释变量的观测值与模型估计值之间的离差平方值为密度函数所导出的似然函数,并对其求极值而得到参数估计的一种方法。在线性回归iiiiiii为ii出具有最大可能取所给定的样本观测数据的参数估计。于是,最大似然估计的关键是2称上式为对数似然函数。为了估计能使ln[L(,)]有最大的总体参数估计ˆ和ˆ,12121212it12(1)参数估计具有一致性,即当样本观测增大时,模型的参数估计值将比较接近(2)参数估计为渐近有效,即当样本观测增大时,参数估计的标准误相应减小。(3)参数估计满足渐近正态性,即随着样本观测的增大,估计的分布近似于正态yLogit,andProbitModels.NewburyPark,SagePublications.三、Logit回归模型的评价和参数的统计检验行评价。如果模型的预测值(拟合值)能够与对应的观测值有较高的一致性,就认为(1)McFaddenR2cFurr有截距项的有约束的对数似然函数值。从概念上讲,LIF和LIF分别等价于普通线性urrMcF(2)期望-预测表检验i12i的比重来检验模型的拟合优度。如果模型估计与实际观测数据比较一致,则大多数的观测数据应该是分组恰当的,反之,如果分组不恰当的观测数据所占的比重很大,说明模型估计与实际观测数据的拟合程度较差,模型就需要调整。第一步,在估计好模型的窗口中按此路径选择View/ExpectationPredictioniitX著性检验对模型中参数的显著性检验,就是决策判断某个解释变量对事件的发生(即选取Y=1)是否有显著性影响。如果检验结果表明该解释变量对选取Y=1的发生有显著性(1)Z检验202i20222显著性。(2)Wald检验02inlogitanalysis.JournaloftheAmericanStatisticalAssociation,Vol.72:851-853.(3)似然比检验统计学上已经证明,在大样本情况下,两个模型之间如果具有嵌套关系,则两个该检验的思想是,假设一个模型记为Model1中有解释变量X,另一个模型记为jjj其中,ln()为所设定的原模型(即包含了所有解释变量——“有约束”)的最大modelj估计方法得到如下结果(1)由计算表格知,拟合优度指标R2=0.3743,表明模型有一定的拟合优度。McF9由前面的推导可知,将事件发生的条件概率定义为P(Y=1|X)=p,则我们可得iii1+e(1+2Xi)1+exp(X)12iln(pi)=+X1p12ii 对模型(5-4),由于等式右端为线性表示,则可完全按照线性回归模型系数那样来解释。一个解释变量的作用如果是增加对数发生比的话,也就增加了事件发生的概率。对数发生比随对应的解释变量值增加而增加,相反,一个显著的负系数代表对数发生比随对应解释变量的增加而减少。如果系数的统计性质不显著,说明对应解释变量的转换成发生比的形式(还原成以e为底的指数函数) pi=e+X=eeX(5-5)1p12i12ii1发生比。对于解释变量的作用的解释,由(5-5)式看出,各项作用之间已经由加法的22i2i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论