离散因变量模型Logit 模型Probit模型PPT课件_第1页
离散因变量模型Logit 模型Probit模型PPT课件_第2页
离散因变量模型Logit 模型Probit模型PPT课件_第3页
离散因变量模型Logit 模型Probit模型PPT课件_第4页
离散因变量模型Logit 模型Probit模型PPT课件_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、内容 二元选择模型的三类模型介绍 二元选择模型的估计: 二元选择模型的检验: 二元选择模型的应用第1页/共29页一、 二元选择模型 二元选择模型的理论模型 二元选择模型经济计量的一般模型 线性概率模型(LPM) Logit 模型 Probit 模型第2页/共29页(一) 二元选择模型的理论模型选择理论:效用是不可观测的,只能观测到选择行为选择理论:效用是不可观测的,只能观测到选择行为Uiii11X1Uiii000X UUiiiii1010X10()()*iiy iX第i个个体选择1的效用第i个个体不选择1(选择0)的效用1(0)0(0)iiiiyyyy选择选择1不选择不选择1 (选择(选择0)

2、第3页/共29页(二) 二元选择的经济计量一般模型FtF t()( )1*(1)(0)()1()1()()iiiiiP yXP yPPFF iiiiXXXX()10(1)()iiE yXPPF iX()YE Y X()YF XB()(1,2. )iiiyF X Bin总体回归模型总体回归模型样本回归模型样本回归模型第4页/共29页(三) 二元选择模型随机误差项及斜率()iiiyF X B()1()()()1()0iiiiiEF X BF X BF X BF X B 222( )()1()()()1()() 1()iiiiiiiiVarEF X BF X BF X BF X BF X BF X

3、B 对于回归模型:对于回归模型:斜率:斜率:()()()()()()iiijjjiiijijE yXF X BPrxxxdF X BX BfX Bd X Bx第5页/共29页(四) 分布函数F的选取选取分布函数选取分布函数F的原则:的原则:0()1iF X BiX B ()1iF X B iX B ()0iF X B F是单调函数是单调函数按照上述原则按照上述原则F取作累计分布函数。取作累计分布函数。下面介绍三种不同分布函数下的计量模型:下面介绍三种不同分布函数下的计量模型: LPM, Probit, Logit第6页/共29页1、 线性概率模型(LPM)()iiF X BX B如果选择如果选

4、择iiiyX B()iiiiyE yX()()iiiiiE yXE X BX B()1* (1)0* (0)10 (1)iiiiiiiiiE yXP yXP yXppp (1)iiiP yXp(0)1iiiP yXp ()iiiiiiiiyE yXpX BLPM的估计方法:的估计方法:OLS对响应概率对响应概率(p)的偏效应:的偏效应:jjx第7页/共29页 线性概率模型存在的问题及适用性LPM在实际的回归当中应用很少,用于理论模型的比较。( )(1)iiiVarpp*iy11iX B iy01iX B00iX B 办法:办法:强令预测值相应等于强令预测值相应等于0或或1 进行约束估计。进行约

5、束估计。随机误差项是异方差: 办法:可用WLS估计。v拟合值可能不在01之间,有可能大于1或小于0:第8页/共29页2、 Logit 模型11( )1111ZZZZeF Zeee 如果选择如果选择05101520253000.20.40.60.81Logistic分布函数分布函数(1) Logit 模型的分布函数模型的分布函数具有以上分布函数的二元选择模型称为具有以上分布函数的二元选择模型称为Logit模型。模型。第9页/共29页(2) Logit 模型的设定( )( )1ZZeF ZZe 2( )( )( )(1( )(1)ZZef ZF ZZZe ()iiiyF X B()iiiyX B

6、模型模型线性化线性化ln()1iiipX Bp()iipX B ()11()iX BiiiipX BepX B iiiLX Biy 取1或00,1ip ,iL ln1iiipLp其中其中得到:得到:P为为y取取1时的概率时的概率取值范围( )1ZZeZe机会比率机会比率odds第10页/共29页(3) Logit 模型的边际分析2( )(1)ZZdpef ZdZeln()1jjjpddZpdxdx2()z(1)ZjjjZjjpdpZef ZxdZxe ( )(1- (z)1、自变量的变化对响应概率(、自变量的变化对响应概率(p)的影响:)的影响:2、对、对Logit模型系数的解释:模型系数的解

7、释:ln()ln()1jjjjjpoddsLoddspoddsxxxx当当 xj 增加一个单位时机会比率的增长率为增加一个单位时机会比率的增长率为j第11页/共29页 南开大学国际经济研究所1999级研究生考试分数及录取情况见数据表(N = 95)。定义变量: Y :考生录取为1,未录取为0;SCORE :考生考试分数; D1:应届生为1,非应届生为0。例例1:第12页/共29页数据表 第13页/共29页模型结果:模型结果:(1)模型)模型()Yx (2)估计:用)估计:用 logit 法估计。法估计。 (调用数据库和程序调用数据库和程序E:logit)1231ScoreYD模型形如:模型形如

8、:Stata 命令:logit y score d1第14页/共29页(3)得到估计式:)得到估计式:1ln()242.45760.67710.47661pScoreDp (0.052)(0.052)(0.873)注:括号里是注:括号里是p值。值。(4)检验:可以直接根据括弧里的)检验:可以直接根据括弧里的 p 值进行判断,也可以值进行判断,也可以利用正态分布表查临界值进行检验。利用正态分布表查临界值进行检验。02:0H检验假设0121212Hzpzz分位点。表查出的其中为由正态N(0,1)第15页/共29页(5) 对参数加以解释:对参数加以解释:20.6771说明当考生分数增加一分,被录取的

9、机会比率增长率增加说明当考生分数增加一分,被录取的机会比率增长率增加0.6771.另外,是否应届生对录取与否没有显著影响。另外,是否应届生对录取与否没有显著影响。121.65z当 0.1时查表可得因为因为 Z=2.051.96,所以,所以score 变量在变量在0.05的显著水平下的显著水平下对对Y的影响是显著的。的影响是显著的。121.96z当 0.05时查表可得第16页/共29页3. Probit模型如果选择如果选择212(2 )( )(2)txFtedx-4-202400.20.40.60.81累积正态概率分布曲线累积正态概率分布曲线 Probit曲线和logit曲线很相似。两条曲线都是

10、在pi = 0.5处有拐点,但logit曲线在两个尾部要比Probit曲线厚。 第17页/共29页(1) Probit 模型的设定()iiiyF X B212(2)()()(2 )iX BxiiF X BX Bedx ()iiiyX B 模型模型212(2)()(2 )iX BxiipX Bedx 1()iiiiZFpX BixYXZX B是 的线性函数, 是 的非线性函数第18页/共29页(2) Probit 模型的边际分析22121)(ZeZfdZdpjjdZdx自变量的变化对响应概率(自变量的变化对响应概率(p)的影响:)的影响:2121( )2ZjjjjpdpZf ZexdZx(1 |

11、)()jjPYXXX一般情况下对连续变量,一般情况下对连续变量,X取样本均值,指的是取样本均值,指的是X在平均意义上在平均意义上每增加一个单位会导致事件发生的概率将会变化多少个单位。每增加一个单位会导致事件发生的概率将会变化多少个单位。第19页/共29页样本样本 i Y x 1 1 x12 0 x2 n 1 xn二、 二元选择模型的估计(ML)Yi 值值 1 0P iF (X B)i1F (X B)(成功)(成功)(失败)(失败)样本每次取值设为样本每次取值设为贝努里分布取值。贝努里分布取值。样本取值样本取值形式如图:形式如图:第20页/共29页P yyyFFnyyii(,)()()12011

12、XXii11()(1()niLFFiiyyiiXXln(ln()() ln()LyFyFiiinXXii111ln()()LyfFyfFiiiiiiin111X0i(1)()iiP yXFiX所以似然函数为:所以似然函数为:求驻点即可。求驻点即可。第21页/共29页三、 二元选择模型的显著性检验() /( ,)/()rurure ee ejFF j nke enk22(loglog) ( )rurLRLLj 2logPseudo R1logurrLL 3. 线性约束线性约束F检验检验4. 似然比检验似然比检验2. 准准R21. t 检验检验 (大样本下用正态分布大样本下用正态分布),re e

13、其中为有约束的模型的残差平方和.ure e 为无约束的模型的残差平方和j 为约束方程的个数为约束方程的个数01:RQHRQHrL其中 为有约束的ML估计得到的似然函数估计值urL为无约束的ML估计得到的似然函数估计值第22页/共29页例 技术采用分析模型及变量说明农户的技术采用变量f(社会关系情况变量;诱导因素变量;农户基本特征变量;生产要 素禀赋变量;风险变量;地区变量) 变量说明:农户的技术采用变量:农户是否采用除草剂(1是;0否)社会关系网络:本村亲友的户数诱导因素:村离最近的公路的距离;技术培训农户基本特征:户主年龄、性别、教育水平生产要素禀赋:家庭财产;非农劳动力;耕地面积风险因素:

14、近五年内是否向信用社贷过款地区影响:村级特征,县级虚变量四、二元选择模型的应用四、二元选择模型的应用第23页/共29页数据来源 根据全国粮食生产的区域布局,分别从东北、华北、华中和西南四个区域,采用分层随机抽样的方法,分别选取辽宁省的辽阳县、山东省的桓台县、湖南省的南县和广西的马山县4个县、40个乡镇、80个村、400个农户的样本,主要针对农民粮食生产技术的需求和采用行为进行调查,内容涉及县、乡、村各级的社会经济基本情况和农户特征、技术需求、技术采用等方面的内容,以及县乡两级农业技术推广部门情况。经过数据的分析整理得到关于农户粮食作物除草剂采用的有效样本397个。第24页/共29页数据描述分析

15、采用不采用采用不采用采用不采用采用不采用采用不采用被解释变量除草剂采用982633692896234948解释变量本村亲友数量3510312291424045024户主年龄50545054555352625254教育水平7486787576户主性别 男972573391786233144 女106311100184家庭财产14.823.8825.8520.1737.6334.6736.6878.2328.8324.32非农劳动力1222112322耕地面积12.488.003.854.0336.6051.304.864.1015.1812.08农业贷款2913013283909617小卖部距离

16、0.300.150.570.700.300.210.160.010.310.5620户时间18.4820.0016.8721.6121.5225.6316.5920.0018.4722.15 公路的距离9.304.012.952.375.2511.931.520.554.953.95 广播88211941491223117 农药经营部88211941491218519 农业技术培训782623269692230142平均湖南广西辽阳桓台第25页/共29页模型的估计 分别运用LPM、Logit 和Probit 模型进行回归STAT 命令:LPM: reg whwecidado tfrnum no

17、flhy hhgender hhag hhed lat cred famstords famclohtm vvpestsho vexttrain vtcrdistan hunan guangxi liaoyang Logit: logit whwecidado tfrnum noflhy hhgender hhag hhed lat cred famstords famclohtm vvpestsho vexttrain vtcrdistan hunan guangxi liaoyang Probit: probit whwecidado tfrnum noflhy hhgender hhag

18、 hhed lat cred famstords famclohtm vvpestsho vexttrain vtcrdistan hunan guangxi liaoyang 第26页/共29页不同模型回归结果比较 Probit Logit LPM 亲 友 数 量 0.008(2.28)* 0.015(2.14)* 0.001(1.87)* 家 庭 财 产 0.000(0.08) 0.001(0.14) 0.000(0.17) 非 农 劳 动 力 0.003(0.04) 0.031(0.23) 0.003(0.22) 户 主 性 别 -0.039(0.10) -0.350(0.47) -0.

19、020(0.30) 户 主 年 龄 -0.008(0.84) -0.016(0.92) -0.002(0.99) 教 育 水 平 0.074(2.03)* 0.148(2.15)* 0.012(2.02)* 耕 地 面 积 -0.003(1.41) -0.006(1.35) 0.000(1.16) 农 业 贷 款 0.120(0.54) 0.319(0.79) 0.019(0.53) 小 卖 部 距 离 0.078(0.72) 0.146(0.77) 0.009(0.43) 20 户 时 间 -0.010(1.66)* -0.018(1.61) -0.002(1.64) 农 药 经 营 部 0

20、.247(1.19) 0.437(1.15) 0.041(1.35) 技 术 培 训 0.142(0.43) 0.415(0.69) 0.022(0.48) 公 路 的 距 离 -0.005(0.49) -0.002(0.07) -0.001(0.57) 湖 南 0.031(0.07) 0.126(0.12) 0.010(0.21) 广 西 -1.872(5.07)* -3.591(4.53)* -0.345(7.55)* 辽 阳 -0.765(1.78)* -1.528(1.68)* -0.051(1.05) Constant 1.854(2.26)* 3.391(2.19)* 0.963(7.76)* 观 测 数 397 397 397 LR chi2(16)=90.13

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论