




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Logit 模型 Logit模型假定模型的误差项服从Logistic分布 利用极大似然估计方法拟合, Yhat=0 负的产出 Yhat0(通常yhat=1) 正的产出1(1| )(| )() 11iiiiiiep yE yee x x x xxx 第1页/共42页 例如: sysuse auto,clear logit foreign weight mpg 相当于计算如下概率: Pr(foreign = 1) = F(B0 + B1weight + B2mpg)第2页/共42页 1。获得个体取值为1的概率。 predict p1,pr list p1 foreign 对比一下结果,判断有正有误
2、 2。对预测准确率的判断 estat class 结果解读第3页/共42页 敏感性(Sensitivity)指 即真实值取1而预测准确的概率; 特异性(Specificity)是指 即真实值取0而预测准确的概率。 默认的门限值为0.5。Pr(1|1)iiyyPr(0|0)iiyy第4页/共42页 3。受试者操控曲线(Receiver operating characteristic,简称为ROC曲线)是指敏感性与(1-特异性)的散点图,即预测值等于1的准确率与错误率的散点图。 lroc 4。goodness-of-fit 拟合优度检验 estat gof 5。变量的边际影响 回归结果中,估计量
3、并非“边际效应”(marginal effects),因此要用命令: mfx第5页/共42页Probit模型 Probit模型假定误差项的分布形式为标准正态分布: 回归方法和检验方法与Logit模型类似。 probit foreign weight mpg221(1| )(| )()2itiiip yE yedt x xxx 第6页/共42页 注意:由于Probit 与Logit 所使用的分布函数不同,其参数估计值并不直接可比。雨宫(Amemiya)提出:同一个模型的logit和probit模型大概具有如下关系: Blogit 约等于 1.6*BProbit 但利用mfx计算的两者的边际效应应
4、该大致相同。第7页/共42页一个综合例子 使用美国妇女就业数据集“womenwork.dta”,估计决定就业的Probit与Logit模型。被解释变量为work=1,就业;work=0,不就业。解释变量为age(年龄), married(婚否), children(子女数), education(教育年限)。 第8页/共42页 use womenwork,clear logit work age married children education mfx estat class predict p1,pr list work p1 lroc estat gof 注意:married是离散变量
5、,因此执行mfx后的结果的含义不同。第9页/共42页 probit work age married children education mfx estat class predict p2,pr list work p2 lroc estat gof tab work tab work if p20.5第10页/共42页2。多项选择模型多项Logit模型:由于可选项目有多项,因此输出结果时stata将自动指定一个为基础类别(Base Output),显示各个变量对另外几个类别的影响系数 。第11页/共42页 use brand,clear tab brand mlogit brand ag
6、e female 结果分析 可以利用predict提取个体选择概率 predict p1 p2 p3 list 可以根据研究需要,自由地指定用来比较的base outcome(参照点)。mlogit brand age female,base(3)第12页/共42页排序选择模型 根据GSS的调查数据,不同的家庭母亲与子女之间的关系也不同。根据调查显示,有的家庭母子(女)关系比较紧张,有的比较融洽。变量包括:warm=关系融洽度(0、1、2、3);educ=子女接受教育的程度;age=子女年龄;male=儿子;prst=职业威望;white=白人;y89=89年调查结果。分析不同因素对母子(女)
7、关系的融洽程度有何影响。第13页/共42页 use ordwarm,clear tab warm 建立如下方程:012345689warmeducagemaleprstwhiteyru第14页/共42页 ologit warm ed age male prst white yr89 oprobit warm ed age male prst white yr89 结果解读 predict p1 p2 p3 p4 list p1 p2 p3 p4iMiiiiyMyyyy若若若若32211210第15页/共42页第16页/共42页计数模型 1。泊松回归 2。负二项回归第17页/共42页泊松回归模型
8、 有些被解释变量只能取非负整数,即0,1, 2, .,对于这一类“计数数据” ,常使用“泊松回归”(Poisson regression)。 yi =1, 2,。 我们知道,泊松分布的最大特点是条件期望和方差相等。即()()iiiiiE y xVar y x !iyiiyeyPii第18页/共42页 利用数据集poissonreg.dta估计决定初中生旷课天数(daysabs)的计数模型。解释变量为langarts(语言艺术课成绩)与male(是否男性)。 use poissonreg,clear poisson daysabs langarts male predict p1,n list
9、mfx estat gof第19页/共42页 泊松MLE分析常常受到很多限制,如泊松分布的所有概率以及更高阶矩完全由其均值决定,特别是方差等于均值这一点有明显的局限性。事实表明,大多数应用都难以满足这一条件。如果被解释变量的方差明显大于期望,即存在“过度分散”(overdispersion) 因此,如果出现“过度分散”,可以考虑使用“负二项回归”。第20页/共42页负二项回归模型 所谓负二项分布是指,在独立的实验中,成功n次的时候,失败次数x的概率分布。当成功n次时,实验停止,此时失败次数为x,那么总的实验次数为(n+x),而且最后一次(即第(n+x)次)是成功的。那么,前(n+x-1)次试验
10、中成功次数为(n-1)、失败次数为x。负二项分布适用于当试验成功的次数(n)确定下来后,试验失败的次数(x)的分布。第21页/共42页 nbreg daysabs langarts male 命令结果中将提供一个LR 检验, 原假设:不存在过度分散,应该使用泊松回归。此时alpha=0。 备则假设: alpha0,不能使用泊松回归。第22页/共42页受限因变量模型 1。断尾回归 2。截取回归第23页/共42页断尾回归 对于线性模型yi =xB+i,假设由于某种原因,只有满足yi c ( c为常数)的数据才能观测到。因此,当yi =10000第25页/共42页截取回归 对于线性模型yi =xB+
11、i,如果满足yi c或者( yi c)( c为常数),使得yi=c。 截取回归与断尾回归不同的是,我们虽然有全部的观测数据,但对于某些观测数据,被 解释变量yi被压缩在一个点上了。此时, yi的概率分布就变成由一个离散点与一个连续分布所组成的“混合分布”。第26页/共42页 tobit y x1 x2 x3,ll(#) (变量#的被右截断) tobit y x1 x2 x3,ll(#) ul(#)(l同时定义下限和上限)第27页/共42页 利用womenwork.dta的数据进行普通OLS回归和截取回归。被解释变量为lwf(log of wage if working and 0 if not
12、 working)。解释变量为age(年龄), married(婚否), children(子女数), education(教育年限)。 use womenwork,clear reg lwf age married children education tobit lwf age married children education,ll(0) 第28页/共42页随机数的产生和常用分布 例1:产生10000个服从0,1均匀分布的随机数和10000个服从正态分布的随机数。 clear set obs 10000 gen x = uniform() histogram x gen y = inv
13、normal(uniform() histogram y, normal第29页/共42页伪随机数 例二: clear set obs 10000 gen x1 = uniform() gen x2 = uniform() list x1 x2 in 1/50 但是如果加上一句话:set seed 123,情况会发生变化。第30页/共42页 set seed 12345 gen x3 = uniform() set seed 12345 gen x4 = uniform() list x3 x4 in 1/50 第31页/共42页 原因:计算机产生的随机数是伪随机数,它是通过一个或者多个复杂的
14、公式计算出来的,是有迹可寻的。 例如:公式可以为: X_j = (a*X_(j-1) + c) mod m (j = 1,2, .)其中:m是一个很大的数; a*X_(j-1)为种子。 蒙特卡罗模拟和自抽样一般都要提供种子,已被检验和分析。第32页/共42页常用分布随机数的产生 findit rnd1。自由度为k的chi2 分布 Chi2(k) clear rndchi 10000 5 histogram xc, normal特点:向右拖尾。2。自由度为k的t分布 t(k) clear rndt 10000 5 histogram xt, normal特点:尖峰厚尾第33页/共42页 3。自由
15、度为k1,k2的F分布 clear rndf 1000 3 20 histogram xf 4。参数为的指数分布: clear rndexp 10000 3 histogram xe 更多的统计分布量察看 help rnd第34页/共42页自抽样(Bootstrap) 实质:可重复抽样 通过一个简单例子说明基本原理:1-9九个数求均值。 clear input x 输入1-9九个数 保存为sample.dta use sample,clear bsample 9 list 反复执行:可以发现每次不同的重复抽样。第35页/共42页 利用Bootstrap命令实现模拟: use sample,cl
16、ear bootstrap x_m = r(mean), reps(500) saving(sample1,replace): sum x 或者简写为: bs x_m = r(mean), reps(500) saving(sample1,replace): sum x use sample1,clear sum x_m第36页/共42页使用BS得到标准误 sysuse auto,clear 普通回归: reg price weight length foreign 利用BS方法:reg price weight length foreign,vce(bs,reps(500) 或者使用下列方法
17、: bootstrap, reps(500):reg price weight length foreign第37页/共42页蒙特卡罗模拟 基本思想: 向这个正方形随机地射箭,并假设其落点在该正方形上服从二维均匀分布。重复实验n 次(n 很大),其中有m 次落在1/4圆内。根据大数定律,m/n/4 ,故 4m/n。第38页/共42页模拟中心极限定理 根据中心极限定理(CLT),当样本容量n 时,样本均值收敛于正态分布。假设x 服从在(0,1) 上的均匀分布,样本容量为30,我们用蒙特卡罗法得到样本均值的分布,并将其与正态分布相比较。为此,抽取10,000 个样本容量为30 的随机样本,得到30个样本均值的10,000 个观测值,然后画其直方图。第39页/共42页 建立程序:lnsim.ado cap program drop lnsim p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 地区安全主任培训课件
- 国网公司节后安全培训课件
- 年度安全承诺书培训课件
- 乡镇政府网站、政务新媒体信息发布三审三校制度
- 拆除工程材料运输车辆调度方案
- 16. 难忘师生情教学设计-2025-2026学年小学美术岭南版六年级下册-岭南版
- 2025年安全生产标准化总结分析(6篇)
- 2025年租房合同范本简化版
- 毕业论文致谢7篇
- 毕业设计(论文)致谢6篇
- 宫颈息肉课件
- 人工智能多智能体课件
- 2024年云南地质工程勘察设计研究院有限公司招聘笔试真题及答案
- 2025秋苏教版科学三年级上册教学设计(附目录)
- 五年级数学思维训练教学计划
- 项目一实验动物初步认识与安全接触任务一认识理解并善待实验动
- 2025年智能楼宇管理师(中级)考试试卷:绿色建筑与能源管理
- 2026版《三维设计》高三一轮复习物理第八章 机械振动和机械波
- 新兵入营安排活动方案
- 2025届湖南中考化学真题试卷【含答案】
- 安全教育培训记录表
评论
0/150
提交评论