




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020/6/9,1,关于虚拟因变量的回归:线性概率模型、对数单位、概率单位及托比模型,1、虚拟应变量2、线性概率模型(LPM)3、线性概率模型的估计问题4、一个线性概率模型的例子5、线性概率模型的应用6、线性概率模型以外的其他方法7、对数单位模型8、对数单位模型的估计9、对数单位模型例子10、概率单位模型11、概率单位模型的例子12、托比模型,2020/6/9,2,12.1虚拟应变量,在前面所考虑的虚拟变量回归模型中,我们隐含假定应变量Y是定量的,而解释变量是定量的、定性的或二者兼有。然而有的应变量可以是二分性质的。如一个人或者在劳动力行列中或者不在,从而劳动力参与这个应变量只能取两个值:如果这个人在劳动力行列中,则取值1;如果不在其中则取值0。又如考察学院教授是不是属于工会成员,因此工会会员资格这个应变量就是一个取值0或1的虚拟变量:0表示非工会会员,1表示工会会员。,2020/6/9,3,1虚拟因变量,这些例子的一个特性是,因变量属于仅要求回答是或否这样一种类型;就是说它是二分类的。处理二分类变量有四种模型:1.线性概率模型2.对数单位模型3.概率单位模型4.托比单位模型,2020/6/9,4,2线性概率模型,为了建立概念,考虑如下模型:(12.2.1)其中X=家庭收入Y=1如果该家庭拥有住宅=0如果该家庭不拥有住宅该模型把二分变量表达为解释变量的函数。像(12.2.1)这样的模型,称为线性概率模型。因为,在给定下的条件期望可解释为在给定下事件(家庭拥有住宅)将发生的条件概率,即,2020/6/9,5,2线性概率模型,假定,我们得到:(12.2.2)现在,令(即事件发生)的概率,而(即事件不发生)的概率。由数学期望定义有:(12.2.3)比较(12.2.2)和(12.2.3)得:(12.2.4),2020/6/9,6,2线性概率模型,就是说,模型(12.2.1)的条件期望事实上可解释为Y的条件概率。条件概率必须落在0与1之间。即:,2020/6/9,7,3线性概率模型的估计问题,我们不能用标准的OLS法去估计线性概率模型。因为有以下一些问题:1.干扰项的非正态性为了统计推断的目的我们假设干扰项服从正态分布。但在线性概率模型中干扰项的正态性不成立。我们把(12.2.1)写为:(12.3.1)当时:当时:(12.3.2),2020/6/9,8,3线性概率模型的估计问题,显然,我们不再可能假定干扰项是正态分布的:实际上,它遵循二项分布。2.干扰项的异方差性由(12.3.2)中可以得到的概率分布:当概率为;当概率为,进而可得到:(12.3.4),出现异方差时,OLS估计虽然无偏,但不是有效,即OLS估计量不具有最小方差性。,2020/6/9,9,3线性概率模型的估计问题,方程(12.3.4)表明误差项的方差为异方差性。解决异方差问题的一个方法是进行数据变换,将模型(12.2.1)的两边除以即,得:(12.3.5),2020/6/9,10,3线性概率模型的估计问题,(12.3.5)中的干扰必定是同方差性的了。真是不知道的,从而权是不知道的,为了估计,可采用如下两步法:1。对(12.2.1)作最小二乘回归,暂且撇开异方差性问题。于是得到真的OLS估计值。再由此求的估计值2。用估计值做如同(12.3.5)的数据变换,然后对变换后的数据做OLS回归。,2020/6/9,11,3线性概率模型的估计问题,3.不被满足在线性概率模型中的估计量不一定在0和1之间,解决的办法是当小于0时取0,大于1时取1。4.可疑的拟合优度:值在二分模型中计算出来的值较低。,2020/6/9,12,4线性概率模型:一个数值例子,我们用一个数值例子来说明线性概率模型的一些问题。表16.1给出40各家庭的住宅所有权Y(1拥有住宅,0不拥有住宅)和家庭收入X(千美元)的虚构数据。根据这些数据,用OLS估计的线性概率模型如下:(0.1128)(0.0082)t(-7.6984)(12.515)(12.4.1),2020/6/9,13,4线性概率模型:一个数值例子,首先我们来解释这一回归。截距值-0.9457给出零收入的家庭拥有自己的住房的概率。由于是负值,而概率又不可能是负值,我们就把该值当作零看待,这样做在本例中是说得过去的。斜率值0.1021意味着收入每增加1单位,平均地说拥有住宅的概率增加0.1021或约10。当然,对某一给定的收入水平,我们可以从(12.4.1)估计出拥有住宅的实际概率。例如,对于X12(12000美元),估计拥有住宅的概率是,2020/6/9,14,4线性概率模型:一个数值例子,0.2795就是说,收入为12000美元的家庭拥有住宅的概率为28。对于上面的估计受异方差的影响,因此我们可以用WLS来获得更有效的估计值。由于某些是负的,和某些大于1,对于这些来说,将是负的,因此删去这些值。得到的WLS回归为:,2020/6/9,15,4线性概率模型:一个数值例子,(0.1206)(0.0069)t(-10.332)(17.454)(16.4.2),2020/6/9,16,5线性概率模型的应用,例16.1:科恩-雷-勒曼研究在为美国劳工部做的一项研究工作中,科恩、雷和勒曼把各类劳工的“劳动力参与”当作一些社会人口统计变量的函数来分析。在所有的回归中应变量都是一个虚拟变量:如果一个人参与劳动队伍,它就取值1;如果不参与取值0。在表16.3中我们复制了他们几个虚拟变量回归中的一个。上述回归是用OLS估计的,后又对它进行异方差校正,由于是大样本所以结果相差不大,t检验和F检验,2020/6/9,17,5线性概率模型的应用,现在转到对结果的解释,每一斜率系数都给出对应于解释变量的一个给定单位变化,事件发生的条件概率的变化率。比如说,变量“65岁及以上”的系数-0.2753表示在保持其他因素不变的情况下,该年龄组的妇女参与劳动的概率要低出27。现在考虑婚姻状况和年龄的交互作用。表中数据表明,从未结婚的女人(和基底类相比),,2020/6/9,18,5线性概率模型的应用,其劳动力参与概率要高出29,而年龄为65岁及以上的妇女,劳动参与概率要低出28。以下依此类推。仿照以上的程序,不难解释表16.3中其余系数。例16.2对债券评级的预测(P545)例16.3预测债券违约(P546),2020/6/9,19,6线性概率模型以外的其他方法,线性概率模型的根本问题在于其在逻辑上不是一个很有吸引力的模型,因为它假定随X而线性地增加,即X的边际或增补效应一直保持不变。这显然不现实。因此我们需要的是具有如下二分性质的模型:(1)随着增加,也增加,但不超出0-1这个区间。(2)和之间是非线性的,即”随着变小概率趋于零的速度越来越慢,,2020/6/9,20,6线性概率模型以外的其他方法,而随着变得很大,概率趋于1的速度也越来越慢”。因此下面我们将讨论满足这些条件的对数单位模型和概率单位模型。,2020/6/9,21,7对数单位模型,我们用住房所有权的例子说明对数单位模型的基本概念。解释住房所有权对收入的线性关系时的线性概率模型曾是:(12.7.1)其中X为收入,而Y1表示家庭拥有住房,但现在考虑如下住房所有权的表达式:(12.7.2),2020/6/9,22,7对数单位模型,(12.7.2)可以写成:(12.7.3)其中方程(12.7.3)代表一个(累积)逻辑斯蒂分布函数为名的模型。随着从变到,从0变到1,而且对有非线性关系,这样就满足了上述两点要求。,2020/6/9,23,0,P,1,CDF,-,X,图16.2累计分布函数(CDF),2020/6/9,24,在进行估计时我们可以将(12.7.2)化成线性形式进行估计,拥有住房的概率为,则不拥有住房的概率是:(12.7.4)因此,可得:(12.7.5),2020/6/9,25,7对数单位模型,现在就是有利于拥有住房的机会比率一个家庭将拥有住房的概率对不拥有住房的概率之比。对(12.7.5)取自然对数得:(12.7.6)即机会比率的对数不仅对为线性,而且对参数也是线性。被称为对数单位模型(Logit)。,2020/6/9,26,7对数单位模型,像(12.7.6)这样的模型取名为对数单位模型对数模型的特点:1、从0变到1,对数单位从变到2、虽然对为线性,但概率本身却不然。对LPM模型,概率随X而线性地增大。3、斜率系数给出每单位变化的的变化,它告知人们随着收入变化一单位,有利于拥有住房的对数机会比率是怎样变化的。截距是当收入为零时的有利于拥有住房的对数机会比率的值。,2020/6/9,27,7对数单位模型,4、对给定的某个收入水平,我们其实想估计的并不是有利于拥有住房的机会比,而是拥有住房本身的概率。但根据1和2的估计值很容易求出拥有住房的概率P.5、对数单位模型假定机会比率的对数与有线性关系。,2020/6/9,28,8对数单位模型的估计,把对数单位模型写成如下形式:如果对这个模型用微观数据直接估计会遇到一些问题,例如当或时,取不到有意义的值,在这种情形下只有用最大似然估计求解。另外的一种估计方法,当我们拥有的数据如下表所示时可以用OLS求解。,2020/6/9,29,8对数单位模型的估计,表16.4,2020/6/9,30,8对数单位模型的估计,根据上表的数据求出利用估计的可以得到估计的对数单位线性模型。这时还不能用OLS直接估计,因为随机误差项的性质还没考虑。,2020/6/9,31,8对数单位模型的估计,随机误差项的满足如下分布:显然模型中存在异方差,因此我们考虑使用加权最小二乘法,权重取。用代替则可求出。,2020/6/9,32,8对数单位模型的估计,总结估计对数单位模型的各个步骤:1、对每一收入水平,计算拥有住房的概率。2、求每一的对数单位3、作如下变换消除异方差,其中。4、用过原点回顾的OLS估计上式。5、按普通最小二乘法建立置信区间和假设检验。,2020/6/9,33,(加权最小二乘法:教材11.6,P371),对于对数单位模型,2020/6/9,34,9对数单位模型的例子,这里只是通过演算一个数值问题,以促进对对数单位模型的理解(具体数据见表16.5)。用加权最小二乘法可以求出如下结果:对于系数经济意义的解释可以参照书上的解释。,2020/6/9,35,10概率单位模型,为了解释二分应变量,有必要使用适当CDF。对数单位模型使用的是累积逻辑斯蒂函数。在实际应用中发现正态CDF效果也不错。使用正态CDF的估计模型通常称为概率单位模型。引入概率单位模型有两种途径:一是模仿前面逻辑斯蒂函数的形式,直接用正态分布函数替换;二是依据麦克法登的效用理论或行为的理性选择引入概率单位模型。,2020/6/9,36,10概率单位模型,下面根据效用理论阐明使用概率单位模型的动机。表示一种不可观测的效用指数,表示收入,仍然研究家庭拥有住房的概率。当越大时,认为拥有住房的概率越大。现在假定有这样一个临界值,当时,该家庭拥有住房,否则不拥有。,2020/6/9,37,10概率单位模型,在正态性假定下,的概率可由标准化正态CDF算出。t是标准化正态变量,。,2020/6/9,38,10概率单位模型,1,(a),(b),2020/6/9,39,10概率单位模型,根据获得关于效用函数以及和的信息,可得到:如果我们掌握了表16.7的分组数据,便可由计算出,一旦有了,就可很轻松的估计和在对数单位分析中,被称为正态等效离差(n.e.d.)。当时,将是负数,在实际中通常把5加到上,其结果称为概率单位.,2020/6/9,40,10概率单位模型,现在估计和。通过下面的式子:概率单位模型的估计步骤:1、从分组数据中估计出。2、根据,从标准正态CDF中求出n.e.d.3、用最为回归的应变量。4、由于随机误差项存在异方差,因此还要进行数据转换或用WLS估计出最后结果。5、用普通方式进行假设检验,但得到的结果只在大样本下有效,同时已没有多大价值,2020/6/9,41,11概率单位模型的例子,根据表16.8所给的数据,可以估计出如下结果。以n.e.d.作为应变量:以概率单位作为应变量:除截距外,两种回归结果没有差别。,2020/6/9,42,11概率单位模型的例子,比较对数单位与概率单位的估计值虽然对数单位模型和概率单位模型给出性质相同的结果,但是两个模型参数的估计值不可直接比较。一般两者参数有如下关系:另外,LPM的系数与对数单位模型的系数有如下关系:不含截距项时含有截距项时,2020/6/9,43,图16.6对数单位与概率单位的累计分布图,概率单位累计分布,对数单位累计分布,2020/6/9,44,三类模型回归系数比较,线性概率模型LPM,对数单位模型logit-M,概率单位模型probit-M,线性概率模型LPM,斜率系数直接测出X单位变化引起的事件发生的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 4064-5:2025 EN Water meters for cold potable water and hot water - Part 5: Installation requirements
- 自由搏击活动方案
- 航材考试题及答案
- 广联达钢筋考试题及答案
- 全新劳务用工书面合同
- 心中那份感动抒情文15篇
- 防疫技能考试题及答案
- 法语高考试题及答案
- 企业人力资源优化策略和员工关系协调表
- (正式版)DB15∕T 3383-2024 《呼伦贝尔羊羔羊育肥全混合颗粒日粮配制与饲养技术规程》
- 高中语文部编版必修上册第一单元检测
- 2025年软件开发工程师面试宝典及编程技能测试题目
- 2025-2026学年鲁科版(五四学制)(2024)初中生物六年级上册教学计划及进度表
- DB32∕T 3957-2020 化工企业安全生产信息化管理平台数据规范
- 高中班主任关于学生心理问题疏导的具体做法
- 2025-2026学年高一上学期《树立正确三观:从庞众望的成长看青春担当》主题班会课件
- 初级注册安全工程师实务试题及答案
- 校园招聘双选会活动方案
- 《无机化学》第六版 课件 第1章 物质及其变化
- 4M变更管理培训
- 2025年天文知识竞赛试题及答案
评论
0/150
提交评论