tobit与选择性样本ppt课件.ppt_第1页
tobit与选择性样本ppt课件.ppt_第2页
tobit与选择性样本ppt课件.ppt_第3页
tobit与选择性样本ppt课件.ppt_第4页
tobit与选择性样本ppt课件.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 Tobit模型与样本选择模型 2 Tobit模型 简单来说 当因变量在正值上连续但是还有很多机会取值为0 可以使用tobit模型 文献中有把tobit模型分为五类的说法 3 TypeITobit假设B 是预算约束下效用最大化得出的牛肉消费量 4 TypeIITobit 5 TypeIIItobitmodel 6 TypeIVtobitmodel 7 TypeVTobitmodel 8 截取 变量的分布与密度函数 1 从下截取已知根据条件概率公式密度函数为根据可以验证 9 2 从上截取当 10 2 截取变量的条件期望当不存在截取时 当存在从下截取时 式中 对于从上截取的情形 容易判断出 11 3 标准正态分布随机变量的截取期望经验分析中随机扰动项经常被假定服从正态分布 1 当 证明过程见靳云汇P237 2 推广当 12 第I类Tobit模型 在零值左截取的回归模型 1 模型 JamesTobin在1958年的文章 estimationofrelationshipsforlimiteddependentvariables 中 以家庭耐用消费品为例 讨论了当因变量y在0点被左截取的时候 如何估计x对y的影响 因此把在零值左截取的回归模型称为第I类Tobit模型 是最简单的一种情形 模型形式为 13 假定观察到 2 y的条件期望在截取的条件下 y的条件期望不再与y 相同 1 的概率分布首先看一下的概率 14 15 2 当时的条件期望其中 为逆米尔斯比 InverseMillsRatio 16 17 的期望 不同于上面的条件期望 有些文献中称为无条件期望 以区别于上面的条件期望 18 3 对于y的边际影响结论 在数据存在截取的情况下 对于y的边际影响通过两个渠道产生作用 首先影响 即观测值是否被截取的概率 其次是通过影响y 的大小 从而影响被观察到的y值的大小 当时 边际影响等于 19 第一类Tobit模型的估计 在零值左截取的回归模型 是截取模型中最简单的一种情形 20 1 ols估计有偏且不一致 1 1如果只对的数据进行简单的OLS估计 正确的模型应该为若遗漏掉中间部分 则还会导致残差项与解释变量相关 出现内生性问题 1 2若对全部数据进行OLS估计 问题会更严重 因为xy之间的正确模型为 21 2 TobitML估计 该似然函数由两部分组成 一部分对应于没有限制的观测值 是经典回归部分 一部分对应于受到限制的观测值 这是一个非标准的似然函数 它实际上是离散分布与连续分布的混合 22 若对上式进行再参数化 令可得 对上式极大化 应用牛顿法求解 然后求得原参数的估计量 注意 若不考虑截取数据情况下的最大似然估计等价于最小二乘估计 对于实际的截取数据 如果采用OLS估计 将得到有偏的估计结果 上述似然函数的假设 截取数据中不可观测的部分和可观测部分具有相同的分布 如果这一条件得不到满足 最大似然估计将遇到困难 这时可使用heckman两步估计 23 3 Tobit回归 也称为heckman两阶段法 或Heckit法 这种方法广泛运用于由于样本选择导致的断尾数据分析中 我们可以对截取数据进行tobit回归 得到系数的一致估计结果 步骤 第一 用全部数据采用probit模型 估计 代入得到的估计值 第二 用y 0的数据 进行y对x和的OLS估计 得到系数的一致估计 24 如果样本观测值不是以0为界 而是以某一个数值a为界 则有 估计原理与方法相同 25 第I类tobit模型的stata命令 Tobityx1x2 xk ll c ul c 26 断尾与选择性样本第II类Tobit模型 27 选择性样本与非随机样本 1 基于自变量的样本选择 外生样本选择的例子Saving b0 b1income b2age b3size u假设数据集是基于对35岁以上人群的调查 是对成年人的非随机样本 但仍能得到无偏和一致估计量 缺点是低效估计 2 基于因变量的样本选择 内生样本选择 28 第I类Tobit模型的缺点之一 是假设同一列变量及参数既决定截断的概率 又决定观测因变量的期望值 考虑进一步放松该假定 29 选择性样本模型 选择性样本模型扩展了克拉格的模型 放松其对模型两步骤相互独立的假设 模型的基本思路是 结果变量y仅当另一变量z满足某种条件时才可被观测 概念 当被解释变量y的断尾与另一变量z有关时 被称为偶然断尾或样本选择 z为选择变量 30 第II类TOBIT模型 概念 第II类TOBIT模型有时又被称为双变量样本选择模型 heckman选择模型 Probit选择模型 1 模型设定其一为 选择方程或叫参与方程其二为 结果方程或称水平方程y1和y2分别表示观察到的水平结果和参与结果 31 对于和 假定都具有线性形式 若不相关 则OLS能得到一致的估计结果 但在样本选择模型中 可把相关性看作是模型内在的固有特质 Berk Ray 即使模型被完美拟合 两项误差仍具共变性 两个模型在本质上受到相同的随即干扰 或共变的随机干扰 32 记x x1 x2 表示模型中所有的解释变量 在双变量样本选择模型中的基本假设如下 1 x和y1总可以观察到 但y2只有当y1 1时才能够被观察到 2 x1和x2为外生的解释变量 3 之所以将选择方程中的随机扰动项方差设为1 是因为后面采用probit方法对该方程进行估计 4 可以推出 33 2 y1与y2的概率分布对于选择结果y1 它的概率分布为 由于水平结果y2只有当y1 1时才能够被观察到 所以当y2连续时 只有讨论它的密度函数才有意义 34 根据贝叶斯法则 可知有 35 3 模型估计 部分ML估计 对于第II类Tobit模型 由于y2只有当y1 1时才能被观察到 因此不能采用全条件的ML估计 而采用部分ML估计法 即所建立的似然函数是以y1 1为条件的 因此所使用的只是部分观察到y2的样本 上面所推导的正是部分ML估计所需要和所能运用的密度函数 对所有观察到y2的样本的对数似然函数进行加总 并最大化 可以估计出 36 对于第i个样本 我们观察到它的样本结果的概率为 进而可构造双变量样本选择模型的对数似然函数 进一步求出待估计参数 37 4 模型估计 heckit方法 与第I类tobit类似 第II类tobti模型也可以采用heckit方法 首先对第II类Tobit模型中的条件期望进行推导 由于我们面对的是断尾数据 因此考虑是有意义的 因为 38 所以这就是heckman两阶段程序即heckit方法中的估计方程 从中可以看出 如果 那么即使用有选择的样本来进行OLS估计 仍然可以得到x2对于y2的一致影响 39 但是当时 OLS估计会遗漏掉 从而产生遗漏变量的问题 被称为选择偏差 逆米尔斯比也称为控制函数 用于控制选择性偏差 步骤总结 在第一阶段的估计中 对所有的观测对象 用y1对x1进行probit估计 得到进而得到逆米尔斯比的估计值 第二阶段中 用观察到的y2对x2和进行OLS估计 从而得到 40 检验 即第二阶段回归方程中逆米尔斯比的系数 由于该回归方程中的随机扰动项具有异方差性 对该系数的检验可通过Wald检验来完成 当检验的结果拒绝原假设时 表明出现了基于未观测变量的选择性 即影响水平的没有观察到的变量同时也影响了选择的结果 或者与选择方程中的残差项相关 所研究的问题存在选择问题及选择性偏差 41 5 对heckit方法的说明 1 对的解释 它的符号能够反映出参与方程与选择方程中没有被观察到的误差之间的相关关系 如果 意味着他们之间为负的相关关系 因此不仅存在选择偏差 而且意味着向下的数据截取 即选择进来的样本具有较低的y2取值 而观察不到那些取值较高的y2 42 2 关于正态分布 对的估计 非常依赖于对正态分布的假设 而且估计的结果对该假设也非常敏感 当该假设不满足时 的估计结果就会存在很大问题 计量经济学家试图用高阶的多项式来表述选择项 从而克服正态分布的局限性 除此之外 如果我们能对的分布进行合理的其他形式假设 仍可采用ML方法 与Heckit两阶段估计相比 ML估计量更有效 但是ML方法比heckit更依赖于分布函数的假设 因此heckit方法更稳健 43 3 模型的识别条件 在采用heckit方法对第II类tobit模型进行估计时 我们要求 即x2是x1的真子集 也就是说影响选择方程的解释变量至少有一个不影响结果方程 而影响结果方程的解释变量一定都包含在选择方程中 没有包含在结果方程中的解释变量称为 排除约束 我们可以这样理解 尽管逆米尔斯比为x1的非线性函数 但它通常可以很好地由一个线性函数来近似 如果x1 x2 就会造成与x2的高度相关 从而出现多重共线性 参数估计的方差极大 44 4 与第I类tobit模型的比较第I类tobit模型以常数0为左截取点 虽然它也采用了隐性变量的模型结构 但在该模型中 仅仅是y 自身的取值大小影响其被观察到的数值大小 与之相比 第II类tobit模型明确提出了选择方程和结果方程 这两个方程是不一样的 并分别进行了估计 第I类tobit模型中 影响数据截取的变量及系数与影响数据水平结果的变量及系数完全一样 但在第II类tobit模型中 影响数据截取 45 的变量x1及其系数与影响结果的变量x2及其系数是有区别的 因此第II类tobit模型有时又被称为一般化的tobit模型 46 样本选择模型的估计 简单OLS估计Heckman两步估计最大似然估计 47 Stata的相关命令 断尾 截取和选择性样本 truncregyx1x2x3 ll lowerlimit 左边断尾 truncregyx1x2x3 ul upperlimit 右边断尾 truncregyx1x2x3 ll ul lowerandupperlimit 双边断尾 截取回归 tobityx1x2x3 ll tobityx1x2x3 ul tobityx1x2x3 ll ul heckmanyx1x2x3 select z1z2 默认MLE 选择方程的被解释变量为y heckmanyx1x2x3 select z1z2 twostep 两步法 选择方程的被解释变量为y 48 Stata的相关命令 heckmanyx1x2x3 select w z1z2 默认MLE 选择方程的被解释变量为w heckmanyx1x2x3 select w z1z2 twostep 选择方程的被解释变量为w Select方程中因变量应该为0 1变量 因此如果缺省的话 则y的观测值缺失被认为没有参与 反之视为参与 Cnreg 对更复杂的截取情况的模型进行估计 允许每个观察对象拥有各自的截取点 因此使用这个命令时还需要生成一个特殊的变量 取值为 1代表左截取 0表示无截取 1表示右截取 49 Examplefromwoold

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论