版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、选择模型课件 1 通常的经济计量模型都假定因变量是连续的,但是在通常的经济计量模型都假定因变量是连续的,但是在 现实的经济决策中经常面临许多选择问题。人们需要在可现实的经济决策中经常面临许多选择问题。人们需要在可 供选择的有限多个方案中作出选择,与通常被解释变量是供选择的有限多个方案中作出选择,与通常被解释变量是 连续变量的假设相反,此时因变量只取有限多个离散的值。连续变量的假设相反,此时因变量只取有限多个离散的值。 例如,人们对交通工具的选择:地铁、公共汽车或出租车;例如,人们对交通工具的选择:地铁、公共汽车或出租车; 投资决策中,是投资股票还是房地产。以这样的决策结果投资决策中,是投资股票
2、还是房地产。以这样的决策结果 作为被解释变量建立的计量经济模型,称为离散被解释变作为被解释变量建立的计量经济模型,称为离散被解释变 量数据计量经济学模型(量数据计量经济学模型(models with discrete dependent variables),或者称为离散选择模型),或者称为离散选择模型(discrete choice model, DCM)。 选择模型课件 2 在实际中,还会经常遇到因变量受到某种限制的情况,在实际中,还会经常遇到因变量受到某种限制的情况, 这种情况下,取得的样本数据来自总体的一个子集,可能这种情况下,取得的样本数据来自总体的一个子集,可能 不能完全反映总体。
3、这时需要建立的经济计量模型称为受不能完全反映总体。这时需要建立的经济计量模型称为受 限因变量模型(限因变量模型(limited dependent variable model)。这两。这两 类模型经常用于调查数据的分析中。类模型经常用于调查数据的分析中。 选择模型课件 3 在离散选择模型中,最简单的情形是在两个可供选择的在离散选择模型中,最简单的情形是在两个可供选择的 方案中选择其一,此时被解释变量只取两个值,称为二元选方案中选择其一,此时被解释变量只取两个值,称为二元选 择模型(择模型(binary choice model)。在实际生活中,我们经常)。在实际生活中,我们经常 遇到二元选择
4、问题。例如,在买车与不买车的选择中,买车遇到二元选择问题。例如,在买车与不买车的选择中,买车 记为记为1,不买记为,不买记为0。是否买车与两类因素有关系:一类是车。是否买车与两类因素有关系:一类是车 本身所具有的属性,如价格、型号等;另一类是决策者所具本身所具有的属性,如价格、型号等;另一类是决策者所具 有的属性如收入水平、对车的偏好程度等。如果我们要研究有的属性如收入水平、对车的偏好程度等。如果我们要研究 是否买车与收入之间的关系,即研究具有某一收入水平的个是否买车与收入之间的关系,即研究具有某一收入水平的个 体买车的可能性。因此,二元选择模型的目的是研究具有给体买车的可能性。因此,二元选择
5、模型的目的是研究具有给 定特征的个体作某种而不作另一种选择的概率。定特征的个体作某种而不作另一种选择的概率。 选择模型课件 4 为了深刻地理解二元选择模型,首先从最简单的线性概率为了深刻地理解二元选择模型,首先从最简单的线性概率 模型开始讨论。线性概率模型的回归形式为:模型开始讨论。线性概率模型的回归形式为: (7.1.1) 其中:其中:N是样本容量;是样本容量;k是解释变量个数;是解释变量个数;xj为第为第j个个体特征个个体特征 的取值。例如,的取值。例如,x1表示收入表示收入;x2表示汽车的价格表示汽车的价格;x3表示消费表示消费 者的偏好等。设者的偏好等。设 yi 表示取值表示取值为为0
6、和和1的离散型随机变量:的离散型随机变量: 式(式(7.1.1)中)中ui为相互独立且均值为为相互独立且均值为0的随机扰动项。的随机扰动项。 ikikiii uxxxy 2211 Ni,2,1 0 1 i y 择(如不买车)如果作出的是第二种选 择(如买车)如果作出的是第一种选 选择模型课件 5 令令pi = P ( yi =1) ,那么那么 1 - pi = P ( yi =0) ,于是于是 (7.1.2) 又因为又因为E(ui ) = 0 ,所以,所以 E(yi ) = xi ,xi =(x1i , x2i , xki ), =( 1 , 2 , k ) ,从而有下面的等式:从而有下面的等
7、式: (7.1.3) iiii pyPyPyE)0(0) 1(1)( xi iii pyPyE) 1()( 选择模型课件 6 式式(7.1.3)只有当只有当xi 的取值在的取值在(0,1)之间时才成立,否则就会之间时才成立,否则就会 产生矛盾,而在实际应用时很可能超出这个范围。因此,线性产生矛盾,而在实际应用时很可能超出这个范围。因此,线性 概率模型常常写成下面的形式:概率模型常常写成下面的形式: (7.1.4) 此时就可以把因变量看成是一个概率。此时就可以把因变量看成是一个概率。 那么扰动项的方差为:那么扰动项的方差为: (7.1.5) 或或 (7.1.6) 0, 0 1, 1 10, x
8、x xx i i ii i p )1 ()1 ()()1 ()( 222 iiiiiii ppppuExx )(1)()( 22 iiii yEyEuE 选择模型课件 7 由此可以看出,误差项具有异方差性。异方差性使得参由此可以看出,误差项具有异方差性。异方差性使得参 数估计不再是有效的,修正异方差的一个方法就是使用加权数估计不再是有效的,修正异方差的一个方法就是使用加权 最小二乘估计。但是加权最小二乘法无法保证预测值最小二乘估计。但是加权最小二乘法无法保证预测值在在(0,1) 之内,这是线性概率模型一个严重的弱点。由于上述问题,之内,这是线性概率模型一个严重的弱点。由于上述问题, 我们考虑对
9、线性概率模型进行一些变换,由此得到下面要讨我们考虑对线性概率模型进行一些变换,由此得到下面要讨 论的模型。论的模型。 假设有一个未被观察到的潜在变量假设有一个未被观察到的潜在变量yi*,它与,它与xi之间具有之间具有 线性关系,即线性关系,即 (7.1.7) 其中:其中: ui*是扰动项。是扰动项。yi和和yi*的关系如下:的关系如下: (7.1.8) * iii uyx 00 01 * * i i i y y y 选择模型课件 8 yi*大于临界值大于临界值0时,时,yi =1;小于等于;小于等于0时,时,yi =0。这里把。这里把 临界值选为临界值选为0,但事实上只要,但事实上只要xi包含
10、有常数项,临界值的选择包含有常数项,临界值的选择 就是无关的,所以不妨设为就是无关的,所以不妨设为0。这样。这样 (7.1.9) 其中:其中:F是是ui*的分布函数,要求它是一个连续函数,并且是的分布函数,要求它是一个连续函数,并且是 单调递增的。因此,原始的回归模型可以看成如下的一个回单调递增的。因此,原始的回归模型可以看成如下的一个回 归模型:归模型: (7.1.10) 即即yi关于它的条件均值的一个回归。关于它的条件均值的一个回归。 )()()0(),|0( )(1)()0(),|1( * * xxx xxx iiiiii iiiiii FuPyPyP FuPyPyP iii uFyx1
11、 选择模型课件 9 分布函数的类型决定了二元选择模型的类型,根据分布函分布函数的类型决定了二元选择模型的类型,根据分布函 数数F的不同,二元选择模型可以有不同的类型,常用的二元选择的不同,二元选择模型可以有不同的类型,常用的二元选择 模型如表模型如表7.1所示:所示: ui*对应的分布对应的分布分布函数分布函数F 相应的二元选择模型相应的二元选择模型 标准正态分布标准正态分布Probit 模型模型 逻辑分布逻辑分布Logit 模型模型 极值分布极值分布Extreme模型模型 )(x )1 ( xx ee )exp(1 x e 选择模型课件 10 二元选择模型一般采用极大似然估计。似然函数为二元
12、选择模型一般采用极大似然估计。似然函数为 (7.1.11) 即即 (7.1.12) 对数似然函数为对数似然函数为 (7.1.13) 01 )()(1 ii yy ii FFLxx N i y i y i ii FFL 1 1 )(1 )(xx N i iiii FyFyL 1 )(1ln)1 ()(lnlnxx 选择模型课件 11 对数似然函数的一阶条件为对数似然函数的一阶条件为 (7.1.14) 其中:其中:fi 表示概率密度函数。那么如果已知分布函数和密度表示概率密度函数。那么如果已知分布函数和密度 函数的表达式及样本值,求解该方程组,就可以得到参数的函数的表达式及样本值,求解该方程组,就
13、可以得到参数的 极大似然估计量。例如,将上述极大似然估计量。例如,将上述3种分布函数和密度函数代种分布函数和密度函数代 入式入式(7.1.14)就可以得到就可以得到3种模型的参数极大似然估计。但是种模型的参数极大似然估计。但是 式式(7.1.14) 通常是非线性的,需用迭代法进行求解。通常是非线性的,需用迭代法进行求解。 二元选择模型中估计的系数不能被解释成对因变量的边二元选择模型中估计的系数不能被解释成对因变量的边 际影响,只能从符号上判断。如果为正,表明解释变量越大,际影响,只能从符号上判断。如果为正,表明解释变量越大, 因变量取因变量取1的概率越大;反之,如果系数为负,表明相应的的概率越
14、大;反之,如果系数为负,表明相应的 概率将越小。概率将越小。 N i i i i i i ii F f y F fyL 1 0 )1 ( )1 ( ln x 选择模型课件 12 考虑考虑Greene 给出的斯佩克特和马泽欧(给出的斯佩克特和马泽欧(1980) 的例子,在例子中分析了某种教学方法对成绩的有效的例子,在例子中分析了某种教学方法对成绩的有效 性。因变量(性。因变量(GRADE)代表在接受新教学方法后成)代表在接受新教学方法后成 绩是否改善,如果改善为绩是否改善,如果改善为1,未改善为,未改善为0。解释变量。解释变量 (PSI)代表是否接受新教学方法,如果接受为)代表是否接受新教学方法
15、,如果接受为1,不,不 接受为接受为0。还有对新教学方法量度的其他解释变量:。还有对新教学方法量度的其他解释变量: 平均分数(平均分数(GPA)和测验得分()和测验得分(TUCE),来分析新),来分析新 的教学方法的效果。的教学方法的效果。 选择模型课件 13 估计二元选择模型,从估计二元选择模型,从Equation Specification对话框中,对话框中, 选择选择Binary估计方法。在二元模型的设定中分为两部分。首估计方法。在二元模型的设定中分为两部分。首 先,在先,在Equation Specification区域中,键入二元因变量的名区域中,键入二元因变量的名 字,随后键入一列
16、回归项。由于二元变量估计只支持列表形字,随后键入一列回归项。由于二元变量估计只支持列表形 式的设定,所以不能输入公式。然后,在式的设定,所以不能输入公式。然后,在Binary estimation method中选择中选择Probit,Logit,Extreme value选择三种估计选择三种估计 方法的一种。以例方法的一种。以例7.1为例,对话框如图为例,对话框如图7.2所示。所示。 选择模型课件 14 选择模型课件 15 例例7.1的估计输出结果如下:的估计输出结果如下: 选择模型课件 16 参数估计结果的上半部分包含与一般的回归结参数估计结果的上半部分包含与一般的回归结 果类似的基本信息
17、,标题包含关于估计方法(果类似的基本信息,标题包含关于估计方法(ML 表示极大似然估计)和估计中所使用的样本的基本表示极大似然估计)和估计中所使用的样本的基本 信息,也包括达到收敛要求的迭代次数。和计算系信息,也包括达到收敛要求的迭代次数。和计算系 数协方差矩阵所使用方法的信息。在其下面显示的数协方差矩阵所使用方法的信息。在其下面显示的 是系数的估计、渐近的标准误差、是系数的估计、渐近的标准误差、z- -统计量和相应统计量和相应 的概率值及各种有关统计量。的概率值及各种有关统计量。 选择模型课件 17 在回归结果中还提供几种似然函数:在回归结果中还提供几种似然函数: log likelihoo
18、d是对数似然函数的最大值是对数似然函数的最大值L(b),b是是 未知参数未知参数 的估计值。的估计值。 Avg. log likelihood 是用观察值的个数是用观察值的个数N去除以对去除以对 数似然函数数似然函数L(b) ,即对数似然函数的平均值。,即对数似然函数的平均值。 Restr. Log likelihood是除了常数以外所有系数被是除了常数以外所有系数被 限制为限制为0时的极大似然函数时的极大似然函数L(b) 。 LR统计量检验除了常数以外所有系数都是统计量检验除了常数以外所有系数都是0的假的假 设,这类似于线性回归模型中的统计量,测试模型整体的设,这类似于线性回归模型中的统计量
19、,测试模型整体的 显著性。圆括号中的数字表示自由度,它是该测试下约束显著性。圆括号中的数字表示自由度,它是该测试下约束 变量的个数。变量的个数。 选择模型课件 18 Probability(LR stat)是)是LR检验统计量的检验统计量的P值。值。 在零假设下,在零假设下,LR检验统计量近似服从于自由度等于检检验统计量近似服从于自由度等于检 验下约束变量的个数的验下约束变量的个数的 2分布。分布。 McFadden R-squared是计算似然比率指标,正是计算似然比率指标,正 像它的名字所表示的,它同线性回归模型中的像它的名字所表示的,它同线性回归模型中的R2是类似是类似 的。它具有总是介
20、于的。它具有总是介于0和和1之间的性质。之间的性质。 选择模型课件 19 利用式利用式(7.1.10),分布函数采用标准正态分布,即,分布函数采用标准正态分布,即Probit模模 型,例型,例7.1计算结果为计算结果为 (7.1.15) z = (-2.93) (2.34) (0.62) (2.39) 利用式利用式(7.1.15)的的Probit模型的系数,本例按如下公式给出模型的系数,本例按如下公式给出 新教学法对学习成绩影响的概率,新教学法对学习成绩影响的概率, 当当PSI = 0时:时: (7.1.19) 当当PSI = 1时:时: (7.1.20) 式中测验得分式中测验得分TUCE取均
21、值取均值(21.938),平均分数,平均分数GPA是按从是按从 小到大重新排序后的序列。小到大重新排序后的序列。 iiii PSITUCEGPAy4263. 10517. 06258. 14523. 7 * )938.210517. 06258. 14523. 7() 1Prob(GPAGrade )42. 1938.210517. 06258. 14523. 7() 1Prob(GPAGrade 选择模型课件 20 0.0 0.2 0.4 0.6 0.8 1.0 2.02.22.42.62.83.03.23.43.63.84.0 PSI=1 PSI=0 Prob(Grade=1) GPA 选
22、择模型课件 21 因为我们是用迭代法求极大似然函数的最大值,所因为我们是用迭代法求极大似然函数的最大值,所 以以Option选项可以从估计选项中设定估计算法与迭代选项可以从估计选项中设定估计算法与迭代 限制。单击限制。单击Options按钮,打开对话框如图按钮,打开对话框如图7.3所示。所示。 选择模型课件 22 Option对话框有以下几项设置:对话框有以下几项设置: (Robust Standard Errors) 对二元因变对二元因变 量 模 型 而 言 ,量 模 型 而 言 , E Vi e w s 允 许 使 用 准允 许 使 用 准 - 极 大 似 然 函 数极 大 似 然 函 数
23、 (Huber/White)或广义的线性模型()或广义的线性模型(GLM)方法估计标)方法估计标 准误差。察看准误差。察看Robust Covariance对话框,并从两种方法中对话框,并从两种方法中 选择一种。选择一种。 EViews的默认值是使用经验运算法则而选的默认值是使用经验运算法则而选 择出来的,适用于二元选择模型的每一种类型。择出来的,适用于二元选择模型的每一种类型。 在在Optimization algorithm 一栏中选择估一栏中选择估 计的运算法则。默认地,计的运算法则。默认地,EViews使用使用quadratic hill- climbing方法得到参数估计。这种运算法
24、则使用对数似然分方法得到参数估计。这种运算法则使用对数似然分 析二次导数的矩阵来形成迭代和计算估计的系数协方差矩析二次导数的矩阵来形成迭代和计算估计的系数协方差矩 阵。还有另外两种不同的估计法则,阵。还有另外两种不同的估计法则,Newton-Raphson也使也使 用二次导数,用二次导数,BHHH使用一次导数,既确定迭代更新,又使用一次导数,既确定迭代更新,又 确定协方差矩阵估计。确定协方差矩阵估计。 选择模型课件 23 从方程工具栏选择从方程工具栏选择Procs/Forecast(Fitted Probability /Index),然后单击想要预测的对象。既可以计算拟合概),然后单击想要预测的对象。既可以计算拟合概 率,率, ,也可以计算指标,也可以计算指标 的拟合值。的拟合值。 像其他方法一样,可以选择预测样本,显示预测图。像其他方法一样,可以选择预测样本,显示预测图。 如果解释变量向量如果解释变量向量xt包括二元因变量包括二元因变量yt的滞后值,选择的滞后值,选择
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年投诉处理专员面试题及答案
- 2026年网络技术专员面试全攻略及答案
- 顺邦安防公司招聘面试题及答案
- 2026年软件开发工程师高级面试题及答案
- 2026年电影业片方保险顾问面试题及答案参考
- 2024年深圳信息职业技术学院单招职业倾向性测试模拟测试卷附答案解析
- 2025年江西财经职业学院单招职业倾向性考试题库附答案解析
- 2026年三亚中瑞酒店管理职业学院单招职业倾向性测试题库附答案
- 2026年上海大学单招职业适应性考试题库附答案
- 2024年湖南财经工业职业技术学院单招职业适应性考试题库附答案解析
- 欢庆元旦启赴新章-2026年元旦联欢主题班会课件
- 2025山东省人民检察院公开招聘聘用制书记员(40名)备考考试题库及答案解析
- 2026届新高考历史冲刺备考复习第一次世界大战与战后国际秩序
- 消防设施操作员基础知识
- 2025天津大学管理岗位集中招聘15人参考笔试题库及答案解析
- 北京市西城区2022-2023学年六年级上学期数学期末试卷(含答案)
- 钢管支撑强度及稳定性验算
- 全国医疗服务项目技术规范
- 人教版六年级数学下册全册教案
- 医院公共卫生事件应急处理预案
- 智慧校园云平台规划建设方案
评论
0/150
提交评论