版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 4 令令pi = P ( yi =1) ,那么那么 1 - pi = P ( yi =0) ,于是于是 (7.1.2) 又因为又因为E(ui ) = 0 ,所以,所以 E(yi ) = xi ,xi =(x1i , x2i , xki ), =( 1 , 2 , k ) ,从而有下面的等式:从而有下面的等式: (7.1.3) iiii pyPyPyE)0(0) 1(1)( xi iii pyPyE) 1()( 5 式式(7.1.3)只有当只有当xi 的取值在的取值在(0,1)之间时才成立,否则就会之间时才成立,否则就会 产生矛盾,而在实际应用时很可能超出这个范围。因此,线性产生矛盾,而在实际
2、应用时很可能超出这个范围。因此,线性 概率模型常常写成下面的形式:概率模型常常写成下面的形式: (7.1.4) 此时就可以把因变量看成是一个概率。此时就可以把因变量看成是一个概率。 那么扰动项的方差为:那么扰动项的方差为: (7.1.5) 或或 (7.1.6) 0, 0 1, 1 10, x x xx i i ii i p )1 ()1 ()()1 ()( 222 iiiiiii ppppuExx )(1)()( 22 iiii yEyEuE 6 由此可以看出,误差项具有异方差性。异方差性使得参由此可以看出,误差项具有异方差性。异方差性使得参 数估计不再是有效的,修正异方差的一个方法就是使用加
3、权数估计不再是有效的,修正异方差的一个方法就是使用加权 最小二乘估计。但是加权最小二乘法无法保证预测值最小二乘估计。但是加权最小二乘法无法保证预测值在在(0,1) 之内,这是线性概率模型一个严重的弱点。由于上述问题,之内,这是线性概率模型一个严重的弱点。由于上述问题, 我们考虑对线性概率模型进行一些变换,由此得到下面要讨我们考虑对线性概率模型进行一些变换,由此得到下面要讨 论的模型。论的模型。 假设有一个未被观察到的潜在变量假设有一个未被观察到的潜在变量yi*,它与,它与xi之间具有之间具有 线性关系,即线性关系,即 (7.1.7) 其中:其中: ui*是扰动项。是扰动项。yi和和yi*的关系
4、如下:的关系如下: (7.1.8) * iii uyx 00 01 * * i i i y y y 7 yi*大于临界值大于临界值0时,时,yi =1;小于等于;小于等于0时,时,yi =0。这里把。这里把 临界值选为临界值选为0,但事实上只要,但事实上只要xi包含有常数项,临界值的选择包含有常数项,临界值的选择 就是无关的,所以不妨设为就是无关的,所以不妨设为0。这样。这样 (7.1.9) 其中:其中:F是是ui*的分布函数,要求它是一个连续函数,并且是的分布函数,要求它是一个连续函数,并且是 单调递增的。因此,原始的回归模型可以看成如下的一个回单调递增的。因此,原始的回归模型可以看成如下的
5、一个回 归模型:归模型: (7.1.10) 即即yi关于它的条件均值的一个回归。关于它的条件均值的一个回归。 )()()0(),|0( )(1)()0(),|1( * * xxx xxx iiiiii iiiiii FuPyPyP FuPyPyP iii uFyx1 8 分布函数的类型决定了二元选择模型的类型,根据分布函分布函数的类型决定了二元选择模型的类型,根据分布函 数数F的不同,二元选择模型可以有不同的类型,常用的二元选择的不同,二元选择模型可以有不同的类型,常用的二元选择 模型如表模型如表7.1所示:所示: ui*对应的分布对应的分布分布函数分布函数F 相应的二元选择模型相应的二元选择
6、模型 标准正态分布标准正态分布Probit 模型模型 逻辑分布逻辑分布Logit 模型模型 极值分布极值分布Extreme模型模型 )(x )1 ( xx ee )exp(1 x e 9 二元选择模型一般采用极大似然估计。似然函数为二元选择模型一般采用极大似然估计。似然函数为 (7.1.11) 即即 (7.1.12) 对数似然函数为对数似然函数为 (7.1.13) 01 )()(1 ii yy ii FFLxx N i y i y i ii FFL 1 1 )(1 )(xx N i iiii FyFyL 1 )(1ln)1 ()(lnlnxx 10 对数似然函数的一阶条件为对数似然函数的一阶条
7、件为 (7.1.14) 其中:其中:fi 表示概率密度函数。那么如果已知分布函数和密度表示概率密度函数。那么如果已知分布函数和密度 函数的表达式及样本值,求解该方程组,就可以得到参数的函数的表达式及样本值,求解该方程组,就可以得到参数的 极大似然估计量。例如,将上述极大似然估计量。例如,将上述3种分布函数和密度函数代种分布函数和密度函数代 入式入式(7.1.14)就可以得到就可以得到3种模型的参数极大似然估计。但是种模型的参数极大似然估计。但是 式式(7.1.14) 通常是非线性的,需用迭代法进行求解。通常是非线性的,需用迭代法进行求解。 二元选择模型中估计的系数不能被解释成对因变量的边二元选
8、择模型中估计的系数不能被解释成对因变量的边 际影响,只能从符号上判断。如果为正,表明解释变量越大,际影响,只能从符号上判断。如果为正,表明解释变量越大, 因变量取因变量取1的概率越大;反之,如果系数为负,表明相应的的概率越大;反之,如果系数为负,表明相应的 概率将越小。概率将越小。 N i i i i i i ii F f y F fyL 1 0 )1 ( )1 ( ln x 11 考虑考虑Greene 给出的斯佩克特和马泽欧(给出的斯佩克特和马泽欧(1980) 的例子,在例子中分析了某种教学方法对成绩的有效的例子,在例子中分析了某种教学方法对成绩的有效 性。因变量(性。因变量(GRADE)代
9、表在接受新教学方法后成)代表在接受新教学方法后成 绩是否改善,如果改善为绩是否改善,如果改善为1,未改善为,未改善为0。解释变量。解释变量 (PSI)代表是否接受新教学方法,如果接受为)代表是否接受新教学方法,如果接受为1,不,不 接受为接受为0。还有对新教学方法量度的其他解释变量:。还有对新教学方法量度的其他解释变量: 平均分数(平均分数(GPA)和测验得分()和测验得分(TUCE),来分析新),来分析新 的教学方法的效果。的教学方法的效果。 12 从从Equation Specification对话框中,选择对话框中,选择Binary估计估计 方法。在方法。在Equation Specif
10、ication区域中,键入二元因变量的区域中,键入二元因变量的 及一列回归项。由于二元变量估计只支持列表形式的设定,及一列回归项。由于二元变量估计只支持列表形式的设定, 所以不能输入公式。然后,从所以不能输入公式。然后,从Binary estimation method 的的 Probit,Logit,Extreme value三种估计方法中选择一种。三种估计方法中选择一种。 13 例例7.1的估计输出结果如下:的估计输出结果如下: 14 在回归结果中还提供几种似然函数:在回归结果中还提供几种似然函数: log likelihood是对数似然函数的最大值是对数似然函数的最大值L(b),b是是
11、未知参数未知参数 的估计值。的估计值。 Avg. log likelihood 是用观察值的个数是用观察值的个数N去除以对去除以对 数似然函数数似然函数L(b) ,即对数似然函数的平均值。,即对数似然函数的平均值。 Restr. Log likelihood是除了常数以外所有系数被是除了常数以外所有系数被 限制为限制为0时的极大似然函数时的极大似然函数L(b) 。 LR统计量检验除了常数以外所有系数都是统计量检验除了常数以外所有系数都是0的假的假 设,这类似于线性回归模型中的统计量,测试模型整体的设,这类似于线性回归模型中的统计量,测试模型整体的 显著性。圆括号中的数字表示自由度,它是该测试下
12、约束显著性。圆括号中的数字表示自由度,它是该测试下约束 变量的个数。变量的个数。 15 Probability(LR stat)是)是LR检验统计量的检验统计量的P值。值。 在零假设下,在零假设下,LR检验统计量近似服从于自由度等于检检验统计量近似服从于自由度等于检 验下约束变量的个数的验下约束变量的个数的 2分布。分布。 McFadden R-squared是计算似然比率指标,正是计算似然比率指标,正 像它的名字所表示的,它同线性回归模型中的像它的名字所表示的,它同线性回归模型中的R2是类似是类似 的。它具有总是介于的。它具有总是介于0和和1之间的性质。之间的性质。 16 利用式利用式(7.
13、1.10),分布函数采用标准正态分布,即,分布函数采用标准正态分布,即Probit模模 型,例型,例7.1计算结果为计算结果为 (7.1.15) z = (-2.93) (2.34) (0.62) (2.39) 利用式利用式(7.1.15)的的Probit模型的系数,本例按如下公式给出模型的系数,本例按如下公式给出 新教学法对学习成绩影响的概率,新教学法对学习成绩影响的概率, 当当PSI = 0时:时: (7.1.19) 当当PSI = 1时:时: (7.1.20) 式中测验得分式中测验得分TUCE取均值取均值(21.938),平均分数,平均分数GPA是按从是按从 小到大重新排序后的序列。小到
14、大重新排序后的序列。 iiii PSITUCEGPAy4263. 10517. 06258. 14523. 7 * )938.210517. 06258. 14523. 7() 1Prob(GPAGrade )42. 1938.210517. 06258. 14523. 7() 1Prob(GPAGrade 17 0.0 0.2 0.4 0.6 0.8 1.0 2.02.22.42.62.83.03.23.43.63.84.0 PSI=1 PSI=0 Prob(Grade=1) GPA 18 因为我们是用迭代法求极大似然函数的最大值,所因为我们是用迭代法求极大似然函数的最大值,所 以以Opti
15、on选项可以从估计选项中设定估计算法与迭代选项可以从估计选项中设定估计算法与迭代 限制。单击限制。单击Options按钮,打开对话框如图按钮,打开对话框如图7.3所示。所示。 19 从方程工具栏选择从方程工具栏选择Procs/Forecast(Fitted Probability /Index),然后单击想要预测的对象。既可以计算拟合概),然后单击想要预测的对象。既可以计算拟合概 率,率, ,也可以计算指标,也可以计算指标 的拟合值。的拟合值。 像其他方法一样,可以选择预测样本,显示预测图。像其他方法一样,可以选择预测样本,显示预测图。 如果解释变量向量如果解释变量向量xt包括二元因变量包括二
16、元因变量yt的滞后值,选择的滞后值,选择 Dynamic选项预测,选项预测,EViews使用拟合值使用拟合值 得到预测值;得到预测值; 而选择而选择Static选项,将使用实际的(滞后的)选项,将使用实际的(滞后的)yt-1得到预测得到预测 值。值。 对于这种估计方法,无论预测评价还是预测标准误差对于这种估计方法,无论预测评价还是预测标准误差 通 常 都 无 法 自 动 计 算 。 后 者 能 够 通 过 使 用通 常 都 无 法 自 动 计 算 。 后 者 能 够 通 过 使 用 Vi e w / Covariance Matrix显示的系数方差矩阵,或者使用显示的系数方差矩阵,或者使用 c
17、ovariance函数来计算。函数来计算。 ) (1xiFp x i 1 t p 20 通过通过Procs/Make Reidual Series选项产生下面三种残差选项产生下面三种残差 类型中的一种类型。类型中的一种类型。 普通残差普通残差(Ordinary) 标准化残差标准化残差(Standardized) 广义残差广义残差(Generalized) iii pye 0 )1( ii ii si pp py e )1 ( ) ()( ii iii gi pp fpy e x 21 当因变量不止是两种选择时,就要用到多元选择模型当因变量不止是两种选择时,就要用到多元选择模型 (multipl
18、e choice model)。多元离散选择问题普遍存在于。多元离散选择问题普遍存在于 经济生活中。例如:经济生活中。例如: (1) 一个人面临多种职业选择,将可供选择的职业排一个人面临多种职业选择,将可供选择的职业排 队,用队,用0,1,2,3表示。影响选择的因素有不同职业的表示。影响选择的因素有不同职业的 收入、发展前景和个人偏好等;收入、发展前景和个人偏好等; (2) 同一种商品,不同的消费者对其偏好不同。例如,同一种商品,不同的消费者对其偏好不同。例如, 十分喜欢、一般喜欢、无所谓、一般厌恶和十分厌恶,十分喜欢、一般喜欢、无所谓、一般厌恶和十分厌恶, 分别用分别用0,1,2,3,4表示
19、。而影响消费者偏好的因素有表示。而影响消费者偏好的因素有 商品的价格、性能、收入及对商品的需求程度等;商品的价格、性能、收入及对商品的需求程度等; (3) 一个人选择上班时所采用的方式一个人选择上班时所采用的方式自己开车,自己开车, 乘出租车,乘公共汽车,还是骑自行车。乘出租车,乘公共汽车,还是骑自行车。 22 与二元选择模型类似,设有一个潜在变量与二元选择模型类似,设有一个潜在变量 yi*,是不可观,是不可观 测的,可观测的是测的,可观测的是 yi ,设,设 yi 有有0,1,2,M等等M+1个取值。个取值。 (7.2.1) 其中:其中:ui*是独立同分布的随机变量,是独立同分布的随机变量,
20、yi 可以通过可以通过 yi*按下式得按下式得 到到 (7.2.2) * iii uyxNi,2,1 * 3 * 2 2 * 1 1 * 2 1 0 iM i i i i ycM cyc cyc cy y 如果 如果 如果 如果 23 设设ui*的分布函数为的分布函数为F(x),可以得到如下的概率,可以得到如下的概率 (7.2.3) 和二元选择模型一样,根据分布函数和二元选择模型一样,根据分布函数F(x)的不同可以有的不同可以有 3种常见的模型:种常见的模型:Probit模型、模型、Logit模型和模型和Extreme value模模 型。仍然采用极大似然方法估计参数,需要指出的是,型。仍然采
21、用极大似然方法估计参数,需要指出的是,M个个 临界值临界值c1, c2, , cM 事先也是不确定的,所以也作为参数和事先也是不确定的,所以也作为参数和 回归系数一起估计。回归系数一起估计。 )(1)( )()()2( )()() 1( )()0( 23 12 1 x xx xx x iMi iii iii ii cFMyP cFcFyP cFcFyP cFyP 24 在调查执政者的支持率的民意测验中,由于执在调查执政者的支持率的民意测验中,由于执 政者执行了对某一收入阶层有利的政策而使得不同政者执行了对某一收入阶层有利的政策而使得不同 收入的人对其支持不同,所以收入成为决定人们是收入的人对其
22、支持不同,所以收入成为决定人们是 否支持的因素。通过调查取得了市民收入否支持的因素。通过调查取得了市民收入(INC)与支与支 持与否持与否(Y)的数据,其中如果选民支持则的数据,其中如果选民支持则Yi取取0,中,中 立取立取1,不支持取,不支持取2。我们选取。我们选取24个样本进行排序选个样本进行排序选 择模型分析。择模型分析。 25 从主菜单中选择从主菜单中选择Objects/New Object/Equation选项,估计方选项,估计方 法选择法选择ORDERED,标准估计对话框将如图标准估计对话框将如图7.4所示。在所示。在Equation Specification区域,键入排序因变量
23、的名字,其后列出回归项。区域,键入排序因变量的名字,其后列出回归项。 排序估计也只支持列表形式的设定,不用输入一个明确的方程。排序估计也只支持列表形式的设定,不用输入一个明确的方程。 然后选择然后选择Normal,Logist,Extreme Value三种误差分布中的一三种误差分布中的一 种即可。种即可。 26 例例7.2估计结果如下:估计结果如下: 27 Make Ordered Limit Vector产生一个临界值向量产生一个临界值向量c, 此向量被命名为此向量被命名为LIMITS01,如果该名称已被使用,则命,如果该名称已被使用,则命 名为名为LIMITS02,以此类推。,以此类推。
24、 Make Ordered Limit Covariance Matrix产生临界产生临界 值向量值向量c的估计值的协方差矩阵。命名为的估计值的协方差矩阵。命名为VLIMITS01,如,如 果该名称已被使用,则命名为果该名称已被使用,则命名为VLIMITS02,以此类推。,以此类推。 28 因为排序选择模型的因变量代表种类或等级数据,因为排序选择模型的因变量代表种类或等级数据, 所以不能从估计排序模型中直接预测。选择所以不能从估计排序模型中直接预测。选择Procs/ Make Model,打开一个包含方程系统的没有标题的,打开一个包含方程系统的没有标题的 模型窗口,单击模型窗口方程栏的模型窗口
25、,单击模型窗口方程栏的Solve按钮。按钮。例例7.2 因变量因变量 y 的拟合线性指标的拟合线性指标 序列被命名为序列被命名为i_Y_0, 拟和值落在第一类中的拟合概率被命名为拟和值落在第一类中的拟合概率被命名为Y_0_0的序的序 列,落在第二类中的拟合概率命名为列,落在第二类中的拟合概率命名为Y_1_0的序列中,的序列中, 落在第三类中的拟合概率命名为落在第三类中的拟合概率命名为Y_2_0的序列中,等的序列中,等 等。注意对每一个观察值,落在每个种类中的拟合概等。注意对每一个观察值,落在每个种类中的拟合概 率相加值为率相加值为1。 x i 29 选择选择Proc/Make Residual
26、 Series产生广义残差序列,输产生广义残差序列,输 入一个名字或用默认的名字,然后单击入一个名字或用默认的名字,然后单击OK按钮。一个排序按钮。一个排序 模型的广义残差由下式给出:模型的广义残差由下式给出: (7.5.2) 其中:其中:c0 = - ,cM+1 = 。 , ) () ( ) () ( 1 1 xx xx igig igig gi cFcF cfcf e 30 现实的经济生活中,有时会遇到这样的问题,因变量现实的经济生活中,有时会遇到这样的问题,因变量 是连续的,但是受到某种限制,也就是说所得到的因变量是连续的,但是受到某种限制,也就是说所得到的因变量 的观测值来源于总体的一
27、个受限制的子集,并不能完全反的观测值来源于总体的一个受限制的子集,并不能完全反 映总体的实际特征,那么通过这样的样本观测值来推断总映总体的实际特征,那么通过这样的样本观测值来推断总 体的特征就需要建立受限因变量模型体的特征就需要建立受限因变量模型(limited dependent variable models)。本节研究两类受限因变量模型,即审查。本节研究两类受限因变量模型,即审查 回归模型回归模型(censored regression models)和截断回归模型和截断回归模型 (truncated regression models)。 31 考虑下面的潜在因变量回归模型考虑下面的潜
28、在因变量回归模型 (7.3.1) 其中:其中: 是比例系数;是比例系数;y*是潜在变量。被观察的数据是潜在变量。被观察的数据 y 与潜与潜 在变量在变量 y* 的关系如下:的关系如下: (7.3.2) iii uyx * 0 00 * * ii i i yify yif y 32 换句话说,换句话说,yi*的所有负值被定义为的所有负值被定义为0值。我们称这些数值。我们称这些数 据在据在0处进行了左截取(审查)(处进行了左截取(审查)(left censored)。而不是把)。而不是把 观测不到的观测不到的 yi* 的所有负值简单地从样本中除掉。此模型称的所有负值简单地从样本中除掉。此模型称 为
29、规范的审查回归模型,也称为为规范的审查回归模型,也称为Tobit模型。模型。 更一般地,可以在任意有限点的左边和右边截取(审更一般地,可以在任意有限点的左边和右边截取(审 查),即查),即 (7.3.3) 其中:其中: , 代表截取(审查)点,是常数值。如果没有左截代表截取(审查)点,是常数值。如果没有左截 取取( (审查审查) )点,可以设为点,可以设为 。如果没有右截取。如果没有右截取( (审查审查) )点,点, 可以设为可以设为 。规范的。规范的Tobit模型是具有模型是具有 和和 的的 一个特例。一个特例。 * * * iii iiii iii i ycifc cycify cyifc
30、 y i c i c i c i c0 i c i c 33 与前边介绍的几个模型类似,可以采用极大似然法估计与前边介绍的几个模型类似,可以采用极大似然法估计 审查回归模型的参数,对数似然函数为审查回归模型的参数,对数似然函数为 (7.3.4) 求式求式(7.3.4)的最大值即可得参数的最大值即可得参数 , 的估计。这里的估计。这里f , F分别分别 是是u的密度函数和分布函数。的密度函数和分布函数。 )()( / )(ln)/ )(lnln ii ii i cyci ii cyi ii yfcFLxx )( )/ )(ln ii cyi ii cFx 34 特别地,对于特别地,对于Tobit
31、模型,设模型,设uN(0,1),这时对数似然,这时对数似然 函数为函数为 (7.3.5) 式式(7.3.5)是由两部分组成的。第一部分对应没有限制的观测是由两部分组成的。第一部分对应没有限制的观测 值,与经典回归的表达式是相同的;第二部分对应于受限制值,与经典回归的表达式是相同的;第二部分对应于受限制 的观测值。因此,此似然函数是离散分布与连续分布的混合。的观测值。因此,此似然函数是离散分布与连续分布的混合。 将似然函数最大化就可以得到参数的极大似然估计。将似然函数最大化就可以得到参数的极大似然估计。 )(1ln )( ln)2ln( 2 1 ln 00 2 2 2 ii y i y ii y
32、 L xx 35 本例研究已婚妇女工作时间问题,共有本例研究已婚妇女工作时间问题,共有50个调查数据,个调查数据, 来自于美国国势调查局来自于美国国势调查局U.S.Bureau of the Census(Current Population Survey, 1993),其中,其中y 表示已婚妇女工作时间,表示已婚妇女工作时间, x1 x4分别表示已婚妇女的未成年子女个数、年龄、受教分别表示已婚妇女的未成年子女个数、年龄、受教 育的年限和丈夫的收入。只要已婚妇女没有提供工作时间,育的年限和丈夫的收入。只要已婚妇女没有提供工作时间, 就将工作时间作零对待,符合审查回归模型的特点。就将工作时间作零
33、对待,符合审查回归模型的特点。 36 截断问题,形象地说就是掐头或者去尾。即在很多实际截断问题,形象地说就是掐头或者去尾。即在很多实际 问题中,不能从全部个体中抽取因变量的样本观测值,而只问题中,不能从全部个体中抽取因变量的样本观测值,而只 能从大于或小于某个数的范围内抽取样本的观测值,此时需能从大于或小于某个数的范围内抽取样本的观测值,此时需 要建立截断因变量模型。例如,在研究与收入有关的问题时,要建立截断因变量模型。例如,在研究与收入有关的问题时, 收入作为被解释变量。从理论上讲,收入应该是从零到正无收入作为被解释变量。从理论上讲,收入应该是从零到正无 穷,但实际中由于各种客观条件的限制,
34、只能获得处在某个穷,但实际中由于各种客观条件的限制,只能获得处在某个 范围内的样本观测值。这就是一个截断问题。截断回归模型范围内的样本观测值。这就是一个截断问题。截断回归模型 的形式如下:的形式如下: (7.3.7) 其中:其中:yi 只有在只有在 时才能取得样本观测值,时才能取得样本观测值, , 为两个常数。为两个常数。 对于截断回归模型,仍然可以采用极大似然法估计模型对于截断回归模型,仍然可以采用极大似然法估计模型 的参数,只不过此时极大似然估计的密度函数是条件密度。的参数,只不过此时极大似然估计的密度函数是条件密度。 iii uyxNi,2,1 iiii cucx i c i c 37
35、打开打开Equation对话框,从对话框,从Equation Specification对话对话 框所列估计方法中选择框所列估计方法中选择CENSORED估计方法。在估计方法。在Equation Specification区域,输入被审区域,输入被审 查的因变量的名字及一系列查的因变量的名字及一系列 回归项。审查回归模型的估回归项。审查回归模型的估 计只支持列表形式的设定。计只支持列表形式的设定。 38 按照要求在编辑栏的左编辑区(按照要求在编辑栏的左编辑区(Left)和右编辑区)和右编辑区 (Right)输入临界点表达式。注意如果在编辑区域留下空)输入临界点表达式。注意如果在编辑区域留下空
36、白,白,EViews将假定该种类型的观测值没有被审查。将假定该种类型的观测值没有被审查。 例如,在规范的例如,在规范的Tobit模型中,数据在模型中,数据在0值左边审查,在值左边审查,在0 值右边不被审查。这种情况可以被指定为:值右边不被审查。这种情况可以被指定为: 左编辑区:左编辑区: 0 右编辑区:右编辑区: blank 而一般的左边和右边审查由下式给出:而一般的左边和右边审查由下式给出: 左编辑区:左编辑区: 右编辑区:右编辑区: EViews也允许更一般的设定,这时审查点已知,但在观也允许更一般的设定,这时审查点已知,但在观 察值之间有所不同。简单地在适当的编辑区域输入包含审查察值之间
37、有所不同。简单地在适当的编辑区域输入包含审查 点的序列名字。点的序列名字。 i c i c 39 在一些情况下,假设临界点对于一些个体(在一些情况下,假设临界点对于一些个体( 和和 不是不是 对所有的观察值都是可观察到的)是未知的,此时可以通过对所有的观察值都是可观察到的)是未知的,此时可以通过 设置设置0-1虚拟变量(审查指示变量)来审查数据。虚拟变量(审查指示变量)来审查数据。EViews提提 供了另外一种数据审查的方法来适应这种形式。简单地,在供了另外一种数据审查的方法来适应这种形式。简单地,在 估计对话框中选择估计对话框中选择Field is zero/one indicator of
38、 censoring选选 项,然后在合适的编辑区域输入审查指示变量的序列名。对项,然后在合适的编辑区域输入审查指示变量的序列名。对 应于审查指示变量值为应于审查指示变量值为1的观察值要进行审查处理,而值为的观察值要进行审查处理,而值为0 的观察值不进行审查。的观察值不进行审查。 i c i c 40 例例7.3的估计结果如下:的估计结果如下: 41 EViews提供了预测因变量期望提供了预测因变量期望 E (y | x, , ) 的选项,的选项, 或预测潜在变量期望或预测潜在变量期望 E (y*| x, , ) 的选项。从工具栏选择的选项。从工具栏选择 Forecast打开预测对话框。为了预测
39、因变量的期望,应该打开预测对话框。为了预测因变量的期望,应该 选择选择Expected dependent variable,并输入一个序列名称用,并输入一个序列名称用 于保存输出结果。为了预测潜在变量的期望,单击于保存输出结果。为了预测潜在变量的期望,单击Index- Expected latent variable,并输入一个序列的名称用于保存,并输入一个序列的名称用于保存 输出结果。潜在变量的期望输出结果。潜在变量的期望 E (y*| x, , ) 可以从如下关系可以从如下关系 中得到:中得到: (7.5.3) 通过选择通过选择Procs/Make Residual Series,并从残
40、差的,并从残差的3种种 类型中进行一种,可以产生审查模型的残差序列。审查模类型中进行一种,可以产生审查模型的残差序列。审查模 型的残差也有型的残差也有3种类型,与前述类似。种类型,与前述类似。 xx),( * yE 42 估计一个截断回归模型和估计一个审查模型遵估计一个截断回归模型和估计一个审查模型遵 循同样的步骤,从主菜单中选择循同样的步骤,从主菜单中选择Quick/Estimate Equation,并在,并在Equation Specification 对话框中,对话框中, 选择选择CENSORED估计方法。出现估计审查和截断回估计方法。出现估计审查和截断回 归模型对话框。在归模型对话框
41、。在Equation Specification区域键入截区域键入截 断因变量的名称和回归项的列表,并从三种分布中断因变量的名称和回归项的列表,并从三种分布中 选择一种作为误差项的分布。选择选择一种作为误差项的分布。选择Truncated sample 选项估计截断模型。选项估计截断模型。 43 在实际应用中,我们应该根据要研究的变量的数据类在实际应用中,我们应该根据要研究的变量的数据类 型选择合适的模型。当因变量型选择合适的模型。当因变量 y 表示事件发生的数目,是离表示事件发生的数目,是离 散的整数,即为计数变量,并且数值较小,取零的个数多,散的整数,即为计数变量,并且数值较小,取零的个数
42、多, 而解释变量多为定性变量时,应该考虑应用计数模型而解释变量多为定性变量时,应该考虑应用计数模型 (count models)。例如,一个公司提出申请的专利的数目,)。例如,一个公司提出申请的专利的数目, 以及在一个固定的时间间隔内的失业人员的数目。在计数模以及在一个固定的时间间隔内的失业人员的数目。在计数模 型中应用较广泛的为泊松模型。型中应用较广泛的为泊松模型。 44 设每个观测值设每个观测值 yi 都来自一个服从参数为都来自一个服从参数为m(xi , ) 的泊松的泊松 分布的总体,分布的总体, (7.4.1) 对于泊松模型(对于泊松模型(poisson model),给定),给定 xi
43、 时时 yi 的条件密度是的条件密度是 泊松分布:泊松分布: (7.4.2) 由泊松分布的特点,由泊松分布的特点, (7.4.3) 参数参数 的极大似然估计量(的极大似然估计量(MLE)通过最大化如下的对)通过最大化如下的对 数似然函数来得到:数似然函数来得到: (7.4.4) x xx i eyEm iii ),(),( ! ),( ),( ),( i y i m ii y me yf ii x x x x xxx i emyEy iiiii ),(),(),var( N i iiii ymmyL 1 )!ln(),(),(ln)(xx 45 对泊松模型的常用替代是使用一个负二项式对泊松模型
44、的常用替代是使用一个负二项式(negative binomial)分布的似然函数极大化来估计模型的参数。负二项分布的似然函数极大化来估计模型的参数。负二项 式分布的对数似然函数如下:式分布的对数似然函数如下: (7.4.5) 其中:其中: 2 是和参数是和参数 一起估计的参数。当数据过度分散时,一起估计的参数。当数据过度分散时, 经常使用负二项式分布,这样条件方差大于条件均值,由于经常使用负二项式分布,这样条件方差大于条件均值,由于 下面的矩条件成立:下面的矩条件成立: (7.4.6) (7.4.7) 因此,因此, 2 测量了条件方差超过条件均值的程度。测量了条件方差超过条件均值的程度。 N
45、i iiiii ymymyL 1 2222 )1(ln),(1ln)/1(),(ln),(xx )1 (ln) !ln( 2 i y ),(),(xx iii myE ),(1),(),var( 2 xxx iiii mmy 46 如果因变量的分布不能被假定为泊松分布,那么就要在如果因变量的分布不能被假定为泊松分布,那么就要在 其他分布假定之下执行准其他分布假定之下执行准-极大似然估计(极大似然估计(quasi-maximum likelihood, QML)。即使分布被错误假定,这些准)。即使分布被错误假定,这些准-极大似极大似 然估计量也能产生一个条件均值被正确设定的参数的一致估然估计量也
46、能产生一个条件均值被正确设定的参数的一致估 计,即对于这些计,即对于这些QML模型,对一致性的要求是条件均值被模型,对一致性的要求是条件均值被 正确设定。正确设定。 关于关于QML估计的进一步的细节参见估计的进一步的细节参见Gourieroux, Monfort,和,和Trognon( (1984a,1984b) )。Wooldridge( (1990) )介介 绍了在估计计数模型参数时绍了在估计计数模型参数时QML方法的使用。也可参见关方法的使用。也可参见关 于广义线性模型于广义线性模型( (McCullagh和和Nelder,1989) )的扩展的相关的扩展的相关 文献。文献。 47 如果
47、条件均值被正确设定,泊松极大似然估计也是如果条件均值被正确设定,泊松极大似然估计也是 服从其他分布类型的数据的准服从其他分布类型的数据的准-极大似然估计。它将产生极大似然估计。它将产生 参数参数 的一致估计量。的一致估计量。 48 指数分布的对数似然函数如下:指数分布的对数似然函数如下: (7.4.8) 和其他和其他QML估计量一样,倘若估计量一样,倘若 m(xi , ) 被正确指定,被正确指定, 即使即使 y 的条件分布不是指数分布,指数分布的准的条件分布不是指数分布,指数分布的准-极大似然极大似然 估计仍是一致的。估计仍是一致的。 N i iii mymL 1 ),(),(ln)(xx 4
48、9 正态分布的似然函数如下:正态分布的似然函数如下: (7.4.9) 对于固定的对于固定的 2和正确设定的和正确设定的m(xi , ),即使分布不是正,即使分布不是正 态的,正态分布的对数极大似然函数仍提供了一致的估计。态的,正态分布的对数极大似然函数仍提供了一致的估计。 N i ii my L 1 2 2 2ln 2 1 ln 2 1),( 2 1 )( x 50 最大化式(最大化式(7.3.12)所表示的负二项式分布的对数似)所表示的负二项式分布的对数似 然函数,对于固定的然函数,对于固定的 2,可以得到参数,可以得到参数 的准的准-极大似极大似 然估计。倘若然估计。倘若m(xi , )被正确指定,即使被正确指定,即使 y 的条件分布不的条件分布不 服从负二项式分布,这个准服从负二项式分布,这个准-极大似然估计量仍是一致极大似然估计量仍是一致 的。的。 51 本例研究轮船发生事故
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四川省乐至县联考2025-2026学年初三第三次诊断语文试题含解析
- 2026届天津市新华圣功校初三尖子生班3月调研考试语文试题含解析
- 落实教育公平助学承诺书(5篇)
- 河北省秦皇岛青龙县联考2026届下学期初三年级期末考试(联考卷)英语试题含解析
- 快乐运动的演讲比赛稿15篇
- 企业沟通渠道评估模板优化交流
- 文档编写格式规范工具包
- 物资采购合规管控承诺书6篇
- 环保建材绿色生产承诺书范文5篇
- 多平台文档编辑格式规范
- 浙江省金华市2025年4月九年级学业水平监测试卷英语一模(含答案)
- 军队器材报废管理办法
- 肿瘤科副主任竞聘
- 2024年江苏省南京市中考英语试卷真题(含答案)
- 新疆金大禹环境科技有限公司长丝无纺布配套技改20万吨-年差别化低熔点聚酯纤维项目环评报告
- DBJ04-T306-2025 建筑基坑工程技术标准
- 图情专硕复试题目及答案
- 《肝癌中医药》课件
- GB/T 4446-2025造船与海上结构物系泊绞车
- (人教2024版)英语七年级下册全册词形转换高清打印(默写版+背诵版)
- 2025年四川省对口招生(农林牧渔类)《植物生产与环境》考试复习题库(含答案)
评论
0/150
提交评论