




已阅读5页,还剩141页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章违背古典假定的计量经济问题 概述 异方差 自相关 随机解释变量 多重共线性 2020 1 7 2 第一节概述 一 古典假定假定1 随机项ui具有零均值 E ui 0i 1 2 n假定2 随机项ui具有同方差 Var ui u2i 1 2 n假定3 随机项ui无序列相关性 Cov ui uj 0i ji j 1 2 n假定4 随机项u与解释变量x之间不相关 Cov xi ui 0i 1 2 n 2020 1 7 3 假定5 u服从正态分布ui N 0 u2 i 1 2 n假定6 多元回归模型中解释变量之间不存在多重共线性rank X k 1k 1 n根据Gauss Markov定理可知 古典回归模型的最小二乘估计量 OLSE 是线性无偏有效的估计量 而且由于正态性假定 它们服从正态分布的 因此 就有可能得出区间估计式 而且也可以检验真实总体回归系数 2020 1 7 4 二 古典假定的违背及造成的后果 在实际经济问题中 上述的古典假定不一定都能得到满足 如果这些假定不完全满足 则OLSE的BLUE特性将不复存在 当然 每一个假定不满足所造成的后果是不同的 在本章中 我们将严格考察上述假定 找出如果有一个或多个假定得不到满足时 估计量的性质将会发生什么变化 并研究当出现这些情况时 应该如何处理 即古典模型假定违背的经济计量问题 2020 1 7 5 关于假定1 一般地我们认为假定E ui 0是合理的 因为随机项u是多种因素的综合 而每种因素的影响都 均匀 地微小 它对因变量的影响不是系统的 且正负影响相互抵消 故所有可能取值平均起来为零 即使有轻度的违反 从实践的观点来看可能不会产生严重的后果 因为它可能只影响回归方程的截距项 关于随机项正态性分布的假定 如果我们的目的仅仅是估计 这种假定并不是绝对必要的 事实上 无论是否是正态分布 OLSE估计式都是BLUE 剩下的四个假定将在下面的四节中分别加以讨论 2020 1 7 6 三 广义最小二乘法 GLS 给定线性回归模型Y X U若古典假定完全满足 根据Gauss Markov定理 其系数的最小二乘估计量B XTX 1XTY具有BLUE性质 若古典假定得不到完全满足 特别是假定2 同方差性 和假定3 无序列相关性 得不到满足时 对OLSE的影响更大 2020 1 7 7 广义最小二乘法 GeneralLeastSquares GLS 就是为了解决上述问题提出的 其基本思路是 若假定2 同方差性 和假定3 无序列相关性 得不到满足时 我们可以采取适当的变换 使原模型变为以下的形式 使得其中的重新满足假定2 同方差性 和假定3 无序列相关性 这样就可以对上式使用OLS估计参数 从而使得上式的OLSE仍然为BLUE 其中 I 是一个n n的正定对称方阵 若因假定2和假定3不满足时 有 2020 1 7 8 此时可以觅得一个n n的非奇异矩阵P 使得 P PT I然后用觅得的P乘以原模型的两边 有 PY PX PU记原模型就转换为 可证明转换后的模型其随机项满足同方差性和无序列相关性 即可以采用OLS估计参数了 2020 1 7 9 此时 GLSE的方差 协方差矩阵为 上式中的称为广义最小二乘估计量 GLSE 可以证明 它具有线性 无偏性和最小方差性 即它是最优线性无偏估计量 BLUE 2020 1 7 10 第二节异方差性 一 异方差的含义二 异方差产生的后果三 异方差的检验四 异方差的消除方法五 案例 2020 1 7 11 对于模型 如果出现 即对于不同的样本点 随机误差项的方差不再是常数 而互不相同 则认为出现了异方差性 Heteroscedasticity 一 异方差的含义 i 1 2 n 2020 1 7 12 异方差举例例1 截面资料下研究居民家庭的储蓄行为yi 0 1xi uiyi 第i个家庭的储蓄额xi 第i个家庭的可支配收入高收入家庭 储蓄的差异较大低收入家庭 储蓄则更有规律性 差异较小ui的方差呈现单调递增型变化 2020 1 7 13 例2 以某一行业的企业为样本建立企业生产函数模型Yi ALi Ki eui 被解释变量 产出量Y解释变量 资本K 劳动力L那么 每个企业所处的外部环境对产出量的影响被包含在随机误差项中 每个企业所处的外部环境对产出量的影响程度不同 造成了随机误差项的异方差性 这时 随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化 呈现复杂型 2020 1 7 14 异方差产生的原因 1 模型中省略的变量有许多变量随解释变量x的变化而发生变化 由此产生异方差 2 测量误差一方面 解释变量取值越大测量误差会趋于增大 另一方面 测量误差可能随时间而变化 3 截面数据中总体各单位的差异如前面家庭储蓄行为中高低收入家庭的差异 注意 异方差问题多在于截面数据中而非时间序列数据中 2020 1 7 15 二 异方差产生的后果 计量经济学模型一旦出现异方差性 如果仍采用OLS估计模型参数 会产生下列不良后果 1 参数估计量非有效 OLS估计量仍然具有无偏性 但不具有有效性 因为在有效性证明中利用了E UUT 2uI 而且 在大样本情况下 尽管参数估计量具有一致性 但仍然不具有渐近有效性 2020 1 7 16 2 参数的显著性检验和置信区间的建立发生困难 变量的显著性检验中 构造了t统计量 其他检验也是如此 它是建立在方差不变而正确估计了参数方差的基础之上的 如果出现了异方差 估计的出现偏误 偏大或偏小 t检验失去意义 2020 1 7 17 3 参数方差的估计量是有偏的 虽然最小二乘法参数的估计量是无偏的 但这些参数方差的估计量 是有偏的 正的偏差会高估参数估计值的真实方差 负的偏差会低估参数估计值的真实方差 2020 1 7 18 4 模型的预测失效 一方面 由于上述后果 使得模型不具有良好的统计性质 所以 当模型出现异方差性时 参数OLS估计值的变异程度增大 从而造成对y的预测误差变大 降低预测精度 预测功能失效 另一方面 在预测值的置信区间中也包含有参数方差的估计量 2020 1 7 19 三 异方差性的检验 检验思路 由于异方差性就是相对于不同的解释变量观测值 随机误差项具有不同的方差 那么 检验异方差性 也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的 形式 2020 1 7 20 一 图示法 随机项u的异方差与解释变量的变化有关 因此 可利用因变量y与解释变量x的散点图或残差e2i与x的散点图 对随机项u的异方差作近似的直观判断 1 用x y的散点图进行判断看是否存在明显的散点扩大 缩小或复杂型趋势 即不在一个固定的带型域中 2020 1 7 21 2020 1 7 22 看是否形成一斜率为零的直线 2 利用x 的散点图 2020 1 7 23 二 戈德菲尔德 匡特 Goldfeld Quandt 检验 G Q检验以F检验为基础 适用于样本容量较大 异方差递增或递减的情况 G Q检验的思想 先将样本一分为二 对子样 和子样 分别作回归 然后利用两个子样的残差平方和之比构造统计量进行异方差检验 由于该统计量服从F分布 因此假如存在递增的异方差 则F远大于1 反之就会等于1 同方差 或小于1 递减方差 2020 1 7 24 G Q检验的步骤 将n对样本观察值 xi yi 按观察值xi的大小排队 将序列中间的c n 4个观察值除去 并将剩下的观察值划分为较小与较大的相同的两个子样本 每个子样样本容量均为 n c 2 对每个子样分别进行OLS回归 并计算各自的残差平方和分别用RSS1与RSS2表示较小与较大的残差平方和 自由度均为 n c 2 k 1 2020 1 7 25 在同方差性假定下 构造如下满足F分布的统计量 给定显著性水平 确定临界值F v1 v2 若F F v1 v2 则拒绝同方差性假设 表明存在异方差 当然 还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差 2020 1 7 26 三 戈里瑟 Gleiser 检验 基本思想 偿试建立 ei 关于解释变量x的各种幂次方程 如 ei 0 1xi vi ei 0 1xi 1 vi等等 选择关于变量x的不同的函数形式 对方程进行估计并进行显著性检验 如果存在某一种函数形式 使得方程显著成立 则说明原模型存在异方差性 该方法计算量大 一般适用于已知存在异方差 用该方法确定异方差的具体形式 2020 1 7 27 四 Spearman等级 秩 相关检验 这是一种非参数检验 方法为 1 利用最小二乘法对模型进行回归 计算残差ei及其绝对值 ei 2 给出x的每个xi的位次和 ei 的位次 3 计算每个样本点的xi的位次和 ei 的位次的差di4 计算Spearman等级 秩 相关系数 2020 1 7 28 上述统计量服从自由度为 n 2 的t分布 对应给定显著性水平的临界值t 2 n 2 若t t 2 n 2 则认为不存在异方差 若t t 2 n 2 则认为存在异方差 5 对Spearman等级 秩 相关系数进行显著性检验 检验统计量为 2020 1 7 29 四 怀特 White 检验 White检验的基本思想 如果存在异方差 其方差与解释变量有关 可以分析方差是否与解释变量有某些形式的联系以判断异方差性 但是方差一般是未知的 可用OLS法估计的残差平方作为其估计量 在大样本的情况下 做对常数项 解释变量 解释变量的平方及其交叉乘积等所构成的辅助回归 利用辅助回归相应的检验统计量 即可判断是否存在异方差性 2020 1 7 30 四 异方差的消除方法 异方差消除的基本思路是将原模型加以 变换 使得 变换 后的模型具有同方差性 但是变换的形式与每个随机项方差的真实值是已知还是未知有关 一 随机项方差 i2已知 当 i2已知或者可以估计出来的情况 可利用广义的最小二乘法 下面介绍广义最小二乘法的另一种情形 加权最小二乘法 WeightedLeastSquares WLS 2020 1 7 31 加权最小二乘法的基本思想 加权最小二乘法是对原模型加权 加权最小二乘法的实质是用方差 i2的平方根 i对原模型进行变换 使之变成一个新的不存在异方差性的模型 然后采用OLS估计其参数 以一元线性模型为例 对原模型两端分别除以 i得 令称为变换后的模型的随机项 因为 所以 所以 2020 1 7 32 加权最小二乘法的基本思想 加权最小二乘法是对原模型加权 加权最小二乘法的实质是用方差 i2的平方根 i对原模型进行变换 使之变成一个新的不存在异方差性的模型 然后采用OLS估计其参数 在采用OLS方法时 对较小的残差平方ei2赋予较大的权数对较大的残差平方ei2赋予较小的权数 其中 2020 1 7 33 注意 加权最小二乘法的思路很简单 但在具体实践中有关随机项方差的信息极少 我们很难找出真实的随机项方差 i2 因此加权最小二乘法仅是理论上的存在 实际上往往很难使用它 所以 当 i2未知或者利用已知观测数据无法估计的情况下 必须寻求其它的方法 二 随机项方差未知 从异方差的意义看 异方差就是随机项在解释变量取不同数值时方差不同 这就意味着异方差 i2是解释变量x的函数 这种函数形式我们可假设出来 2020 1 7 34 例如 如果只与一个解释变量有关 则可设 如果与m个解释变量有关 则可设 设原模型为 i 1 2 n 用去除原模型两端得 2020 1 7 35 记 则 这说明转换后的模型具有了同方差性 可以使用OLS进行估计了 2020 1 7 36 再以一元模型为例进行分析 假定1 此时用x去除以原模型 可得 则有 这样转换后的模型具有同方差性 其中 2020 1 7 37 假定2此时用去除以原模型 可得其中 则有 对转换后的模型即可应用普通最小二乘法进行参数估计 需要注意的是 应将估计的结果转换回原模型 2020 1 7 38 五 案例 储蓄与收入模型 例4 1下表是储蓄与收入的样本观测值 试进行异方差性分析并建立储蓄y关于收入x的线性回归模型 2020 1 7 39 个人储蓄与收入数据单位 百万英镑 2020 1 7 40 1 根据表中数据 做出与的散点图与残差图 方法为 打开SPSS 依次点击Graphsscatter 将x定义为横轴 y定义为纵轴 点击 ok 散点图如下 一 异方差检验 2020 1 7 41 2 根据表中数据 做出残差图运行SPSS 依次点击Analyze Regression linear 打开对话框 定义好自变量和因变量 点击OK 输出结果整理如下 利用SPSS的Transform中的Compute功能 计算各样本点的 残差ei 和残差的平方ei2 据此绘制x与ei2的散点图如下 124 2690 005t 5 27916 538R2 0 904 2020 1 7 42 x与残差平方的散点图 从上面两图可以看出 在较高的收入水平上储蓄的离散程度增大 表明随机项可能存在递增型的异方差 2020 1 7 43 进一步的统计检验 G Q检验 将原始数据按 排成升序 去掉中间的 个观测点数据 得两个容量为11的子样本 对两个子样本分别作OLS回归 求各自的残差平方和RSS1和RSS2 子样本1 子样本2 189 4 0 015 R2 0 787RSS1 144771 5 709 8 0 022 R2 0 152RSS2 769889 2 2020 1 7 44 计算F统计量 F RSS2 RSS1 769889 2 144771 5 5 3 查表给定 5 查得临界值F0 05 9 9 3 18判断F F0 05 9 9 否定两组子样方差相同的假设 从而该总体随机项存在递增异方差性 2020 1 7 45 3 Spearman等级相关检验 打开SPSS 依次点击Analyze Correlate Bivariate 打开对话框 指定x和绝对残差为相关变量 选择Spearman 点击OK 输出结果 2020 1 7 46 二 异方差的处理 1 最优权数的确定以上检验证实了y的异方差性的存在 所以需要用加权最小二乘法估计参数 使用WLS首先需要估计权数 我们采用自变量幂函数的倒数权数的形式 利用SPSS 可以求得幂的最佳取值 打开SPSS 依次点击Analyze Regression Weight Estimate 本例通过运行SPSS得到的取值为2 即权数为 2020 1 7 47 相当于对原总体回归模型变换为 从而异方差性的影响 其拟合优度检验 F检验 t检验均高度显著 加权回归的结果比不加权的回归结果有很大的改进 0 004484 74 165566 19 815 9 985 R2 0 93122F 392 64453 2 加权回归从输出结果看 还原后的加权最小二乘法的估计结果为 2020 1 7 48 一 自相关的含义二 自相关产生的后果三 自相关检验四 自相关模型的经济计量方法五 案例 第三节自相关 2020 1 7 49 一 自相关的含义 如果对于不同的样本点 随机误差项之间不再是不相关的 而是存在某种相关性 即Cov ui uj 0 则认为出现了序列相关或自相关 对于模型yi 0 1x1i 2x2i kxki uii 1 2 n 随机项互不相关的基本假设表现为Cov ui uj 0i j i j 1 2 n 2020 1 7 50 或 在其他假设仍成立的条件下 序列相关即意味着 2020 1 7 51 称为一阶序列相关 或自相关 autocorrelation 其中 被称为自协方差系数 coefficientofautocovariance 或一阶自相关系数 first ordercoefficientofautocorrelation vi是满足以下标准的OLS假定的随机干扰项 如果仅存在E uiui 1 0i 1 2 n 自相关往往可写成如下形式 ui ui 1 vi 1 1 由于序列相关性经常出现在以时间序列为样本的模型中 因此 本节将用下标t代表i E vi 0 Var vi 2 Cov vi vi s 0s 0 2020 1 7 52 自相关产生的原因 一 被解释变量的自相关 二 模型省略了自相关的解释变量 三 随机项本身存在自相关 四 回归模型的数学形式不正确 五 经济变量的惯性作用 2020 1 7 53 计量经济学模型一旦出现序列相关性 如果仍采用OLS法估计模型参数 会产生下列不良后果 二 自相关产生的后果 1 最小二乘估计量仍然是线性无偏的但不具有最优性 因为 在有效性证明中利用了E UUT 2I即同方差性和互相独立性条件 而且 在大样本情况下 参数估计量虽然具有一致性 但仍然不具有渐近有效性 2020 1 7 54 2 变量的显著性检验失去意义 在变量的显著性检验中 统计量是建立在参数方差正确估计基础之上的 这只有当随机误差项具有同方差性和互相独立性时才能成立 其他检验也是如此 2020 1 7 55 3 模型的预测失效 区间预测与参数估计量的方差有关 在方差有偏误的情况下 使得预测估计不准确 预测精度降低 所以 当模型出现序列相关性时 它的预测功能失效 2020 1 7 56 然后 通过分析这些 近似估计量 之间的相关性 以判断随机误差项是否具有序列相关性 序列相关性检验方法有多种 但基本思路相同 基本思路 三 自相关检验 由于序列相关性经常出现在以时间序列为样本的模型中 因此 本节将用下标t代表i 首先 采用OLS法估计模型 以求得随机误差项的 近似估计量 用ei表示 2020 1 7 57 一 图示法 用et的变化图形来判断ut的序列相关性 2020 1 7 58 二 杜宾 瓦森 Durbin Watson 检验法 D W检验是杜宾 J Durbin 和瓦森 G S Watson 于1951年提出的一种检验序列自相关的方法 该方法的假定条件是 1 解释变量x非随机变量 2 随机误差项ut为一阶自回归形式 ut ut 1 vt 1 1 自回归系数 3 回归模型中不应含有滞后应变量作为解释变量 即不应出现下列形式 yt 0 1x1t kxkt yt 1 ut 4 大样本数据 n充分大 2020 1 7 59 该统计量的分布与出现在给定样本中的x值有复杂的关系 因此其精确的分布很难得到 但是 他们成功地导出了临界值的下限dL和上限dU 且这些上下限只与样本的容量n和解释变量的个数k有关 而与解释变量x的取值无关 杜宾和瓦森针对原假设 H0 0 即不存在一阶自回归 构如下造统计量 D W 统计量 2020 1 7 60 D W 统计量的值介于0到4之间 当D W 值在2左右时 模型不存在一阶自相关 证明 展开D W 统计量 这里 只相差一期值 当n较大时 可以认为三者相等 所以上式可以写为 2020 1 7 61 这里 为一阶自回归模型ut ut 1 vt的参数估计 如果存在完全一阶正相关 即 1 则D W 0 完全一阶负相关 即 1 则D W 4 完全不相关 即 0 则D W 2 2020 1 7 62 D W 检验步骤 1 计算DW值 2 给定 由n和k的大小查DW分布表 得临界值dL和dU 3 比较 判断 若0 D W dL存在正自相关dL D W dU不能确定dU D W 4 dU无自相关4 dU D W 4 dL不能确定4 dL D W 4存在负自相关 2020 1 7 63 D W检验的局限性 D W检验仅适用于一阶自回归 且D W检验有两个不能确定的区域 一旦D W的值落在这两个区域 就无法确定u是否存在自相关 在这种情况下 只能通过增加样本观测值或选区其他样本的方法重新检验或采取别的检验方法 2020 1 7 64 如果模型被检验证明存在序列相关性 则需要发展新的方法估计模型 最常用的方法是广义最小二乘法 GLS Generalizedleastsquares 和广义差分法 GeneralizedDifference 四 自相关模型的经济计量方法 2020 1 7 65 一 差分法 适用于一阶自回归模型ut ut 1 vt的参数 已知的情形 下面以一元线性模型为例进行说明 设模型为 其中ut具有一阶自回归形式 将上式滞后一期 并乘以 得 两式相减得 2020 1 7 66 令 这种变换称为广义差分变换 变换后的模型称为广义差分模型 上述方法是将原回归模型进行广义差分变化得到广义差分模型 对广义差分模型应用OLS 这种方法称为广义差分法 则得到 为了避免变换带来的观测值的损失 可采取如下方法 令 2020 1 7 67 假定 1 则 4 47 变为 再作如下变换 这种变换叫做一阶差分变换 上式叫做一阶差分模型 其重要特征是没有常数项 最小二乘估计量为 则上式变为 2020 1 7 68 二 杜宾 durbin 两步法 第一步 将广义差分变换后的模型写作 基本思路 先估计出 得到 的估计值 再进行广义差分变换 具体步骤如下 令 则 4 54 可写作 4 54 4 55 对上式进行OLS估计 求得 的估计值 2020 1 7 69 第二步 用 的估计值对原模型 4 45 进行差分变换 即代入差分变换式 对差分模型 应用OLS 求得a0 1的估计值 从而 杜宾二步法存在两个问题 一 所得参数估计值的精度依赖于 的估计值的精确度 二 差分模型的随机项仍有可能存在自相关 2020 1 7 70 三 科克伦 奥科特迭代法 1 采用OLS法估计原模型得到的u的 近似估计值 e 得到 et et 1 vt 2 以之作为观测值使用OLS法估计求得 的估计值 记作 则 该方法是对杜宾二步法中精度的一种改进 通过迭代过程来降低变换后的模型中随机项序列自相关的程度 具体步骤如下 2020 1 7 71 3 利用 1 进行广义差分变换得广义差分模型 其中 4 对 应用OLS进行估计 得到a0 1的估计值分别为 并对vt进行自相关检验 如果vt无自相关 迭代就此结束 否则将还原为原模型的参数估计值 得到它的回归方程 由此计算ut的第二次估计值et 重复上述过程 应用OLS计算 的第二次估计值 记作 2 2020 1 7 72 关于迭代的次数 可根据具体的问题来定 一般是事先给出一个精度 当相邻两次 的估计值之差小于这一精度时 迭代终止 实践中 有时只要迭代两次 就可得到较满意的结果 两次迭代过程也被称为科克伦 奥科特两步法 在得到 2 之后 利用 2 对模型再进行差分变换 这就是第二次迭代 类似地 可进行第三次 第四次迭代 2020 1 7 73 五 案例 某国进口贸易额IM与国民生产总值GDP的数据见表 试建立进口贸易额IM与国民生产总值GDP的线性回归模型 资料见下页 2020 1 7 74 进口贸易额与国民生产总值的数据 单位 百万英镑 2020 1 7 75 应用最小二乘法得到如下回归方程 R2 0 983 d 0 9337 给定 0 05 查显著性水平为0 05 观测值个数为20及解释变量个数为1的D W分布表 得到临界值 dL 1 20dU 1 41 因为d dL 所以随机项u存在一阶正自相关 248 65 0 087 2020 1 7 76 自相关的处理 杜宾二步法 估计一阶自相关系数 作et关于et 1的线性回归 得到 可得 0 53 对关于的线性模型做最小二乘估计 得 令 0 53 做以下变换 2020 1 7 77 标准差 235 35 0 02 样本决定系数R2 0 949D W 值d 1 87 因为d接近2 已经消除自相关 故得回归系数估计值 由此得要估计的原回归方程为 第四节随机解释变量问题 一 估计量的渐近性质二 随机解释变量模型OLS估计特性三 随机解释变量模型的经济计量方法四 案例 2020 1 7 79 对于模型 i 1 2 n 要求满足古典假设4 随机项u与解释变量x之间不相关 即 Cov xi ui 0i 1 2 n只要解释变量x1 x2 xk是确定性变量 则上述假设自动满足 2020 1 7 80 在许多经济现象中 自变量的非随机性假定有时是不符合实际的 因为 许多经济变量是不能用控制的方法进行观测的 所以作为模型中的解释变量其取值就不可能是确定的 而是随机的 又由于随机项包含了模型中略去的解释变量 而略去的解释变量同模型中保留的解释变量往往是相关的 自回归模型中 因变量作为解释变量也必定是随机变量了 因此 我们必须对模型中的解释变量为随机变量且与随机项相关的情形进行讨论 如果存在一个或多个随机变量作为解释变量 则称原模型出现随机解释变量问题 下面我们就对解释变量为随机变量且与随机项相关的情形进行讨论 2020 1 7 81 一 估计量的渐近性质 线性 无偏性和有效性是评价一个估计量优劣的标准 在有的情况下 小样本的估计量不具有某种统计特性 但随着样本容量的增大 估计量逐渐有了这种统计性质 此时称之为估计量的渐近统计性质 1 渐近无偏性 2 渐近一致性 2020 1 7 82 1 渐近无偏性 记为样本容量为n时参数 的估计量 如果满足 则称为 的渐近无偏估计量 有时 在小样本的情况下 是有偏的 但随着样本容量的逐步增大 与 的系统偏差越来越小 逐渐趋于0 通过增加样本容量 可以改善参数估计的精度 2020 1 7 83 2 渐近一致性 对真实值 在样本容量为n时的估计值 如果当样本容量n充分大时 值趋近于真值 的概率接近于1 即 则称为 的一致估计量 可以证明 为 的一致估计量 当且仅当 简记为 2020 1 7 84 概率极限有以下运算法则 c为一常数 2020 1 7 85 二 随机解释变量模型OLS估计特性 以一元线性回归模型为例说明 设给定的模型为 采用离差形式即为 式中 不管自变量x是否是随机变量 对上式应用OLS 参数的估计量都是 2020 1 7 86 我们分下列四种情况进行讨论 1 x是非随机变量 x与u自然不相关 最小二乘估计量是无偏的 2020 1 7 87 2 x是随机变量 但x与u不相关 且相互独立 最小二乘估计量仍然是无偏的 3 x是随机变量 x与u不相关 但也不独立 最小二乘估计量是有偏的 2020 1 7 88 但由于Cov x u 0 即 对式 4 70 两边取概率极限 说明最小二乘估计量具有一致性 也就是说 如果x是随机变量 且x与u不相关但也不独立 虽然小样本的无偏性得不到满足 但在样本容量增加时 OLSE会逐渐逼近真实的总体参数 即在样本足够大时 OLSE仍然是有意义的 2020 1 7 89 4 x是随机变量 x与u相关 即使在大样本条件下 仍然存在 对式 4 68 设 x与u之间的相关系数为 则式 4 75 变为 由此可以看出 是 1的非一致估计量 这时OLS失效 必须引进其他方法估计参数和进行统计推论推论 2020 1 7 90 模型中出现随机解释变量且与随机误差项相关时 OLS估计量是有偏的 如果随机解释变量与随机误差项异期相关 则可以通过增大样本容量的办法来得到一致的估计量 但如果是同期相关 即使增大样本容量也无济于事 这时 最常用的估计方法是工具变量法 Instrumentvariables 三 随机解释变量模型的经济计量方法 2020 1 7 91 1 工具变量的选取 工具变量法的基本思路 当解释变量与随机项相关时 则寻找另一个变量 该变量与随机解释变量高度相关 但与随机误差项不相关 则称该变量为工具变量 用其替代随机解释变量 选择为工具变量的变量必须满足以下条件 1 工具变量必须具有实际经济意义 2 与所替代的随机解释变量高度相关 但与随机误差项不相关 3 与模型中其它解释变量不相关 以避免出现多重共线性 4 模型中多个工具变量之间不相关 2020 1 7 92 2 工具变量的应用 以一元回归模型的离差形式为例说明如下 用OLS估计模型 由可得 用去乘模型两边 对i从1到n求和得到 由古典假定u和x不相关 即Cov u x 0 因此有 4 77 利用该条件就可以略去 4 77 等式右边的第二项 将 1用代替也得到正规方程组 2020 1 7 93 如果u与x相关 则 普通最小二乘法失效 不能用去乘模型两边 需要另寻找一个变量z z与x高度相关而与u不相关 z叫做工具变量 用去乘模型两边 对i从1到n求和得到 由于z和u不相关 即Cov u z 0 因此有 利用该条件就可以略去上述等式右边的第二项 将 1用代替也得到 2020 1 7 94 从而得到工具变量法估计量 然后由公式 得到 0的估计值 2020 1 7 95 i 1 2 n 如果xj j 1 2 k 与随机项u不相关 用最小二乘原理可得到正规方程组 对于多元线性回归模型 设模型为 解得 XTX 1XTY 2020 1 7 96 但当xj j 1 2 k 与随机项u相关 即Cov xj u 0或 普通最小二乘法失效 此时可采用工具变量法 设xj j 1 2 k 的工具变量为zj 即每一个解释变量都对应一个工具变量 根据工具变量应满足的条件 可得 将关系式 i 1 2 n 代入上式得 2020 1 7 97 当j 1 2 k时 上式即可分解为k个方程式 与上述正规方程组的第一个方程一起就组成了由 k 1 个方程组成的方程组 利用样本数据求解便得到参数的工具变量法的估计量 也可将此方程组转化为矩阵的形式求解 可见 工具变量法实际上是一种矩方法 参数的工具变量估计量无论对一元还是多元的模型都具有有偏且一致的统计性 2020 1 7 98 四 案例 下页表中x代表国内生产总值 y代表消费 z代表投资 用表中所提供的某地的三项指标的资料说明工具变量的使用方法 2020 1 7 99 国内生产总值 消费 投资数据 单位 亿元 2020 1 7 100 设消费y与国内生产总值x之间具有线性关系 可建立如下模型 由于消费y和国内生产总值x与随机项u相关 而投资z与随机项u无关 与国内生产总值x高度相关 故可用z作为国内生产总值x的工具变量 参数估计如下 0 568051 876 010088 则样本回归模型为 2020 1 7 101 一 多重共线性的含义二 多重共线性引起的后果三 多重共线性的检验四 消除多重共线性的方法五 案例 第五节多重共线性 2020 1 7 102 一 多重共线性的含义 如果某两个或多个解释变量之间出现了某种相关关系 则称解释变量之间存在多重共线性 Multicollinearity 对于模型yi 0 1x1i 2x2i kxki uii 1 2 n其基本假设之一是解释变量是互相独立的 即要求Rank X k 1 2020 1 7 103 如果存在不全为零的常数c1 c2 ck使得 c1x1i c2x2i ckxki 0i 1 2 n成立 则称为解释变量间存在完全共线性 perfectmulticollinearity 如果存在不全为零的常数c1 c2 ck使得 c1x1i c2x2i ckxki vi 0i 1 2 n成立 其中vi为随机误差项 则称解释变量间存在近似共线性 approximatemulticollinearity 或交互相关 intercorrelated 对于多元线性回归模型 解释变量的线性相关性分完全线性相关和不完全线性相关或接近线性相关两类 2020 1 7 104 在矩阵表示的线性回归模型 Y X u中 完全共线性指 rank X k 1 即 中 至少有一列向量可由其他列向量 不包括第一列 线性表示 如 x2i x1i 则x2对y的作用可由x1代替 2020 1 7 105 注意 完全共线性的情况并不多见 一般出现的是在一定程度上的共线性 即近似共线性 综上所述 多重共线性就是指解释变量之间存在完全的线性关系或接近的线性关系 2020 1 7 106 多重共线性产生的原因 一般地 产生多重共线性的主要原因有以下三个方面 1 经济变量相互关系复杂 有共同变化趋势时间序列样本 经济繁荣时期 各基本经济变量 收入 消费 投资 价格 都趋于增长 衰退时期 又同时趋于下降 横截面数据 生产函数中 资本投入与劳动力投入往往出现高度相关情况 大企业二者都大 小企业都小 2020 1 7 107 2 滞后变量的引入 在经济计量模型中 往往需要引入滞后经济变量来反映真实的经济关系 例如 消费 f 当期收入 前期收入 显然 两期收入间有较强的线性相关性 2020 1 7 108 3 样本资料的限制 一般经验 时间序列数据样本 简单线性模型 往往存在多重共线性 截面数据样本 问题不那么严重 但多重共线性仍然是存在的 由于完全符合理论模型所要求的样本数据较难收集 特定样本可能存在某种程度的多重共线性 2020 1 7 109 1 参数估计值不精确 也不稳定 样本观测值稍有变动 增加或减少解释变量等都会使参数估计值发生较大变化 甚至出现符号错误 从而不能正确反映解释变量对因变量的影响 2 参数估计值的标准差较大 使参数的显著性检验增加了接受零假设的可能 从而舍去对因变量有显著影响的解释变量 3 难以区分每个解释变量的单独影响 多重共线性产生的影响具有一定的不确定性 在一些模型中 程度并不高的共线性可能带来了严重的后果 而在另一些模型中 较高程度的共线性却没有造成不利影响 甚至参数估计值的标准差也不大 一般的 模型中存在多重共线性 便有造成不利后果的可能 二 多重共线性的后果 2020 1 7 110 注意 除非是完全共线性 多重共线性并不意味着任何基本假设的违背 因此 即使出现较高程度的多重共线性 OLS估计量仍具有线性性等良好的统计性质 问题在于 即使OLS法仍是最好的估计方法 它却不是 完美的 尤其是在统计推断上无法给出真正有用的信息 2020 1 7 111 多重共线性检验的任务是 1 检验多重共线性是否存在 2 估计多重共线性的范围 即判断哪些变量之间存在共线性 多重共线性表现为解释变量之间具有相关关系 所以用于多重共线性的检验方法主要是统计方法 三 多重共线性的检验 2020 1 7 112 一 直观判断法 1 散点图法 对含有两个解释变量的模型 利用解释变量样本观测值的散点图来考察二者是否存在显著的线性关系 2 相关系数法 计算解释变量之间的简单相关系数 若两个解释变量之间的相关系数 r 接近于1 则可以认为模型存在多重共线性 3 经典 判断法 多重共线性的 经典 特征是R2较高 但参数检验值显著的不多 如果一个回归分析结果中存在这一特征 则应考虑其是否存在多重共线性的问题 2020 1 7 113 注意 直观判断的前两种方法只适用于两个解释变量的情况 因为在多于两个解释变量的线性模型中 虽其中的两个解释变量呈低度线性相关 但多个解释变量之间可能呈现出较强的共线性 如下面的例子 设有三个样本值如下 x1i 1 2 24x2i 2 25 48x3i 1 23 24 则 可以发现 它们两两相关系数不大 但是x2i x1i x3i 显然x1i x2i x3i是完全共线的 2020 1 7 114 二 自变量之间的复决定系数和方差扩大因子 设解释变量为k个 即x1 x2 xk 我们分别以其中的一个对其它所有的解释变量进行回归 得k个回归方程 对每个回归方程求其决定系数分别为 在这些决定系数中寻其最大而且接近于1者 比如说Rj2最大 则可以判定解释变量与其它解释变量中的一个或多个相关程度高 因此就使得回归模型出现高度多重共线性 2020 1 7 115 计量经济学中在检验多重共线性时 往往称 1 Rj2 为自变量xj的容忍度 Tolerance 其倒数为方差扩大因子 VarianceInflationFactor 简记为VIF 即 2020 1 7 116 现以二元线性模型yi 0 1x1i 2x2i ui为例 恰为x1与x2的线性相关系数的平方r2 由于r2 1 故1 1 r2 1 2020 1 7 117 多重共线性使参数估计值的方差增大 1 1 r2 为方差扩大因子 VarianceInflationFactor VIF 当完全不共线时 r2 0 当近似共线时 0 r2 1 当完全共线时 r2 1 2020 1 7 118 现以二元线性模型yi 0 1x1i 2x2i ui为例 用x1 x2的样本相关系数代入上式得 同理可得 2020 1 7 119 注 也可以用k个自变量所对应的方差扩大因子的平均数来度量多重共线性 当模型中全部k个自变量所对应的方差扩大因子的平均数大于1时 就表明存在严重的多重共线性 经验表明 当VIFj 10时 自变量xj与其它自变量之间的多重共线性就非常大了 以至于足以影响到OLSE 可见 一个自变量与其他自变量的复决定系数越大 即多重共线性越严重 会造成回归系数的OLSE的方差越大 所以我们把VIFj称为 方差扩大因子 它可以反映多重共线性的严重程度 2020 1 7 120 三 利用不包括某一解释变量所构成的回归方程之决定系数 设多元线性回归模型为以下函数形式 设其样本决定系数为R2 假定依次缺一个解释变量进行回归 则可得到k个回归方程 其中Rj2为缺少解释变量xj的回归方程之决定系数 对应的样本决定系数分别为 2020 1 7 121 在这些决定系数中选取一个最大者比如说Rj2 则Rj2与R2的差为最小 这样解释变量xj从模型中去掉 对样本决定系数的影响不大 由此说明了解释变量xj对因变量的解释能力已由其它解释变量代替了 从而表明xj可能是其它解释变量的线性组合 因此可以判定解释变量中包含xj引起了多重共线性 2020 1 7 122 四 法勒 格劳伯 Farrar Glauber 检验 Farrar Glauber提出的检验是三种检验的结合 第一种检验是 2检验 它检验多元回归模型中所有解释变量之间存在共线性及共线性的程度 第二种检验是F检验 用来确定哪些解释变量是多重共线的 第三种检验是t检验 用来找出造成解释变量多重共线性原因的是哪些变量 2020 1 7 123 第一 2检验 若k个变量x1 x2 xk满足rij 0 i j i j 1 2 k 则说这k个变量是正交的 基本思想 设相关系数矩阵为 其中 2020 1 7 124 由A可以看出 当解释变量存在完全共线性时 A 0 当解释变量互相正交时 A 1 因此可以认为当解释变量存在多重共线性时 0 A 1 多重共线性程度越高 A 就越偏离1而接近于0 也就是说解释变量就越偏离正交性而接近完全共线性 根据样本数据计算统计量 2的值与 2分布的临界值相比较 若 2的值大于 2分布的临界值 拒绝正交假设 接受多重共线性假设 所计算的值越大 多重共线性程度就越高 若计算的 2值小于 2分布的临界值 就接受正交假设 即不存在多重共线性 构造统计量 2020 1 7 125 第二 F检验 基本思路 分别建立每一个解释变量与其它解释变量的线性回归方程 并在此基础上 计算每个回归方程的样本决定系数 我们的目的是检验xj与其它 k 1 个解释变量之间的线性关系是否显著 即与其它个解释变量是否显著多重共线 构造统计量 给定显著性水平 查F分布表得临界值F k 1 n k 若F F 则认为xj与其它 k 1 个解释变量之间多重共线显著 若F F 则可认为xj与其它 k 1 个解释变量之间多重共线不显著 2020 1 7 126 第三 t检验 通过F检验 若得出xj与其余的解释变量存在多重共线性 那么xj与哪些解释变量是引起多重共线的原因 这是需要解决的问题 可由下面的t检验给出 给定显著性水平 查t分布表得临界值t 2 若统计量t t 2 则认为xj和xi的偏相关系数是显著的 也就是xj和xi是引起多重共线的原因 若t t 2 则认为xj和xi不是引起多重共线的原因 构造统计量 计算xj与其余每一个解释变量的偏相关系数 2020 1 7 127 四 消除多重共线性的方法 模型中存在多重共线性 是不是一定不好呢 这要视模型的具体用途而定 如果模型只是用来进行预测 只要多重样本决定系数 R2 足够大即可 无需消除多重共线性 但如果模型是用来进行结构分析和政策评价 由于多重共线性影响到每个自变量系数估计的正确性和有效性 所以应设法消除多重共线性的影响 确保模型的可用性 2020 1 7 128 一 增加样本观测值 如果多重共线性是由样本引起的 例如测量误差或偶然的样本 但解释变量的总体不存在多重共线性 则可以通过收集更多的观测值增加样本容量 避免或减弱多重共线性 对于时间序列资料就是增大观测次数 对于截面数据资料就是增加观测对象 或者把时间序列资料与截面数据资料结合起来使用 2020 1 7 129 现以二元线性模型yi 0 1x1i 2x2i ui为例 用x1 x2的样本相关系数代入上式得 同理可得 2020 1 7 130 注意 当解释变量总体存在多重共线性时 增加样本容量也无助于减轻多重共线的程度 2020 1 7 131 二 删去不重要的解释变量 对待严重的多重共线性问题 一个最简单的解决办法就是删去那些产生多重共线性 对因变量影响不大且人们认为不重要的解释变量 使模型中剩下那些对因变量起重要作用的解释变量 然后对仅包含重要解释变量的模型应用普通最小二乘法 但应注意的是 由于把
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 离婚简短协议书
- 2025-2030中国无纺布面罩行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030中国品牌设计行业发展分析及发展前景与投资研究报告
- 2025-2030年高粘度沥青行业市场发展分析及发展趋势与投资前景研究报告
- 2025-2030年蔬菜种植行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年电子机械行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年养殖保温灯行业市场发展分析及前景趋势与投资管理研究报告
- 2025-2030年中国高性能摩托车头盔行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国镁焊接粉行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国薰蒸治疗保健仪行业市场深度发展趋势与前景展望战略研究报告
- 语文五年级 【知识精讲】7.阅读(2)文言文阅读
- 社会心理学8-人际关系课件
- QC-R 596-2017高速铁路板式无砟轨道自密实混凝土高清-无水印
- 邻补角、对顶角、同位角、内错角、同旁内角经典习题-一对一专用
- 保密管理-保密教育培训签到簿
- 常见病媒生物分类鉴定
- 手术室剖宫产护理查房-课件
- 隧道工程隧道洞口临建施工方案
- DBJ∕T13-374-2021 福建省钢筋桁架叠合楼板技术标准
- 事故池管理的有关规定
- 高中语文部编版选择性必修下册第四单元 单元学习导航 课件 (8张PPT)
评论
0/150
提交评论