




已阅读5页,还剩100页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高级计量经济学 第四章异方差性 引子 更为接近真实的结论是什么 根据四川省2000年21个地市州医疗机构数与人口数资料 分析医疗机构与人口数量的关系 建立卫生医疗机构数与人口数的回归模型 对模型估计的结果如下 291 5778 0 644284 t 1 931062 8 340265 式中Y表示卫生医疗机构数 个 X表示人口数量 万人 模型显示的结果和问题 人口数量对应参数的标准误差较小 t统计量远大于临界值 可决系数和修正的可决系数结果较好 F检验结果明显显著表明该模型的估计效果不错 可以认为人口数量每增加1万人 平均说来医疗机构将增加5 3735个 然而 这里得出的结论可能是不可靠的 平均说来每增加1万人口可能并不需要增加这样多的医疗机构 所得结论并不符合真实情况 有什么充分的理由说明这一回归结果不可靠呢 更为接近真实的结论又是什么呢 第一节异方差性的实质与产生的原因 一 异方差性的实质 一 同方差性的含义 同方差性 对所有的i i 1 2 n 有 4 1 因为方差是度量被解释变量Y的观测值围绕回归线 4 2 的分散程度 因此同方差性指的是所有观测值的分散程度相同 二 异方差性的含义 设模型为如果对于模型中随机误差项有 4 3 则称具有异方差性 进一步 把异方差看成是由于某个解释变量的变化而引起的 则 4 4 图形表示 一 模型中省略了某些重要的解释变量假设正确的计量模型是 假如略去 而采用 4 5 当被略去的与有呈同方向或反方向变化的趋势时 随的有规律变化会体现在 4 5 式的中 二 模型的设定误差模型的设定主要包括变量的选择和模型数学形式的确定 模型中略去了重要解释变量常常导致异方差 实际就是模型设定问题 除此而外 模型的函数形式不正确 如把变量间本来为非线性的关系设定为线性 也可能导致异方差 二 产生异方差的原因 三 测量误差的变化样本数据的观测误差有可能随研究范围的扩大而增加 或随时间的推移逐步积累 也可能随着观测技术的提高而逐步减小 四 截面数据中总体各单位的差异通常认为 截面数据较时间序列数据更容易产生异方差 这是因为同一时点不同对象的差异 一般说来会大于同一对象不同时间的差异 不过 在时间序列数据发生较大变化的情况下 也可能出现比截面数据更严重的异方差 第二节异方差的后果 一 对参数估计统计特性的影响 一 参数估计的无偏性仍然成立参数估计的无偏性仅依赖于基本假定中的零均值假定 即 所以异方差的存在对无偏性的成立没有影响 二 参数估计的方差不再是最小的同方差假定是OLS估计方差最小的前提条件 所以随机误差项是异方差时 将不能再保证最小二乘估计的方差最小 二 对参数显著性检验的影响由于异方差的影响 使得无法正确估计参数的标准误差 导致参数估计的t统计量值不能正确确定 所以 如果仍用t统计量值进行参数的显著性检验将失去意义 三 对预测的影响尽管参数的OLS估计量仍然无偏 并且基于此的预测也是无偏的 但是由于参数估计量不是有效的 从而对Y的预测也将不是有效的 第三节异方差的检验 一 图形法 一 相关图形分析方差描述的是随机变量取值的 与其均值的 离散程度 因为被解释变量Y与随机误差项u有相同的方差 所以利用分析Y与X的相关图形 可以初略地看到Y的离散程度与X之间是否有相关关系 如果随着x的增加 Y的离散程度为逐渐增大 或减小 的变化趋势 则认为存在递增型 或递减型 的异方差 用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据 绘制出消费支出对纯收入的散点图 其中用表示农村家庭消费支出 表示家庭纯收入 图形举例 二 残差图形分析 设一元线性回归模型为 4 10 运用OLS法估计 得样本回归模型为 4 11 由式 4 10 和式 4 11 得残差 4 12 绘制出对的散点图 如果不随而变化 则表明不存在异方差 如果随而变化 则表明存在异方差 二 Goldfeld Quanadt检验 作用 检验递增性 或递减性 异方差 基本思想 将样本分为两部分 然后分别对两个样本进行回归 并计算两个子样的残差平方和所构成的比 以此为统计量来判断是否存在异方差 一 检验的前提条件1 要求检验使用的为大样本容量 2 除了同方差假定不成立外 其它假定均满足 二 检验的具体做法 1 排序将解释变量的取值按从小到大排序 2 数据分组将排列在中间的约1 4的观察值删除掉 记为c 再将剩余的分为两个部分 每部分观察值的个数为 n c 2 3 提出假设 即 分别对上述两个部分的观察值求回归模型 由此得到的两个部分的残差平方为和 为前一部分样本回归产生的残差平方和 为后一部分样本回归产生的残差平方和 它们的自由度均为 n c 2 k k为参数的个数 在原假设成立的条件下 因和自由度均为 n c 2 k 分布 可导出 4 13 4 构造F统计量 5 判断给定显著性水平 查F分布表得临界值计算统计量F 如果F 则拒绝原假设 接受备择假设 即模型中的随机误差存在异方差 三 检验的特点 要求大样本 异方差的表现既可为递增型 也可为递减型 检验结果与选择数据删除的个数c的大小有关 只能判断异方差是否存在 在多个解释变量的情况下 对哪一个变量引起异方差的判断存在局限 三 White检验 一 基本思想 不需要关于异方差的任何先验信息 只需要在大样本的情况下 将OLS估计后的残差平方对常数 解释变量 解释变量的平方及其交叉乘积等所构成一个辅助回归 利用辅助回归建立相应的检验统计量来判断异方差性 二 检验的特点 要求变量的取值为大样本 不仅能够检验异方差的存在性 同时在多变量的情况下 还能判断出是哪一个变量引起的异方差 三 检验的基本步骤 以一个二元线性回归模型为例 设模型为 并且 设异方差与的一般关系为其中为随机误差项 1 求回归估计式并计算用OLS估计式 4 14 计算残差并求残差的平方 2 求辅助函数用残差平方作为异方差的估计 并建立的辅助回归 即3 计算利用求回归估计式 4 15 得到辅助回归函数的可决系数 n为样本容量 4 提出假设中至少有一个不为零 5 检验在零假设成立下 有渐进服从自由度为5的分布 给定显著性水平 查分布表得临界值 如果 则拒绝原假设 表明模型中随机误差存在异方差 一 ARCH过程设ARCH过程为p为ARCH过程的阶数 并且为随机误差 二 检验的基本思想在时间序列数据中 可认为存在的异方差性为ARCH过程 并通过检验这一过程是否成立去判断时间序列是否存在异方差 四 ARCH检验 1 提出原假设 中至少有一个不为零2 参数估计并计算对原模型作OLS估计 求出残差 并计算残差平方序列 以分别作为对的估计 3 求辅助回归 4 17 三 ARCH检验的基本步骤 4 检验计算辅助回归的可决系数 并且在成立时 基于大样本 渐进服从给定显著性水平查分布表得临界值 如果 则拒绝原假设 表明模型中得随机误差存在异方差 四 检验的特点 变量的取值为大样本 并且是时间序列 只能判断模型中是否存在异方差 而不能诊断出哪一个变量引起的异方差 五 Glejser检验 一 检验的基本思想由OLS法得到残差 取得绝对值 然后将对某个解释变量回归 根据回归模型的显著性和拟合优度来判断是否存在异方差 二 检验的特点不仅能对异方差的存在进行判断 而且还能对异方差随某个解释变量变化的函数形式进行诊断 该检验要求变量的观测值为大样本 三 检验的步骤 1 建立模型并求根据样本数据建立回归模型 并求残差序列2 寻找与的最佳函数形式用残差绝对值对进行回归 用各种函数形式去试 寻找最佳的函数形式 3 判断根据选择的函数形式作对的回归 用作为的替代变量 对所选函数形式回归 用回归所得到的 t F等信息判断 若表明参数显著不为零 即认为存在异方差性 模型变换法 加权最小二乘法 模型的对数变换 第四节异方差的修正 一 模型变换法以一元线性回归模型为例 4 17 经检验存在异方差 且 其中是常数 是的某种函数 变换模型时 用去除 4 17 式的两端 得 记 4 18 则有 4 19 式的随机误差项的方差为 4 20 经变换的 4 19 式的随机误差项已是同方差 常见的设定形式及对应的情况 二 加权最小二乘法 以一元线性回归模型为例 4 17 经检验存在异方差且 其中是常数 是的某种函数 一 基本思路区别对待不同的 对较小的给予较大的权数 对较大的给予较小的权数 从而使更好地反映对残差平方和的影响 二 具体做法1 选取权数并求出加权的残差平方和通常取权数 当越小时 越大 当越大时 越小 将权数与残差平方相乘以后再求和 得到加权的残差平方和 2 求使满足的根据最小二乘原理 若使得加权残差平方和最小 则 其中 三 模型的对数变换 在经济意义成立的情况下 如果对模型 作对数变换 其变量和分别用和代替 即 对数变换后的模型通常可以降低异方差性的影响 运用对数变换能使测定变量值的尺度缩小 经过对数变换后的线性模型 其残差表示相对误差往往比绝对误差有较小的差异 注意 对变量取对数虽然能够减少异方差对模型的影响 但应注意取对数后变量的经济意义 第五章序列相关 引子T检验和F检验一定就可靠吗 研究居民储蓄存款Y与居民收入X的关系 用普通最小二乘法估计其参数 结果为 1 8690 0 0055 t 14 9343 64 2069 F 4122 531检验结果 回归系数的标准误差非常小 t统计量较大 说明居民收入X对居民储蓄存款Y的影响非常显著 同时可决系数也非常高 F统计量 4122 531 也表明模型异常的显著 但此估计结果可能是虚假的 t统计量和F统计量都被虚假地夸大 因此所得结果是不可信的 为什么 第一节序列相关的定义 一 序列相关的概念序列相关 serialcorrelation 又称自相关 autocorrelation 是指总体回归模型的随机误差项之间存在相关关系 即不同观测点上的误差项彼此相关 序列相关系数 的定义与普通相关系的公式形式相同 的取值范围为 1 1 式 5 1 中ut 1是ut滞后一期的随机误差项 因此 将式 5 1 计算的序列相关系数 称为一阶序列相关系数 一阶序列相关系数 式 5 1 二 序列相关产生的原因 序列相关产生的原因 1 经济系统的惯性 2 经济活动的滞后效应 3 数据处理造成的相关 4 蛛网现象 5 模型设定偏误 如GDP 价格 就业等经济指标都会随经济系统的周期而波动 例如 在经济高涨时期 较高的经济增长率会持续一段时间 而在经济衰退期 较高的失业率也会持续一段时间 这种现象就会表现为经济指标的序列相关现象 序列相关现象大多出现在时间序列数据中 而经济系统的经济行为都具有时间上的惯性 原因1 经济系统的惯性 滞后效应是指某一指标对另一指标的影响不仅限于当期而是延续若干期 由此带来变量的序列相关 例如 居民当期可支配收入的增加 不会使居民的消费水平在当期就达到应有水平 而是要经过若干期才能达到 因为人的消费观念的改变客观上存在自适应期 原因2 经济活动的滞后效应 因为某些原因对数据进行了修整和内插处理 在这样的数据序列中就会有序列相关 例如 将月度数据调整为季度数据 由于采用了加合处理 修匀了月度数据的波动 使季度数据具有平滑性 这种平滑性产生序列相关 对缺失的历史资料 采用特定统计方法进行内插处理 使得数据前后期相关 产生了序列相关 原因3 数据处理造成的相关 许多农产品的供给呈现为蛛网现象 供给对价格的反应要滞后一段时间 因为供给需要经过一定的时间才能实现 如果时期t的价格Pt低于上一期的价格Pt 1 农民就会减少时期t 1的生产量 如此则形成蛛网现象 此时的供给模型为 蛛网现象是微观经济学中的一个概念 它表示某种商品的供给量受前一期价格影响而表现出来的某种规律性 即呈蛛网状收敛或发散于供需的均衡点 原因4 蛛网现象 原因5 模型设定偏误 而建立模型时 模型设定为 例如 应该用两个解释变量解释Y 即 则X3t对Yt的影响在式 5 4 中便归入随机误差项ut中 由于X3t在不同观测点上是相关的 这就造成了ut在不同观测点是相关的 呈现出系统模式 此时ut是序列相关的 5 3 5 4 如果模型中省略了某些重要的解释变量或者模型函数形式不正确 都会产生系统误差 这种误差存在于随机误差项中 从而带来了序列相关 由于该现象是由于设定失误造成的序列相关 因此 也称其为虚假序列相关 模型形式设定偏误也会导致序列相关现象 如将U形成本曲线设定为线性成本曲线 则必定会导致序列相关 由设定偏误产生的序列相关是一种虚假序列相关 可通过改变模型设定予以消除 序列相关关系主要存在于时间序列数据中 但是在横截面数据中 也可能会出现序列相关 通常称其为空间序列相关 Spatialautocorrelation 三 序列相关的表现形式 序列相关的性质可以用序列相关系数 的符号判断序列相关的方向 即 0为正相关 当 接近1时 表示相关的程度很高 但序列相关是u1 u2 un序列自身的相关 因n个随机误差项的关联形式不同而具有不同的序列相关形式 序列相关大多出现在时间序列数据中 对于样本观测期为n的时间序列数据 可得到总体回归模型 PRF 的随机误差项为u1 u2 un 如果序列相关形式为 ut ut 1 vt 1 1 其中 为序列相关系数 vt为经典误差项 即E vt 0 Var vt 2 Cov vt vt s 0 s 0 则式 5 5 称为一阶自回归模式 记为AR 1 因为模型 5 5 中ut 1是ut滞后一期的值 因此称为一阶 式 5 5 中的 也称为一阶序列相关系数 5 5 如果式 5 5 中的随机误差项vt不是经典误差项 即vt中包含有ut的成份 如包含有ut 2则需将ut 2显含在回归模型中 其为 ut 1ut 1 2ut 2 vt 5 6 其中 1为一阶序列相关系数 2为二阶序列相关系数 vt 是经典误差项 式 5 6 称为二阶自回归模式 记为AR 2 一般地 如果u1 u2 ut之间的关系为 5 7 其中 vt为经典误差项 则称式 5 7 为m阶自回归模式 记为AR m 在经济计量分析中 通常采用一阶自回归形式 即假定自回归形式为一阶自回归AR 1 第二节序列相关的后果 序列相关的后果 对参数估计的影响 对模型检验的影响 对模型预测的影响 一 对参数估计的影响 在有序列相关的条件下 仍然使用普通最小二乘法将低估估计量的方差 将低估真实的 对于一元线性回归模型 5 8 5 9 其中 为现期随机误差 为前期随机误差 是经典误差项 满足零均值 同方差 无序列相关的假定 假定随机误差项u存在一阶序列相关 5 10 将随机误差项的各期滞后值 逐次代入式 5 9 可得 式 5 10 表明随机误差项可表示为独立同分布的随机误差序列 的加权和 权数分别为1 当0 1时 这些权数是随时间推移而呈几何衰减的 而当 1 0时 这些权数是随时间推移而交错振荡衰减的 5 11 5 12 式 5 11 式 5 12 表明 在为一阶自回归的相关形式时 随机误差依然是零均值 同方差的误差项 由式 5 10 可推得 5 13 由于现期的随机误差项并不影响回归模型中随机误差项的以前各期值 k 0 所以与不相关 即有 因此 由式 5 9 可得随机误差项与其以前各期的协方差分别为 5 14 5 15 5 16 这些协方差分别称为随机误差项的一阶自协方差 二阶自协方差和k阶自协方差 对于一元线性回归模型 5 8 当u为经典误差项时 普通最小二乘估计量的方差为 以此类推 可得 当式 5 8 的随机误差项u有序列相关时 依然是无偏的 即 这一点在普通最小二乘法无偏性证明中可以看到 因为 无偏性证明并不需要u满足无序列相关的假定 那么 最小二乘估计量是否是有效的 即在所有线性无偏估计量中方差最小呢 下面我们将以说明 式 5 8 中的最小二乘估计量为 5 17 因此 5 18 当存在序列相关时 普通最小二乘估计量不再是最佳线性无估计量 即它在线性无偏估计量中不是方差最小的 在实际经济系统中 通常存在正的序列相关 即 0 同时X序列自身也呈正相关 因此式 5 18 右边括号内的值通常大于0 因此 在有序列相关的条件下 仍然使用普通最小二乘法将低估估计量的方差 将低估真实的 二 对模型检验的影响 对模型检验的影响 考虑序列相关时的检验 忽视序列相关时的检验 一 考虑序列相关时的检验 由于并不是所有线性无偏估计量中最小的 使用t检验判断回归系数的显著性时就可能得到错误的结论 t检验的统计量为 由于的错误夸大 得到的t统计量就可能小于临界值 从而得到参数 不显著的结论 而这一结论可能是不正确的 二 忽视序列相关时的检验 如果我们忽视序列相关问题依然假设经典假定成立 使用 将会导致错误结果 当 0 即有正相关时 对所有的j都有 0 另外回归模型中的解释变量在不同时期通常是正相关的 对于xt和xt j来说是大于0的 因此 由式 5 18 可以看出 普通最小二乘法的方差通常会低估的真实方差 当 较大和 t有较强的正序列相关时 普通最小二乘估计量的方差会有很大偏差 我们会夸大估计量的估计精度 即得到较小的标准误 因为的标准误是的标准差的估计值 在有序列相关时 普通最小二乘估计的标准误就不可靠了 一个被低估了的标准误意味着一个较大的t统计量 因此 当 0时 通常t统计量都很大 这种有偏的t统计量是不能用来判断回归系数的显著性的 综上所述 在序列相关情形下 无论考虑序列相关 还是忽视序列相关 通常的回归系统显著性的t检验都将是无效的 类似地 由于序列相关的存在 参数的最小二乘估计量是无效的 使得F检验和检验也是不可靠的 三 对模型预测的影响 模型预测的精度决定于抽样误差和总体误差项的方差 抽样误差来自于对的估计 在序列相关情形下 的方差的最小二乘估计变得不可靠 由此必定加大抽样误差 同时 在序列相关情形下 对的估计也会不可靠 由此可看出 影响预测精度的两大因素都会因序列相关的存在而加大不确定性 使预测的置信区间不可靠 从而降低预测的精度 一 图示检验法 图示法是一种直观的诊断方法 它是把给定的回归模型直接用普通最小二乘法估计参数 求出残差项et et作为ut随机项的真实估计值 再描绘et的散点图 根据散点图来判断et的相关性 残差et的散点图通常有两种绘制方式 第三节序列相关的检验 绘制et 1 et的散点图 用 et 1 et t 1 2 n 作为散布点绘图 如果大部分点落在第 象限 表明随机误差项ut存在着正序列相关 如图5 1所示 如果大部分点落在第 象限 那么随机误差项ut存在着负序列相关 如图5 2所示 按照时间顺序绘制回归残差项et的图形 如果et t 1 2 n 随着t的变化逐次有规律地变化 呈现锯齿形或循环形状的变化 就可断言et存在相关 表明存在着序列相关 如果et随着t的变化逐次变化并不断地改变符号 那么随机误差项ut存在负序列相关 如图5 3所示 如果et随着t的变化逐次变化并不频繁地改变符号 而是几个正的et后面跟着几个负的 则表明随机误差项存ut在正序列相关 如图5 4所示 二 DW检验法 DW检验是J Durbin 杜宾 和G S Watson 沃特森 于1951年提出的一种适用于小样本的检验方法 DW检验只能用于检验随机误差项具有一阶自回归形式的序列相关问题 这种检验方法是建立经济计量模型中最常用的方法 一般的计算机软件都可以计算出DW值 5 20 5 21 5 22 随机误差项的一阶自回归形式为 为了检验序列的相关性 构造的原假设是 为了检验上述假设 构造DW统计量首先要求出回归估计式的残差et定义DW统计量为 DW值的取值范围 在认为 则 5 23 5 24 由于 表5 1 因此 所以 DW值与的对应关系如表5 1所示 由上述讨论可知DW的取值范围为 DW 根据样本容量n和解释变量的数目k 不包括常数项 查DW分布表 得临界值dL和dU 然后依下列准则考察计算得到的DW值 以决定模型的序列相关状态 表5 2DW检验决策规则 图5 5DW检验示意图 表5 2可以用坐标图更加直观地表示出来 需要注意的是 DW检验尽管有着广泛的应用 但也有明显的缺点和局限性 DW检验有两个不能确定的区域 一旦DW值落在这两个区域 就无法判断 这时 只有增大样本容量或选取其他方法 DW统计量的上 下界表要求n 15 这是因为样本如果再小 利用残差就很难对序列相关的存在性做出比较正确的诊断 DW检验不适应随机误差项具有高阶序列相关的检验 只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量 第四节序列相关的修正 对于虚假序列相关 由于是模型设定偏误造成的 只能通过改变模型的设定去消除 对于设定正确的模型 如随机误差项有序列相关 则为真实的序列相关 对于真实的序列相关可采用如下方法予以消除 广义差分法 Cochrane Orcutt迭代法 其它方法 一阶差分法德宾两步法 广义差分法 对于序列相关的结构已知的情形可采用广义差分法解决 由于随机误差项ut是不可观测的 通常我们假定ut为一阶自回归形式 即ut ut 1 vt 5 25 其中 1 vt为经典误差项 当序列相关系数为已知时 使用广义差分法 序列相关问题就可彻底解决 我们以一元线性回归模型为例说明广义差分法的应用 对于一元线性回归模型 5 26 将模型 5 26 滞后一期可得 5 27 用 乘式 5 27 两边 得 5 28 用式 5 26 减去式 5 28 可得 5 29 模型 随机误差项无序列相关 式 5 29 中 ut ut 1 vt是经典误差项 因此 模型 5 29 已经是经典线性回归 令 则式 5 29 可表示为 5 30 对模型 5 30 使用普通最小二乘估计就会得到参数估计的最佳线性无偏估计量 式 5 29 称为广义差分方程 因为被解释变量与解释变量均为现期值减去前期值的一部分 由此而得名 在进行广义差分时 解释变量X与被解释变量Y均以差分形式出现 因而样本容量由n减少为n 1 即丢失了第一个观测值 如果样本容量较大 减少一个观测值对估计结果影响不大 但是 如果样本容量较小 则对估计精度产生较大的影响 此时 可采用普莱斯 温斯滕 Prais Winsten 变换 将第一个观测值变换为 补充到差分序列中 再使用普通最小二乘法估计参数 第六章多重共线性 第一节多重共线性的定义 一 多重共线性的含义在计量经济学中所谓的多重共线性 Multi Collinearity 不仅包括完全的多重共线性 还包括不完全的多重共线性 如果存在不全为0的数 使得则称解释变量之间存在着完全的多重共线性 当Rank X k时 表明在数据矩阵X中 至少有一个列向量可以用其余的列向量线性表示 则说明存在完全的多重共线性 对于解释变量 不完全的多重共线性 实际中 常见的情形是解释变量之间存在不完全的多重共线性 对于解释变量 存在不全为0的数 使得 为随机变量 这表明解释变量 只是一种近似的线性关系 其中 回归模型中解释变量的关系 可能表现为三种情形 1 解释变量间毫无线性关系 变量间相互正交 这时已不需要作多元回归 每个参数 j都可以通过Y对Xj的一元回归来估计 解释变量间完全共线性 此时模型参数将无法确定 解释变量间存在一定程度的线性关系 实际中常遇到的情形 2 3 二 产生多重共线性的原因 多重共线性产生的经济原因主要有几种情形 1 经济变量之间具有共同变化趋势 2 模型中包含滞后变量 3 利用截面数据建立模型也可能出现多重共线性 4 样本数据自身的原因 第二节多重共线性产生的后果 一 完全多重共线性产生的后果1 参数的估计值不确定当解释变量完全线性相关时 OLS估计式不确定 从偏回归系数意义看 在和完全共线性时 无法保持不变 去单独考虑对Y的影响 和的影响不可区分 从OLS估计式看 可以证明此时2 参数估计值的方差无限大OLS估计式的方差成为无穷大 二 不完全多重共线性下产生的后果 如果模型中存在不完全的多重共线性 可以得到参数的估计值 但是对计量经济分析可能会产生一系列的影响 1 参数估计值的方差增大当增大时也增大2 对参数区间估计时 置信区间趋于变大3 假设检验容易作出错误的判断4 可能造成可决系数较高 但对各个参数单独的t检验却可能不显著 甚至可能使估计的回归系数符号相反 得出完全错误的结论 第三节多重共线性的检验 一 简单相关系数检验法含义 简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法 判断规则 一般而言 如果每两个解释变量的简单相关系数 零阶相关系数 比较高 例如大于0 8 则可认为存在着较严重的多重共线性 注意事项 较高的简单相关系数只是多重共线性存在的充分条件 而不是必要条件 特别是在多于两个解释变量的回归模型中 有时较低的简单相关系数也可能存在多重共线性 因此并不能简单地依据相关系数进行多重共线性的准确判断 二 方差扩大 膨胀 因子法 含义 统计上可以证明 解释变量 的参数估计值 的方差可表示为 其中的 是变量 VarianceInflationFactor 即 的方差扩大因子 其中是多个解释变量辅助回归的可决系数 经验规则 方差膨胀因子越大 表明解释变量之间的多重共线性越严重 反过来 方差膨胀因子越接近于1 多重共线性越弱 经验表明 方差膨胀因子 10时 说明解释变量与其余解释变量之间有严重的多重共线性 且这种多重共线性可能会过度地影响最小二乘估计 三 直观判断法 1 当增加或剔除一个解释变量 或者改变一个观测值时 回归参数的估计值发生较大变化 回
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 10357.7-2025家具力学性能试验第7部分:桌类稳定性
- 2025年宁夏安全员考试法规题库答案
- 2025年无人机巡检员巡检研发面试模拟题
- 2025年扶贫基金会面试技巧与模拟题集锦
- 2025年医院会计实施预测题及答案
- 2025年学校安全员技能考核题及答案
- 2025年司法鉴定助理环境面试模拟试卷集
- 2025年安全生产培训考试答案
- 2025年农林技术员资格考试试题及答案解析
- 机票业务培训基础知识
- 2025年北师大版新教材数学二年级上册教学计划(含进度表)
- 2025年职业技能鉴定-油品储运调和操作工-油品储运调和操作工(高级技师)历年参考题库含答案解析(5套)
- 初中语文学科组质量分析
- 2025年电抗器行业当前市场规模及未来五到十年发展趋势报告
- 新班主任自我介绍课件
- 2025广西中考英语真题(原卷版)
- 餐饮行业食品安全管理实务培训教材
- 反歧视艾滋病课件
- 供应商保价协议合同范本
- 2025-2030中国乒乓发球机行业市场运营模式及未来发展动向预测报告
- 2025年广东省中考历史试卷(含答案)
评论
0/150
提交评论