




已阅读5页,还剩129页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 计量经济学 econometrics 2 第一章绪论 一 计量经济学 1 计量经济学 econometrics 利用数学和统计推断为工具 在经济理论指导下对经济现象进行分析 并对经济理论进行检验和发展的一门学科 其内容涉及经济理论 数理经济 经济统计和数理统计等 2 计量经济学与经济理论经济理论 定性计量经济学 数值估计 检验3 计量经济学与数理经济学数理经济学 以数学形式表述经济理论 不涉及理论的可度量性和经验方面的可论证性 计量经济学 利用数理经济学的数学方程式 并把之改造成适合于经验检验的形式 3 4 计量经济学与经济统计学经济统计 经济数据的收集 加工 不利用数据来检验经济理论 计量经济学 以经济统计数据为原始资料进行分析 5 计量经济学与数理统计数理统计 是计量经济学的基本工具 但由于经济数据的特殊性 力量经济学需要特殊的处理方法 4 二 计量经济学的建模过程 基本过程 经济理论或假说的陈述 经济理论或假说的数学模型的设定 理论的计量经济学模型 数据的收集整理 计量经济模型的参数估计 假设检验 预测 利用模型进行控制或制定政策 5 例 检验凯恩斯关于边际消费倾向理论 或利用该理论进行经济控制或经济政策制定 理论人们的消费支出随收入的增加而增加 但消费支出的增加小于收入的增加 即边际消费倾向mpc大于零而小于1 定性 建立数学模型假定消费支出y与收入x之间有如下关系 其中 y为消费支出 x为收入 a和b为模型参数 b就是mpc 这里y为因变量 x为自变量 解释变量 假定两者之间存在先行关系 在不同情况下 数学模型的形式不一样 也可能是多个方程连立 有多个解释变量 6 建立计量经济学模型由于经济变量之间的关系不是确定的 以函数形式准确表达 必须修改数理模型 建立计量模型 u为误差项 代表了影响变量间非确定关系的其他因素的影响 这是一个线性回归模型 o x y 斜率为b 数理模型 o x y 斜率为b 计量模型 a a 7 数据的收集整理如果分析一国的消费情况 要收集该国的总消费支出数据和总收入数据 选择 加工 美国1980 1991年个人消费支出与gdp 10亿美元 1987年不变价格 8 计量经济模型的参数估计采用回归技术 利用统计数据估计出参数a和b的经验值 根据估计结果 美国1980 1991年的mpc约为0 72 假设检验以一定的标准 对参数的估计结果进行检验 如果在统计意义上 b小于1 说明结果是可接受的 预报和预测如果计量模型可以接受 就可用来对因变量进行预测 假定1994年 美国的gdp预计为6万亿美元 则该年的消费支出预计为 9 控制或政策制定如果希望1994年的消费支出达到4万亿美元 则政府必须通过政策来保证收入水平为 三 计量经济学的内容 可分为理论和应用两大类 理论计量经济学 研究适当的方法 来测度有计量经济模型设定的经济关系式 应用计量经济学 以理论计量经济学为工具 研究经济学或商业中的各领域 10 四 计量经济分析使用的数据有三类 1 时间序列数据 一个时间序列是对一个变量在不同时间取的一组观测结果 这些数据可以按固定的时间间隔收集 收集的数据可以是定量的 也可以是定性的 虚拟变量 中国1993年 1998年的gdp增长率 11 2 横截面数据 一个或多个变量在同一时点上收集的数据 1992年实际gdp增长 3 面板数据 12 第二章一元线性回归模型 第一节经典正态线性回归模型 cnlrm 一 基本概念以下表为例 13 1 几个概念条件分布 conditionaldistribution 以x取定值为条件的y的条件分布条件概率 conditionalprobability 给定x的y的概率 记为p y x 例如 p y 55 x 80 1 5 p y 150 x 260 1 7 条件期望 conditionalexpectation 给定x的y的期望值 记为e y x 例如 e y x 80 55 1 5 60 1 5 65 1 5 70 1 5 75 1 5 65总体回归曲线 popularregressioncurve 总体回归曲线的几何意义 当解释变量给定值时因变量的条件期望值的轨迹 2 总体回归函数 popularregressionfunction prf e y xi f xi 当prf的函数形式为线性函数 则有 e y xi 1 2xi其中 1和 2为未知而固定的参数 称为回归系数 1和 2也分别称为截距和斜率系数 上述方程也称为线性总体回归函数 3 线性 的含义 线性 可作两种解释 对变量为线性 对参数为线性 一般 线性回归 一词总是指对参数 为线性的一种回归 即参数只以它的1次方出现 14 4 prf的随机设定将个别的yi围绕其期望值的离差 deviation 表述如下 ui yi e y xi 或yi e y xi ui其中ui为随机误差项 stochasticerror 或随机干扰项 stochasticdisturbance 线性总体回归函数 prf yi 1 2xi ui e y xi ui5 随机干扰项的意义随机扰动项是从模型中省略下来的而又集体地影响着y的全部变量的替代物 显然的问题是 为什么不把这些变量明显地引进到模型中来 而以随即扰动项来替代 理由是多方面的 1 理论的含糊性 理论不能完全说明影响因变量的所有影响因素 2 数据的欠缺 无法获得有关数据 3 核心变量与周边变量 希望能找到与有较大影响的核心变量的关系 4 内在随机性 因变量具有内在的随机性 5 替代变量 用来代替不可观测变量的替代变量选择 造成一定误差 6 省略原则 研究中尽可能使回归式简单 7 错误的函数形式 回归式的的选择是主观的 15 6 样本回归函数 srf 由于在大多数情况下 我们只知道变量值得一个样本 要用样本信息的基础上估计prf 样本1 样本2 样本回归函数srf 在回归分析中 我们用srf估计prf 16 估计量 estimator 一个估计量又称统计量 statistic 是指一个规则 公式或方法 以用来根据已知的样本所提供的信息去估计总体参数 在应用中 由估计量算出的数值称为估计 值 estimate 样本回归函数srf的随机形式为 其中表示 样本 残差项 residual xix prf e y xi 1 2xi srf y e y xi srf是prf的近似估计 为了使二者更为接近 即要使 17 二 经典线性回归模型 clrm 的基本假定假定1 回归模型对参数是线性的假定2 在重复抽样中x的值是固定的 非随机 假定3 干扰项的均值为零 即 e ui xi 0假定4 同方差性或ui的方差相等 即var ui xi e ui e ui xi 2 e ui2 xi 2 2假定5 各个干扰项无自相关 即cov ui uj xi xj e ui e ui xi uj e uj xj e ui xi uj xj 0假定6 ui和xi的协方差为零 即cov ui xi e ui e ui xi e xi e ui xi e xi e uixi e ui e xi e uixi 0假定7 观测次数必须大于待估计的参数个数 假定8 解释变量x的只要有变异性 即一个样本中 xi不能完全相同 假定9 模型没有设定误差 假定10 没有完全的多重共线性 即解释变量之间没有完全的线性关系 18 第二节一元线性回归模型的估计 一 普通最小二乘法 ordinaryleastsquares ols 基本思路 用样本回归函数估计总体回归函数 以 估计 时 真实值 19 求解这一最小化问题 根据最大化的一阶条件 20 可得到以下正规方程 normalequation 二 参数的估计 点估计 ols估计量1 解上述正规方程组得到估计值 解出 可得到估计值 称为最小二乘估计量 ols估计 21 2 ols样本回归线的性质 22 三 2的估计真实方差 的估计量 四 ols估计的精度或标准误差由于ols估计是根据一个样本得到的 需要检验估计量的可靠性 reliability 或精密度 在统计学中 一个估计量的精密度由它的标准误 standarderror se 来衡量 23 24 五 ols统计量的性质 高斯 马尔柯夫定理在clrm假定下 在所有线性无偏估计量中 ols估计量有最小方差 即ols是blue bestlinearunbiasedestimator 1 线性 为yi的线性函数 25 2 无偏性 为 的无偏估计量 26 3 最小方差性 ols估计量 在所有线性无偏估计量中 具有最小方差 即 可以证明ols估计量具有最小方差 27 第三节拟合优度检验 拟合优度检验是指对样本回归线与样本观测值之间拟合程度的检验 度量拟合程度的指标是判定系数r2 基本思路 因变量y的变异 能够被x的变异解释的比例越大 则ols回归线对总体的解释程度就越好 xix prf srf y 总平方和 tss 实测的y值围绕其均值的总变异 28 定义判定系数r2 估计的y值围绕其均值的总变异 未被解释的围绕回归线的y值的变异 29 r2测度了在y的总变异中 由回归模型解释的部分所占的比例 r2越高 回归模型拟合的程度就越好 r2的性质 1 非负 2 0 r2 1其它表达方式 30 判定系数与相关系数的关系 相关系数 表示两个随机变量之间的相关程度 定义为 以样本方差和样本协方差估计x y的方差和协方差 样本相关系数为 样本相关系数的平方与判定系数相等 但二者的意义不同 31 第四节区间估计 为了判断点估计与真值的接近程度 可以通过构造以估计值为中心的一个区间 随机的 以该区间包括了真值的概率来确定估计值接近真值的把握程度 一 的置信区间 32 由于 未知 以其估计值代替 给定置信系数100 1 随机的置信区间将有100 1 包含真值 2 二 的置信区间 33 三 的置信区间 34 第五节ols估计量的显著性检验 根据样本回归得到的总体参数的估计量 随着选取样本的不同观测值而不同 给定样本观测值时 得到的参数也与总体参数的真值不同 因此 必须对估计的参数值是否显著成立 做统计检验 即显著性检验 一 的显著性检验 原假设h0 2 0备择假设h1 2 0 35 如果有理由认为 2不能小于零 不能大于零 则在 2倍t法则 36 二 的显著性检验 原假设h0 1 0备择假设h1 1 0 三 回归方程的的显著性检验 f检验从方差分析 analysisofvariance anova 的角度 检验回归方程的显著性 根据总离查平方和的分解式 tss ess rss 37 总离差 tss 的自由度为 n 1 回归平方和 ess 的自由度为1 残差平方和 rss 的自由度为 n 2 定义均方差 平方和 自由度 方差分析表 anova aov表 为 双变量回归模型anova表 样本决定系数r2能够说明样本的拟和优度 但是我们还需要对总体做出推断 检验总体的线性是否成立 思路 若ess rss比较大 则x对y的解释程度就比较高 可以推测总体存在线性 但是ess rss样本不同而不同 对于给定的样本 利用ess rss对总体进行推断 必须进行统计检验 38 原假设h0 2 0备择假设h1 2 0 若h0成立 说明回归方程无显著意义 总体不存在线性 若拒绝h0 则可认为回归方程显著成立 总体存在线性 因此 定义统计量 39 第六节利用回归方程预测 根据经济理论建立线性回归模型 并利用统计资料对模型参数进行了估计 建立了回归方程 经过显著性检验 判定回归方程能正确反映经济现象时 一个重要目标就是利用回归方程进行预测 一 均值预测 已知x的一个特定值x0 要预测y0的条件均值 总体回归线上的对应y值 e y x0 40 显然 当x0越接近x的均值 区间就变得越狭窄 41 二 个值预测预测给定x的值x0 对应的y0 仍为blue 42 小结 简单线性回归分析的主要步骤 1 建立回归模型研究某一经济现象 先根据经济理论 选择具有因果关系的两个变量 y x 建立线性回归模型 确定解释变量和被解释变量 如果不明确两个变量是否为线性关系 也可以根据散点图来分析 建立回归模型可以是根据经济理论 也可以根据相同或相似经济现象的历史分析经验来建立回归模型 建立模型时 不仅要考虑理论或经验的依据 同时也要考虑数据的可利用程度 2 收集数据 并经过适当的加工整理 得到适于回归分析的样本数据集 3 估计模型参数 利用样本数据 以ols得到模型参数的估计值 4 对回归模型和参数估计值进行检验 检验回归结果是否正确反映经济现象 是否与理论相符 包括理论检验和统计检验 经济理论检验 参数的符号 大小是否与理论和实际相符 若不符 寻找原因 数据 模型设定 理论错误 统计检验 拟和优度检验 估计量 回归方程的显著性检验 43 5 预测对于解释变量的特定值 带入回归方程得到因变量的预测值 在给定的置信水平上 得到因变量预测值的置信区间 6 回归结果的表述 并说明参数的显著水平 44 第三章多元线性回归模型 第一节多元线性回归模型一 多元线性回归模型的prf如果假定对因变量y有k 1个解释变量 x2 x3 xk k变量总体回归函数为 其中 1为常数项 2 2为解释变量x2 xk的系数 u为随机干扰项 总体回归函数prf给出的是给定解释变量x2 xk的值时 y的期望值 e y x2 x3 xk 假定有n组观测值 则可写成矩阵形式 45 二 多元线性回归模型的基本假定 随机干扰项的期望值为0 同方差性 无序列相关 46 无多重共线性 即xi i 2 3 k 之间不存在线性关系 随机干扰项服从正态分布 三 多元线性回归模型的srf 47 根据残差的平方和最小化的原理 解出参数的估计量 第二节多元回归模型的ols估计 一 参数估计 可得到如下正规方程组 48 49 如果直接用矩阵微分 则 二 的估计量 三 的方差 协方差矩阵 50 51 四 ols估计量的性质 52 第三节拟合优度检验 一 判定系数r2 方差分析表 anova 53 二 校正的r2 由r2的计算式可看出 r2随解释变量的增加而可能提高 不可能降低 与解释变量x的个数无关 而则可能随着解释变量的增加而减少 至少不会下降 因而 不同的srf 得到的r2就可能不同 必须消除这种因素 使r2即能说明被解释的离差与总离差之间的关系 又能说明自由度的数目 定义校正的样本决定系数 54 三 r2与的性质 第四节显著性检验一 单参数的显著性检验 如果接受h0 则变量xi对因变量没有影响 而接受h1 则说明变量xi对因变量有显著影响 检验的显著性 即在一定显著水平下 是否显著不为0 55 检验步骤 如果根据理论或常识 非负 则可做单侧检验 比较t与t 二 回归的总显著性检验 检验回归系数全部为零的可能性 56 方差分析表 anova 显然 r2越大 f越大 当r2 1时 f无限大 选择显著水平 计算f统计量的值 与f分布表中的临界值进行比较 57 第五节解释变量的选择在回归模型中的解释变量 除非由明确的理论指导或其他原因 在选择上具有一定的主观性 如何正确选择解释变量是非常重要的 一 解释变量的边际贡献分析在建立回归模型时 假定我们顺序引入变量 在建立了y与x2的回归模型 并进行回归分析后 再加入x2 考虑加入的变量x2是否有贡献 能否再加入后显著提高回归的解释程度ess或决定系数r2 ess提高的量称为变量x2的边际贡献 决定一个变量是否引入回归模型 就要先研究它的边际贡献 以正确地建立模型 如果变量的边际贡献较小 说明改变量没有必要加入模型 分析变量的编辑贡献 可以使用方差分析表为工具 根据变量引入前 后的rss的变化量及其显著性检验 扣除原来引入模型的解释变量的贡献 确定该变量的边际贡献是否显著 一个简单的检验方法 就是对引入新变量后的rss增量与新的ess的比值做显著性检验 58 可以利用方差分析表来进行分析 设ess为引入变量前的回归平方和 ess 为引入m个新变量后 得到的回归平方和 rss 为引入变量后的残差平方和 anova表如下 59 在新引入变量的系数为0的原假设下 把计算出的该统计量的值与 显著水平下的临界值进行比较 引入的新变量的边际贡献显著 则应该把这些变量纳入回归模型 否则这些变量不应引入回归模型做解释变量 二 逐步回归法如果根据理论 因变量y与k 1个变量x2 x2 xk有因果关系 我们要建立的回归模型要在这些变量中选择正确的解释变量 要根据变量的边际贡献大小 把贡献大的变量纳入回归模型 分析边际贡献并选择变量的过程 实际上是一个逐步回归的过程 首先 分别建立y与k 1个变量x2 x2 xk的回归模型 60 回归后 得到各回归方程的平方和 选择其中ess最大并通过f检验的变量作为首选解释变量 假定是x2 此时可确定一个基本的回归方程 在此基础上进行第二次回归 在剩下的变量中寻找最佳的变量 建立k 2个回归方程 61 回归后 得到各回归方程的平方和 同样 选择其中ess最大并通过f检验的变量作为新增解释变量 假定是x3 此时可确定一个基本的回归方程 重复这一过程 直到所有变量中 边际贡献显著的变量全部引入回归模型中为止 得到最终的回归式 也可以采用逐步减少边际贡献不显著的变量的方式 逐步回归确定回归模型包括的变量 方法一样 62 第六节利用多元回归模型进行预测 对于多元回归模型 通过回归分析 得到回归方程 后 就可根据给定的解释变量的一组值x0 1 x20 x30 xk0 对因变量y的值进行估计 一 个值预测 为y0及的预测值 63 二 区间预测 64 第四章非线性回归模型的线性化 因变量和解释变量之间的线性关系 包括参数线性和解释变量线性两种 前面的分析假定总体回归函数的形式为 但是根据经济现实或经济理论 变量之间不一定存在这种形式的线性关系 如参数线性形式的回归函数 或参数 变量均为非线性形式的函数关系 如c d生产函数 对于这些不符合线性假定的模型进行参数估计 必须加以适当的变换以后 才能用ols方法估计模型参数 65 对于参数线性的模型 可以采用变量的直接代换 转化为参数 变量均为线性的形式进行估计 一 倒数模型 函数形式为 令变量 则回归函数可变为 根据解释变量的观测值 计算出x i的之后进行ols估计 得到 因此可得到原模型的估计方程 66 二 对数线性模型 通过对原模型的对数变换 函数形式可变为 令变量 则回归函数可变为 根据解释变量的观测值 进行ols估计 得到 因此可得到原模型的估计方程 例如 估计c d函数 两边取对数后 得到原模型的估计方程 因此 c d函数的估计形式为 67 三 半对数线性模型 模型的函数形式可变为 令变量 同样可以进行参数的ols估计 根据解释变量的观测值 进行ols估计 得到 因此可得到原模型的估计方程 四 多项式模型 模型的函数为 68 我们关于经典线性回归模型 clrm 有如下假定 假定1 回归模型对参数是线性的假定2 在重复抽样中x的值是固定的 非随机 假定3 干扰项的均值为零 即 e ui xi 0假定4 同方差性或ui的方差相等 即var ui xi e ui e ui xi 2 e ui2 xi 2 2假定5 各个干扰项无自相关 即cov ui uj xi xj e ui e ui xi uj e uj xj e ui xi uj xj 0假定6 ui和xi的协方差为零 即cov ui xi e ui e ui xi e xi e ui xi e xi e uixi e ui e xi e uixi 0假定7 观测次数必须大于待估计的参数个数 假定8 解释变量x的只要有变异性 即一个样本中 xi不能完全相同 假定9 模型没有设定误差 假定10 没有完全的多重共线性 即解释变量之间没有完全的线性关系 在现实中 以上假定不一定得到满足 本章讨论某些假定不成立时的估计问题 第五章多重共线性 第一节违背古典假定的估计问题 69 第二节多重共线性 multi collinearity 如果假定10不成立 即在解释变量x1 x2 xk中 存在线性关系 当解释变量间的确定线系关系存在时 存在不全为零的常数 这种关系为完全多重共线性 变量间的相关系数为1 实际上更多的情况是 解释变量间有不完全的线性关系 存在不全为零的数 其中vi为随机项 我们把这种解释变量间存在的完全或不完全的线性关系称为多重共线性 由于经济变量自身的性质 它们之间这种多重共线性或强或弱 普遍存在的 假定 10 70 第三节多重共线性的影响一 完全多重共线性以两个解释变量的回归模型为例 假定回归模型为 如果采用ols估计 则有 根据最小平方和原则 并求解正规方程组 可得到 71 如果x2与x3存在完全共线性 即则 因此 存在完全共线性时 不能利用ols估计参数 参数的方差变为无限大 72 二 不完全多重共线性假定x2 x3间存在不完全多重共线性 以离差形式表示为 其中vi为随机项 则 73 显然 当解释变量x2 x3之间的相关系数r23的绝对值越大 共线性程度就越高 参数估计值的方差就越大 越不准确 且随着相关系数的增大 方差以更大的幅度增加 三 多重共线性的影响 1 参数估计值的方差增大 估计量的精度大大降低 影响预测结果 准确度和置信区间 2 参数估计值的标准差增大 使的t检验值变小 增大了接受h0 舍弃对因变量有显著影响的变量 3 尽管t检验不显著 但是r2仍可能非常高 4 ols估计量对观测值的轻微变化相当敏感 一 多重共线性的探查由于多重共线性使一种普遍现象 而多重共线性的程度影响了参数估计结果 因此我们关心的是共线性的程度 而不是共线性是否存在 第四节多重共线性的探查和解决 74 在双边量回归模型中 可以直接对解释变量的相关系数进行显著性检验 以确定线性相关的程度 此时相关系数的平方等于样本决定系数 而对于多于两个结束变量的回归模型 则不能利用俩俩相关系数来检验 对于有多个变量的回归模型 可以采用辅助回归的方法 分别以k 1个解释变量中的第i个对其他变量进行回归 可得到k 2个回归方程的判定系数 r22 r32 rk2 假定这些判定系数中rj2最大且接近1 则变量xj与其他解释变量中的一个或多个有较高相关程度 因此回归方程出现高度多重共线性 可以进行f检验确定其显著性 根据第三章的结果 检验r2显著性的f检验值为 可以采用类似的方法检验 选择显著水平 计算f统计量的值 与f分布表中的临界值进行比较 若f检验值小于临界值 则多重共线性不显著 反之 则多重共线性显著 75 二 解决多重共线性的方法如果发现监视变量之间存在高度得多重共线性 就必须消除这种多重共线性的影响 保证模型的正确性和估计的有效性 有以下几种解决方法 1 除去不重要的变量把回归模型中引起多重共线性 而对因变量的影响不大的变量 但是变量的剔除可能导致模型的设定偏误 服从t n k 1 给定显著水平 若统计量大于临界值t 2 则说明xj与xi引起回归方程的多重共线性 如果通过前的f检验得到某解释变量xj与其它解释变量存在多重共线性 则可以通过t检验寻找xj与哪些变量引起多重共线性 首先计算xj与其它每个解释变量的偏相关系数 76 已知x2和x3之间高度共线 根据先验信息 确定 3 2 2 带入模型后可得 例如 c d生产函数 k与l高度相关 已知规模收益不变 则 1 生产汉数的双对数模型可变为 可以对这一新回归方程进行估计 2 利用先验信息假定对回归模型 77 3 变换模型的形式如果作为解释变量的某些经济变量间出现高度相关 而进行回归分析的目的是为了预测 不是研究单个经济变量对因变量的影响时 可以根据实际问题 改变模型模型的形式 4 增加样本容量如果多重共线性是由样本引起 增加样本容量可以减少多重共线性的程度 以二元回归方程为例 根据第二节的结果 参数估计值的方差为 当样本容量增大时 增大 方差将减小 可以提高参数估计的精度 5 横截面数据与时间序列数据并用如果时间序列数据中 解释变量间存在高度相关 可以先使用横截面数据估计出存在高度相关解释变量中的一个或多个 然后再在时间序列数据中剔除这些变量 在消除多重共线性影响下估计因变量与剩余变量间的回归式 78 例如 为了估计汽车需求的价格弹性和收入弹性 得到销售量 平均价格 消费者收入的时间序列数据 设定回归式 新的回归式中消除了多重共线性的影响 由于在时间序列数据中价格pt 收入it一般都具有高度共线的趋势 因此 直接估计上面的回归式将存在问题 由于在同一式点上 价格与收入的相关程度不高 可以先利用截面数据估计出收入弹性 再利用这一估计结果修改原回归式 变为 6 利用时间序列数据的差分或离差进行估计如果时间序列数据中 解释变量间存在高度相关 那么这些变量的差分之间不一定相关 因此利用差分进行回归能降低多重共线性的程度 79 第六章异方差 第一节异方差的性质 一 异方差 在经典线性回归模型 clrm 中 我们假定随即干扰项具有同方差性 即 var ui xi e ui e ui xi 2 e ui2 xi 2 2这实际上是假定了解释变量yi的值围绕其期望值的分散程度相同 实际上 对应于解释变量的不同取值 方差可能不同 即本假定不成立 y2 x2 y1 x1 x2 同方差 异方差 80 如果保持随机项的协方差为0 则 的方差 协方差矩阵为 或者说 在这种情况下 称随机项ui具有异方差性 二 异方差的原因 1 因变量与解释变量间相互关系的性质 如 干中学 经济行为规则等 2 解释变量的遗漏 3 异常观测值的出现 4 时间序列数据中 观测技术的改进引起的观测值的变化 81 三 异方差的后果由于异方差性 基于clrm假定的ols估计参数结果将受到影响 1 考虑异方差性的ols估计如果假定 保留其它的clrm假定 以双变量回归模型为例 普通ols估计为 可以证明该估计量是线性 无偏的 第二章的证明 但是否为最优估计量 具有最小方差性 性 则不一定 可以在考虑异方差性的前提下 采用适当的ols估计方法来分析 2 存在异方差性的ols估计 广义最小二乘法 gls 估计对于 可以进行变量代换 构造满足clrm假定的回归方程 82 83 在估计过程中 新模型的残差平方和实际上是原模型的残差的加权平方和 因此 这种gls估计 称为加权最小二乘法 wls 显然 在求最小残差的过程中 对于方差较大的观测值赋予的权重较小 不符合 平均 意义上的 异常 观测值 而对于方差较小的观测值赋予较大的权重 使样本回归函数更接近总体回归函数 这种先将原始变量转换成满足clrm假定的转换变量 再利用ols进行估计的方法 称为广义最小二乘法 gls 得到的估计量称为gls估计量 显然 gls估计量是blue的 84 3 考虑ols估计与gls估计的比较ols估计量 gls估计量 1 两种估计量都是无偏的 2 gls估计量具有最小方差性 3 在假设检验中 ols估计将降低检验的显著性 4 ols估计降低估计的精度 4 忽略异方差的ols估计 同方差假定下的ols估计 不仅不具最小方差性 而且估计是有偏的 以此为基础的统计推断将可能产生严重的误导 85 第二节异方差性的探察由于异方差性可能导致的后果 在估计中要考虑如何探察异方差的存在 并采取相应的补救措施 一 图示法由于在存在异方差的情况下 随机项ui的方差与解释变量的取值有关 因此可以画出因变量y与解释变量x的散点图 或同方差假定下以ols估计得到的残差平方与x或y 多变量模型中 的散点图 据此对异方差做出直观的近似判断 二 帕克 pack 检验 且能确定影响随机项的解释变量 86 二 glejser检验 如果回归结果表明异方差与多个变量有关 可以引入多个变量进行回归 并进行检验 glejser检验的优点在于 在检验异方差的同时 可以得到异方差形式的信息 与解释变量的关系 在后续分析中据此处理样本数据和回归模型 以得到blue估计 87 三 斯皮尔曼 spearman 等级相关系数检验通过随机项的方差与解释变量的等级相关系数的显著性检验 判断是否存在异方差性 步骤 这一检验的依据 其实就是检查随着因变量的变化 方差是否随之变化 等级差异意味着变动 88 四 戈德菲尔德 匡特 goldfied quandt 检验g q检验适用于大样本 随机项的方差与某异解释变量存在正相关的情况 检验的前提条件是 随机项服从正态分布 无序列相关 步骤 如果同方差 则f 1 如果存在以方差性 根据正相关的假设 f 1 f越大 超过临界值 说明存在以方差性的可能性就越大 89 第三节异方差模型的处理一 随机项的方差已知的情况 对新模型作ols回归可以估计出原模型参数的blue估计 二 随机项的方差未知的情况存在以方差性 则随机项的方差与一个或多个解释变量有关 如 90 可得到满足clrm假定的新模型 因此 关键的问题是找出异方差的具体形式 91 第七章自相关 第一节自相关一 自相关对于时间序列数据 不同期的样本观测值形成一个序列 横截面数据中按不同空间 省份 厂商 家庭等 排列的样本数据也可看为一个序列 为了方便 先把横截面数据也视为不同期的数据 对于一个变量u 可以得到其观测值序列 u1 u2 ut 1 ut下标t代表不同时期 如果在这个序列中 每期的观测值与其前一期或前几期的取值有关 即cov ui uj 0 ij则称该序列存在自相关 autocorrelation 在clrm中 假定干扰项u不存在自相关 即cov ui uj 0 ij如果这一条件被破坏 即干扰项存在自相关 那么使用ols估计就可能存在问题 实际上 在经济计量研究中 自相关士一种常见的现象 如 消费支出要受到当期和前几期收入的影响 某一年的gdp要受到前期的gdp水平的影响 某种商品的供给量要受到前一期的其它变量影响 等等 92 三 自相关的形式如果u存在自相关 t期的取值与前p期有关 关系可由 ut f ut 1 ut p vt决定 其中vt满足 即vt满足clrm假定 一般把f ut 1 ut p 假定为线性形式 二 产生自相关的原因 1 经济变量的惯性 时间序列变量的自相关导致干扰项的自相关 2 应进入模型的变量未被引入模型 能引起自相关 3 回归模型的的形式设定存在错误 4 蛛网现象 应变量对子变量的反应滞后 5 滞后效应 应变量受其前几期取值的影响 6 数据 编造 数据的加工过程 如季度数据 或推算过程 根据某种假定获得未调查数据 引起自相关 7 随机项自身可能存在 真正自相关 性 偶然性冲击对变量的长期影响 自相关主要出现在时间序列数据中 横截面数据中也可能存在自相关 spatialautocorrelation 空间自相关 93 如果 则称为马尔科夫一阶自回归模式 或简称为一阶自回归模式 记为ar 1 其中 被称为自协方差系数 coefficientofautocovariance 或自相关系数 如果 则称为s阶自回归模式 记为ar s 对于ar 1 同方差假定 这与异方差一样 影响ols估计的结果 94 第二节存在自相关的ols估计一 考虑自相关的gls估计对于二元回归模型 95 估计系数和方差为 其中 c和d未校正因子 关于 的表达式 较小 二 忽略自相关使用ols估计的后果利用ols估计 得到的估计值和方差都与gls估计不同 根据前面关于ols估计的线性和无偏性的证明 ols估计是线性无偏的 但是考虑到干扰项的自相关 ols估计是无效的 96 如果 0 估计结果是相同的 在存在自相关的情况下 参数的gls估计式和方差估计式中均有自相关系数 因此 忽略自相关的ols估计值和方差都是不可信的 97 1 绘制的散点图 第三节自相关的探察一 图示法 首先利用ols回归后 求出残差 如果大部分落在第i 第三象限 则存在正自相关 如果大部分落在第ii 第iv象限 则存在负自相关 98 2 按时间顺序绘制图作出随时间变化的图形 如果呈由规律的变化 如锯齿形或循环形 则说明干扰项存在自相关 若随时间变化不断变换符号 说明存在负相关 若连续几个为正 后边几个为负 则可能存在正相关 二 杜宾 瓦特森 durbin watson 检验基本假定 1 回归式中有截距项 2 解释变量是非随机的 3 干扰项的模式为一阶自回归模式 99 4 回归模型中 物质后因变量被当作解释变量 5 没有缺落数据 检验方法如下 当d约接近2 u的自相关性越小 100 检验步骤 1 做ols回归 得到残差 2 计算统计量d 3 对给定的样本数量和解释变量数目 在给定显著水平下 找出临界值的下界和上界dl du 4 根据下表的决策规则决定是否接受原假设 d w检验的缺陷是存在两个不确定域 如果统计量落入不确定域中时 无法判断是否存在自相关 101 第四节自相关的解决方法一 差分法若存在一阶自相关 可采用广义差分 利用gls得到参数的blue估计量 对于二元回归模型 然后再计算出估计值 102 二 杜宾两步法把二元回归模型的差分形式写为 再计算出 1 2 103 第八章虚拟变量与滞后变量模型 104 第一节虚拟变量模型一 虚拟变量的引入在经济分析中 某些特殊因素会影响到变量的取值 如季节对饮料需求的影响 特定时期实施特殊政策对各宏观经济变量产生的影响等 而这些因素属于 定性 的变量 可以通过赋予一个数量值 以虚拟变量 哑变量dummy 的形式进入分析模型中 例如 消费函数模型 ct b0 b1yt ut ct b0 b1yt b2dt ut二 虚拟变量的不同形式虚拟变量在模型中可代表对截距的影响 如 ct b0 b1yt b2dt ut dt在正常年份取1 反常年份取0 可利用ols估计得到估计结果 ct yt 0 正常年份 反常年份 根据回归结果 正常年份的基本支出水平比反常年份小 而边际支出倾向不变 105 虚拟变量在模型中也可以代表对和参数的全面影响 如 ct b01 b02dt b11 b12dt yt ut该式可变为 ct b01 b02dt b11dtyt b12dtyt ut如果得到估计方程 ct yt 0 正常年份 反常年份 二 多个虚拟变量的引入及虚拟变量陷阱问题在模型中 对于一个定性变量可能需要引入多个虚拟变量 典型的例子是季节变化对商品销售的影响 106 在该季节模型 中 有 即解释变量间存在完全的共线性 因此模型无法估计 这就是虚拟变量陷阱 为了解决这以问题 在引入虚拟变量时 对于一个有m种可能的定性变量 只能引入m 1个虚拟变量 如前面的模型 107 三 引入不同定性变量的多个虚拟变量在模型中 如果有多个定性变量对因变量有影响 可同时把对应于各定性变量的虚拟变量引入模型 如 季节变化和当年是否有重大事件发生对商品的销售都有影响 销售回归方程可写为 其中 qt 取1获0 代表正常年份和反常年份 而d2 d4代表季节变化 使用的原则 仍是对于任一个有m种可能的定性变量 只能引入m 1个对应的虚拟变量 第二节滞后变量模型一 滞后变量滞后变量是指在回归模型中 因变量与解释变量的时间滞后量 如 第一个模型称作外生滞后变量模型或分布滞后模型 第二个模型称为内生滞后变量模型或自回归模型 在很多经济分析中 把滞后变量引入模型中是必要的 这里先讨论分布滞后模型 108 分布滞后模型 包含了多时期的滞后变量 各时期的滞后变量之间往往存在多重共线性 因此不能用ols估计 此外 如果滞后变量较多而样本较小 不仅估计困难 而且较小的自由度下也难以进行传统的拟和优度检验 基于以上原因 必须对模型进行变换 以减少被估计参数的数目 可以考虑对滞后变量加以约束 把这些滞后变量组合成新的变量 方法有经验权数法 阿尔蒙多项式法等 二 经验权数法根据经验为滞后变量制定权数 把滞后变量按权数线性组合成新变量 1 递减滞后形式假定解释变量的滞后期越长 对因变量的影响越小 滞后变量期数越大则指定的权数越小 如 对于模型 109 三 阿尔蒙多项式法根据一个连续函数为滞后变量制定权数 对于模型 2 矩形滞后形式假定所有滞后变量对因变量的影响相同 滞后变量的权数相等 如 前面的模型中 新变量定义为 3 倒 v 型滞后形式假定所有滞后变量对因变量的影响岁滞后时间 先递增 再递减 滞后变量的权数大小成倒 v 型变化 如 前面的模型中 新变量定义为 对经验权数模型进行回归后 根据显著性检验 标准差 样本决定系数及d w检验等 选择最优的形式 110 111 这一方法可以推广到多个滞后变量的情形 112 第九章联立方程模型 第一节联立方程模型的概念一 联立方程模型由于经济现象的复杂性 各经济变量间关系是交错复杂的 因而对一些经济现象进行分析时 单一方程模型是不适宜的 需要多个方程联立 才能正确说明经济现象 例如 在均衡价格模型中 均衡数量和价格要由供 求双方决定 假定粮食需求量由消费者的收入水平和商品价格决定 供给量由价格和气候条件决定 供 求双方决定了市场均衡数量q 这里讨论的局部均衡模型 需要多个单一方程和在一起的联立方程组来描述 这个方程组就是描述这以经济系统的联立方程模型 二 联立方程模型中的变量分类联立方程模型中的变量 可分为内生变量 外生变量和预定变量 113 1 内生变量指由模型系统内决定的变量 取值在系统内决定 如d s p 2 外生变量指不由模型系统范围内决定的变量 如y w 政策变量属于外生变量 3 预定变量指变量的滞后值 内生变量的滞后值称预定内生变量 外生变量的滞后值称预定外内生变量 三 联立方程模型中方程式的分类1 行为方程式描述经济系统中个体经济行为的方程 如消费需求方程 2 技术方程式指基于生产技术关系而建立的函数关系 如生产函数 3 制度方程式与法律 制度有直接关系的经济数量关系式 如税收方程 4 恒等式有两种 一种是定义方程式 有经济变量的定义所构成的方程 另一种是平衡方程 表示经济变量之间的平衡关系 114 四 结构式模型与简化式模型1 结构式模型体现经济理论中经济变量之间的关系结构的联立方程模型 为结构式模型 如 结构模型中的每个方程称为结构方程 各结构方程的系数称为结构系数或结构参数 在结构模型中 结构方程的右边可能出现内生变量 在结构方程中 把内生变量表示为其它内生变量 前定变量和随机项的函数形式 被称为结构方程的正规形式 以y代表内生变量 x代表预定变量 代表内生变量的结构参数 代表预定变量的结构参数 对于常数项 可视为观测值为1的变量x0 结构模型的一般形式可写为 115 写成矩阵形式 如果模型有g个内生变量 k个预定变量 g个结构方程 内生变量数等于结构方程数 则称模型为完备模型 这里 116 样本观测值 n个样本 117 例 截距项视为观测值为1的预定变量 y x u y x u 118 2 简化式模型根据结构式模型推导得到 把内生变量表示为预定变量和随机项的函数形式的方程组 这种模型称为简化式模型 其中的每个方程称为简化式方程 结构式 简化式 显然 简化式模型中 每个内生变量的函数方程都包括了预定变量对其的全部影响 而且 简化式模型中的随机项与各变量不相关 简化型参数矩阵 119 3 简化型与结构型的参数关系体系从结构型到简化型 变换过程为 11 12 13 21 22 23 31 32 33 120 五 联立方程模型与单方程模型以简单的凯恩斯模型为例 这说明作为解释变量的收入y与随机项相关 违背了clrm的假定 如果采用ols逐个对单个结构方程进行估计 将得到有偏估计量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025贵州贵阳机场股份公司质量安全部呼叫中心96967实习生招聘1人笔试历年参考题库附带答案详解
- 2025贵州毕节市水务投资集团有限责任公司及所属金沙弘禹供水有限责任公司招聘笔试历年参考题库附带答案详解
- 2025安徽芜湖市鸠江区招聘区属国有企业领导人员拟聘用人员考前自测高频考点模拟试题及答案详解(网校专用)
- 2025福建南平委党校教师招聘8人模拟试卷及一套答案详解
- 2025浙江省衢州市衢江区国有企业春季引才活动笔试人员等笔试历年参考题库附带答案详解
- 2025广东韶关市新丰县招聘暨选聘公办教师30人(编制)考前自测高频考点模拟试题含答案详解
- 2025广东广州花都城投西城经济开发有限公司第二次招聘项目用工人员23人笔试历年参考题库附带答案详解
- 2025江苏无锡市锡山区卫生健康系统招聘事业编制卫生人才15人(校园招聘)考前自测高频考点模拟试题带答案详解
- 2025广东肇庆市怀集县卫生健康局赴高校招聘卫生专业技术人员52人考前自测高频考点模拟试题完整参考答案详解
- 2025年吉安市青原区两山人力资源服务有限公司面向社会公开招聘临聘人员的模拟试卷及完整答案详解
- 教育培训机构合作培训协议
- 苹果电脑macOS效率手册
- 职称英语A级词汇大全
- 某光伏发电工程EPC总承包投标文件技术文件
- (正式版)JBT 2603-2024 电动悬挂起重机
- JJG(交通) 133-2023 落锤式弯沉仪
- 工厂主管人员值班表
- 消防安全周巡查记录表
- 第三章 护理伦理学基本原则规范和范畴
- 能源化学与能源化工概论-第一章 能源简介
- FZ/T 52058-2021低熔点聚乳酸(LMPLA)/聚乳酸(PLA)复合短纤维
评论
0/150
提交评论