计量经济学 第三章 多元线性回归ppt课件.ppt_第1页
计量经济学 第三章 多元线性回归ppt课件.ppt_第2页
计量经济学 第三章 多元线性回归ppt课件.ppt_第3页
计量经济学 第三章 多元线性回归ppt课件.ppt_第4页
计量经济学 第三章 多元线性回归ppt课件.ppt_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高等学校经济学类核心课程 计量经济学 Econometrics 云南财经大学数量经济系 第三章多元线性回归模型 3 1多元线性回归模型 3 2多元线性回归模型的参数估计 3 3多元线性回归模型的统计检验 3 4多元线性回归模型的预测 3 5可线性化的多元非线性回归模型 3 6受约束回归 3 1多元线性回归模型 一 模型形式二 基本假定 一 模型形式 注意 1 解释变量X的个数 k回归系数 j的个数 k 1 2 j 偏回归系数 表示了Xj对Y的净影响 3 X的第一个下标j区分变量 j 1 2 k 第二个下标i区分观测 i 1 2 n 总体回归函数 PRF 样本回归函数 SRF 样本回归模型 SRM 其中 ei称为残差 residuals 可看成是随机误差项 i的近似替代 2 于是 总体回归模型可以表示为 总体回归模型的矩阵表示 1 总体回归模型表示了n个随机方程 引入如下矩阵记号 2 于是 样本回归模型和函数可以表示为 样本回归模型和函数的矩阵表示 1 同理 采用如下矩阵记号 二 多元线性回归模型的基本假设 假设1 解释变量是非随机的或固定的 且各X之间互不相关 无多重共线性 假设2 随机误差项 具有零均值 同方差和无序列相关性 E i 0Var i 2i 1 2 NCov i j 0i ji j 1 2 N 假设3 随机误差项 与解释变量X之间不相关 Cov Xji i 0i 1 2 N 假设4 服从零均值 同方差 零协方差的正态分布 i N 0 2 i 1 2 N 基本假设的矩阵表示 假设1 n k 1 矩阵X是非随机的 且X的秩 k 1 即X列满秩 假设2 假设4 向量 有一多维正态分布 即 暗含假设 假设5 样本容量趋于无穷时 各解释变量的方差趋于有界常数 即n 时 假设6 回归模型是正确设定的 或 其中 Q为一非奇异固定矩阵 矩阵x是由各解释变量的离差为元素组成的n k阶矩阵 3 2多元线性回归模型的参数估计 一 普通最小二乘估计二 参数估计量的性质三 样本容量问题 参数估计的任务和方法 1 估计目标 回归系数 j 随机误差项方差 22 估计方法 OLS ML或者MM OLS 普通最小二乘估计 ML 最大似然估计 MM 矩估计 一 普通最小二乘估计 基本思想 残差平方和最小基于取得最小值的条件获得系数估计 残差平方和 取得最小值的条件 正规方程组 解此 k 1 个方程组成的正规方程组 即可求得 k 1 个未知参数 j的估计 最小二乘估计的矩阵表示 1 正规方程组的矩阵形式 2 由于X X满秩 其逆矩阵存在 故有 OLSE的矩阵估计过程 矩阵有关定理 残差平方和的矩阵表示为 参数估计的实例 例3 2 1 在例2 1 1的家庭收入 消费支出例中 误差方差 2的估计 1 基于OLS下 随机误差项 的方差的无偏估计量为 注意 分母的形式 n k 1 n k 1 k 解释变量X的个数 k 1 回归系数的个数 2 称为估计标准误或者回归标准误 S Eofregression 最大似然估计 MaximumLikelihoodEstimate 1 基本原理 样本观测值出现的概率最大 2 似然函数 3 最大似然估计MLE 参数的MLE与参数的OLSE相同 矩估计 MomentMethod MM 1 OLS估计是通过得到一个关于参数估计值的正规方程组 并对它进行求解而完成的 2 该正规方程组可以从另外一种思路来导出 两侧求期望 矩条件 矩条件和矩估计量 3 由此得到正规方程组 解此正规方程组即得参数的MM估计量 MM估计量与OLS ML估计量等价 关于矩估计 矩方法是工具变量方法 InstrumentalVariables IV 和广义矩估计方法 GeneralizedMomentMethod GMM 的基础 在矩方法中关键是利用了 E X 0如果某个解释变量与随机项相关 只要能找到1个工具变量 仍然可以构成一组矩条件 这就是IV 如果存在 k 1个变量与随机项不相关 可以构成一组包含 k 1方程的矩条件 这就是GMM OLS只是GMM的一个特例 二 最小二乘估计量的性质 高斯 马尔可夫定理 Gauss Markovtheorem 在给定经典线性回归的假定下 最小二乘估计量是具有最小方差的线性无偏估计量 即最佳线性无偏估计量 BLUE 1 线性 其中 C X X 1X 为一仅与固定的X有关的行向量 2 无偏性 这里利用了假设 E X 0 3 有效性 其中利用了 参数估计量的概率分布 1 由参数估计量的上述性质和基本假设 易知 线性性 基本假设 正态分布无偏性 期望为 有效性的证明 方差表达式 2 记C X X 1的第j个主对角元素为Cjj j 0 1 k 则 三 样本容量问题 最小样本容量满足基本要求的样本容量 1 最小样本容量 所谓 最小样本容量 即从最小二乘原理和最大或然原理出发 欲得到参数估计量 不管其质量如何 所要求的样本容量的下限 样本最小容量必须不少于模型中解释变量的数目 包括常数项 即 n k 1因为 无多重共线性要求 秩 X k 1 2 基本样本容量 从统计检验的角度 n 30时 Z检验才能应用 n k 8时 t分布较为稳定 一般经验认为 当n 30或者至少n 3 k 1 时 才能说满足模型估计的基本要求 模型的良好性质只有在大样本下才能得到理论上的证明 3 3多元线性回归模型的统计检验 一 拟合优度检验二 方程显著性检验三 变量显著性检验 一 拟合优度检验 目的 测定样本回归函数对样本观测值的拟合紧密程度指标 R2 Adj R2 可决系数R2 coefficientofdetermination 0 R2 1 该统计量越接近于1 模型的拟合优度越高 1 定义 2 问题 在模型中增加一个解释变量 R2往往增大但是 增加解释变量个数往往得不偿失 不重要的变量不应引入 增加解释变量使得估计参数增加 从而自由度减小 如果引入的变量对减少残差平方和的作用很小 这将导致误差方差 2的增大 引起模型精度的降低 因此 R2需调整 调整的可决系数Adj R2 adjustedcoefficientofdetermination 1 调整思路 将残差平方和与总离差平方和分别除以各自的自由度 以剔除变量个数对拟合优度的影响 2 自由度 统计量可自由变化的样本观测值的个数 记为df TSS df n 1ESS df kRSS df n k 1 注意 df TSS df ESS df RSS 3 定义 Adj R2 的作用 1 消除拟合优度评价中解释变量的多少对拟合优度的影响2 对于因变量Y相同 而自变量X个数不同的模型 不能用R2直接比较拟合优度 而应使用Adj R2 3 可以通过Adj R2 的增加变化 决定是否引入一个新的解释变量 Adj R2 R2 即 调整可决系数不大于未经调整的可决系数 随着解释变量的增加 二者的差异越来越大 Adj R2 与R2的关系 赤池信息准则和施瓦茨准则 AIC SC 用于比较因变量相同 解释变量个数不同的多元回归模型的拟合优度 赤池信息准则 Akaikeinformationcriterion AIC 施瓦茨准则 Schwarzcriterion SC 这两准则均要求仅当所增加的解释变量能够减少AIC值或AC值时才在原模型中增加该解释变量 二 方程的显著性检验 F检验 目的 检验Y与所有X的线性关系在总体上是否成立方法 F检验 1 原假设和备择假设 检验模型中的参数 j是否至少有一个显著不为0 Yi 0 1X1i 2X2i kXki ii 1 2 n 原假设与备择假设 H0 0 1 2 k 0H1 j不全为0 2 检验统计量 可以证明 在原假设H0成立的条件下 F F k n k 1 其中 k为模型中解释变量个数 3 检验步骤 1 提出原假设和备择假设 H0 0 1 2 k 0H1 j不全为0 2 在H0成立的条件下 计算检验统计量的值 3 给定显著性水平 可得到临界值 F k n k 1 右侧检验 4 如果F F k n k 1 拒绝原假设 总体线性关系成立如果F F k n k 1 接受原假设 总体线性关系不成立 拟合优度和方程显著性检验 在中国居民人均收入 消费一元模型中 在中国居民人均收入 消费二元模型中 可见 一个显著的模型并不意味着拟合优度一定很高 注意到F检验是一个严格的统计检验 因此实际中要多参考这一检验的结果 示例 三 变量的显著性检验 t检验 目的 检验Y与某个Xj的线性关系在总体上是否成立或者说Xj对Y是否存在显著影响方法 t检验 1 原假设和备择假设 检验模型中Xj对应的系数 j是否显著不为0 Yi 0 1X1i 2X2i jXji kXki i 原假设与备择假设 H0 j 0H1 j 0 2 检验统计量 2为随机误差项的方差 在实际计算时 用它的估计量代替 可构造t统计量 参数估计量的概率分布 1 建立原假设和备择假设 H0 j 0H1 j 0 3 给定显著性水平 可得到临界值t 2 n k 1 3 检验步骤 2 在原假设成立的条件下计算t统计量的值 4 如果 t t 2 n k 1 拒绝原假设 Xj对Y存在显著影响如果 t t 2 n k 1 接受原假设 Xj对Y不存在显著影响 双侧检验 对t检验的说明 1 在一元线性回归模型中 变量的显著性t检验与方程的F检验是一致的一方面 二者检验的假设一致 1 0另一方面 从检验统计量来看 F t22 在多元线性回归模型中 二者的作用不同 并不等价3 在多元回归模型中 对各个变量的进行t检验时 显著性水平应该一致4 t检验未通过 说明在给定的显著性水平下 变量对Y没有显著性影响 但不要简单的剔除变量 关键仍然是考察变量在经济关系上是否对因变量有影响以及变量在模型及应用中的作用 显著性检验起到验证的作用 三 参数的置信区间 j j 0 1 2 k 的置信区间 在变量的显著性检验中已经知道 给定置信度 1 对于临界值t 2 n 2 t值处在 t 2 t 2 的概率是1 表示为 于是得到 1 的置信度下 j的置信区间是 3 4多元线性回归分析的预测 一 均值E Y0 的置信区间二 个值Y0的置信区间 预测的理解 1 预测类型 实际个值Y0的点预测 条件均值E Y0 的点预测 实际个值Y0的区间预测 条件均值E Y0 的区间预测 点预测 区间预测 3 它可以是总体均值E Y0 或个值Y0的点预测 4 为了进行科学预测 还需求出预测值的置信区间 包括E Y0 和Y0的置信区间 2 对于模型 给定样本以外的解释变量的观测值 X0 1 X10 X20 Xk0 可以得到被解释变量的预测值 1 总体均值E Y0 X X0 的置信区间 容易证明 于是 得到 1 的置信水平下E Y0 的置信区间 其中 t 2为 1 的置信水平下的临界值 2 总体个值Y0的置信区间 如果已经知道X X0处的实际个值Y0 那么预测误差为 容易证明 e0服从正态分布 即 构造t统计量 可得给定 1 的置信水平下Y0的置信区间 置信区间宽度 个值 均值 回归分析的预测实例 中国居民人均收入 消费支出二元模型例中 2001年人均GDP 4033 1元 于是人均居民消费的预测值为 2001 120 7 0 2213 4033 1 0 4515 1690 8 1776 8 元 实测值 90年价 1782 2元 相对误差 0 31 预测的置信区间 E 2001 的95 的置信区间为 1741 8 1811 7 2001的95 的置信区间为 1711 1 1842 4 3 5可线性化的多元非线性回归模型 线性模型的本质含义解释变量的非线性 变量代换法回归参数的非线性 函数变换法 实际中的非线性模型 1 恩格尔曲线 Englecurves 消费者的收入与某类商品需求量之间的函数关系 幂函数 2 菲利普斯曲线 Pillipscuves 通货膨胀率 货币工资率 与失业率之间的关系 双曲线函数 线性模型的本质含义 1 被解释变量Y与解释变量X之间为线性关系 2 被解释变量Y与参数 之间为线性关系 3 更重要的在于后者 例如 拉弗曲线 描述税收与税率关系S a bR cR2c 0 抛物线 令 X1 r X2 r2 则原方程变换为 S a bX1 cX2c 0 1 解释变量的非线性问题 变量代换 适用于倒数模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论