




已阅读5页,还剩50页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多元线性回归模型 计量经济学 第三章 2 引子 中国已成为世界汽车产销第一大国 2009年 为应对国际金融危机 确保经济平稳较快增长 国家出台了一系列促进汽车消费的政策 有效刺激了汽车消费市场 汽车产销呈高增长态势 首次成为世界汽车产销第一大国 2009年 汽车产销分别为1379 1万辆和1364 5万辆 同比增长48 3 和46 15 是什么因素导致中国汽车数量的增长 影响中国汽车行业发展的因素并不是单一的 经济增长 消费趋势 市场行情 业界心态 能源价格 道路发展 内外环境 都会使中国汽车行业面临机遇和挑战 3 分析中国汽车行业未来的趋势 应具体分析这样一些问题 中国汽车市场发展的状况如何 用销售量观测 影响中国汽车销量的主要因素是什么 如收入 价格 费用 道路状况 能源 政策环境等 各种因素对汽车销量影响的性质怎样 正 负 各种因素影响汽车销量的具体数量关系是什么 所得到的数量结论是否可靠 中国汽车行业今后的发展前景怎样 应当如何制定汽车的产业政策 很明显 只用一个解释变量已很难分析汽车产业的发展 还需要寻求有更多个解释变量情况的回归分析方法 怎样分析多种因素的影响 4 本章主要讨论 多元线性回归模型及古典假定 多元线性回归模型的估计 多元线性回归模型的检验 多元线性回归模型的预测 5 第一节多元线性回归模型及古典假定一 多元线性回归模型的意义一般形式 对于有K 1个解释变量的线性回归模型注意 模型中的 j 1 2 k 是偏回归系数样本容量为n偏回归系数 控制其它解释量不变的条件下 第j个解释变量的单位变动对被解释变量平均值的影响 即对Y平均值 直接 或 净 的影响 5 6 多元线性回归中的 线性 指对各个回归系数而言是 线性 的 对变量则可以是线性的 也可以是非线性的例如 生产函数取对数这也是多元线性回归模型 只是这时变量为lnY lnL lnK 7 多元总体回归函数条件期望表现形式 将Y的总体条件期望表示为多个解释变量的函数 如 注意 这时Y总体条件期望的轨迹是K维空间的一条线个别值表现形式 引入随机扰动项或表示为 8 多元样本回归函数Y的样本条件均值可表示为多个解释变量的函数或回归剩余 残差 其中 9 二 多元线性回归模型的矩阵表示 多个解释变量的多元线性回归模型的n组样本观测值 可表示为用矩阵表示 9 10 总体回归函数或样本回归函数或其中 都是有n个元素的列向量是有k个元素的列向量 k 解释变量个数 1 是第一列为1的n k阶解释变量数据矩阵 截距项可视为解释变量总是取值为1 矩阵表示方式 11 三 多元线性回归中的基本假定 假定1 零均值假定 i 1 2 n 或E u 0假定2和假定3 同方差和无自相关假定 或用方差 协方差矩阵表示为 i j i j 0 12 假定5 无多重共线性假定 多元中增加的 假定各解释变量之间不存在线性关系 或各个解释变量观测值之间线性无关 或解释变量观测值矩阵X的秩为K 注意X为n行K列 Ran X kRak X X k即 X X 可逆假定6 正态性假定 12 假定4 随机扰动项与解释变量不相关 第二节多元线性回归模型的估计 一 普通最小二乘法 OLS 原则 寻求剩余平方和最小的参数估计式即求偏导 并令其为0其中即 13 14 用矩阵表示的正规方程偏导数因为样本回归函数为两边左乘根据最小二乘原则则正规方程为 15 OLS估计式由正规方程多元回归的OLS估计量为当只有两个解释变量时为 注意 为X Y的离差 对比 简单线性回归中 16 OLS回归线的数学性质 与简单线性回归相同 回归线通过样本均值 估计值的均值等于实际观测值的均值 剩余项的均值为零 被解释变量估计值与剩余项不相关 解释变量与剩余项不相关 j 1 2 k 16 17 二 OLS估计式的统计性质 1 线性特征是Y的线性函数 因是非随机或取固定值的矩阵2 无偏特性 证明见教材P101附录3 1 3 最小方差特性在所有的线性无偏估计中 OLS估计具有最小方差 证明见教材P101或附录3 2 结论 在古典假定下 多元线性回归的OLS估计式是最佳线性无偏估计式 BLUE 18 三 OLS估计的分布性质基本思想 是随机变量 必须确定其分布性质才可能进行区间估计和假设检验 是服从正态分布的随机变量 决定了Y也是服从正态分布的随机变量 是Y的线性函数 决定了也是服从正态分布的随机变量 19 的期望 由无偏性 的方差和标准误差 可以证明的方差 协方差矩阵为 见下页 这里的 其中是矩阵中第j行第j列的元素 所以 j 1 2 k 的期望与方差 20 其中 由无偏性 由同方差性 由OLS估计式 20 注意是向量 的方差 协方差 21 四 随机扰动项方差的估计 一般未知 可证明多元回归中的无偏估计为 证明见P103附录3 3 或表示为将作标准化变换 21 对比 一元回归中 22 未知时的标准化变换 因是未知的 可用代替去估计参数的标准误差 当为大样本时 用估计的参数标准误差对作标准化变换 所得Z统计量仍可视为服从正态分布 当为小样本时 用估计的参数标准误差对作标准化变换 所得的t统计量服从t分布 22 23 五 回归系数的区间估计 由于给定 查t分布表的自由度为n k的临界值或或表示为 23 24 第三节多元线性回归模型的检验 一 多元回归的拟合优度检验多重可决系数 在多元回归模型中 由各个解释变量联合起来解释了的Y的变差 在Y的总变差中占的比重 用表示与简单线性回归中可决系数的区别只是不同多元回归中多重可决系数可表示为 注意 红色字体是与一元回归不同的部分 24 25 多重可决系数的矩阵表示可用代数式表达为特点 多重可决系数是模型中解释变量个数的不减函数 这给对比不同模型的多重可决系数带来缺陷 所以需要修正 26 修正的可决系数思想 可决系数只涉及变差 没有考虑自由度 如果用自由度去校正所计算的变差 可纠正解释变量个数不同引起的对比困难 回顾 自由度 统计量的自由度指可自由变化的样本观测值个数 它等于所用样本观测值的个数减去对观测值的约束个数 27 可决系数的修正方法总变差TSS自由度为n 1解释了的变差ESS自由度为k 1剩余平方和RSS自由度为n k修正的可决系数为 28 修正的可决系数与可决系数的关系已经导出 注意 可决系数必定非负 但所计算的修正可决系数有可能为负值解决办法 若计算的 规定取值为0 29 29 二 回归方程的显著性检验 F检验 基本思想 在多元回归中包含多个解释变量 它们与被解释变量是否有显著关系呢 当然可以分别检验各个解释变量对被解释变量影响的显著性 但是我们首先关注的是所有解释变量联合起来对被解释变量影响的显著性 或整个方程总的联合显著性 需要对方程的总显著性在方差分析的基础上进行F检验 30 30 在讨论可决系数时已经分析了被解释变量总变差TSS的分解及自由度 TSS ESS RSS注意 Y的样本方差 总变差 自由度即显然 Y的样本方差也可分解为两部分 可用方差分析表分解 30 1 方差分析 31 总变差TSS 自由度n 1模型解释了的变差ESS 自由度k 1剩余变差RSS 自由度n k 变差来源平方和自由度方差归于回归模型ESS k 1归于剩余RSS n k总变差TSS n 1基本思想 如果多个解释变量联合起来对被解释变量的影响不显著 归于回归的方差 比 归于剩余的方差 显著地小应是大概率事件 方差分析表 32 2 F检验 原假设 所有解释变量联合起来对被解释变量的影响不显著 备择假设 不全为0建立统计量 可以证明 给定显著性水平 查F分布表中自由度为k 1和n k的临界值 并通过样本观测值计算F值 32 33 F检验方式 如果计算的F值大于临界值 则拒绝 说明回归模型有显著意义 即所有解释变量联合起来对Y确有显著影响 如果计算的F值小于临界值 则不拒绝 说明回归模型没有显著意义 即所有解释变量联合起来对Y没有显著影响 34 三 各回归系数的假设检验 注意 在一元回归中F检验与t检验等价 且 见教材P87证明 但在多元回归中 F检验显著 不一定每个解释变量都对Y有显著影响 还需要分别检验当其他解释变量保持不变时 各个解释变量X对被解释变量Y是否有显著影响 方法 原假设 j 1 2 k 备择假设统计量t为 35 给定显著性水平 查t分布表的临界值为如果就不拒绝 而拒绝即认为所对应的解释变量对被解释变量Y的影响不显著 如果就拒绝而不拒绝即认为所对应的解释变量对被解释变量Y的影响是显著的 讨论 在多元回归中 可以作F检验 也可以分别对每个回归系数逐个地进行t检验 F检验与t检验的关系是什么 对各回归系数假设检验的作法 36 第四节多元线性回归模型的预测 一 被解释变量平均值预测1 Y平均值的点预测方法 将解释变量预测值代入估计的方程 多元回归时 或注意 预测期的是第一个元素为1的行向量 不是矩阵 也不是列向量 37 2 Y平均值的区间预测 基本思想 与简单线性回归时相同 由于存在抽样波动 预测的平均值不一定等于真实平均值 还需要对作区间估计 为了对Y作区间预测 必须确定平均值预测值的抽样分布 必须找出与和都有关的统计量 并要明确其概率分布性质 37 38 区间预测的具体作法 当未知时 只得用代替 这时 简单线性回归中 回顾简单线性回归 38 39 多元回归时 与预测的平均值和真实平均值都有关的是二者的偏差 服从正态分布 可证明用代替 可构造t统计量 区间预测的具体作法 多元时 40 或者 服从正态分布 可证明即标准化当用代替时 可构造t统计量 40 41 给定显著性水平 查t分布表 得自由度为n k的临界值 则或 区间预测的具体作法 42 二 被解释变量个别值预测 基本思想 与简单线性回归时相同 由于存在随机扰动的影响 Y的平均值并不等于Y的个别值 为了对Y的个别值作区间预测 需要寻找与预测值和个别值有关的统计量 并要明确其概率分布性质 43 已知剩余项是与预测值和个别值都有关的变量并且已知服从正态分布 且多元回归时可证明当用代替时 对标准化的变量t为 个别值区间预测具体作法 44 给定显著性水平 查t分布表得自由度为n k的临界值则因此 多元回归时Y的个别值的置信度1 的预测区间的上下限为 45 第五节案例分析 研究的目的要求为了研究影响中国税收收入增长的主要原因 分析中央和地方税收收入增长的数量规律 预测中国税收未来的增长趋势 需要建立计量经济模型 研究范围 1978年 2007年全国税收收入理论分析 为了全面反映中国税收增长的全貌 选择包括中央和地方税收的 国家财政收入 中的 各项税收 简称 税收收入 作为被解释变量 选择国内生产总值 GDP 作为经济整体增长水平的代表 选择中央和地方 财政支出 作为公共财政需求的代表 选择 商品零售价格指数 作为物价水平的代表 46 47 48 序列Y X2 X3 X4的线性图 可以看出Y X2 X3都是逐年增长的 但增长速率有所变动 而且X4在多数年份呈现出水平波动 说明变量间不一定是线性关系 可探索将模型设定为以下对数模型 注意这里的 商品零售价格指数 X4 未取对数 49 三 估计参数 模型估计的结果为 0 6397 0 1355 0 1557 0 0055 t 4 4538 3 0420 4 2788 2 0856 F 673 7521df 30 50 模型检验 1 经济意义检验 模型估计结果说明 在假定其它变量不变的情况下 当年GDP每增长1 税收收入会增长0 4123 当年财政支出每增长1 平均说来税收收入会增长0 6664 当年商品零售价格指数上涨一个百分点 平均说来税收收入会增长0 0115 这与理论分析和经验判断相一致 2 统计检验 拟合优度 表明样本回归方程较好地拟合了样本观测值 F检验 对已得到F 673 7521 给定查表得自由度k 1 3和n k 26的临界值 因为F 673 7521 2 98 说明模型总体上显著 即 国内生产总值 财政支出 商品零售价格指数 等变量联合起来确实对 税收收入 有显著影响 50 51 t检验 分别针对 给定显著性水平 查t分布表得自由度为n k 21的临界值 由回归结果已知与 对应的t值分别为 4 4538 3 0420 4 2788 2 0856 其绝对值均大于 这说明在显著性水平下 分别都应当拒绝说明当在其它解释变量不变的情况下 解释变量 国内生产总值 财政支出 商品零售价格指数 分别对被解释变量 税收收入 Y都有显著的影响 52 本章小结 1 多元线性回归模型及其矩阵形式 2 多元线性回归模型中对随机扰动项u的假定 除了其他基本假定以外
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2E-Hexadecenoyl-CoA-2E-Hexadecenoyl-coenzyme-A-生命科学试剂-MCE
- 禁烟知识培训方案课件
- 2025年外科专升本题库及答案
- 重庆七中2025-2026学年数学高三上期末考试试题
- 宁夏回族自治区银川市兴庆区高级中学2025-2026学年数学高三上期末监测模拟试题
- 江苏省南京市六合区程桥高级中学2025-2026学年高三数学第一学期期末质量检测试题
- 陕西省西安市秦汉中学2025年高三数学第一学期期末经典试题
- 指南考试试题及答案
- 2025年度枣阳市合同制教师公开招聘265人备考练习题库及答案解析
- 2025年马鞍山博望区中小学银龄讲学教师招募6人备考练习试题及答案解析
- 成人高考成考大学语文(专升本)试题及答案指导(2025年)
- 网络物理融合系统的韧性分析
- 2025届山东省德州一中高三毕业班第三次统测物理试题含解析
- 小学形容词副词单选题200道及答案(完整版)
- 湘艺版音乐七年级下册第二单元 野蜂飞舞 教学设计教案1000字
- 2025届辽宁省辽南协作校高一物理第二学期期末考试试题含解析
- DZ∕T 0153-2014 物化探工程测量规范(正式版)
- 企业商标保护风险评估与管理
- 建筑地基处理技术规范DBJ-T 15-38-2019
- 中国律师学 课件 陈卫东 第1-9章 律师制度的产生和发展-律师的管理
- 法学概论(第七版) 课件全套 谷春德 第1-7章 我国社会主义法的基本理论 - 国际法
评论
0/150
提交评论