




免费预览已结束,剩余68页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 下部分 一元线性回归模型的统计检验 第三节拟合优度检验第四节变量的显著性检验第五节预测第六节案例分析小结 回归分析是要通过样本所估计的参数来代替总体的真实参数 尽管从统计性质上已知 如果有足够多的重复抽样 参数的估计值的期望 均值 就等于其总体的参数真值 但在一次抽样中 估计值不一定就等于该真值 那么 在一次抽样中 参数的估计值与真值的差异有多大 是否显著 这就需要进一步进行统计检验 主要包括拟合优度检验 变量的显著性检验 up 用最小二乘法得到的回归直线至少从残差平方和为最小这一意义上来说是所有可能直线中最佳的拟合线 它是对Y和X之间关系的一种描述 但该直线是不是Y和X之间关系的一种恰当的描述呢 如果各观测点紧密地聚集在这条直线的周围 则表明该直线对Y和X之间关系的描述是好的 否则 用直线来描述这两个变量之间的关系就未必恰当 如下图所示 a 恰当描述 b 不恰当描述问题是该直线能否较好地拟合所给定的观测值 这就是拟合优度问题 up 第一节拟合优度检验 拟合优度检验含义 是检验模型对样本观测值的拟合程度 一 总离差平方和的分解二 拟合优度的测度三 习题 up 一 总离差平方和的分解 已知由一组样本观测值 Xi Yi i 1 2 n得到如下样本回归直线 如果Yi i即实际观测值落在样本回归 线 上 则拟合最好 可认为 离差 全部来自回归线 而与 残差 无关 对于所有样本点 则需考虑这些点与样本均值离差的平方和 可以证明 记 总体平方和 TotalSumofSquares 回归平方和 ExplainedSumofSquares 残差平方和 ResidualSumofSquares TSS反映因变量n个观测值与其均值的总离差ESS反映自变量X的变化对因变量Y取值变化的影响 或者说由于X和Y线性关系引起Y取值的变化RSS反映X以外的因素对Y取值的影响 在给定样本中 TSS不变 如果实际观测点离样本回归线越近 则ESS在TSS中占的比重越大 因此拟合优度 回归平方和ESS Y的总离差TSS up 1 可决系数R2可决系数是反映估计的回归曲线对观测的数据的解释能力或者说是反映两者拟合优度的尺度 我们将两端都除以总离差平方和 得 二 拟合优度的测度 用符号表示为 可决系数的取值范围 0 1 R2越接近1 说明实际观测点离样本线越近 拟合优度越高 R2 1 完全拟合 R2 0 X与Y完全不存在线性关系 课本例题P42 Eviews操作结果 作用 可决系数越大 说明在总变差中由模型作出了解释的部分占的比重越大 模型拟合优度越好 反之可决系数小 说明模型对样本观测值的拟合程度越差 特点 可决系数取值范围 随抽样波动 样本可决系数是随抽样而变动的随机变量 可决系数是非负的统计 可决系数的作用和特点 可决系数与相关系数的关系 1 联系数值上 可决系数等于应变量与解释变量之间简单相关系数的平方 可决系数与相关系数的关系 2 区别 up 思考 可决系数 相关系数 回归系数之间的关联 练习 1 各实际观测值与回归值的差的平方和称为A 总变差平方和B 残差平方和C 回归平方和D 决定系数2 总体平方和TSS 残差平方和RSS与回归平方和ESS三者的关系是 A RSS TSS ESSB TSS RSS ESSC ESS RSS TSSD ESS TSS RSS 3 下面哪一个必定是错误的 4 在一元线性回归模型中 如果相关系数r 0 8 说明回归直线能解释被解释变量总变差的 A 80 B 64 C 20 D 89 up 解答 第四节变量的显著性检验 t检验 如例2 2中关于消费支出 Y 元 与可支配收入 X 元 的分析 依据10个观测资料所得的样本回归方程 可以知道 可支配收入每增加1元 消费支出将增加0 61元 这说明 消费支出是随着可支配收入的提高而增加的 R2 0 996627 拟合程度较高 up 在一元线性模型中 要判断X是否对Y具有显著的线性性影响 这就需要进行变量的显著性检验 变量的显著性检验所应用的方法是统计学中的假设检验 计量经计学中 主要是针对变量的参数真值是否为零来进行显著性检验的 一 显著性检验的原理 假设检验 基本原则 小概率事件在一次试验中是不可能发生的 例如 有一个厂商声称 他的产品的合格品率很高 可以达到99 那么从一批产品 譬如100件 中随机抽取一件 这一件恰恰是次品的概率就非常小 只有1 如果厂商的宣传是真的 随机抽取一件是次品的情况就几乎是不可能发生的 但如果这种情况确实发生了 就有理由怀疑原来的假设 即产品中只有1 的次品的假设是否成立 这时就有理由推翻原来的假设 可以做出厂商的宣传是假的这样一个推断 小概率事件的含义 我们从上图看到 正态总体在以外取值的概率只有4 6 在以外取值的概率只有0 3 由于这些概率值很小 一般不超过5 通常称这些情况发生为小概率事件 即事件在一次试验中几乎不可能发生 关于 小概率 的值通常根据实际问题的要求而定 如取 0 1 0 05 0 01等 为检验的显著性水平 描写小概率事件的统计量的取值范围称为该原假设的否定域 拒绝域 否定域的边界称为该假设检验的临界值 H0值 临界值 临界值 a 2 a 2 拒绝域 拒绝域 1 如图所示 基本步骤 1 提出原假设 确定备择假设 原假设为正待检验的假设 H0 备择假设为可供选择的假设 H1 2 构造分布已知的合适的统计量 u检验 t检验 F检验 常用统计量 回顾 t 分布与F 分布 4 计算统计量的样本观测值 如果落在拒绝域内 则拒绝原假设 否则 接受原假设 3 由给定的检验水平 求出在H0成立的条件下的临界值 临界值 临界值 a 2 a 2 拒绝域 拒绝域 接受域 1 置信水平 如图所示 up 在假设检验中 有关 是否为0的假设检验特别重要 如果通过检验 接受 0的原假设 则表明X和Y没有关系 即X对Y的变动没有影响 在这种情况下 就应从模型中剔除X 寻找其他解释变量 这类检验称为系数的显著性检验 二 系数的显著性检验 UP 回归系数的显著性检验步骤 提出假设H0 2 0 没有线性关系 H1 2 0 有线性关系 计算检验的统计量 确定显著性水平 课本例题Eviews操作结果 T统计量 练习 一元回归模型Y 14 107 1 224X标准差 1 863 0 061 R2 0 9760n 12按5 的显著水平 对回归系数进行显著性检验 例子 假设李先生消费函数可用模型表示 其中表示李先生第i期的消费 表示李先生第i期的收入 根据李先生19个月的观测资料进行回归分析得到下例结果 3 1 18 7 括号里的数字表示相应参数的t值 请回答以下问题 1 利用t值进行假设检验 取显著水平为5 2 确定参数估计量的标准误差 解 1 因t统计量 自由度为17 19 2 且显著性水平为5 的t统计量的临界值为2 11 所以这就是说如果统计量t的值落在以为中心的其概率度为1 5 的区间之外 所以根据样本和5 的显著性水平判断回归系数显著 同样回归系数显著 2 根据 得的标准误差为 根据 得的标准误差为 例子2 依据美国1970 1983年的数据 得到下面的回归结果 其中GDP是国内生产总值 单位是亿美元 M1是货币供给 单位为百万美元 a 填充括号内缺省的参数 b 货币学家认为 货币供给对GDP有显著的影响 你如何检验这个假设 t值及显著性判断的实际运用 1 t值具有选择解释变量的作用 2 常数项的t值 除非在经济理论上具有重要意义或者在进行经济预测时 一般地 即使不显著 也没有必要在意 3 样本个数n如果大到一定程度 n 30 t值只要大于2 0 计量经济学家们就习惯于将回归系数判定为显著 这是因为 通常在利用5 的显著水平 双侧检验 如果自由度在28以上 即一元回归的n 30 则将小数第二位四舍五入 t全部等于2 0 即使自由度 时 1 96 2 0 当待验回归系数非常多时 利用这种方法比较方便 不用特意去查t分布表 但是 如果样本数很小 即使判定值在2 0以上 也不要使用这一规则 up 第五节预测 当回归方程完成了参数估计和显著性检验之后 如果结果理想 拟合得较好 且系数估计值符合经济理论和常识 我们就可以利用回归方程进行预测 对因变量Y的预测通常有两种 点预测和区间预测 up 一 回归分析结果的报告经过模型的估计 检验 得到一系列重要的数据 为了简明 清晰 规范地表述这些数据 计量经济学通常采用以下规范化的方式 例如 回归结果为 299 11 0 61348 56 6044 0 012618 标准误差SEt 5 2843 48 6194 t统计量 0 996627df 8可决系数和自由度 up 二 点预测 例题假定样本回归函数为 求Xf 1000时的预测值 f在Xf 1000处 f 103 172 0 777 1000 673 84 严格地说 这只是被解释变量的预测值的估计值 而不是预测值 原因 1 参数估计量不确定 2 随机项的影响 说明 up 三 区间预测 由于随机因素的影响 模型中的参数估计量是不确定的 所以 我们得到的仅能是预测值的一个估计值 预测值仅以某一个置信水平处于以该估计值为中心的一个区间中 区间预测是在一定置信概率的保证下 通过考察预测误差的范围 进而确定真实值Yf可能被哪个区间范围所包含 预测误差 Yf表示实际的预测值 是一随机变量 可以证明 构造t统计量ef服从正态分布 可利用它的性质构造统计量 构建个别值的预测区间 给定显著性水平 预测区间上下限为 即15 24至21 76 如何缩小置信区间 增大样本容量n 因为在同样的样本容量下 n越大 t分布表中的临界值越小 同时 增大样本容量 还可使随机误差项的标准差减小 提高模型的拟合优度 模型优度越高 残差平方和应越小 第六节案例分析 提出问题 改革开放以来随着中国经济的快速发展 居民的消费水平也不断增长 但全国各地区经济发展速度不同 居民消费水平也有明显差异 为了分析什么是影响各地区居民消费支出有明显差异的最主要因素 并分析影响因素与消费水平的数量关系 可以建立相应的计量经济模型去研究 研究范围 全国1978 2007年人均消费水平和人均GDP的时间序列 理论分析 影响各地区城市居民人均消费支出的因素有多种 但从理论和经验分析 最主要的影响因素应是居民收入 从理论上说可支配收入越高 居民消费越多 但边际消费倾向大于0 小于1 建立模型 其中 Y 城市居民家庭平均每人每年消费支出 元 X 城市居民人均年可支配收入 元 一 参数估计 在主页上选Quick菜单 点击EstimateEquation项 屏幕出现估计对话框 EquationSpecification 在EstimationSettings中选OLS估计 即LeastSquares 键入YCX或YXC C为Eviews固定的截距项系数 然后OK 即显示估计结果 估计参数 具体操作 使用EViews软件包 估计结果 假定模型中随机扰动满足基本假定 可用OLS法 表示为 1 可决系数 模型整体上拟合好 即用人均可支配说如解释消费型支出变化效果很好 2 系数显著性检验 给定 查t分布表 在自由度为n 2 28时临界值为因为t 49 90815 说明 城镇人均可支配收入 对 城镇人均消费支出 有显著影响 模型检验 3 经济意义检验 估计的解释变量的系数为0 38643 说明城镇居民人均可支配收入每增加1元 人均年消费支出平均将增加0 38643元 这符合经济理论对边际消费倾向的界定 回归预测操作1 点预测 1 给定解释变量的预测值X2008 22001 元 2 预测的值 先将Range从1978 2007扩展为1978 2008 再将X2008 22001输入变量X中 在Equation对话框里选Forecast 将时间Sample定义在1978 2008 按OK 这时Eviews自动计算出 up 小结 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《几何图形:小学数学几何图形学习教案》
- 地基检测考试题及答案
- 护理入学考试题库及答案
- 工程项目进度控制及验收流程说明文档
- 猴王出世缩写300字7篇范文
- 招投标信息标准化录入与审核表
- 团队协作激励与任务考核体系表
- 农村社区公共设施维护管理责任书
- 企业内部沟通纪要记录表
- 医疗安全事故案例培训课件
- 乡村振兴战略实施与美丽乡村建设课件
- 中频电疗法理疗(共60张PPT)精选
- 医学信息检索与利用智慧树知到答案章节测试2023年杭州医学院
- 黑底搭配大气企业宣传商业计划书商务通用PPT模板
- GB/T 17608-2006煤炭产品品种和等级划分
- 沪教五年级数学上册第一单元测试卷
- 地下停车库设计统一规定
- 综合实践课《绳结》教学设计
- 建筑装饰设计收费管理规定
- 电子课件-《市场营销》-A45-2298完整版教学课件全书电子讲义(最新)
- (整理)ASME-B161.34规定的标准磅级阀门(常用材料)额定工作压力和试验压力
评论
0/150
提交评论