拟合优度检验统计量的设定方法.docx_第1页
拟合优度检验统计量的设定方法.docx_第2页
拟合优度检验统计量的设定方法.docx_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

拟合优度检验统计量的设定方法王重,刘黎明(首都经济贸易大 学 统计学院,北 京 100026)摘 要:模型的拟合优度检验是模型构建的关键部分 ,决定模型分析经济问题的精度 。 文 章 通 过实 证 分 析 ,证 明 了 统 计 量 R2 检验模型的拟合优度时存在的问题 ,并提出新的拟合优度检验统计量 ,通过实证分析新的统计量检验模型的拟合度更加有效 。关键词:数 量 模 型; 拟 合 优 度;模 型 检 验中图分类号:TK730.2;O357.5文献标识码:A文章编号:10026487(2010)050154-03检 验 、模 型 系 数 检 验 、模 型 总 体 检 验 。 三个检验方法中 ,拟 合优 度 检 验 和模型总体检验主要检验模型的拟合程度 ,模 型 通 过拟合优度检验 ,才可以进行系数检验 。问题提出1构 建 经济计量模型研究经济问题 , 首先确定研究对象 ,然后分析研究对象 ,确定影响研究对象的变量 ;根 据 变 量 之 间 的 相 互 关 系 ,确 定经济计量模型的结构解析式 ;而 后 利 用 搜 集 到 的 数 据估计模型未知参数 ;最 后 ,对模型进行检验 ,模 型 通 过 检 验 后 ,就可以利用经济计量模型解释经济现象 。经 济 计量模型的变量选取 ,模型结构解析式的确定需要 经 济 理 论 和先验的经验研究 ,模型检验是经济计量模型能够 解释经济现象的保证 。 经典线性模型中的检验中有拟合优度 模型检验存在的问题2拟合优度检验最早由英国统计学家 K皮 尔 逊 提 出 , 皮尔 逊 明 确 指出统计学不仅仅研究样本 ,而是根据样本对总体 进 行 推 断 。 模型检验是构建模型过程中重要的一环 。 经 典 的 计量经济学通过构造检验统计量进行模型假设检验 。 模 型 拟 合 优 度 检 验 ,模型假设和检验统计量的构造以数理统计知识 基金项目:首都经济贸易大学研究生科技创新项目 作者简介:王 重 (1983-),男 ,山 东 潍 坊 人 ,博 士 研 究 生 ,研 究 方 向 :应 用 数 理 统 计 。刘 黎 明 (1956-),女 ,山 东 人 ,博 士 ,教 授 ,研 究 方 向 :应 用 数 理 统 计 。结语4认 为 ,最 优检验方法的选择还依赖于人们对可能的异方差形 式 的 先 验 认 识 。在 某 些有关计量经济的回归模型中 ,假设误差项具有方 差齐性是不合理的 。 异方差的情况在截面数据中常常出现.。 对 这 种 异 方差模型进行最小二乘估计 , 会产生严重的错误 , 因此研究异方差的检验方法具有重要意义 。由于戈德菲尔德 -匡特检验方法只适用于一个自变量 , 因 此 ,本文给出针对多变量的 G-Q 检 验 方 法 ,即 对 每 个 解 释 变 量 进 行 异 方 差 检 验 ,从而判断原模型的异方差性 。 通 过 实 例 我 们 还 看 出 , 本 文 所 给 的 方 法 比 文 献 3 中的方法适用更 广 ,也 更 简 便 易 行 ,即只要进行若干次 的 单 变 量 G-Q 检 验 就 行 了 。当 然 ,异 方差的检验除了上述叙述的方法外 ,还 有 很 多 的 方 法 。 文 献 3给出了一种基于样本主成分的 推 广 的 G-Q 检 验 方 法 , 文 献 4 则 给 出 了一种基于分组的异方差检验方 法 。 如 何 根据实际情况选择最好的检验方法是值得研究的 。 当 然 ,最优检验方法的选择不是固定的 ,George G.Jude7等 人参考文献:1White H. A. Heteroscedasticity-Consistent Covariance Matrix Es-timator and Direct Test for Heteroscedasticity J.Econometrica,1980,(48).2Park R. E. Estimation With Heteroscedastic Error Terms J.E-conometrica,1966,(34).3龚秀芳.戈德菲尔德-匡特检验的推广J.数理统计与管理,2005,24. 4张 荷 观.基于分组的异方差检验和两阶段估计J.数 量 经 济 技 术 经济 研 究 ,2006,(1).5白 雪 梅.异方差性的检验方法及评述J.东 北 财 经 大 学 学 报 ,2002,(11).6 王 正 林 等 . 精 通 MATLAB 科 学 计 算 M. 北 京 : 电子工业出版社 ,2007.7姜 诗 章 ,王 锦 功.计量经济学教程M.吉 林 :吉林大学出版社 ,1989.(责任编辑/李友平)表 1Anscombe 数据表 2各数据组模型统计量据 ,证 明 了 R2 不能充分检验回 归 模 型 拟合 情 况 ,统 计 量 R2 无 法 充 分 反 映 模 型 的 拟 合 程 度 ,使 用 统 计 量 R2 无 法 有 效 的 检 验模型的拟合程度 。表 1 中 数 据 被 分 为 四 组 ,G1(x1,y1), G2 (x2,y2),G3 (x3,y3),G4 (x2,y4), 对 这 四 组 数 据进行一元线性回归 。 设 定 模 型 :y=0+1x+采 用 最 小二乘法估计模型 ,得 到 模 型参数和模型的主要统计量 。从 表 2 可 以 看 出 , 数 据 组 G1,G2,G3 的模型参数估计值和模 型 的 拟 合 优1表 3各组数据估计模型残差表数 据 来 源 :韦 博 成 鲁 国 斌 史 建 清 统 计 诊 断 引 论 为 基 础 。 经典的模型检验 ,需 要 检 验 模 型参 数 ,并且还需检验模型总体显著性 。回归拟合度评价统计量 :度检验统计量基本一致 , 赞赞0=3, 1,R =20.7。拟 合 优 度 检 验统计量的值不是很 高 , 但还是不能否认 R2 本 身 存 在 的 问题 。 四组数据拟合模型 ,我们得到相似的回归方程 ,但 数 据 却 存 在 很 大 差 别 。如 图 1 所 示 , 模 型 y=3+0.5x 对 于 数 据 组 G1 与 G3 的 拟 合 优 度检验统计量为 0.7, 基 本 可 以 拟 合 , 但是对于数据组 G2,拟合优度检验统计量也是 0.7,拟 合 效 果 就 要 差 很 多 ,因 此 单 独 利 用 R2 检验模型的拟合优度是欠妥的 。拟合优度检验统计量 R2 不能够很好检 验模型的拟合情 况 ,这 与 统 计 量 R2 的 构 造 有 关 。 R2 中 包 含 有(Y-Y軍)与(Y赞 -Y軍), 获得自变量数值的方式不同 ,Y軍也就具有不同的含义 。 自 变 量 Y 数据来源有两种方式 ,第一类是通过可重复实 验 获 得 的 数 据 。 例 如 :在 常 温 ,常 压 状 态 下 ,某工厂测量合金 A 的 强 度 ,对 合 金 A 施 加 100000 牛 冲 击 力 , 实 验 3 万 次 , 合 金 A 的 3 万 次实验的数据记录下来 ,测 算 合 金 A 的 强 度 。 合 金 A 的 强 度 为 研 究 对 象 ,构 造 模 型 y=ps+,利 用 数 理 方 法 ,估 计 合 金 A 的 强 度 。 可重复实验得到数据 ,可以保证实验条件的稳定性 , 把外界的干扰控制到最低 。 在 实 验 中 ,可以精确的控制 每 一 个 Y 影响研究对象的变量 。 本 例 中 ,可 以 精 确 的 控 制 温 度 、压 强 、冲 击 力 。 此 时 R2 的就是试验观测数值得 均 值 ,并且与每一个 十 分 接 近 ,此 时 R2 作为检验模型的 拟合程度不是很合适 。 第二类是不可重复性试验的时间 序 列 数 据 。 在经济问题的研究中 ,我 们 得到大量无法重 复的时间序列数据 。 例 如 :为了研究某地区的消费规律 , 根据统计资料查到该地区人均收入 、人 均储蓄和人均消 费 1981 年 到 2002 年 的 年 度 数 据 , 通 过 对 数 据 的 分 析 , 估 计 人 均 收 入 、人均储蓄对人均消费的 影 响 程 度 。 人 均 消费作为研究对象 , 记录纵向年度不同 时 刻 变 量 的 值 , 利用这些统计数据构建模型研究人均收入 、人 均 储 蓄 与 人均消费的关系 。 构建面板数据模型 ,存 在 个 自 变 量 ,研 究面板数据研究自变量与因变量的关系 ,面 板 数 据 收 集 时 ,n 个自变量与因变 量 同 时 变 化 ,这 时Y軍就 变 成 自 变 量 Y 的 算 术 平 均 值 ,并不能保证与每一个 Y 十 分 接 近 ,那2eiiR2=1-(Yi-Y)2i2eiR軍2=1- n-1 i n-K-1(Yi-Y軍)2ibk-k参数检验统计量 :tk=t(n-K-1)姨S2(XX)-1)k+1,k+1R2n-K-1 F(K,n-模型总体显著性检验统计量 :F=1-R2 KK-1)拟 合 优度检验用于检验回归模型的拟合程度 ,拟 合 优 度 检 验 是 模 型系数检验的基础 , 在模型通过拟合优度检验后 , 才可进行模型系数检验 。 统 计 量 R2 与R軍2 检验模型的拟合程 度 被 证 明 存 在 问 题 ,Anscombe 在 1973 年给出了四组著名数 NO123410.0160220.1246270.0716670.06108620.0003530.1399370.0336910.25936530.2334130.0870610.2527990.09442940.1564340.1447080.0543410.21018750.0072680.0819750.087440.17568560.0131890.234680.1298330.00824670.1721370.0210590.0129040.32989580.1819250.6131960.0714290.00676290.1200490.0141390.1032130.255746100.3429650.1045580.0124330.117326110.0291610.1605290.0395680.013345NOx1y1y2y3x2y41108.049.147.4686.58286.958.146.778.65.763137.588.7412.787.71498.818.777.1188.845118.339.267.8188.476149.968.18.8487.04767.246.136.0885.25844.263.15.391912.0591210.089.138.1585.561074.827.266.4287.911155.684.745.7386.89数 据 组G1G2G3G403.1175453.0009093.0119093.3553580.4793640.50.4982730.453324R20.6883230.6662420.6692320.607462从检验结果来看 ,模 型 y=0+1x+ 对四组数据模拟 ,G3(x1,y3)的 检 验 值 最 小 ,统 计 量 =0.07,若 假 设 0.1 就 可 以 接 受 模 型 ,那么就可以利用模 型 对 数 据 G3(x1,y3)进 行 经 济 分 析 , 数 据 组 G1(x1,y1),G2(x2,y2),G4(x2,y4) 的模型需要进行修正 , 仅 当 G1、G2、G3 的 模 型 统 计 量 i0.1,才 可 借 助 模 型 进 行 经 济 分 析 。么 借 助 R2 与 R軍 2 对 模 型 进 行 拟 合 的 检 验 就 可 能 出 现Anscombe 所 论 证 的 问 题 。拟合优度检验统计量3检 验 模型的拟合优度可以构建新的统计量 ,拟 合 优 度 检验的统计量可以设定为 :结论4= 1 |i|i=| i |yin |yi|模 型 的拟合优度检验是检验设定模型的拟合程度 ,检 验拟合优度的统计量应该实际反映模型的拟合水平 。 检 验 模 型 的 拟 合 程 度 ,残 差 是良好的统计量 ,使用残差必须消除残差 的 量 纲 影 响 ,统 计 量 i 消 除 量 纲 影 响 ,残差表示估计值与真 实 值 之 间 的 差 别 , 残差除以真实值表示残差占真实值的比 率 。模 型 因变量与自变量关系稳定 ,确定模型变量之间的函 数 关 系 ,yi 服 从 正 态 分 布 。 模型因变量服从正态分布 ,不 可 采 用 拟 合 优 度 X2 统计量检验模型拟合优度 。 估 计 模 型 函 数 关 系 确 定 后 ,构造模型的拟合优度检验 X2 统 计 量n检验模型拟合优度 ,统 计 量 R2 构 造 存 在 问 题 ,不 能 很 好地反映模型的实际拟合程度 , 而 统 计 量 从模型本身出发 , 可 以 准 确 的辨别模型的拟合情况 。 实 际 研 究 中 ,根 据 研 究 对 象 的 不 同 ,设 定 不 同 精 度 ,得到拟合数据的最佳模型 ,分 析 经 济 问 题 。参考文献:1Anscombe,F.J, et al. Graphs in Statistical Analysis J.Am.Statist,1973,27.2Braun,H, et al. A Simple Method for Testing Goodness of Fit in the Presence of Nuisance ParametersJ.R.Staat.Soc.1980,42.3Larntz,K,Small-sample Comparisons of Exact levels for Goodness of Fit StatisticsJ.J. Am. Stat. Assoc,1978,73.4Khan, Azizur Rahman, Carl Riskin, et al. Growth and Distribu-tion of Household Income in China between 1995 and 2002 C. Working Paper,2008.5Tigor, Robert L. W. Arthur Lewis and the Birth of DevelopmentEconomicsM. Princeton: Princeton University Press,2006. 6Christopher M, Fleming Robert R, et al. Single -species VersusMultiple-species Models:the Economic Implications J.Ecol Model,2003,170.7Fafchamps, M Minten, et al. Returns to Social Network CapitalAmong TradersJ.Oxford Economic, 2002,542.8韦 博 成 ,鲁 国 斌 ,史 建 清 等.统 计 诊 断 引 论(第 一 版)M.南 京:东 南 大 学 出 版 社 ,1991.9谢 识 予 ,朱 宏 鑫 .高级计量经济学 (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论