


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Glossary:ls(least squares) 最小二乘法R-sequared样本决定系数(R2):值为0-1,越接近1表示拟合越好,>0.8认为可以接受, 但是R2随因变量的增多而增大,解决这个问题使用来调整回归标准误差对数似然比:残差越小, L 值越大,越大说明模型越正确 :DW统计量,0-4之间因变量的均值 因变量的标准差 赤池信息量 施瓦兹信息量( 相伴概率Adjust R-seqaured()S.E of regressionDurbin-Watson statLog likelihood(AIC) (越小说明模型越精确)SC (越小说明模型越精确)0,标准差为(T的正态
2、分布Mean dependent var S.D. dependent var Akaike info criterionSchwarz ctiterion:Prob(F-statistic) fitted( 拟合值 )线性回归的基本假设:1. 自变量之间不相关2. 随机误差相互独立,且服从期望为3. 样本个数多于参数个数 建模方法 :ls y c x1 x2 x3 .x1 x2 x3 的选择先做各序列之间的简单相关系数计算,选择同因变量相关系数大而自变量相关系数小的一些变量。模型的实际业务含义也有指导意义,比如ml同gdp肯定是相关的。模型的建立是简单的,复杂的是模型的检验、评价和之后的调整
3、、择优。模型检验:1)方程显著性检验( F 检验):模型拟合样本的效果,即选择的所有自变量对因变量的解 释力度F大于临界值则说明拒绝 0假设。Eviews给出了拒绝0假设(所有系统为0的假设)犯错误(第一类错误或 a错误)的概率(收 尾概率或相伴概率 )p 值,若 p 小于置信度 (如 0.05) 则可以拒绝 0假设,即认为方程显著性 明显。2)回归系数显著性检验( t 检验):检验每一个自变量的合理性|t| 大于临界值表示可拒绝系数为 0 的假设,即系数合理。 t 分布的自由度为 n-p-1,n 为样 本数, p 为系数位置3)DW检验:检验残差序列的自相关性,检验基本假设2 (随机误差相互
4、独立)残差:模型计算值与资料实测值之差为残差0<=dw<=dl 残差序列正相关, du<dw<4-du 无自相关, 4-dl<dw<=4 负相关 ,若不在以上 3 个区间则检验失败,无法判断demo中的 dw=0.141430 , dl=1.73369,du=1.7786,所以存在正相关 模型评价目的:不同模型中择优1 )样本决定系数 R-squared 及修正的 R-squaredR-squared=SSR/SST 表示总离差平方和中由回归方程可以解释部分的比例, 比例越大说明回 归方程可以解释的部分越多。Adjust R-seqaured=1-(n-1)
5、/(n-k)(1-R2)2) 对数似然值 (Log Likelihood, 简记为 L)残差越小, L 越大3) AIC 准则AIC= -2L/n+2k/n, 其中 L 为 log likelihood,n 为样本总量, k 为参数个数。AIC可认为是反向修正的L, AIC越小说明模型越精确。4) SC准则SC= -2L/n + k*ln(n)/n用法同AIC非常接近预测 forecastroot mean sequared error(RMSE) 均方根误差Mean Absolute Error(MAE) 平均绝对误差 这两个变量取决于因变量的绝对值,MAPE(Mea n Abs. Perc
6、e nt Error)平均绝对百分误差,一般的认为MAPE<1(则认为预测精度较高Theil Inequality Coefficient(希尔不等系数)值为 0-1 ,越小表示拟合值和真实值差异越小。偏差率(bias Proportion),bp,反映预测值和真实值均值间的差异方差率(varianee Proportion) ,vp,反映预测值和真实值标准差的差异协变率(eovarianee Proportion) ,ep,反映了剩余的误差以上三项相加等于 1。预测比较理想是 bp,vp 比较小,值集中在 ep 上。eviews 不能直接计算出预测值的置信区间,需要通过置信区间的上下限
7、公式来计算。如何 操作?其他1) Chow 检验ehow's breakpoint 检验零假设是:两个子样本拟合的方程无显著差异。有差异则说明关系中结构发生改变demo中Chow Breakpoint Test: 1977Q1F-statistie 2.95511837136742 Prob. F(3,174) 0.0339915698953355Log likelihood ratio 8.94507926849178 Prob. Chi-Square(3) 0.0300300700620291 p 值 <0.05 ,可拒绝 0 假设,即认为各个因素的影响强弱发生了改变。 问题
8、是如何才能准确的找到这个或这几个断点?目前的方法是找残差扩大超出边线的那个点,但这是不准确的,在demo中1975Q2的残差超出,但是 chow's breakpoint 检验的两个p 值都接近 0.2 , 1976Q3 开始两个 p 值才小于 0.05 ,并且有逐渐减小之势。chow's forecast 检验用断点隔断样本, 用之前的样本建立回归模型, 然后用这个模型对后一段进行预测, 检验这 个模型对后续样本的拟合程度。0 假设是:模型与后段样本无显著差异demo中的1976Q4作为break point,得到两个p值为0,即认为两段样本的系数应该是不同 的。2) 自变量
9、的选择testadd 检验: 操作方法是 : eqation name.testadd ser1 ser2 .0 假设:应该将该变量引入方程 检验统计量: wald,LR结果:通过两个 p值(Prob. F,Prob Chi-sequare)看是否拒绝原假设testdrop 检验:操作方法是 : eqation name.testdrop ser1 ser2 .0 假设:应该将该变量剔除 检验统计量: wald,LR 结果:通过两个 p值(Prob. F,Prob Chi-sequare)看是否拒绝原假设含定性变量的回归模型 分为:自变量含定性变量,因变量含定性变量。后一种情况较为复杂 建立d
10、ummy变量(名义变量):用D表示当变量有m种情况时,需要引入m-1个dummy变量处理办法:把定性变量定义成 0.1.2 等数值后和一般变量同样处理常见问题及对策1 ) 多重共线性( multicollinearity) :p 个回归变量之间存在严格或近似的线性关系 诊断方法:1. 如果模型的R-sequared很大,F检验通过,但是某些系统的t检验没通过2. 某些自变量系数之间的简单相关系数很大3. 回归系数符号与简单相关系统符号相反 以上 3 条发生都有理由怀疑存在多重共线性方差扩大因子 (variance inflation factor VIFj)是诊断多重共线性的常用手段。VIFj
11、 为矩阵(X' X) -1 第 j 个对角元素 cjj=1/(1-R2j)(j=1,2 ,p)其中 R2j 为以作为 cj 因变量,其余 p-1 个自变量作为自变量建立多元回归模型所得的样本 决定系数,所以 R2j 越大则说明自变量之间自相关性越大,此时也越大,可以认为 VIFj>10(R2j>0.9) 则存在多重共线性。还可以使用 VIFj 的平均数作为判断标准, 如果 avg(VIFj) 远大于 1 0则认为存在多重共线性。eviews里如何使用 VIF法?-建立方程,然后手工建立scalar vif 。 demo中GDP和PR的 vif为66,存在多重共线性?只有一个
12、自变量的方程是否会失效 ?此时dw值只有0.01远小 于dl,说明GDP远远不是PR能决定的。结合testdrop 将PR去除,两个p值为0,说明不 能把PR去除。在 eviews 中当自变量存在严重的多重共线性时将不能给出参数估计值,而会报错:nearlysingular matrix多重共线性的处理:1. 剔除自变量,选择通过testdrop 实验,并且 vif 值最大的那个2. 差分法,在建立方程时填入 ls m1-m1(-1) c gdp-gdp(-1) pr-pr(-1)。 m1(-1) 表示上一个 m1差分法常常会丢失一些信息,使用时应谨慎。demo中得到的模型,c的p值0.11,
13、 pr-pr(-1)的 p 值为 0.60 ,说明参数无效。2) 异方差性( Herteroskedasticity)即随机误差项不满足基本假设的同方差性 , 异方差性说明随机误差中有些项对因变量的影响 是不同于其他项的。一般地,截面数据做样本时出现异方差性的可能较大,或者说都存在异方差性若存在异方差性,用OLS估计出来的参数,可能导致估计值虽然是无偏的,但不是有效的。(截面数据就是同一时间点上各个主体的数据,比如2007年各省的GDP数据放在一起就是一组截面数据与之相对的是时间序列数据 如河北省从 00年到 07年的数据就是一组时间序列数据 两者综合叫面板数据 )00 年到 07 年各省的数
14、据综合在一起就叫面板数据诊断方法:1. 图示法,以因变量作为横坐标,以残差项为纵坐标,根据散点图判断是否存在相关性。( 选择两个序列作为 group 打开,先选中的序列将作为 group 的纵坐标 )2. 戈里瑟 (Glejser) 检验:?3. 怀特 (White) 检验 :用e2作为因变量,原先的自变量及自变量的平方(还可以加上各自变量之间的相互乘积)作为自变量 建立模型。怀特检验的统计量为:m=n*R2(n是样本容量,R2是新模型的拟合优度),m x 2(k) k 为新模型除常数项之外的自变量个数 零假设:模型不存在异方差性操作: 在估计出来的方程中, view-residual tes
15、ts-White Herteroskedasticity(no cross/cross) 分别为是否含自变量交叉项demo中的两个p值为0,所以拒绝零假设,认为存在严重的异方差性。异方差性的处理:1. 加权最小二乘法 (WLS weighted least sequare) 。最常用的方法, 一般用于异方差形式可知的情况。 基本思路是赋予残差的每个观测值不同的 权数,从而使模型的随机误差项具有相同的方差。2. 自相关相容协方差 (Heteroskedasticity and antocorrelation consistent convariances HAC) 用于异方差性形式未知时。在建模
16、时在 options 中选择 Heteroskedasticity consistent convariances 再从 white,newey-west 中选择一种。HAC不改变参数的点估计,改变的知识估计标准差。如何改变标准差?3) 自相关性残差项不满足相互独立的假设。 一般的, 经济时间序列中自相关现象较为常见, 这主要是经 济变量的滞后性带来的。自相关性将导致参数估计值虽然是无偏的,但不是有效的。诊断方法:1. 绘制残差序列图。如果序列图成锯齿形或循环状的变化,可以判定存在自相关2. 回归检验法:以残差 e(t) 为被解释变量,以各种可能的相关变量,如 e(t-1) e(t-2) 作为
17、自变量,选择 显著的最优拟合模型作为自相关的形式。demo中以 Is residml c residml(-l) residm1(-2)后 发现 c 的 p 值为 0.54,做 testdrop实验,两个p值都0.5可以将c剔除。剔除c后:Dependent VariabIe: RESIDM1Method: Least SquaresDate: 12/29/07 Time: 11:26SampIe (adjusted): 1952Q3 1996Q4IncIuded observations: 178 after adjustmentsVariabIe Coefficient Std. Erro
18、r t-Statistic Prob.RESIDM1(-1) 1.215361 0.077011 15.78173 0.0000RESIDM1(-2) -0.271664 0.078272 -3.470763 0.0007R-squared 0.868569 Mean dependent var 0.011855Adjusted R-squared 0.867823 S.D. dependent var 26.91138S.E. of regression 9.783961 Akaike info criterion 7.410538Sum squared resid 16847.76 Schwarz criterion 7.446289Log IikeIihood -657.5379 Durbin-Watson stat
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC TR 63309:2025 EN Active fibres – Characteristics and measurement methods – Guidance
- 2025至2030中国电镀表配件行业深度研究及发展前景投资评估分析
- 2025至2030中国电子商务食品行业深度研究及发展前景投资评估分析
- 2025至2030中国电动尾门行业产业运行态势及投资规划深度研究报告
- 2025至2030中国玛瑙饰品行业市场占有率及投资前景评估规划报告
- 技术培训推动教师职业发展的重要动力
- 幼儿园营养性疾病知识培训
- 智慧教育大数据驱动的教学效率变革
- 探索不同国家在线教育平台的创新实践
- 教育中的心理学技巧激发学生潜能的实践
- 【MOOC】教育研究方法-浙江大学 中国大学慕课MOOC答案
- 《回归分析》课件
- 心脏手术围手术期
- 餐车经营食品安全应急预案
- DB43T 876.11-2017 高标准农田建设 第11部分:耕地地力评定技术规范
- 2024新版(外研版三起孙有中)三年级英语上册单词带音标
- 2024至2030年中国汉白玉石雕数据监测研究报告
- 三年级下册混合计算题100道及答案
- DB12T 998-2020 殡葬服务机构消毒卫生规范
- 广东省广州市五校2023-2024学年高一下学期期末联考化学试卷
- 2024年天津高考数学真题试题(原卷版+含解析)
评论
0/150
提交评论