计量经济学Econometrics-3一元线性回归_第1页
计量经济学Econometrics-3一元线性回归_第2页
计量经济学Econometrics-3一元线性回归_第3页
计量经济学Econometrics-3一元线性回归_第4页
计量经济学Econometrics-3一元线性回归_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一元线性回归模型的统计检验 一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间 回归分析 是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。 尽管从 统计性质 上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。 那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行 统计检验 。 主要包括 拟合优度检验 、变量的 显著性检验及参数的 区间估计 。 一、拟合优度检验 拟合优度检验( : 对样本回归直线与样本观测值之间拟合程度的检验。 度量拟合优度的指标 : 判定系数 ( 可决系数 of 题: 采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度? 果采用不同的解释变量来解释被解释变量,可能有的解释好点,有点解释差点。相当于模型的选择方法。 1、总离差平方和的分解 已知由一组样本观测值( i), i=1,2, Y 10 )()( 没有解释的部分 被解释了的部分 如果 i 即实际观测值落在样本回归“线”上,则 拟合最好 。 可认为, “离差” 全部来自回归线,而与“残差”无关。 对于所有样本点,则需考虑这些点与样本均值离差的平方和 ,可以证明: 记 22 )( S um 22 )( S um 22 )( S 残差平方和 ( um 的观测值围绕其均值的 总离差 (分解为两部分: 一部分来自回归线 (另一部分则来自随机势力 ( 在给定样本中, 如果实际观测点离样本回归线越近,则 此 拟合优度 :回归平方和 的总离差 S 1记 22、可决系数 称 (样本) 可决系数 /判定系数 ( of 可决系数 的 取值范围 : 0, 1 ,说明实际观测点离样本线越近,拟合优度越高 。 直观上,若 回归显得拟合得较好! 在实际计算可决系数时,在 1 已经估计出后 : 22212 在例 入 中, 9 0 0 2 07 4 2 5 0 0 0) 222212 注:可决系数 是一个非负的统计量。它也是随着抽样的不同而不同。为此,对可决系数的统计可靠性也应进行检验,这将在第 3章中进行。但是实际计算有可能为负值,这是由于计算的问题,通常要求有常数项,可以保证非负 ! 可决系数为负的原因 见 2004, . of 20 to a ) of of y - of y On SS is 2 be is SS is is SS is a of y (in b! 可决系数为负的原因 见 2004, . 如果没有常数项,那么( 的一式不存在,即估计的残差和不一定等于 0。从而不能保证第 41页中 从而无法保证 样 就有可能小于 0。 T S 120 ii 可决系数只是说明列入模型的所有解释变量对 因变量的联合的影响程度,不说明模型中每个 解释变量的影响程度(在多元中) 回归的主要目的如果是经济结构分析,不能只 追求高的可决系数,而是要得到总体回归系数 可信的估计量,可决系数高并不表示每个回归 系数都可信任 如果建模的目的只是为了预测因变量值,不是 为了正确估计回归系数,一般可考虑有较高的 可决系数,一般来说时间系列的很高, 可决系数与相关系数的关系( 1) ( 1)联系 数值上,可决系数等于应变量与解释变量之间简单相关系数的平方 : 2 2 2 2 2222 2 2 2 2222()()( ) ( )i i i i ii i i x x y y x 可决系数与相关系数的关系( 2) 可决系数 相关系数 就模型而言 就两个变量而言 说明解释变量对应变量的解释程度 度量两个变量线性依存程度。 度量不对称的因果关系 度量不含因果关系的对称相关关系 取值: 0,1 取值: 1,1 ( 2)区别 二、变量的显著性检验 回归分析 是要判断 解释变量 解释变量 在 一元线性模型 中,就是要判断 具有显著的线性性影响。这就需要进行 变量的显著性检验。 变量的显著性检验所应用的方法是数理统计学中的 假设检验 。 计量经计学中 ,主要是针对变量的参数真值是否为零来进行显著性检验的。 1、假设检验 所谓 假设检验 , 就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设 。 假设检验采用的逻辑推理方法是反证法。 先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。 判断结果合理与否,是基于“小概率事件不易发生”这一原理的 2、变量的显著性检验 ),( 2211 )2(1112211 检验步骤: ( 1)对总体参数提出假设 1=0, 10 ( 2)以原假设 由样本计算其值 11( 3)给定显著性水平 ,查 临界值 t /2(4) 比较,判断 若 |t| t /2(则拒绝 接受 若 |t| t /2(则拒绝 接受 现在常用 么是 对于一元线性回归方程中的 0,可构造如下 )2(0022200 在上述 收入 中,首先计算 2的估计值 13402210 0 4 2 1 2 5 0 0 0/1 3 4 0 2 221 2 5 0 0 010/5 3 6 5 0 0 0 01 3 4 0 2 2220 ii 2 3000 = t (8)=明 家庭可支配收入在 95%的置信度下显著,即是消费支出的主要解释变量; |明在 95%的置信度下 , 无法拒绝截距项为零的假设 。 3、置信区间 前面,我们讨论了参数的点估计 . 它是用样本算得的一个值去估计未知参数 . 但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大 称 参数真值的区间估计 )正好弥补了点估计的这个缺陷 . 譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数 N 的极大似然估计为 1000条 . 若我们能给出一个区间,在此区间内我们合理地相信 N 的真值位于其中 . 这样对鱼数的估计就有把握多了 . 实际上, 000条,也可能小于 1000条 . 也就是说,我们希望确定一个区间,使我们能以比较高的 可靠程度 相信它包含真参数值 . 湖中鱼数的真值 这里所说的“ 可靠程度 ”是用概率来度量的 , 称为 置信度 或 置信水平 . 习惯上把置信水平记作 1 ,这里 是一个 很小的正数 . 一、 置信区间定义 满足 设 是 一个待估参数,给定 ,02, 则称区间 是 的置信水平(置信度 )为 的置信区间 . 1和 分别称为置信下限和置信上限 . 若由样本 1P 12( , , , ) X X X12( , , , ) X X X() ( , ) 找一个区间使得要估计的参数以 1 置信水平的大小是根据实际需要选定的 . 置信区间 . 称区间 为 的 1置信水平为 的 ( , ) 例如,通常可取置信水平 = 1根据一个实际样本,由给定的置信水平,我 小的区间 ,使 们求出一个尽可能 ( , ) 1P 这里有两个要求 : 可见, 对参数 作区间估计,就是要设法找出两个 只依赖于样本的界限 (构造统计量 ). 一旦有了样本,就把 估计在区间 内 . 12( , , , ) X X X12( , , , ) X X X() ( , ) 可靠度与精度是一对矛盾,一般是 在保证可靠度的条件下尽可能提高 精度 . 1. 要求 以很大的可能被包含在区间 内,就是说,概率 要尽可能大 . 即要求估计尽量可靠 . ( , ) P 2. 估计的精度要尽可能的高 . 如要求区间长度 尽可能短,或能体现该要求的其它准则 . 可见,确定区间估计很关键的是要寻找一个 待估参数 和估计量 T 的函数 U(T, ), 且 U(T, ) 的分布为已知 , 不依赖于任何未知参数 . 而这与总体分布有关,所以, 总体分布的形式是 否已知,是怎样的类型,至关重要 . 假设检验 可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多 “ 近 ” 。 要判断样本参数的估计值在多大程度上可以“ 近似 ” 地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的 “ 区间 ” ,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数检验的 置信区间估计 。 1)( 存 在 这 样 一 个 区 间 , 称之为 置 信 区 间( ; 1-称为 置信系数 ( 置信度 )( , 称为 显著性水平 ( of ; 置信区间的端点称为 置信限( 或 临界值 ( 。 一元线性模型中 , i (i=1, 2) 的置信区间 : 在变量的显著性检验中已经知道: )2( 意味着,如果给定置信度( 1-) ,从分布表中查得自由度为 (临界值,那么 t/2, t/2)的概率是 (1- )。表示为: P t t t( ) 2 21即 P ) 2 21P t s t si i ii i( ) 2 21于是得到 :(1-)的置信度下 , ( , ) i it s t si i 2 2在上述 收入 中,如果给定 =表得: 3 5 ()2( 0 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论