计量经济学第五章ppt课件_第1页
计量经济学第五章ppt课件_第2页
计量经济学第五章ppt课件_第3页
计量经济学第五章ppt课件_第4页
计量经济学第五章ppt课件_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

5 异方差性,Heteroskedasticity,引子:更为接近真实的结论是什么?,根据四川省2000年21个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下: 式中 表示卫生医疗机构数(个), 表示人口数量(万人)。,模型显示的结果和问题,人口数量对应参数的标准误差较小; t统计量远大于临界值,可决系数和修正的可决系 数结果较好,F检验结果明显显著; 表明该模型的估计效果不错,可以认为人口数量 每增加1万人,平均说来医疗机构将增加5.3735人。 然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。 有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?,5.1 异方差性,一、异方差的概念 二、异方差的类型 三、实际经济问题中的异方差性 四、异方差性的后果 五、异方差性的检验 六、异方差的修正 七、案例,同方差的含义,同方差性:对所有的 有: (5.1) 因为方差是度量被解释变量 的观测值围绕回归线 (5.2) 的分散程度,因此同方差性指的是所有观测值的 分散程度相同。,对于模型,如果出现,即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性(Heteroskedasticity)。,一、异方差的概念,二、异方差的类型,同方差性假定:i2 = 常数 f(Xi) 异方差时: i2 = f(Xi),异方差一般可归结为三种类型: (1)单调递增型: i2随X的增大而增大 (2)单调递减型: i2随X的增大而减小 (3)复 杂 型: i2与X的变化呈复杂形式,三、实际经济问题中的异方差性,例4.1.1:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i Yi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入,高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小 i的方差呈现单调递增型变化,例4.1,2,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数: Ci=0+1Yi+I,将居民按照收入等距离分成n组,取组平均数为样本观测值。 一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。 所以样本观测值的观测误差随着解释变量观测值的不同而不同,往往引起异方差性。,例4.1.3,以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3ei,被解释变量:产出量Y 解释变量:资本K、劳动L、技术A, 那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。 每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。,(一)模型中省略了某些重要的解释变量 假设正确的计量模型是: 假如略去 ,而采用 当被略去的 与 有呈同方向或反方向变 化的趋势时,随 的有规律变化会体现在(5.5) 式的 中。,(5.5),三、产生异方差性的原因,(二)模型的设定误差 模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。,(三)数据的测量误差 样本数据的观测误差有可能随研究范围的扩大 而增加,或随时间的推移逐步积累,也可能随 着观测技术的提高而逐步减小。 按照边错边改学习模型。如随着打字练习小时数的增加,平均打错个数和方差都会下降,(四)截面数据中总体各单位的差异 通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。,5)个别异常值的存在 6)随着选择的增多而使方差增加。(如收入和储蓄的关系) 7)模型中一个或多个回归元分布偏态,四、异方差性的后果,计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:,1、参数估计量非有效,OLS估计量仍然具有无偏性,但不具有有效性,因为在有效性证明中利用了 E()=2I,而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。,2、变量的显著性检验失去意义,变量的显著性检验中,构造了t统计量,其他检验也是如此。,3、模型的预测失效,一方面,由于上述后果,使得模型不具有良好的统计性质;,所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。,五、异方差性的检验,检验思路:,由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么: 检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。,问题在于用什么来表示随机误差项的方差,一般的处理方法:,几种异方差的检验方法:,1、图示法,(1)用X-Y的散点图进行判断 看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中),用1998年四川省各地市州农村居民家庭消费支出与家庭纯 收入的数据,绘制出消费支出对纯收入的散点图,其中用 表示农村家庭消费支出, 表示家庭纯收入。,图形举例,设一元线性回归模型为: 运用OLS法估计,得样本回归模型为: 由上两式得残差: 绘制出 对 的散点图 如果 不随 而变化,则表明不存在异方差; 如果 随 而变化,则表明存在异方差。,看是否形成一斜率为零的直线,2、戈德菲尔德-匡特(Goldfeld-Quandt)检验,G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况。,G-Q检验的思想: 先将样本一分为二,对子样和子样分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。 由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。,G-Q检验的步骤:,将n对样本观察值(Xi,Yi)按观察值Xi的大小排队 将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2,对每个子样分别进行OLS回归,并计算各自的残差平方和 提出假设:,在同方差性假定下,构造如下满足F分布的统计量,给定显著性水平,确定临界值F(v1,v2), 若F F(v1,v2), 则拒绝同方差性假设,表明存在异方差。 当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。,要求大样本 异方差的表现既可为递增型,也可为递减型 检验结果与选择数据删除的个数 的大小有关 只能判断异方差是否存在,在多个解释变量的情下,对哪一个变量引起异方差的判断存在局限。,G-Q检验的特点,3、怀特(White)检验,怀特检验不需要排序,且适合任何形式的异方差 怀特检验的基本思想与步骤(以二元为例):,然后做如下辅助回归,可以证明,在同方差假设下:,(*),R2为(*)的可决系数,h为(*)式解释变量的个数,,表示渐近服从某分布。,1.求回归估计式并计算 用OLS估计式(5.14),计算残差 ,并求残差的平方 。 2.求辅助函数 用残差平方 作为异方差 的估计,并建立 的辅助回归,即,(5.15),检验的基本步骤:,3.计算 利用求回归估计式(5.15)得到辅助回归函数的可决系数 , 为样本容量。 4.提出假设,5.检验 在零假设成立下,有 渐进服从自由度为5的 分布。给定显著性水平 ,查 分布表得临界值 ,如果 ,则拒绝原假设,表明模型中随机误差存在异方差 。,怀特(White)检验的特点,若 怀特检验程序中没有出现交互项,则是对纯粹异方差性的检验 若出现交互项,则既是对异方差性又是对设定偏误的检验 要求变量的取值为大样本 不仅能够检验异方差的存在性,同时在多变量的 情况下,还能判断出是哪一个变量引起的异方差。,注意:,辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。 如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。 当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。,(一)ARCH 过程 设ARCH 过程为 为ARCH过程的阶数,并且 为随机误差。 (二)检验的基本思想 在时间序列数据中,可认为存在的异方差性为ARCH过程, 并通过检验这一过程是否成立去判断时间序列是否存在异方 差。,四、ARCH检验,1.提出原假设 2.参数估计并计算 对原模型作OLS估计,求出残差 ,并计算 残差平方序列 ,以分别作为对 的估计。,(三)ARCH 检验的基本步骤,3.求辅助回归 (5.17) 4.检验 计算辅助回归的可决系数 与 的乘积 。在 成立时,基于大样本, 渐进服从 分布。 给定显著性水平 ,查 分布表得临界值 ,如果 ,则拒绝原假 设,表明模型中得随机误差存在异方差。,变量的样本值为大样本 数据是时间序列数据 只能判断模型中是否存在异方差,而不能诊断出哪一个变量引起的异方差。,(四)检验的特点,五、Glejser检验,(一)检验的基本思想 由OLS法得到残差,取得绝对值,然后将对某个解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。 (二)检验的特点 不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式 进行诊断。该检验要求变量的观测值为大样本。,(三)检验的步骤 1.建立模型并求 根据样本数据建立回归模型,并求残差序列 2.寻找 与 的最佳函数形式 用残差绝对值 对 进行回归,用各种函数 形式去试,寻找最佳的函数形式。,3.判断 根据选择的函数形式作 对 的回归, 作为 的替代变量,对所选函数形式回归。用回归所得到的 、 、 等信息判断,若参数 显著不为零,即认为存在异方差性。,六、异方差的修正,模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Squares, WLS)进行估计。,加权最小二乘法的基本思想: 加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。,在采用OLS方法时: 对较小的残差平方ei2赋予较大的权数, 对较大的残差平方ei2赋予较小的权数。,例如,如果对一多元模型,经检验知:,新模型中,存在,即满足同方差性,可用OLS法估计。,注意:,在实际操作中人们通常采用如下的经验方法: 不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。 如果确实存在异方差,则被有效地消除了; 如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法,White对异方差的修正,见eviews试验,谨防对异方差性的反应过度,一个好的模型,绝不会因为异方差而被抛弃 约翰.福克斯:当最大方差比最小方差的10倍还大时,异方差就成为问题。,七、案例-中国农村居民人均消费函数,例4.1.4 中国农村居民人均消费支出主要由人均纯收入来决定。 农村人均纯收入包括(1)从事农业经营的收入,(2)包括从事其他产业的经营性收入(3)工资性收入、(4)财产收入(4)转移支付收入。 考察从事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响:,普通最小二乘法的估计结果:,异方差检验,进一步的统计检验,(1)G-Q检验,将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为12的子样本。 对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:,子样本1:,(3.18) (4.13) (0.94) R2=0.7068, RSS1=0.0648,子样本2:,(0.43) (0.73) (6.53) R2=0.8339, RSS2=0.2729,计算F统计量: F= RSS2/RSS1=0.2792/0.0648=4.31,查表 给定=5%,查得临界值 F0.05(9,9)=2.97 判断 F F0.05(9,9) 否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。,(2)怀特检验,作辅助回归:,(-0.04)(0.10) (0.21) (-0.12) (1.47),(-1.11) R2 =0.4638,似乎没有哪个参数的t检验是显著的 。但 n R2 =31*0.4638=14.38 =5%下,临界值 20.05(5)=11.07,拒绝同方差性,去掉交叉项后的辅助回归结果,(1.36) (-0.64) (064) (-2.76) (2.90) R2 =0.4374,X2项与X2的平方项的参数的t检验是显著的,且 n R2 =31 0.4374=13.56,=5%下,临界值 20.05(4)=9.49 拒绝同方差的原假设,原模型的加权最小二乘回归,对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵2W的估计量; 再以1/| i|为权重进行WLS估计,得,各项统计检验指标全面改善,第五节 案例分析,一、问题的提出和模型设定 为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。 假定医疗机构数与人口数之间满足线性约束,则理论模型设定为: 其中 表示卫生医疗机构数, 表示人口数。,四川省2000年各地区医疗机构数与人口数,二、参数估计,估计结果为:,三、检验模型的异方差,(一)图形法 1. EViews软件操作 由路径:Quick/Qstimate Equation,进入 Equation Specification窗口,键入 ,点“ok”,得样本回归估计结果,见教材表5.2。,(1)生成残差平方序列。 在得到表5.2估计结果后,用生成命令生成序列,记为 。生成过程如下,先按路径:Procs/Generate Series,进入Generate Series by Equation对话框,键入下式并点“OK”即可:,生成序列图示,(2)绘制 对 的散点图。选择变量名 与 。(注意选择变量的顺序,先选的变量将在 图形中表示横轴, 后选的变量表示 纵轴),进入数 据列表,再按路 径view/ graph/ scatter,可得散 点图,见右图:,2.判断 由图可以看出,残差平方 对解释变量 的散点图主要分布在图形中的下三角部分,大致看出残差平方 随 的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。,(二)Goldfeld-Quanadt检验,1. EViews软件操作 (1)对变量取值排序(按递增或递减)。在Procs菜单里选Sort Current Page/Sort Workfile Series命令,出现排序对话框,键入 ,如果以递增型排序,选“Ascenging”,如果以递减型排序,则应选“Descending”,点ok。本例选递增型排序,这时变量 与 将以 按递增型排序。 (2)构造子样本区间,建立回归模型。在本例中,样本容量 ,删除中间1/4的观测值,即大约5个观测值,余下部分平分得两个样本区间:18和1421,它们的样本个数均是8个,即,在Sample菜单里,将区间定义为18,然后用OLS方法 求得如下结果(表1),在Sample菜单里,将区间定义为1421,再用OLS方法求得如下结果(表2),(3)求F统计量值。基于表1和表2中残差平方和的 数据,即Sum squared resid的值。由表1计算得到 的残差平方和为 ,由表2计算得到的 残差平方和为 。 根据Goldfeld-Quanadt检验,F统计量为,(4)判断 在 下,式中分子、分母的自由度均为6, 查F分布表得临界值为: 因为 ,所以拒绝原假设,表明模型确实存在异方差。,(三)White检验,由表5.2估计结果,按路径view/residual tests/white heteroskedasticity(no cross terms or cross terms),进入White检验。 根据White检验中辅助函数的构造,最后一项为变 量的交叉乘积项,因为本例为一元函数,故无交叉

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论