




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章 异方差1第一部分 背景资料1一、学习目的和要求1二、本章要点1第二部分 练习题2一、名词解释2二、简答题2三、计算题2第三部分 参考答案5一、名词解释5二、简答题6三、计算题812第八章 异方差第一部分 学习目的和要求经典线性回归模型的一个重要假设是干扰项具有相同的方差。如果该假设不满足,就可能出现异方差问题。本章主要讲述了异方差的基本理论、检验方法和校正问题。主要需要掌握并理解以下几个问题:1异方差的概念;2出现异方差的原因;3存在异方差情况下用OLS估计的后果;4异方差的检验,主要是图形检验、戈德费尔德匡特检验、帕克检验、White检验、Glejser检验和布鲁尔什培甘检验;5广义最小二乘法的概念和步骤;6用GLS对一般形式的异方差模型估计的校正。7经典线性回归模型的一个关键性的假定是干扰项都有相同的方差。如果此假定不成立,则说明有异方差。8异方差并不破坏OLS估计量的无偏性和一致性。9在异方差条件下的得到的估计量不再是最小方差或有效的,即不再是BLUE。10如果相异的误差方差已知,那么加权最小二乘法可给出BLUE估计量。11当异方差出现时,OLS估计量的方差并不由常用的OLS公式给出。如果我们一味地使用OLS公式,则以这些公式为依据的t检验和F检验可能严重误导,以致引出错误的结论。12检验异方差的方法有若干种,但在不同的情况下使用哪一种方法最有效,现在并没有结论。13即使异方差受到怀疑并已被检验出来,其校正也很困难,我们常用广义最小二乘法进行校正。第二部分 练习题一、名词解释1异方差2图形检验3戈德费尔德匡特检验4帕克检验5White检验6Glejser检验7广义最小二乘法二、简答题1异方差的存在对下面各项有何影响?(1)OLS估计量及其方差;(2)置信区间;(3)显著性t检验和F检验的使用。2产生异方差的经济背景是什么?检验异方差的方法思路是什么?3从直观上解释,当存在异方差时,加权最小二乘法(WLS)优于OLS法。4下列异方差检查方法的逻辑关系是什么?(1)图示法(2)Park检验(3)White检验5在一元线性回归函数中,假设误差方差有如下结构:如何变换模型以达到同方差的目的?我们将如何估计变换后的模型?请列出估计步骤。三、计算题1考虑如下两个回归方程(根据19461975年美国数据)(括号中给出的是标准差):(2.73)(0.0060) (0.0736)R=0.999: (2.22) (0.0068)(0.0597)R=0.875式中,C为总私人消费支出;GNP为国民生产总值;D为国防支出;t为时间。研究的目的是确定国防支出对经济中其他支出的影响。(1)将第一个方程变换为第二个方程的原因是什么?(2)如果变换的目的是为了消除或者减弱异方差,那么我们对误差项要做哪些假设?(3)如果存在异方差,是否已成功地消除异方差?请说明原因。(4)变换后的回归方程是否一定要通过原点?为什么?(5)能否将两个回归方程中的R加以比较?为什么?21964年,对9966名经济学家的调查数据如下:年龄中值工资 单位:美元/年年龄202425293034353940444549505455596064656970+中值工资7800840097001150013000148001500015000150001450012000 资料来源:“The Structure of Economists Employment and Salaries”, Committee on the National Science Foundation Report on the Economics Profession, American Economics Review, vol.55, No.4, December 1965.(1)建立适当的模型解释平均工资与年龄间的关系。为了分析的方便,假设中值工资是年龄区间中点的工资。(2)假设误差与年龄成比例,变换数据求得WLS回归方程。(3)现假设误差与年龄的平方成比例,求WLS回归方程。(4)哪一个假设更可行?3参考下表给出的R&D数据。下面的回归方程给出了对数形式的R&D费用支出和销售额的回归结果。1988年美国研究与发展(R&D)支出费用 单位:百万美元序号行业销售额R&D费用支出利润1容器与包装6375.362.5185.12非银行金融机构11626.492.91569.53服务行业14655.1178.3274.84金属与采掘业21896.2258.42828.15住房与建筑业26408.3494.7225.96一般制造业32405.61083.03751.97闲暇时间行业35107.71620.62884.18纸与林产品行业40295.4421.74645.79食品行业70761.6509.25036.410健康护理业80552.86620.113869.911宇航业95294.03918.64487.812消费品101314.11595.310278.913电器与电子产品116141.36107.58787.314化学工业122315.74454.116438.815聚合物141649.93163.89761.416办公设备与计算机175025.813210.719774.517燃料230614.51703.822626.618汽车行业293543.09528.218415.4说明:行业是按销售额递增的次序排列的。资料来源:Business Week, Special 1989 Bonus Issue, R&D Scorecard. : (1.8480)(0.16804) t: (-3.9582)(7.8687) R=0.7947(1)根据上表提供的数据,验证这个回归结果。(2)分别将残差的绝对值和残差平方值对销售额对数描图。该图是否标明存在着异方差?(3)对回归的残差进行Park检验和Glejser检验。我们能得出什么结论?(4)如果有证据表明现行回归函数 :(990.99)(0.0083) t: (0.1948)(3.8434) R=0.4783存在异方差。而在对数对数模型中没有证据表明存在异方差,那么应选择哪个模型?为什么?第三部分 参考答案一、名词解释1在经典的线性回归模型中,误差项的方差与i无关,是一个等于的常数。这就是同方差性质假定。异方差性则与此相对,即误差项的方差与i有关,并不是一个常数。一元回归模型中的异方差性质可表示为:的条件方差随解释变量取值的变化而变化。即:2图形检验是检验回归模型中是否存在异方差问题的一种检验方法。我们先假设不存在异方差性,然后对模型进行OLS估计。由于残差可以看成是误差项的一种估计,将残差对其相应的观察值描图,或是对一个或多个解释变量描图,或是对估计的的均值描图,然后再根据这样的残差图来判断是否存在异方差。3戈德费尔德匡特检验(Goldfeld-Quandt)是检验回归模型中是否存在异方差问题的一种检验方法。假设模型如下: i=1,2,n戈德费尔德匡特检验的步骤:第一步,以解释变量为纵轴,以的绝对值为横轴作出散点图。第二步,把按绝对值大小大致分为两组,参照的分组把模型观测值分为两组。用和分别表示每组的样本容量。第三步,在两组中,分别对模型运用最小二乘法,求出各自的误差项方差估计和。定义统计量:上述统计量在误差项方差一定的零假设下,服从自由度为的F分布。对于给定的显著水平,当时,拒绝零假设,即认为异方差性存在;当时,不能拒绝零假设。4帕克检验(Park Test)是检验回归模型中是否存在异方差问题的一种检验方法。如果存在异方差,那么异方差可能与一个或者多个解释变量系统相关。我们可以做对一个或者多个解释变量的回归。例如:其中,是误差项。帕克建议用来代替,则回归方程可以写为:帕克检验的步骤:第一步,用普通最小二乘法求出回归方程,不考虑异方差问题。第二步,从所求的回归方程中得到残差,并求其平方,再取对数形式。第三步,利用原始模型中的一个解释变量做回归;如果有多个解释变量,则对每个解释变量都做回归,或者做对Y的估计值的回归。若和之间的关系是统计显著的,则拒绝零假设,表明存在异方差;若不能拒绝零假设,则可以解释为同方差。5White检验(Whites General Heteroscedasticity Test)是检验回归模型中是否存在异方差问题的一种检验方法。假设模型:White检验的步骤:第一步,首先用普通最小二乘法估计回归方程,获得残差。第二步,作如下辅助回归:我们也可以加入原始变量的更高次幂。是辅助回归方程中的误差项。零假设条件下不存在异方差,方程中所有的斜率系数都为零。第三步,求辅助回归方程的R值。White证明了R值与样本容量(n)的积服从分布,其自由度等于辅助回归方程中解释变量的个数。若值超过了所选显著水平下的临界值,则拒绝零假设;若值没有超过临界值,则没有理由拒绝零假设。6Glejser检验是检验回归模型中是否存在异方差问题的一种检验方法。实质上与帕克检验很相似,不同的是从原始模型中获得残差之后,Glejser建议做的绝对值对X的回归。函数形式可以为:零假设都不存在异方差,即。若零假设被拒绝,则表明原模型的误差项可能存在异方差。7广义最小二乘法(GLS)先将原始变量转换成满足经典模型假设的转换变量,然后对它们使用OLS方法。概括地说,GLS是将不满足标准最小二乘假定的变量转换成满足OLS条件的变量,由此得到的估计量叫做GLS估计量,是BLUE。二、简答题1答:(1)OLS估计量仍然是线性的,也是无偏的。但它们不再具有最小方差性,即它们不是有效的。根据常用于OLS估计量方差的公式得到的方差通常是有偏的。如果OLS高估了估计量的真实方差,则产生正的偏差;如果OLS低估了估计量的真实方差,则会产生负的偏差。(2)(3)由于我们是在同方差的基础上讨论t分布和F分布,因此建立在它们之上的置信区间和假设检验是不可靠的。2答:产生异方差的经济背景可能有:(1)按照学习改错模型,人们在学习的过程中,其行为误差随时间的推移而减少。 在这种情况下,会减少。(2)随着收入增长,人们有更多的备用收入,从而如何支配他们的收入会有更大的选择范围。(3)随着数据采集技术的改进,可能减小。(4)异方差性还会因为异常值得出现而产生。(5)异方差的另一来源是对经典回归模型的破坏,也就是回归模型的设定不正确。有一些看来是异方差性的问题,其实是由于模型中的一些重要变量被忽略了。(6)异方差性问题在横截面数据中比在时间序列数据中更为常见。检验异方差的方法思路是:相对于不同的样本点,也就是相对于不同的解释变量观测值,若随机误差项具有不同的方差,才会继续检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性。3答:OLS法是最小化无权重或等权重的残差平方和;而WLS法是最小化一个加权残差平方和。导致的结果是:在异方差存在的情况下,用OLS法得到的估计量虽然仍是线性和无偏的,但并不是有效的;而用WLS法得到的估计量却是BLUE。4答:在异方差的检验中,图示法是最初的最直观的方法。通过残差与相应的观察值作散点图,能从图形上直观地判断是否有异方差存在的可能性。虽然方便且直观,但缺乏规范性,以及若模型中有较多的解释变量时,描图就成为一件繁琐的工作。Park检验就是在规范性上更近了一步。帕克建议用残差来代替误差项,建立残差和解释变量之间的回归模型,从系数的显著性角度来定量地判断残差与解释变量之间是否存在相关关系,从而原始模型是否存在异方差性。White检验在Park检验的基础上又有了发展,在建立残差与解释变量的回归关系时,不仅考虑了解释变量本身,还考虑了解释变量彼此间的交叉乘积,使得检验更加严谨。5答:假设一元线性回归模型为:,模型转换为:可以写成:其中,和表示转换模型的参数。经变换后,误差项有如下特点:因此,这样的变换就使得模型满足了同方差性的假定。估计的具体步骤为:第一步,对模型,i=1,2,3,n运用最小二乘法求出残差。第二步,假设为变量z的函数f(z),即。用代替对以下模型运用最小二乘法:,i=1,2,p求出估计值。第三步,得出的估计值:,i=1,2,3,n第四步,利用估计值作如下变换:,i=1,2,3,n对变换后的上述模型运用最小二乘法进行估计。三、计算题1解:(1)原因有二:第一,将被解释变量和解释变量均转换为支出与GNP的比值,表示该项支出在国民生产总值中的比重,更加强了模型对于经济现象的解释作用。第二,有可能是因为该模型中出现了异方差的现象,转换方程是想变异方差为同方差,使得估计结果是BLUE估计量。(2)误差项的期望为零,方差为,即,(3)基于(2)的假设,通过这样的转换,转换模型的误差项已具有如下特点: 这样的误差项已符合使用OLS的假定,可以说是已消除了异方差。(4)变换后的回归模型是不一定通过原点的。在本例中,变换后的模型解释变量为,被解释变量为,而这一项近似地等于零,可以忽略不计。因此,模型中还有一个正截距,不通过原点。(5)不能单纯地用R的值对两个回归方程进行比较。虽然,R值表示的是解释变量对被解释变量的解释程度的大小,R越接近1,表示模型的解释能力越强。但是,在本例中,由于原始模型中的误差项具有异方差性质,这时R值是受到怀疑的,因为有可能是异方差的存在影响了模型的R值。所以转换前后模型的R孰大孰小,并不能据此判断两个模型的解释能力孰弱孰强。2解:(1)为了分析的方便,先将原始数据处理如下:年龄22273237424752576267中值工资78008400970011500130001480015000150001500014500设一元线性回归模型为:其中,表示中值工资,表示年龄,和分别是回归系数,是误差项。(2)假设误差与年龄成比例,模型可以变换为:可以写成:其中,和分别是回归系数,是误差项。变量数据列表如下:1662.9656 1616.5808 1714.7339 1890.58842005.94352158.80192080.12571986.79851905.00191771.45690.2132 0.19250.1768 0.1644 0.1543 0.1459 0.1387 0.1325 0.1270 0.1222 4.69045.19625.65696.08286.48076.85577.21117.54987.87408.1854对变换后的模型使用OLS法进行估计,结果是:即: R=0.8333(3)假设误差与年龄的平方成比例,模型可以变换为:可以写成:其中,和分别是回归系数,是误差项。变量数据列表如下:354.5455311.1111303.125310.8108309.5238314.8936288.4615263.1579241.9355216.41790.0454550.0370370.031250.0270270.023810.0212770.0192310.0175440.0161290.014925对变换后的模型使用OLS法进行估计,结果是:即: R=0.8148(4)比较两个模型的R,一般认为,第一种假设更为可行。理论上来说,在第一种假设下,模型变换后产生了两个解释变量,即和,这样就能使得模型的解释能力增强。3 解:(1)变量数据列表如下:8.7602 9.3610 9.5925 9.9941 10.1814 10.3861 10.4662 10.6040 11.1671 4.1352 4.5315 5.1835 5.5545 6.2040 6.9875 7.3906 6.0443 6.2328 11.2967 11.4647 11.5260 11.6626 11.7144 11.8611 12.0727 12.3485 12.5898 8.7979 8.2735 7.3748 8.7173 8.4016 8.0595 9.4888 7.4406 9.1620 使用OLS法进行估计,结果是: 回归系数数值上的微小差异可能是由于计算过程中四舍五入所致,可以认为回归结果一致。(2)的估计值残差残差绝对值残差平方值8.76024.13524.2182-0.08300.08300.00699.36104.53155.0127-0.48120.48120.23159.59255.18355.3188-0.13540.13540.01839.99415.55455.8498-0.29520.29520.087210.18146.20406.09750.10640.10640.011310.38616.98756.36810.61940.619
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 森林运动会两只老虎课件
- 2025铁路监理培训考试试题库及答案
- 2025年高级卫生专业技术资格考试脑电图技术(112)(副高级)试题及答案
- 2025年无人机航拍测绘技术中级考试要点梳理与解析
- 2025年教育行业从业人员能力提升模拟题集及答案解析
- 2025年ai笔试题库大全及答案
- 桥梁护栏常识知识培训课件
- 2025年空管招聘考试高频词汇及模拟题实战演练
- 2025年电子商务运营专家面试指南中级模拟题与答案解析
- 2025年注册验船师资格考试(C级船舶检验专业能力)综合试题及答案二
- 无轨运输安全操作规程
- 妇产科学-第十二章-正常分娩课件
- 1【L】系列离心式冷水机组技术手册
- 专升本英语统考试翻译技巧课堂教学课件2
- 除颤仪的使用及护理
- Q∕SY 1753-2014 炼化循环水用缓蚀阻垢剂技术规范
- 压焊方法及设备
- 医院感染管理组织架构图
- 内科医生工作总结PPT课件
- 贯彻落实2022年新修订的《地理》科目《义务教育地理课程标准(2022年版)》新课标PPT课件
- SAP_FI__清账接口和部分清账接口_例子
评论
0/150
提交评论