线性回归的定式偏差.ppt_第1页
线性回归的定式偏差.ppt_第2页
线性回归的定式偏差.ppt_第3页
线性回归的定式偏差.ppt_第4页
线性回归的定式偏差.ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1,5章线性回归的正态偏差,2,前面介绍的线性回归分析是基于模型假设的,但不一定成立。牙齿章节介绍了变量关系非线性、异常值、规则性扰动、变量缺失分析等。因此,线性回归模型的前两个假设不成立的正式偏差包括对线性回归分析的影响、判断和处理方法等。3,牙齿章节结构,1节变量关系非线性2节以上值3节规则性扰动4节解释变量缺失5节参数变化,4,1节变量关系非线性,1,问题2,发现和判断3,问题处理和非线性回归,5,1,问题,线性回归模型都假定变量关系是线性随机的,但实际变量关系中可以说,将非线性变量关系视为线性关系,或违反误差项目平均值为零的假设,对线性回归分析的有效性起着根本性的破坏作用。例如,如果

2、两个变量之间的实际关系满足=0且线性回归模型中的其他假定,则直接使用回归分析:因此:不能始终为零。、7、非线性变量关系分析为线性关系是变量关系的误识。不仅降低回归分析的拟合程度,还会导致对经济规律的错误判断和大的预测偏差,计量经济分析是一个严重的问题。8,2,由于发现和判断,随机扰动因素的影响,线性回归模型的错误设置不容易被发现。发现和判断变量关系的非线性,首先通过数学经济分析进一步分析模型的函数关系。第二是根据数据和分布图,散布图直接判断。9,更重要的方法是根据回归误差序列从技术角度发现和判断异常值问题。回归误差序列是根据所分析变量的实际值和回归理论值之间的差异计算的。在EViews软件中执

3、行回归分析时,获得回归结果后,可以直接在“回归结果”窗口中单击“视图/实际”、“fitted”、“Residual/Actual”、“Fitted”、“residual table模型存在变量关系非线性问题时,回归误差序列表示规则变化。10,例如,如果模型的回归误差序列发现图5.1所示的规则变化,则应考虑将非线性关系(二次函数等)回归到线性关系的问题。必须处理。图5.1使用非线性变量关系的残差序列、11、回归残差序列判断变量关系非线性的最大问题是,与线性回归模型中其他问题(例如参数(结构)的变化等变量关系的非线性表示非常相似,不易正确区分。因此,必须结合问题背景分析、相关理论和经验进行综合判断

4、,然后通过处理和结果的反复比较来决定。12,3,问题处理和非线性回归,错误解决的第一步是恢复变量之间的实际函数关系。然后,通过力函数、代数化等数学变换,尝试将非线性关系转换为正确的线性回归模型。如果变量关系可以通过初等数学变化转换成线性模型,那么转换后只需进行线性回归分析。13,但也有很多非线性变量关系,不能通过初等数学变换转换成线性模型。例如,Y和X之间存在两个茄子变量关系。其中,是未知参数,牙齿函数不能通过初等数学转换转换成线性模型。此时,必须直接处理非线性回归模型。非线性回归分析是线性回归分析的自然延伸。14、对于牙齿非线性回归模型,解决方法之一是使用级数展开法作为非线性函数的近似线性函

5、数,将模型强制为线性模型。、15、泰勒系列扩展首先采用参数集的初始值。然后,将上述非线性函数从该点扩展到泰勒级数,仅取其中的线性项,忽略所有父项。结果:16,其中是原始变量关系的错误项和泰勒系列扩展的父项。整理上面的扩展表达式,移动合并是,提高近似值的方法是将从以前的回归中获得的估计值扩展到新级别数,然后扩展新级别数。然后进行变换和线性回归,获得另一个参数估计值。19、牙齿程序可以重复,直到参数估计收敛或没有进一步的变化。最后得到的是非线性回归模型的参数估计。除了上述泰勒级数展开线性化近似迭代方法外,还可以直接执行非线性回归分析。但是,测量软件对非线性回归的迭代最优化分析没有这样的困难。您只需

6、直接输入相关命令。20,实例51场所消费功能,表5.1区域消费函数相关数据年度Y C年度Y C年度Y C年度Y C 1950 791.8 733.2 1962 1170.2 1069.0 1974 1896.6 1974.6 1951 819.0 748.7 1963 1207.3 1108.4 1975 19754 1961.0 1955 944 . 5 873 . 8 1967 1493 . 2 1337 . 7 1979 2212 . 6 2004 . 4 1956 989 . 4 899 . 8 1968 1551.3 1405.9 1980 2214 . 3 2000 . 4 195

7、7 1012 . 1 919 . 7 1969 1599。456.7 1981 2248.6 2024.2 1958 1028.8 932.9 1970 1688.1 1492.0 1982 2261.5 2050.7 1959 1067.2 979.4 1971 1728.4 1538.8 1983 234.6 2145.9 1960 1091.1 1091.1 图5.2根据场所收入与消费的散点图、23、上述散点图的直观判断,对消费与收益的线性回归分析基本合理。 但是,如图5.3所示,通过“回归结果”窗口中的菜单操作,进一步得到以下误差流程图,可以看到回归误差序列显示出明显的规则变化,包含明

8、显的趋势性。24,图5.3根据特定消费函数回归误差序列图表,25,根据牙齿误差序列图,可以考虑变量之间存在非线性关系的可能性,因此,可以将泰勒级数展开法作为非线性函数的近似线性函数,将模型强制为线性模型。26,2节以上值,1,2,异常值发现判断3,问题处理,27,1,问题,现实经济中经常存在这种情况。一些突发事件或变化对经济活动、经济关系产生了短暂的影响,但却是巨大的冲击。这种影响不能看作是轻微的随机扰动,但不会决定或改变长期的经济关系或经济规律。如果这种情况反映在经济数据中,就会出现偏离基本趋势的异常值。,28,如果正在研究的经济问题或相关数据中存在这种情况,如果在创建线性回归模型时不提前处

9、理或消除这种影响,模型误差项在此时显示为平均不等于零牙齿的问题。例如,变量Y和X的器官关系基本上满足了线性回归模型中的每个假设,但瞬间有突发情况,Y发生了C单位的临时波动。因此,如果使用线性回归模型:分析牙齿两个变量的关系,错误项的平均值为:,异常值会导致回归分析结果出现很大偏差,参数估计量的特性和相关统计估计都无效。30,2,发现和判断异常值的方法之一是分析经济问题的背景情况,包括经济现象、相关社会经济事件、对数据序列的直接分析等。残差序列分析也是从技术角度发现和判断异常值问题的基本方法。由于异常值只是个别情况,因此最小二乘法估计仍然是一致的估计,回归残差包含由于异常值而导致的模型误差项目的

10、平均值不等于零牙齿的信息。31,回归残差序列分析中发现和判断异常值问题的方法,如果模型假设成立,则回归残差是服从正态分布的随机变量,其值的95%左右必须分布在平均加、减、倍标准偏差范围内。如果发现残差,这里残差的标准偏差,模型很可能在视点I有异常值问题。32,以上回归误差序列分析与以下误差序列图表分析相同。根据回归误差序列和误差标准偏差,将计算的/S数据序列绘制为以I为横轴,/S为纵轴的坐标平面,然后在纵轴上绘制两条水平临界线。用误差序列的点是否在两个临界线范围之外作为判断异常值的初步标准。(大卫亚设,美国电视电视剧,错误),33,检查图5.4或更高值的残差序列图表,如果单个/S坐标位于两条临

11、界线范围外,则表示I点有异常值。当然,如果落在临界线外的多个点,可以考虑存在多个异常值的可能性,也应该怀疑另一个系统偏差。35,多个大残差被简单地视为多个异常值,需要与其他问题的分析一起进行更深入的分析。此外,上述误差序列认为理想值的阈值基准为95%置信度,如果/S的绝对值落在2 3之间,则判断为95%置信度存在异常值,如果判断为99%置信度,则判断为没有异常值,因此仍然存在模糊部分。这时必须结合问题背景分析进行考虑,考虑各点的残差相对情况等。36,3,问题处理,如果判断模型有异常问题,必须作为目标处理。例如,具有异常值问题的双变量线性回归模型。解决方法为、37、与此相比,1996年、1999

12、年、2000年、2001年4年的误差更大,而消除牙齿几年趋势后的其余年份基本上有器官趋势,所以请考虑引入4个虚拟变量。40,从引入虚拟变量后回归的下一残差序列图来看,不再认为个体点在2倍标准偏差阈值之外,而是距离阈值不远,2倍标准偏差的阈值范围也比没有引入虚拟变量的情况小得多,因此不再认为存在异常值。(大卫亚设,Northern Exposure(美国电视电视剧),Northern Exposure,41,图5.6引入虚拟变量后的回归残差,42,3节规律性扰动,1,2,问题发现和判断3,)周期性扰动的典型例子是商业销售指数的季节性变化。这些问题不会影响变量关系的整体趋势,但会对变量关系产生有规

13、律的影响,如果不提前处理或排除,错误项的平均值将出现非零牙齿的问题,可能会影响回归分析的效果。44,例如,在变量y的季度数据中,第一季度始终受季节因素的影响。如果我们忽略这种影响,用双变量模型或多元模型研究Y定律,误差恒均非0牙齿问题,45,2,问题的发现和判断,规则性扰动引起的误差恒均非0牙齿问题的发现,判断,处理,异常值问题几乎类似。在发现和判断方面,诸如经济问题的背景分析等回归残差序列分析基本上可以应用于规律性扰动问题。规则性扰动在残差序列图中用多个规则的大残差表示,通过与问题背景的相互验证和分析,可以确定是否属于规则性扰动。46,3,解决问题处理、规律性扰动问题的方法之一是对数据进行统计平稳处理,消除季节性或其他周期性扰动的影响。但是,平滑处理有两个茄子问题。一是不能区分趋势因素和季节扰动,不能真正确定所研究变量关系的具体变化轨迹,二是容易出现另一个问题。这就是误差序列自相关问题(稍后讨论)。因此,平滑不是克服规则扰动对线性回归分析影响的好方法。47,处理规则性扰动问题的更好方法是引入虚拟变量,但有时需要引入多个虚拟变量。以上述第一季度季节性因素影响的问题为例。在牙齿情况下,使用虚拟变量,48将模型更改为或Y,新模型不再有误差项平均非零牙齿的问题,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论