回归预测法.ppt_第1页
回归预测法.ppt_第2页
回归预测法.ppt_第3页
回归预测法.ppt_第4页
回归预测法.ppt_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

市场调查与预测 第九章第九章 回归预测法回归预测法 第九章 回归预测法 学习目标与要求 教学重点与难点 讲授与训练内容 单元小结 复习思考题 教学重点与难点 了解回归预测的含义;掌握一元线性回归和二元线性 回归的原理,理解其分析过程;应用线性回归预测法来解决市 场预测实践中遇到的问题;掌握回归模型的统计、计量经济检 验原理和方法。 一元线性回归和二元线性回归的原理和分析过程,回 归模型的统计检验原理和计量经济检验原理。 学习目标与要求 教学重点与难点 讲授与训练 在市场预测的定量方法中,因果分析预测法是与时间序 列预测法不同的另一类预测方法。时间序列法侧重从时间来考虑 预测对象的变化和发展,时间序列发展数学模型一般都是时间的 函数。而因果分析预测法是一类从分析事物变化的因果联系入手 ,通过统计分析和建立数学模型揭示预测目标与其他有关的经济 变量之间的数量变化关系,据此进行预测的方法,即把其相关因 素的变化看做“因”,把预测对象的变化看做“果”,建立因果之间 的数学模型,并根据相关因素的变化,推断预测对象的变动趋势 。因果分析预测法最常用的有回归分析预测法和投入产出分析预 测法。 所谓回归分析预测法,就是依据数理统计的回归分析理 论和方法,找出因变量和自变量之间的依存关系,建立起一个回 归方程用于预测的方法。 第一节 回归预测概述 一、回归预测的含义 回归(regression)一词是由生物学相关概念引申而来,它 是英国生物学家高而顿用来描述遗传变异现象的术语。1989年 他在普用回归定律一文中指出:每个人的特点和他的亲属 有相似之处,但也有一定的差异。他的朋友皮而逊后来对1078 个家庭进行了调查,发现个子高的父母比个子矮的父母趋向于 生育个子高的子女,但是从平均数来看,父母高,他们的子女 不一定像父母那样高,反之也不像父母那样矮。这种现象便称 之为回归。后来这个名词被广泛用来表示变量间的数量关系。 回归预测概述 二、回归预测的分类 在回归分析中,如果研究的因果关系涉及两个变量就叫做一 元回归分析;如果涉及两个以上的变量,则叫做多元回归分析。 如果变量之间的相关关系呈线性变化,则叫线性回归;如果变量 之间的相关关系呈非线性变化,则叫非线性回归。回归分析建立 的是预测对象与影响因素之间的单一方程,因此也被称为单方程 模型分析。 三、回归预测的一般程序 1、确立相关变量。相关变量选择的准确与否直接影响回归预 测结果的准确性。如家庭消费支出与家庭收入。 2、建立数学模型。根据已知的数据资料,找出变量之间相关 关系的类型,选择与其最为吻合的数学模型,代入已知数据并经 过数学运算,求得有关系数或参数,从而建立预测的数学模型。 回归预测概述 3、检验和评价数学模型。建立的数学模型是否正确,必 须用一套数理统计方法来加以检验,并测量其误差大小和精 确程度。如果不正确,则要重建或修正。 4、运用模型进行预测。数学模型经检验后如果正确,即 用所建的数学模型进行预测和控制。 必须指出,回归预测虽然是一种科学的定量预测方法, 但决不能把预测过程看成是简单的数学运算,特别是对经济 预测来说,必须结合定性的分析来判断和推测未来市场的变 化情况。另外,回归预测模型的适用对象必须是对象本身确 实内含某种规律性,从而用回归方程能把这种规律性表示出 来。如果研究对象无内在规律可循,那么也就无法进行回归 预测。 第二节 一元线性回归 一、一元线性回归预测方程 设一元线性回归方程为: 式中,n为样本容量;a为回归常数;b为回归系数,即回归 直线的斜率;为残差值或称随机误差项, 的平均值为零,其中 每个 的分布方差相同,它是用 估计因变量 的数值所造 成的,它是估计值与实际数值之间的离差,即 。 实际预测时,残差项 是无法预测的,其目的只是借助 得 到预测对象 的估计值,所以预测模型为: 式中, 为预测值(又称为估计值)。 一元线性回归 二、最小二乘法 用最小二乘法(又称最小平方法),选择的参数a,b要使因 变量的观察值 与预测值 之间的离差平方和最小,即: 令 , 求导可得: 为的 平均值, 为 的平均值。 例9-1:某地区人均月收入与耐用消费品销售情况如表9.1所 示,请根据人均月收入的变化来预测耐用品的销售额。 一元线性回归 表9.1 某地区人均月收入x与耐用品消费额y数据 (x的单位为百元,y的单位为10万元) t 19951.54.84.652370.14763 19961.85.75.531450.16855 19972.477.28962-0.28962 199838.39.04779-0.74779 19993.510.910.51290.38707 20003.912.411.6850.71496 20014.413.113.1502-0.05018 20024.813.614.3223-0.72229 2003515.314.90830.39165 一元线性回归 r-squared判定系数 adjusted r-squared调整的判定系数 s.e. of regression回归方程标准差 sum squared resid残差平方和 log likelihood似然函数的对数 durbin-watson stat德宾-瓦森统计量 mean dependent var被解释变量均值 s.d. dependent var 被解释变量标准差 akaike info criterion 赤池信息准则 schwarz criterion施瓦兹信息准则 f-statistic f统计量 prob(f-statistic)f统计量的概率 一元线性回归 dependent variable: y method: least squares date: 04/27/08 time: 21:28 sample: 1995 2003 included observations: 9 variablecoefficientstd. errort-statisticprob. c 0.2569470.5323530.4826620.6441 x 2.9302800.14885519.685430.0000 r-squared 0.982257 mean dependent var10.12222 adjusted r-squared 0.979722 s.d. dependent var 3.783443 s.e. of regression 0.538766 akaike info criterion1.794057 sum squared resid 2.031878 schwarz criterion 1.837885 log likelihood -6.073258 f-statistic 387.5163 durbin-watson stat 2.014755 prob(f-statistic)0.000000 一元线性回归 三、一元线性回归预测的置信区间 1、回归模型的基本假定 (1)解释变量x为非随机变量,即在重复抽样过程中,x取值 是可控的、固定的;被解释变量y为随机变量。 (2)零均值假定: ,随机误差项的平均值为零。在此 假定下才有: 回归方程才能反映总体的平均变化趋势。即 的平均值就在 给定 值的回归线上。 一元线性回归 (3)同方差假定: (常数),即各个随机误差项 的离散程度(或波动幅度)是相同的。这样结合假定2,虽 然我们无法知道随机误差项 具体取哪些值,但可以将其“ 固定”在一定范围内。 (4)非自相关假定: ,即随机误差项 之间是互不相关、互不影响的。这样可以独立考虑各个水平 下随机误差项的影响。 (5)解释变量与随机误差项不相关假定, 即解释变量与随机误差项不相关,彼此独立的对y产生影 响。在假定1成立的情况下,该假定自动成立。 (6)无多重共线性假定,即解释变量之间不存在完全的 线性关系,这样才能分析每个解释变量对y的单独影响。 一元线性回归 2、一元线性回归预测的置信区间 一元线性回归标准差的计算公式为: s为给定x值时y预测值分布的标准差; 为预测值点的自变 量值。 一元线性回归预测的置信区间为: 预测区间的大小与置信概率(置信水平)的大小为同向关系 ,概率取的越高,预测区间就越大。但是如果预测区间过宽,就 会使预测结果失去意义。 一元线性回归 例9-2:续例9-1,假设 ,求预测区间。 解: 查表可知, 根据 和预测方程,可求出 因此,预测区间为: 一元线性回归 此外,使用回归方程预测,首先得确定自变量的取值,在 某些情况下,自变量属于可控变量(如投资、税率等),可 以人为地确定,这时的模型效果比较可靠。但有的情况下, 自变量x也是未知的,同样需要预测,这样只有当x的预测值 比y的预测值容易获得并且比较准确时,单方程因果型回归预 测方法才有实际的应用意义。 第三节 多元线性回归 一、二元线性回归 如果因变量 与 和 两个自变量在统计意义上有相互关系 ,则这种关系可以体现为如下的方程式: 预测公式为: 回归系数或参数 , , 可根据最小二乘法求出。 多元线性回归 二、多元线性回归 一般地,含有m个自变量的回归方程为: 预测公式为: 同样地,回归系数或参数可由最小二乘法求出。 在自变量超过3个时,一般用矩阵形式表示,并通过 matlab软件求解参数,即: 。 多元线性回归 多元线性回归的预测区间: 多元线性回归 三、虚拟变量回归预测法 在实际的回归模型分析中,因变量不仅受诸如产量、收入、 价格等数量变量的影响,而且也受性别、文化程度、宗教、地震 以及政府经济文化政策等品质变量(无法量化的变量)的影响, 因而在建立模型时有必要引进品质变量。由于品质变量无法直接 引入回归模型,必须将其数量化,为此需要构造虚拟变量。所谓 虚拟变量是指当某种品质或属性或经济政策出现时为1,不出现 时为0的品质变量。例如: 多元线性回归 虚拟变量的引入方式 1、加法方式 例如,居民家庭的教育费用支出除了受收入水平的影响 之外,还与子女的年龄结构密切相关。如果家庭中有学龄子 女(621岁),教育费用支出就多。因此,为了反映“子女 年龄结构”这一定性因素,设置虚拟变量: 将家庭教育费用支出函数取成: 即以加法形式引入虚拟变量。该消费函数又可以表示成 以下等价形式: 多元线性回归 无学龄子女家庭的教育费用支出函数( ): 有学龄子女家庭的教育费用支出函数( ): 因此,以加法方式引入虚拟变量时,实际上反映的是定性因 素对截距的影响,即平均水平的差异情况:在相同的收入水平情 况下,有学龄子女家庭的教育费用平均要比无学龄子女家庭要多 支出 个单位。 多元线性回归 2、乘法方式 定性因素的影响不仅表现在截距上,有时可能还会影响 斜率。例如,随着收入水平的提高,家庭教育支出的边际消 费倾向可能也会发生变化。为了反映定性因素对斜率的影响 ,可以用乘法方式引入虚拟变量,将家庭教育费用支出函数 取成: 该消费函数等价于: 3、一般方式: 多元线性回归 例9-3:表9.2列出了1998年我国城镇居民人均收入与彩电每 百户拥有量的统计资料。从表中资料绘制的相关图可以看出, 前3个样本点(即低收入家庭)与后5个样本点(即中、高收入 家庭)的拥有量存在较大差异,因此,为了反映“收入层次”这 一定性因素的影响,设置虚拟变量: 将我国城镇居民的彩电需求函数设成: 多元线性回归 表9.2 我国城镇居民家庭抽样调查资料 收入等级彩电拥有量y(台/百户)人均收入x(元/年) 困难户83.642198.8800 最低收入户87.012476.7500 低收入户96.753303.1700 中等偏下户100.94107.2614107.26 中等收入户105.895118.9915118.99 中等偏上户109.646370.5916370.59 高收入户115.137877.6917877.69 最高收入户122.5410962.16110962.16 多元线性回归 在eviews5.0软件的命令窗口中依次键入以下命令: create u 8 建立工作文件 data y x 输入需求量、收入数据 scat x y 绘制相关图 data d1 输入虚拟变量的值 (由于d是eviews软件的保留字,所以将虚拟变量取名为d1 ) genr xd=x*d1 生成变量xd ls y c x d1 xd 估计需求函数 多元线性回归 图9-1:彩电拥有量与人均收入的相关图 多元线性回归 运行eviews5.0软件,得到我国城镇居民彩电需求函数的估 计结果为: 的t检验都是显著的,表明我国城镇居民低收入家庭与中 高收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差 异,各自的需求函数为: 低收入家庭: 中高收入家庭: 多元线性回归 定量分析结论:由此可以看出我国城镇居民家庭现阶段彩电消 费需求的特点:对于人均年收入在3300元以下的低收入家庭, 需求量随着收入水平的提高而快速上升,人均年收入每增加 1000元,百户拥有量将平均增加12台;对于人均年收入在4100 元以上的中高收入家庭,虽然需求量随着收入水平的提高也在增 加,但增速趋缓,人均年收入每增加1000元,百户拥有量只增 加3台。事实上,现阶段我国城镇居民中高收入家庭的彩电普及 率已达到百分之百,所以对彩电的消费需求处于更新换代阶段。 此例说明了三个问题:(1)如何在模型中引入虚拟变量;( 2)如何测量定性因素(即收入层次)的影响;(3)如何区分不 同类型的模型(即需求函数)。 第四节 回归模型的统计检验和 计量经济检验 一、简单相关检验 变量y与x之间是否存在线性相关的问题,在前面是通过散点 图用目测的方法解决的,这样既不精确也不方便。现在用相关系 数r来解决这个问题。r的计算公式为: 1、 r的取值范围为: ; 2、当 时,表示y与x“完全线性相关”,当 时 ,表示y与x“零相关”; 3、 r的绝对值越接近于1,说明y与x相关性越强。 思考题: r究竟为多大, y与x的相关关系才是显著的呢? 统计检验 答案:在经济预测中,为了保证预测精度,必须查概率与 数理统计(见黄良文统计学原理,第2版)的“相关系数临 界值表”。当 时,则称y与x之间存在显著的线性相关关系 ;反之则反。查表时, ,k为回归方程中解释变量即 自变量的个数,对于一元线性回归入程k =1。显著性水平一般取 (或0.01)。 例9-4:已知某工厂产品质量y和单位成本x之间的相关系数为 : ,样本容量 ,给定显著性水平 ,则y 与x之间存在显著的线性相关关系吗? 因样本容量 ,故样本的自由度为 查 概率与数理统计的“相关系数临界值表”得 ,故它 们之间的相关关系是显著的。 统计检验 二、复相关系数和决定系数检验 在多个变量 中,变量y的复相关(也称多元相关 )系数是指 对y相关程度的测量。(相关可分为简单 相关和复相关) (推导过程见赵卫亚编著 的计量经济学教程,p41) 记 , , 得: 决定系数 因此, 。 统计检验 1、剩余平方和越小,说明预测值越靠近观察值,即回归效果 越好(或者说模型的拟合程度越好),此时 越接近于1;如果 ,则剩余平方和为零,说明预测值与观察值完全一致。 2、决定系数不仅反映了模型拟合程度的优劣,而且有直观的 经济含义:它定量地描述了y的变化中可以用回归模型来说明的 部分,即模型的可解释程度。如我国城镇居民消费函数的 ,这意味着城镇居民消费支出的变化中,有99.68%可 以通过所估计的消费函数来解释。 统计检验 3、对于一元回归模型来说,决定系数在数值上恰好等于相关 系数的平方。但是对于多元回归模型来说,随着模型中解释变量 的增多,决定系数的值往往会增大,从而增加了模型的拟合优度 或解释功能。这就给人们一个错觉:要使模型拟合得好,就必须 增加解释变量。但是,在样本容量一定的情况下,增加解释变量 必定使得待估参数的个数增加,从而损失自由度;而且在实际应 用中,有时所增加的解释变量并非必要。因此,人们引入了修正 的决定系数: 当 时, ,这意味着随着解释变量的增加, 将越 来越小于 。 统计检验 三、f检验 决定系数检验只能说明模型对样本数据的近似情况,如果要 判定回归方程在整体上是否显著成立,即检验模型中多个解释变 量(整体)同被解释变量之间是否存在显著的线性关系,需要使 用f检验法。 f检验的步骤如下: 1、计算剩余平方和 和回归平方和 。 2、计算f统计量的值: 式中m为回归方程中自变量的个数。 3、查表检验显著性。按显著性水平 查f分布表(第一自由 度为 ,第二自由度为 ,得到临界值 ) 如果 ,则认为回归效果显著,否则,回归效果不显 著。 统计检验 模型的回归效果显著(或线性关系显著)就说明对于: 中, 不 全为零。 f检验与决定系数检验的关系: 1、当 时, ; 2、如果模型对样本有较高的拟合优度,则f检验一般都能通 过; 3、实际应用中可以不必过分苛求 的值,重要的是f检验能 否通过。 统计检验 四、t检验 如果模型通过了f检验,则表明模型中所有解释变量对被解释变量 的“总影响”是显著的,但这并不同时意味着模型中的每一个解释变量 对y都有重要影响,或者说并不是每个解释变量的单独影响都是显著的 。判定回归方程中解释变量的系数的作用是否显著,可用t检验法。 显然,对于一元回归模型, t检验等同于f检验。在多元回归中, 如果某个解释变量对因变量y的作用不显著,则该解释变量前的系数就 可视为0。但需要注意,回归系数同0的差异是否显著,不能根据系数 绝对值的大小来判断,而要根据统计假设检验的理论进行检验,因为 系数值的大小要受变量计量单位的影响。如例9-1中得到的回归方程, x前的系数是2.9303,倘若把x的单位由百元改为千元,则x前的系数就 要缩小10倍,成为0.29303,但实际上它们的作用完全是等价的。在多 元回归中,需要对各个x前的回归系数逐一进行t检验。步骤见陈殿阁 市场调查与预测教材p306。 计量经济检验 五、自相关检验 对于模型: 如果随机误差项的各期值之间存在着相关关系,即: 则称模型存在着自相关性。 (一)模型产生自相关性的主要原因: 1、模型中遗漏了重要的解释变量 例如,以年度资料建立居民消费函数 时,居民消 费y除了受收入水平x的影响之外,还受消费习惯、家庭财产等因 素的影响,这些因素的各期值之间一般是相关的,如果模型未包 含这些因素,它们对消费的影响就表现在随机误差项中,从而使 随机误差项的各期值之间呈现出相关关系。 计量经济检验 2、模型函数形式的设定误差 例如,平均成本函数应该是二次多项式模型,如果设成了直 线形式,则随机误差项是自相关的,因为误差项中包括了产值的 平方项 。 3、经济惯性 由于经济发展的连续性所形成的惯性,使得许多经济变量的 前后期之间是相互关联的。例如,本期的投资规模,往往与前一 年甚至前几年的投资相关。受消费习惯的影响,居民的本期消费 水平在很大程度上还受到上期消费水平的制约。 4、随机因素的影响 例如自然灾害、金融危机、世界经济环境的变化等随机因素 的影响,往往要持续多个时期,使得随机误差项呈现出自相关性 。 计量经济检验 (二)自相关的形式 随机误差项的自相关性可以有多种形式,其中最常见的类型 是一阶自回归形式,即随机误差项 只与它的前一期值 相关 : 其中, 是 与 的相关系数, 是满足回归模型基本假定 的随机误差项。 自相关的一般形式可以表示成: 称之为p阶自回归形式,或模型存在p阶自相关。 计量经济检验 (三)自相关的影响 1、最小二乘估计不再是有效估计 根据高斯-马尔可夫定理的证明过程(赵卫亚编著的计量经 济学教程,p30-p32 )可以看出,只有在同方差和非自相关性 的条件下,最小二乘估计才具有最小方差(即 最小)的特性 。当模型存在自相关时,最小二乘估计仍然是无偏估计 (即 ),但不再具备有效性。这与异方差时的情况一样,说明存在其 它的参数估计方法,其估计误差小于最小二乘估计的误差。也就 是说,对于存在自相关性的模型,应该改用其它方法估计模型中 的参数。 2、一般会低估最小二乘估计的标准误差 即 计算出的 偏小。 计量经济检验 3、t检验的可靠性降低 在自相关性的影响下, 的估计偏低将直接导致t统计量的 值增大,这很可能使原来不显著的t值变为显著的,即容易将不 重要的因素误认为有显著影响的变量而引入模型。 4、模型的预测区间与参数估计量的方差密切相关,系数估计 误差的不准确,将直接影响模型的预测精度。 (四)dw检验的步骤 1、计算: 2、计算dw统计量d: 计量经济检验 3、查dw分布表,得 和 。 4、比较判断(一阶自相关): 如果 , 存在正相关; 如果 ,无法判定; 如果 ,无自相关; 如果 ,无法判定; 如果 , 存在负自相关; 计量经济检验 (五)dw检验的局限性 1、如果模型模型的解释变量中含有滞后的被解释变量,例如 : 。 此时,即使模型存在自相关性, dw统计量的值也经常会接 近于2。 2、对于dw检验不能确定的范围,是应用dw统计量的障碍 。 3、 dw检验不适用于联立方程组中各方程的自相关检验。 4、 dw检验不适用于高阶自相关及其它形式(如非线性形式 等)的自相关检验。 计量经济检验 (六)自相关性的解决办法 例9-4:中国城乡居民储蓄存款模型(自相关性检验)。表 9.3列出了我国城乡居民储蓄存款年底余额(单位:亿元)和国 内生产总值指数(1978年=100)的历史统计资料,试建立居民 储蓄存款模型,并检验、消除模型的自相关性。 (1)绘制相关图,确定模型的函数形式。利用scat命令绘 制居民存款与gdp的相关图,见图9-2。图形显示两者存在着明 显的曲线相关关系,所以将居民储蓄存款模型的函数形式初步确 定为:双对数模型、指数曲线模型和二次多项式模型。 (2)利用ols法估计模型,并选择统计检验结果较好的模型 。经过比较、分析,取居民储蓄存款模型为双对数模型。 计量经济检验 表9.3 我国城乡居民储蓄存款与gdp统计资料 年份存款余额gdp指数年份存款余额gdp指数 1978210.610019895146.9271.3 1979281107.619907034.2281.7 1980399.511619919107307.6 1981523.7122.1199211545.4351.4 1982675.4133.1199314762.39398.8 1983892.5147.6199421518.8449.3 19841214.7170199529662.25496.5 19851622.6192.9199638520.84544.1 19862237.6210199746279.8592 19873073.3234.3199853407.47638.2 19883801.5260.7 计量经济检验 图9-2:居民储蓄存款与gdp指数相关图 计量经济检验 双对数模型: 在eviews5.0软件的命令窗口中键入以下命令: genr lny=log(y) genr lnx=log(x) ls lny c lnx 估计居民储蓄存款模型 指数曲线模型: ls lny c x 估计居民储蓄存款模型 二次多项式模型: 在eviews5.0软件的命令窗口中键入以下命令: genr x2=x2 ls y c x x2 估计居民储蓄存款模型 三种模型的回归方程输出分别见下面幻灯片。 计量经济检验 双对数模型: dependent variable: lny method: least squares date: 05/03/08 time: 22:17 sample: 1978 1998 included observations: 21 variablecoefficientstd. errort-statisticprob. c -8.075655 0.255649 -31.588870.0000 lnx 2.958865 0.046119 64.15673 0.0000 r-squared 0.995405 mean dependent var8.236497 adjusted r-squared0.995163 s.d. dependent var1.756767 s.e. of regression0.122176 akaike info criterion-1.276311 sum squared resid0.283614 schwarz criterion-1.176833 log likelihood15.40126 f-statistic 4116.086 durbin-watson stat0.702817 prob(f-statistic)0.000000 计量经济检验 指数曲线模型: dependent variable: lny method: least squares date: 12/10/08 time: 02:09 sample: 1978 1998 included observations: 21 variablecoefficientstd. errort-statisticprob. c 5.318171 0.224222 23.71830 0.0000 x 0.010005 0.000670 14.94246 0.0000 r-squared 0.921577 mean dependent var 8.236497 adjusted r-squared 0.917450 s.d. dependent var 1.756767 s.e. of regression 0.504746 akaike info criterion 1.560871 sum squared resid 4.840607 schwarz criterion 1.660349 log likelihood -14.38915 f-statistic 223.2770 durbin-watson stat 0.142654 prob(f-statistic) 0.000000 计量经济检验 二次多项式模型: dependent variable: y method: least squares date: 12/10/08 time: 02:17 sample: 1978 1998 included observations: 21 variablecoefficientstd. errort-statisticprob. c 2945.453 786.0611 3.747104 0.0015 x -44.56211 5.410339 -8.236473 0.0000 x2 0.196625 0.007596 25.88482 0.0000 r-squared 0.997645 mean dependent var 11996.07 adjusted r-squared0.997383 s.d. dependent var 16346.06 s.e. of regression836.1864 akaike info criterion 16.42714 sum squared resid12585738 schwarz criterion 16.57636 log likelihood-169.4850 f-statistic 3812.380 durbin-watson stat1.246316 prob(f-statistic) 0.000000 计量经济检验 (3)检验自相关性 1)残差图分析:在方程窗口中点击resides按钮,所显示 的残差图表明 呈现有规律的波动,预示着可能存在自相关性。 见图9-2。 计量经济检验 2)dw检验:因为 ,取显著性水平 时,查 表得 ,而 ,所以存在着正 自相关性。 3)偏相关系数检验:在方程窗口中点击view residual testcorrelogram-q-statistics,并输入滞后期为10 ,屏幕将显示残差 与 的各期相关系数和偏相关系数 。 图中ac表示各期的自相关系数,pac表示各期的偏自相关系 数。为了直观地反映相关系数值的大小,在图形左半部分分别绘 制了相关系数和偏相关系数的直方图,其中虚线表示 。当第 s期偏相关系数的直方块超过虚线部分时,表明偏相关系 ,即存在s阶自相关性。从该例中可以看出,我国城乡 居民储蓄存款模型存在着一阶和二阶自相关性。 计量经济检验 4)bg检验:在方程窗口中点击view residual testserial correlation lm test,并选择滞后期为2, 可得: 计量经济检验 breusch-godfrey serial correlation lm test: f-statistic 10.10323 probability0.001284 obs*r-squared 11.40489 probability0.003338 test equation: dependent variable: resid method: least squares variablecoefficient std. errort-statisticprob. c -0.019718 0.187489-0.1051690.9175 lnx 0.003548 0.033911 0.104615 0.9179 resid(-1)0.911540 0.204436 4.458813 0.0003 resid(-2)-0.6051860.210925 -2.8691960.0106 r-squared 0.543090 mean dependent var5.91e-16 adjusted r-squared0.462459 s.d. dependent var0.119083 s.e. of regression0.087308 akaike info criterion-1.869104 sum squared resid0.129586 schwarz criterion-1.670147 log likelihood23.62559 f-statistic 6.735486 durbin-watson stat1.530676 prob(f-statistic) 0.003386 计量经济检验 其中, ,临界概率 ,所以 只要取显著水平=0.0033,就可以认为辅助回归模型是显著的, 即存在着自相关性。又因为 的回归系数均显著地不为0, 表明居民存款模型存在一阶和二阶自相关性。 从本例的检验过程可以看出,利用ols估计建立回归模型之 后,一般是先根据残差图和dw值初步判断模型是否存在自相关 性,然后再利用偏相关系数检验或bg检验进一步确认自相关性 。但最后还需要通过自相关性的调整过程,消除自相关性。 计量经济检验 (4)消除自相关性 根据本例前面的检验结果,模型存在一阶和二阶自相关性, 即: 所以在ls命令中加上ar(1)和ar(2),使用迭代估计法 估计模型,键入命令: ls lny c lnx ar(1) ar(2)。 估计结果见下页。 计量经济检验 dependent variable: lny method: least squares date: 05/03/08 time: 23:39 sample (adjusted): 1980 1998 included observations: 19 after adjustments convergence achieved after 5 iterations variablecoefficientstd. errort-statisticprob. c -7.8475520.309236-25.377200.0000 lnx2.9197730.05519652.898620.0000 ar(1)0.9531220.2029734.6958100.0003 ar(2)-0.5965880.193356-3.0854340.0075 r-squared0.998181 mean dependent var8.525164 adjusted r-squared 0.997818 s.d. dependent var1.582174 s.e. of regression0.073914 akaike info criterion-2.187155 sum squared resid0.081950 schwarz criterion-1.988326 log likelihood24.77798 f-statistic2744.172 durbin-watson stat1.635397 prob(f-statistic)0.000000 计量经济检验 输出结果表明,估计过程经过5次迭代后收敛; 的估计值 分别为0.9531和-0.5966,并且t检验显著,说明原模型确实存在 着一阶和二阶自相关性。调整后模型的 , 查表得 , ,说明 模型已不存在一阶自相关性;再进行偏相关系数检验和bg检验 ,也表明不存在高阶自相关性。因此,模型已消除了自相关性的 影响,中国城乡居民储蓄存款模型应该为: 而 ols估计为: 计量经济检验 六、异方差检验 (一)异方差性及其产生的原因 对于线性回归模型 同方差假定为: 即对于不同的样本点,随机误差项的离散程度是相同的;如 果出现: 则称模型出现了异方差性(heteroskedasticity)。 注: 可以作为 的估计。 计量经济检验 模型产生异方差性主要有以下原因: 1、模型中遗漏了影响逐渐增大的因素 例如,储蓄函数中的证券投资、利息、消费者行为等因素; 成本函数中的管理水平、生产技术条件和规模效益等因素;消费 函数中的家庭财产、消费心理等因素。 2、模型函数形式的设定误差 如将指数曲线模型误设成了线性模型,则误差有增大的趋势 。 3、随机因素的影响 如政策变动、自然灾害、金融危机等。 因此,经济分析中经常会遇到异方差性的问题。经验表明, 利用横截面数据建立模型时,由于在不同样本点上其他因素(解 释变量之外的因素)影响的差异较大,所以比时间序列资料更容 易产生异方差性。 计量经济检验 (二)异方差性的影响 1、最小二乘估计虽然是无偏估计,但不再是有效估计 即存在其它的参数估计方法,其估计误差将小于ols估计的 误差。 2、无法正确估计系数的标准误差 3、 t检验的可靠性降低 4、增大模型的预测误差 异方差性的存在一方面使模型失去了良好的统计性质,另一 方面由于随机误差项的方差与模型的预测区间密切相关,在 逐渐增大的情况下,模型的预测误差也随着增大。 计量经济检验 (三)异方差性的检验 例9-8:我国制造工业利润函数。表9.4列出了1998年我国主 要制造工业销售收入与销售利润的统计资料。 1、图示检验法 注意:图示检验法只能粗略地判断模型是否存在异方差性, 当异方差性不太明显时,还需要采用一些较为精确的检验方法。 (1)相关图分析 如果随着x值的增加,y的离散程度呈现逐渐增大(或减小) 的趋势,则表明模型存在着递增型(或递减型)的异方差性。 见下图。 计量经济检验 表9.4 我国制造工业1998年销售利润与销售收入 情况 单位:亿元 行业名称销售利润销售收入行业名称销售利润销售收入 食品加工业187.253180.44医药制造业238.711264.1 食品制造业111.421119.88化学纤维制造81.57779.46 饮料制造业205.421489.89橡胶制品业77.84692.08 烟草加工业183.871328.59塑料制品业144.341345 纺织业316.793862.9非金属矿制品339.262866.14 服装制品业157.71779.1黑色金属冶炼367.473868.28 皮革羽绒制品81.71081.77有色金属冶炼144.291535.16 木材加工业35.67443.74金属制品业201.421948.12 家具制造业31.06226.78普通机械制造354.692351.68 造纸及纸制品134.41124.94专用设备制造238.161714.73 印刷业90.12499.83交通运输设备511.944011.53 文教体育用品54.4504.44电子机械制造409.833286.15 石油加工业194.452363.8电子通讯设备508.154499.19 化学原料制品502.614195.22仪器仪表设备72.46663.68 计量经济检验 从上图中可以明显看出,随着销售收入的增加,销售利润的 平均水平不断提高,其离散程度同时也在逐步扩大,即呈现出递 增型的异方差性。 计量经济检验 (2)残差分布图分析 建立回归模型之后,在方程窗口中点击resids按钮可以得到 模型的残差分布图,如果残差分布的离散程度有明显扩大的趋势 ,则表明存在着异方差性。注意观察之前(建立回归方程之前) 需要先将数据关于解释变量排序,命令为:sort x。 计量经济检验 2、white检验 在回归方程窗口中点击view residual test white heteroskedasticity,此时可以选择在辅助回归模型中 是否包含交叉乘 积项(cross terms)。本例为一元回归模型,辅助回归模型中 只有 和 两项,不存在交叉乘积项。可得: white heteroskedasticity test: f-statistic 3.607090 probability0.042040 obs*r-squared 6.270439 probability0.043490 只要取显著水平大于0.043,就可以认为利润函数存在异方差 性。 计量经济检验 3、park检验和gleiser检验 park检验的模型形式为: gleiser检验的模型形式为: 其中, 是随机误差项。如果经检验某个方程是显著的,则 表明随机误差项的方差随着解释变量取值的不同而变化,即存在 异方差性。 这两种检验的特点是:不仅能检验异方差性,而且通过“实验 ”可以探测异方差的具体形式,这有助于进一步研究如何消除异 方差性的影响。 利用eviews5.0软件进行park检验的步骤是: ls y c x genr lne2=log(resid2) 计量经济检验 genr lnx=log(x) ls lne2 c lnx 进行gleiser检验的步骤为: ls y c x genr e=abs(resid) 生成 序列 然后利用genr命令依次生成 等变量序列,再分别建立 与这些序列的回归方程。 例9-8利用park检验和gleiser检验可以得到以下结果: 计量经济检验 得:(1) (2) (3) (4) 以上四个方程表明,利润函数存在着异方差性(只要取显著 性水平 )。注意:这里的p是指解释变量的t检验值 。 计量经济检验 (四)异方差性的解决方法(wls,weighted least square) 、先用最小二乘法估计模型,估计结果为: (19.5181)(0.0084) t=(0.62) (12.37) 2、生成权数变量 根据park检验,得到: 而gleiser检验中,统计检验最为显著的是: 计量经济检验 所以,取权数变量为: 3、利用加权最小二乘法估计模型 依次键入命令: ls(w=wi) y c x 得:(1) (3.8823)(0.0099) 计量经济检验 (2) (11.1877)(0.0077) (3) (3.7798)(0.0035) (4) (1.6603)(0.0021) t = (3.11) (54.16) 计量经济检验 其中,每个方程下面第一组括号里的数字为系数的标准误差 。为了分析异方差性的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论