第三讲基本回归模型演示文稿_第1页
第三讲基本回归模型演示文稿_第2页
第三讲基本回归模型演示文稿_第3页
第三讲基本回归模型演示文稿_第4页
第三讲基本回归模型演示文稿_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲基本回归模型演示文稿1目前一页\总数六十五页\编于七点(优选)第三讲基本回归模型目前二页\总数六十五页\编于七点3创建方程对象对话框如下图:对话框分三部分:说明方程,先列因变量再列自变量,或者直接输入函数形式估计方法估计使用的样本目前三页\总数六十五页\编于七点4

有两种说明方程的基本方法:列表法:只能用于线性方程的说明;公式法:可用于非线性模型或带有参数约束模型的说明。二、方程说明目前四页\总数六十五页\编于七点51、列表法在编辑框列出方程中要使用的变量列表。例如,利用文件“3-1”数据,建立线性消费函数,用常数c和收入inc对消费cs作回归。在方程说明对话框上部输入:

cscinc其中c说明在回归中包括常数项,内部序列c不出现在工作文档中,除了说明方程外不能使用它。在上例中,常数存储于c(1),inc的系数存储于c(2),即回归方程形式为:

cs=c(1)+c(2)*inc。目前五页\总数六十五页\编于七点6以下均为常见的说明方程的方法:变量包括滞后序列:如“csccs(-1)inc”相当于建立回归方程:cs=c(1)+c(2)*cs(-1)+c(3)*inc。滞后项使用关键词to:如:“csccs(-1to-4)inc”相当于建立cs关于常数c、cs(-1)、cs(-2)、cs(-3)、cs(-4)和inc的回归方程。在变量列表中包括自动序列:如:“log(cs)clog(cs(-1))log((inc+inc(-1))/2)”相当于建立回归方程:log(cs)=c(1)+c(2)*log(cs(-1))+c(3)*log((inc+inc(-1))/2)目前六页\总数六十五页\编于七点72、公式法当列表方法满足不了要求时,可以用公式来说明方程。许多估计方法允许使用公式来说明方程。

EViews中的公式是一个包括回归变量和系数的数学表达式。要用公式说明一个方程,只需在对话框中变量列表处输入表达式即可。EViews会在方程中添加一个随机附加扰动项并用最小二乘法估计模型中的参数。

目前七页\总数六十五页\编于七点8用公式法说明方程可以使用不同的系数向量。方法为:首先要创建一个新的系数向量:选择Object/NewObject…从主菜单中选择Matrix-Vector-Coef,为系数向量输入名字,选择OK,在NewMatrix对话框中,选择CoefficientVector并说明向量的行数,带有系数向量图标的对象会列在工作文档目录中.再在方程说明中使用这个系数向量。例如,假设创造了系数向量a和b,各有一行。则可以用新的系数向量代替c:log(cs)=a(1)+b(1)*log(cs(-1))目前八页\总数六十五页\编于七点9三、方程的估计方法

在创建方程对象对话框的Method框下拉框中,会看到估计方法列表:

标准的单方程回归用最小二乘估计(LS)。其他还有TSLS(两阶段最小二乘法)、GMM(广义矩估计法),和ARCH(自回归条件异方差)等方法。目前九页\总数六十五页\编于七点10在方程说明对话框中单击OK后,显示估计结果如下图:第二节方程的结果输出具体包括以下指标:目前十页\总数六十五页\编于七点111、回归系数(Coefficient)

如果使用列表法说明方程,系数会列在变量栏中相应的自变量名下;如果是使用公式法来说明方程,EViews会列出实际系数c(1),c(2),c(3)等等。对于所考虑的简单线性模型,系数是在其他变量保持不变的情况下自变量对因变量的边际收益。系数c是回归中的常数或者截距---它是当其他所有自变量都为零时预测的基本水平。其他系数可以理解为假设所有其它变量都不变,相应的自变量和因变量之间的斜率关系。目前十一页\总数六十五页\编于七点12

例如,利用文件“3-1”数据,建立线性消费函数cst=c0+c1inct+ut(cs是城镇居民消费;inc是可支配收入)。方程中c0代表自发消费,表示收入等于零时的消费水平;而c1代表了边际消费倾向,0<c1<1,即收入每增加1元,消费将增加c1元。从分析结果可以看出边际消费倾向是0.514。也即1978年-2002年中国城镇居民可支配收入的51.4%用来消费。目前十二页\总数六十五页\编于七点132.标准差(Std.Error)

标准差项报告了系数估计的标准差。标准差衡量了系数估计的统计可信性----标准差越大,估计中的统计干扰越大。

3.t-统计量

t统计量是由系数估计值和标准差之间的比率来计算的,它是用来检验系数为零的假设的。目前十三页\总数六十五页\编于七点144.概率(P值)

这个概率称为边际显著性水平或P值。如果显著水平为5%,P值小于0.05就拒绝系数为零的原假设。对于上例结果,系数inc的零假设在1%的显著水平下被拒绝。目前十四页\总数六十五页\编于七点155、R2与调整R2

R2是衡量因变量方差能被自变量解释程度的指标。如果回归完全符合,统计值会等于1。R2的公式为:其中,是残差,是因变量的均值。

调整R2计算公式为:

目前十五页\总数六十五页\编于七点166.回归标准差

(S.E.ofregression)7.残差平方和(Sumsquaredresid)8.对数似然函数值:其数值越大,意味着模型精确

9.Meandependentvar:因变量均值

目前十六页\总数六十五页\编于七点1710.因变量标准差(S.D)

11.AIC准则(赤池信息准则AkaikeInformationCriterion)

其中:l

是对数似然值AIC值越小越好

。12.Schwarz准则(施瓦茨准则):越小越好

目前十七页\总数六十五页\编于七点1813.Hannan-QuinnCriterion(HQC)

一种模型选择标准,相对于贝叶斯信息标准(Bayesianinformationcriterion=BIC)标准的另外一种标准。

14.Durbin-Watson

统计量目前十八页\总数六十五页\编于七点19第三节方程操作

一、方程视图Representation:以三种形式显示方程:EViews命令形式、带系数符号的方程和有系数估计值的方程。目前十九页\总数六十五页\编于七点20EstimationOutput显示方程结果。Actual,Fitted,ResidualTable以表的形式显示因变量的实际值和拟合值及残差。Actual,Fitted,ResidualGraph以图的形式来显示这些值。目前二十页\总数六十五页\编于七点21ARMA

Structure用于对ARMA模型的进行结构分析GradientsandDerivatives...描述目标函数的梯度和回归函数的导数计算的信息。CovarianceMatrix以表的形式显示系数估计值的协方差矩阵。CoefficientDiagnostics,ResidualDiagnostics,andStabilityDiagnostics

,在后面的“方程的诊断检验”中再作说明。目前二十一页\总数六十五页\编于七点22二、方程过程

Specify/Estimate...编辑方程说明、改变估计方法、估计样本。Forecast...用估计方程的预测。MadeResidualSeries...以序列形式保存回归中的残差。MakeRegressorGroup创建包含方程中使用的所有变量的未命名组(常数除外)。MadeGradientGroup创建包含目标函数关于模型的系数的斜率的组。MakeDerivativeGroup创建包含回归函数关于其系数的导数的组。MakeModle创建一个与被估计方程有关的未命名模型。UpdateCoefsfromEquation把方程系数的估计值放在系数向量中。目前二十二页\总数六十五页\编于七点23非线性回归方程:下面模型都是参数线性模型,但是变量却不一定是线性的:(1)双对数线性模型(不变弹性模型)(2)半对数模型(3)双曲函数模型。。。含虚拟变量的方程第四节线性回归方程的衍生方程

目前二十三页\总数六十五页\编于七点24一、双对数线性方程

双对数线性模型估计得到的参数本身就是该变量的弹性。例如,利用“3-1”数据建立我国居民消费的收入弹性方程:

log(cst)=

0.18+0.917log(inct)t=(1.01)(45.72)

R2=0.989D.W.=0.447其中cst是城镇居民消费,inct是居民消费可支配收入。

目前二十四页\总数六十五页\编于七点25

方程中消费的收入弹性为0.917,说明我国城镇居民收入每增加1%,将使得城镇居民消费增加0.917%。目前二十五页\总数六十五页\编于七点26二、半对数模型

线性模型与对数线性模型的混合就是半对数模型或对数方程又称增长模型,通常我们用这类估计许多变量的增长率。如果x取“时间”t,即按时间顺序依次取值为1,2,…,T,变量t的系数1度量了ln(y)随时间向前推进产生的变化。如果1为正,则有随时间向上增长的趋势;如果1为负,则有随时间向下的趋势,因此t可称为趋势变量,而且

是y的平均增长率。宏观经济模型表达式中常有时间趋势,在研究经济长期增长或确定性趋势成分时,常常将产出取对数,然后用时间t作解释变量建立回归方程。目前二十六页\总数六十五页\编于七点27

例如,根据文件“3.4”提供的数据,建立半对数线性方程,估计我国实际GDP(支出法,样本区间:1978~2002年)的长期平均增长率。模型形式为其中:GDPPt表示剔出价格因素的实际GDPt

。方程中时间趋势变量的系数估计值是0.0815,说明我国实际GDP(支出法)年平均增长率为8.15%。F值或R2表明模型拟合效果很好,D.W.显示模型存在(正的)自相关。目前二十七页\总数六十五页\编于七点28三、双曲函数模型形如下式的模型称为双曲函数模型

这是一个变量之间是非线性的模型,因为Xt

是以倒数的形式进入模型的,但这个模型却是参数线性模型,因为模型中参数之间是线性的。这个模型的显著特征是随着Xt的无限增大,(1/Xt

)接近于零。

目前二十八页\总数六十五页\编于七点29利用美国1955~1984年的数据(见文件“3-5”),根据菲利普斯曲线,即通货膨胀率t

和失业率Ut的反向关系,建立双曲函数:

估计结果表明,菲利普斯曲线所描述的t

和Ut的反向关系并不存在。之所以出现这样的背离,主要是因为20世纪70年代出现石油危机,从而引发了“滞胀”,通货膨胀伴随着高失业率。如果考虑到通货膨胀预期的影响,则可以在模型中引入代表通货膨胀预期的变量,比如用通货膨胀前期值来代表。目前二十九页\总数六十五页\编于七点30含有通货膨胀预期的菲利普斯曲线估计结果为

可以看出,加入通货膨胀预期因素后,模型的拟合效果很好,而且这时的模型体现出了失业率和通货膨胀率之间的显著的反向变动关系。

目前三十页\总数六十五页\编于七点31四、含虚拟变量的回归方程例如,在文件“3-6”中,用截面数据研究男女工资有没有差别,以了解工作妇女是否受到了歧视。用到的变量有:

W—雇员的工资(美元/小时)

1;若雇员为妇女

SEX=0;其他

ED—受教育的年数

AGE—雇员的年龄

1;若雇员不是西班牙裔也不是白人

NONWH=0;其他

1;若雇员是西班牙裔

HISP=0;其他目前三十一页\总数六十五页\编于七点32

对206名雇员的样本所进行的研究得到的回归结果为(括号内是t统计量的值):(22.10)(-3.86)

R2=0.068D.W.=1.79

反映雇员性别的虚拟变量SEX在显著性水平5%下显著。妇女工资比男性平均低2.72美元。目前三十二页\总数六十五页\编于七点33

在回归模型中加入年龄AGE和受教育年数ED以及种族或民族,性别虚拟变量仍然是显著的:(-3.38)(-4.61)(8.54)(4.63)(-1.07)(0.22)R2=0.367D.W.=1.78目前三十三页\总数六十五页\编于七点34

例,文件“3.7”数据含季节虚拟变量。当使用含有季节因素的经济数据进行回归分析时,可以对数据进行季节调整消除原数据带有的季节性影响,也可以使用虚拟变量描述季节因素,进而可以同时计算出各个不同季度对经济变量的不同影响。如果用虚拟变量,这时包含了4个季度的4种分类,需要建立3个虚拟变量。用Qi表示第i个季度取值为1,其他季度取值为0的季节虚拟变量,显然Q1+Q2+Q3+Q4=1,如果模型中包含常数项,则只能加入Q1,Q2,Q3

,否则模型将因为解释变量的线性相关而无法估计,即导致虚拟变量陷阱问题。当使用月度数据时,方法与上述类似,但需要有11个虚拟变量。

目前三十四页\总数六十五页\编于七点35图社会消费品零售总额RS图GDP

通过下图中,可以看出1995年1季度~2003年1季度的季度GDP和社会消费品零售额RS存在明显的季节因素,GDP通常逐季增加,也有一些年份中第二季度高于第三季度。RS在第一季度增加,第二季度减小,第三季度略有上升,第四季度达到高峰。目前三十五页\总数六十五页\编于七点36

下面利用季度数据对我国的国民生产总值GDP和社会消费品零售额RS进行回归分析,分别考虑不包含和包含虚拟变量的情形。不包含虚拟变量的回归结果为:

t=(1.44)(9.11)R2=0.73D.W.=1.64

使用季度虚拟变量的回归方程结果为:

t=(-6.31)(12.06)(5.36)(4.97)(24.49)R2=0.96D.W.=1.83目前三十六页\总数六十五页\编于七点37

可以看出包含虚拟变量的方程明显地改进了拟合能力。图RS的实际曲线(实线)和拟合曲线(虚线)目前三十七页\总数六十五页\编于七点38

方程对象菜单的View中给出三种检验类型选择来检验方程。包括系数检验、残差检验和稳定性检验:第五节方程的诊断检验目前三十八页\总数六十五页\编于七点39一、系数检验

系数检验包括对估计系数约束条件检验、遗漏变量和冗余变量的检验。

1、Wald检验——系数约束条件检验

目前三十九页\总数六十五页\编于七点40

以生产函数为例说明,生产函数数学表达式为:

其中参数,分别是资本和劳动的产出弹性。在最初提出的C-D生产函数中,假定参数满足+=1

,也就是假定研究对象满足规模报酬不变。后来提出的C-D生产函数的改进型,取消了+=1

的假定,允许要素的产出弹性之和大于1或小于1,即承认研究对象可以是规模报酬递增的,也可以是规模报酬递减的,取决于参数的估计结果。目前四十页\总数六十五页\编于七点41

为了检验是否满足规模报酬不变的假设,现利用文件“3.8”中的美国主要金属工业企业的数据估计Cobb-Douglas生产函数:命令语句:LSlog(q)clog(l)log(k)生产函数估计结果如下:目前四十一页\总数六十五页\编于七点42为检验

+=1的规模报酬不变的假设,选择View/CoefficientDiagnostics/Wald-CoefficientRestrictions,在编辑对话框中输入约束条件。约束条件应表示为含有估计参数和常数(不可以含有序列名)的方程,系数应表示为c(1),c(2)等等,除非在估计中已使用过一个不同的系数向量。在对话框中输入下列约束:

c(2)+c(3)=1单击OK,Wald检验如下结果(原假设:约束条件成立):

目前四十二页\总数六十五页\编于七点43输出t统计量、F统计量和

2统计量及相应的P值。2统计量等于F统计量乘以检验约束条件数。本例仅有一个约束条件,所以这两个检验统计量相等。P值结果表明应该接受规模报酬不变的原假设。目前四十三页\总数六十五页\编于七点44多个约束条件的检验:例如,前面的C-D生产函数为非线性形式,估计一个如下形式的生产函数:

命令:lslog(q)clog(l)log(k)log(l)^2/2log(k)^2/2log(l)*log(k)目前四十四页\总数六十五页\编于七点45非线性模型的估计结果如下:

log(q)clog(l)log(k)log(l)^2/2log(k)^2/2log(l)*log(k)

检验约束条件:目前四十五页\总数六十五页\编于七点46在方程对话框中选择View/CoefficientDiagnostics/WaldCoefficientRestrictions。在Wald检验对话框中输入如下约束条件:c(4)=0,c(5)=0,c(6)=0(检验多个约束条件,应用逗号隔开约束条件)。结果如下:检验结果是不能拒绝原假设,表明(1)式的Cobb-Douglas生产函数是这一问题较适当的方程定义形式。目前四十六页\总数六十五页\编于七点472、遗漏变量(OmittedVariables)检验

能检验添加的变量对解释因变量变动是否有显著作用。原假设H0:添加变量不显著。

检验输出是F统计量和似然比(LR)统计量及各自P值,以及在备选假设下无约束模型估计结果。F统计量基于约束和无约束回归残差平方和之差。LR统计量由下式计算:

Lr和Lu是约束和无约束约束回归对数似然函数的最大值。在H0下,LR统计量服从渐近2分布,自由度等于约束条件数,即加入变量数。目前四十七页\总数六十五页\编于七点48

注意:

(1)遗漏变量检验要求在原始方程中和检验方程中观测值数相等。如果要加入变量的任一序列与原方程样本相比,含有缺失观测值(当加入滞后变量时这种情况常见),检验统计量将无法建立。

(2)遗漏变量检验可应用于线性LS、TSLS、ARCH、Binary、Ordered、Censored、Count模型估计方程。检验只有通过列表法列出回归因子,而不能通过公式定义方程。遗漏变量检验方法:选择View/CoefficientTests/OmittedVariables—LikelihoodRation,在打开的对话框中,列出检验统计量名,用至少一个空格相互隔开。目前四十八页\总数六十五页\编于七点49

例如,原始回归为“log(q)clog(L)log(k)”,在变量框输入“KL”,EViews将显示含有这两个附加解释变量的无约束回归结果,而且显示原假设:新添变量系数为0

的检验统计量。输出的结果如下:

对数似数比统计量就是LR检验统计量,且渐进服从于2分布,自由度等于添加回归因子数。本例中,检验结果不能拒绝原假设,即添加变量不显著。目前四十九页\总数六十五页\编于七点503、冗余(RedundantVariables)变量

冗余变量检验可以检验方程中一部分变量的统计显著性,从而确定方程中一部分变量系数是否为0,从而可以从方程中剔出去。原假设:被检验变量系数为0。

冗余变量检验可以应用于线性LS、TSLS、ARCH(仅均值方程)、Binary、Ordered、Censored、Count估计,检验只有用列表法列出回归因子形式,而不是公式定义方程情况下才可以进行。

冗余变量检验方法:选择View/CoefficientTests/RedundantVariable—likelihoodRatio,在对话框中,输入检验的变量名,相互间至少用一空格隔开。目前五十页\总数六十五页\编于七点51例如:原始回归为

lslog(Q)clog(L)log(K)KL

如果输入增加的变量K和L,EViews显示去掉这两个回归因子的约束回归结果,以及检验原假设:被检验变量系数为0

的统计量。结果如下:

检验统计量是F统计量和对数似然比。如果误差是独立正态分布随机变量,F统计量有确定有限样本F分布,分子自由度为原假设下系数约束条件数,分母自由度为总回归自由度。LR检验是渐近检验,服从2分布。

目前五十一页\总数六十五页\编于七点52二、残差检验

EViews提供了对估计方程残差的序列相关、正态性、异方差性和自回归条件异方差性检验。目前五十二页\总数六十五页\编于七点53(1)相关图和Q统计量

(2)平方残差相关图

(3)残差直方图和正态检验:显示残差直方图和残差的描述统计量,包括检验残差正态性的Jarque-Bera统计量。如果残差服从正态分布,直方图应呈钟型,J-B统计量应不显著。选择View/ResidualTests/HistogramNormality显示直方图和J-B统计量。在原假设:残差正态分布下,J-B统计量应服从2分布,自由度为2。

(4)序列相关LM检验

(5)White异方差性检验目前五十三页\总数六十五页\编于七点54三、稳定性检验

EViews提供了一些检验统计量选项,检查模型参数在不同的样本子区间是否平稳。目前五十四页\总数六十五页\编于七点551.Chow分割点检验

Chow分割点检验是把数据分为两个或多个子样本区间,对每一个子样本区间估计方程,看估计方程是否存在显著差异,例如检查石油危机前后的能源需求函数是否一样。若存在显著差异,说明存在结构变化。检验的原假设:不存在结构变化。

Chow分割点检验是通过,将整个样本回归方程的残差平方和与子区间样本回归方程的残差平方和进行差异对比来检验是否存在结构变化。检验统计量——F统计量和对数似然比(LR)统计量,F统计量基于对约束和非约束残差平方和的比较。在最简单情况下(一个分割点),计算如下:

目前五十五页\总数六十五页\编于七点56其中:是整个样本期间估计的残差平方和;是第i个子区间的残差平方和;T是观测值数;k是方程参数个数,这一公式可以扩展为多于一个分割点。目前五十六页\总数六十五页\编于七点57

Chow分割点检验的缺陷:每一个子区间要求至少和被估计参数一样多的样本数,那么这里就存在一个问题,比如说,要检验战争和和平时期的结构变化,但是战争时期的样本数较少。后面的Chow预测检验可以解决这个问题。

目前五十七页\总数六十五页\编于七点58Chow分割点检验方法:选择View/StabilityTests/ChowBreakpointTest…出现对话框以后,填入间断点的日期。例如利用文件“3-1”数据判断所建立的消费函数的稳定性。若填入间断点的日期1994,则被定义成两个子区间:一个是1978到1993,另一个是1994到2002。结果如下:

该结果表明拒绝原假设:存在结构变化。

目前五十八页\总数六十五页\编于七点59

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论