金融计量学学习_第1页
金融计量学学习_第2页
金融计量学学习_第3页
金融计量学学习_第4页
金融计量学学习_第5页
已阅读5页,还剩514页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融计量学学习第1页/共519页2本章要点金融计量学的方法论与应用步骤。金融数据的特点和来源金融计量学软件的使用第2页/共519页3第一节金融计量学的含义及建模步骤

一、金融计量学的含义

金融计量学就是把计量经济学中的方法和技术应用到金融领域,即应用统计方法和统计技术解决金融问题。

第3页/共519页4二、金融计量建模的主要步骤

经济理论或金融理论

建立金融计量模型

数据收集

模型估计

模型检验不通过通过重新建立模型模型的应用第4页/共519页5第一步,把需要研究的金融问题模型化;第二步,收集样本数据;第三步,选择合适的估计方法来估计模型;第四步,对模型进行检验;第五步,对模型进行相应的应用。第5页/共519页6三、金融数据的主要类型、特点和来源1.金融数据的主要类型

时间序列数据(Timeseriesdata)是按照一定的时间间隔对某一变量在不同时间的取值进行观测得到的一组数据,例如每天的股票价格、每月的货币供应量、每季度的GDP、每年用于表示通货膨胀率的GDP平减指数等。第6页/共519页7在分析时间序列数据时,应注意以下几点:(1)在利用时间序列数据回归模型时,各变量数据的频率应该是相同的;(2)不同时间的样本点之间的可比性问题;(3)使用时间序列数据回归模型时,往往会导致模型随机误差项产生序列相关;(4)使用时间序列数据回归模型时应特别注意数据序列的平稳性问题。第7页/共519页8横截面数据(Cross-sectionaldata)是指对变量在某一时点上收集的数据的集合,例如,某一时间点上海证券交易所所有股票的收益率,2004年世界上发展中国家的外汇储备等。平行数据(Paneldata)是指多个个体同样变量的时间序列数据按照一定顺序排列得到的集合,例如30家蓝筹股过去3年每日的收盘价。第8页/共519页92.金融数据的特点与一般宏观经济数据相比,金融数据在频率、准确性、周期性等方面具有自己特有的性质:(1)金融数据可以更频繁地观察到,可用于计量分析的数据观测值个数可以成千上万,数量十分巨大;(2)金融数据一般都能在交易时准确记录下来;(3)金融数据一般也是不平稳的,但难以区分金融数据序列的随机游走、趋势以及其他的一些特征。第9页/共519页103.金融数据的主要来源政府部门和国际组织的出版物及网站专业信息数据公司,抽样调查第10页/共519页11

第二节金融计量学软件简介

一、金融计量学主要软件简介1.金融计量分析的主要任务从反映金融问题的大量数据中提取和归纳金融问题的客观规律性,进行解释和预测,为金融政策和金融实践提供依据。为此,必须合理、科学地组织管理大量的数据信息,并用计量经济学或金融计量学的方法对这些数据进行一系列复杂的数值计算处理。第11页/共519页122.分类(按操作的互动性与否分为)菜单模式,如Microfit命令行模式,如Eviews及介于二者之间的中间模式第12页/共519页133.主要计量经济学软件Eviews软件GAUSS软件LIMDEP软件Mathematica软件Matlab软件Microfit软件Minitab软件RATS软件SAS软件SHAZMA软件S-PLUS软件SPSS软件STATA软件TSP软件第13页/共519页14二、本课程所用软件-Microfit4.0和Eviews3.11.Microfit4.0使用简介以Microfit4.0版本为例。1.数据输入、修改及保存第14页/共519页15图1-2Microfit4.0主界面第15页/共519页16图1-3数据录入设定界面第16页/共519页17图1-4变量定义、修改窗口第17页/共519页18图1-5数据录入界面第18页/共519页192.命令窗口及绘图

图1-6Microfit命令窗口第19页/共519页20图1-71962~1972年辞职率和失业率线性图第20页/共519页21图1-81962~1972年辞职率和失业率散点图第21页/共519页223.一个回归分析案例

图1-9Microfit单方程回归分析窗口第22页/共519页23图1-10最小二乘估计结果及相关统计量第23页/共519页24图1-11四种假设检验的结果第24页/共519页25(二)Eviews3.1使用简介1.数据输入、修改及保存图1-12Eviews新工作文件数据设定窗口第25页/共519页26图1-13空白新工作文件第26页/共519页27(二)Eviews3.1使用简介1.数据输入、修改及保存图1-14新工作文件数据导入窗口第27页/共519页28图1-15数据导入后工作文件第28页/共519页29图1-16察看数据窗口第29页/共519页30图1-17GDP和M1线性图第30页/共519页31图1-18方程设定窗口第31页/共519页32图1-19回归结果第32页/共519页33本章小节金融计量学是金融学的一个重要分支,金融问题的数量化研究是金融计量学的目的,包括金融模型的设计、建立、估计、检验及使用模型进行预测和政策策划的系列过程。金融理论的迅速发展、金融模型的不断推出、计算机技术的日益发展和计量软件的多样化都为现代金融的数量化研究提供了有力的工具,这些条件的结合形成了金融计量分析的基础。第33页/共519页34本章简要阐述了金融计量学的方法和一般应用步骤,着重介绍了金融数据的类型和特点,简要评述了主要的计量和统计软件包,对常用的Microfit和Eviews计量软件的使用方法进行了详细讲解并举例说明。本章旨在使学生理解金融计量模型思想,了解金融数据的特点与来源,掌握常用的金融计量软件。第34页/共519页35第二章

最小二乘法(OLS)

和线性回归模型第35页/共519页36本章要点最小二乘法的基本原理和计算方法经典线性回归模型的基本假定BLUE统计量的性质t检验和置信区间检验的原理及步骤多变量模型的回归系数的F检验预测的类型及评判预测的标准好模型具有的特征第36页/共519页37第一节最小二乘法的基本属性一、有关回归的基本介绍金融、经济变量之间的关系,大体上可以分为两种:(1)函数关系:Y=f(X1,X2,….,XP),其中Y的值是由Xi(i=1,2….p)所唯一确定的。(2)相关关系:Y=f(X1,X2,….,XP),这里Y的值不能由Xi(i=1,2….p)精确的唯一确定。第37页/共519页38图2-1货币供应量和GDP散点图第38页/共519页39图2-1表示的是我国货币供应量M2(y)与经过季节调整的GDP(x)之间的关系(数据为1995年第一季度到2004年第二季度的季度数据)。第39页/共519页40但有时候我们想知道当x变化一单位时,y平均变化多少,可以看到,由于图中所有的点都相对的集中在图中直线周围,因此我们可以以这条直线大致代表x与y之间的关系。如果我们能够确定这条直线,我们就可以用直线的斜率来表示当x变化一单位时y的变化程度,由图中的点确定线的过程就是回归。

第40页/共519页41对于变量间的相关关系,我们可以根据大量的统计资料,找出它们在数量变化方面的规律(即“平均”的规律),这种统计规律所揭示的关系就是回归关系(regressiverelationship),所表示的数学方程就是回归方程(regressionequation)或回归模型(regressionmodel)。第41页/共519页42图2-1中的直线可表示为

(2.1)

根据上式,在确定α、β的情况下,给定一个x值,我们就能够得到一个确定的y值,然而根据式(2.1)得到的y值与实际的y值存在一个误差(即图2-1中点到直线的距离)。第42页/共519页43如果我们以u表示误差,则方程(2.1)变为:

即:

其中t(=1,2,3,…..,T)表示观测数。(2.2)(2.3)式(2.3)即为一个简单的双变量回归模型(因其仅具有两个变量x,y)的基本形式。第43页/共519页44其中yt被称作因变量(dependentvariable)、被解释变量(explainedvariable)、结果变量(effectvariable);xt被称作自变量(independentvariable)、解释变量(explanatoryvariable)、原因变量(causalvariable)第44页/共519页45α、β为参数(parameters),或称回归系数(regressioncoefficients);ut通常被称为随机误差项(stochasticerrorterm),或随机扰动项(randomdisturbanceterm),简称误差项,在回归模型中它是不确定的,服从随机分布(相应的,yt也是不确定的,服从随机分布)。第45页/共519页46为什么将ut

包含在模型中?(1)有些变量是观测不到的或者是无法度量的,又或者影响因变量yt的因素太多;(2)在yt的度量过程中会发生偏误,这些偏误在模型中是表示不出来的;(3)外界随机因素对yt的影响也很难模型化,比如:恐怖事件、自然灾害、设备故障等。第46页/共519页47二、参数的最小二乘估计(一)方法介绍本章所介绍的是普通最小二乘法(ordinaryleastsquares,简记OLS);最小二乘法的基本原则是:最优拟合直线应该使各点到直线的距离的和最小,也可表述为距离的平方和最小。假定根据这一原理得到的α、β估计值为、,则直线可表示为。第47页/共519页48直线上的yt值,记为,称为拟合值(fittedvalue),实际值与拟合值的差,记为,称为残差(residual),可以看作是随机误差项的估计值。

根据OLS的基本原则,使直线与各散点的距离的平方和最小,实际上是使残差平方和(residualsumofsquares,简记RSS)最小,即最小化:RSS==(2.4)

第48页/共519页49根据最小化的一阶条件,将式2.4分别对、求偏导,并令其为零,即可求得结果如下:(2.5)

(2.6)第49页/共519页50(二)一些基本概念1.总体(thepopulation)和样本(thesample)总体是指待研究变量的所有数据集合,可以是有限的,也可以是无限的;而样本是总体的一个子集。2、总体回归方程(thepopulationregressionfunction,简记PRF),样本回归方程(thesampleregressionfunction,简记SRF)。第50页/共519页51总体回归方程(PRF)表示变量之间的真实关系,有时也被称为数据生成过程(DGP),PRF中的α、β值是真实值,方程为:+

(2.7)样本回归方程(SRF)是根据所选样本估算的变量之间的关系函数,方程为:注意:SRF中没有误差项,根据这一方程得到的是总体因变量的期望值(2.8)第51页/共519页52于是方程(2.7)可以写为:(2.9)总体y值被分解为两部分:模型拟合值()和残差项()。第52页/共519页533.线性关系对线性的第一种解释是指:y是x的线性函数,比如,y=。对线性的第二种解释是指:y是参数的一个线性函数,它可以不是变量x的线性函数。比如,y=就是一个线性回归模型,但则不是。在本课程中,线性回归一词总是对指参数β为线性的一种回归(即参数只以一次方出现),对解释变量x则可以是或不是线性的。第53页/共519页54有些模型看起来不是线性回归,但经过一些基本代数变换可以转换成线性回归模型。例如,

(2.10)

可以进行如下变换:

(2.11)令、、,则方程(2.11)变为:(2.12)

可以看到,模型2.12即为一线性模型。

第54页/共519页554.估计量(estimator)和估计值(estimate)估计量是指计算系数的方程;而估计值是指估计出来的系数的数值。第55页/共519页56三、最小二乘估计量的性质和分布(一)经典线性回归模型的基本假设(1),即残差具有零均值;(2)var<∞,即残差具有常数方差,且对于所有x值是有限的;(3)cov,即残差项之间在统计意义上是相互独立的;(4)cov,即残差项与变量x无关;(5)ut~N,即残差项服从正态分布第56页/共519页57(二)最小二乘估计量的性质如果满足假设(1)-(4),由最小二乘法得到的估计量、具有一些特性,它们是最优线性无偏估计量(BestLinearUnbiasedEstimators,简记BLUE)。第57页/共519页58估计量(estimator):意味着、是包含着真实α、β值的估计量;线性(linear):意味着、与随机变量y之间是线性函数关系;无偏(unbiased):意味着平均而言,实际得到的、值与其真实值是一致的;最优(best):意味着在所有线性无偏估计量里,OLS估计量具有最小方差。第58页/共519页59(三)OLS估计量的方差、标准差和其概率分布1.OLS估计量的方差、标准差。给定假设(1)-(4),估计量的标准差计算方程如下:其中,是残差的估计标准差。(2.21)(2.22)第59页/共519页60参数估计量的标准差具有如下的性质:(1)样本容量T越大,参数估计值的标准差越小;(2)和都取决于s2。s2是残差的方差估计量。s2越大,残差的分布就越分散,这样模型的不确定性也就越大。如果s2很大,这意味着估计直线不能很好地拟合散点;第60页/共519页61(3)参数估计值的方差与成反比。其值越小,散点越集中,这样就越难准确地估计拟合直线;相反,如果越大,散点越分散,这样就可以容易地估计出拟合直线,并且可信度也大得多。比较图2-2就可以清楚地看到这点。第61页/共519页62图2-2直线拟合和散点集中度的关系第62页/共519页63(4)项只影响截距的标准差,不影响斜率的标准差。理由是:衡量的是散点与y轴的距离。越大,散点离y轴越远,就越难准确地估计出拟合直线与y轴的交点(即截距);反之,则相反。第63页/共519页642.OLS估计量的概率分布给定假设条件(5),即~,则也服从正态分布系数估计量也是服从正态分布的:(2.30)

(2.31)第64页/共519页65需要注意的是:如果残差不服从正态分布,即假设(5)不成立,但只要CLRM的其他假设条件还成立,且样本容量足够大,则通常认为系数估计量还是服从正态分布的。其标准正态分布为:

(2.32)

(2.33)第65页/共519页66但是,总体回归方程中的系数的真实标准差是得不到的,只能得到样本的系数标准差(、)。用样本的标准差去替代总体标准差会产生不确定性,并且

、将不再服从正态分布,而服从自由度为T-2的t分布,其中T为样本容量

即:~(2.34)

~

(2.35)第66页/共519页673.正态分布和t分布的关系图2-3正态分布和t分布形状比较第67页/共519页68

从图形上来看,t分布的尾比较厚,均值处的最大值小于正态分布。随着t分布自由度的增大,其对应临界值显著减小,当自由度趋向于无穷时,t分布就服从标准正态分布了。所以正态分布可以看作是t分布的一个特例。第68页/共519页69第二节一元线性回归模型的统计检验

一、拟合优度(goodnessoffitstatistics)检验

拟合优度可用R2表示:模型所要解释的是y相对于其均值的波动性,即(总平方和,thetotalsumofsquares,简记TSS),这一平方和可以分成两部分:

第69页/共519页70=+(2.36)

是被模型所解释的部分,称为回归平方和(theexplainedsumofsquares,简记ESS);是不能被模型所解释的残差平方和(RSS),即=第70页/共519页71TSS、ESS、RSS的关系以下图来表示更加直观一些:

图2-4TSS、ESS、RSS的关系第71页/共519页72拟合优度=因为TSS=ESS+RSS所以R2=(2.39)

(2.37)

(2.38)

R2越大,说明回归线拟合程度越好;R2越小,说明回归线拟合程度越差。由上可知,通过考察R2的大小,我们就能粗略地看出回归线的优劣。第72页/共519页73但是,R2作为拟合优度的一个衡量标准也存在一些问题:

(1)如果模型被重新组合,被解释变量发生了变化,那么R2也将随之改变,因此具有不同被解释变量的模型之间是无法来比较R2的大小的。第73页/共519页74

(2)增加了一个解释变量以后,R2只会增大而不会减小,除非增加的那个解释变量之前的系数为零,但在通常情况下该系数是不为零的,因此只要增加解释变量,R2就会不断的增大,这样我们就无法判断出这些解释变量是否应该包含在模型中。

(3)R2的值经常会很高,达到0.9或更高,所以我们无法判断模型之间到底孰优孰劣。第74页/共519页75为了解决上面第二个问题,我们通常用调整过的R2来代替未调整过的R2

。对R2进行调整主要是考虑到在引进一个解释变量时,会失去相应的自由度。调整过的R2用来表示,公式为:其中T为样本容量,K为自变量个数(2.40)第75页/共519页76二、假设检验假设检验的基本任务是根据样本所提供的信息,对未知总体分布某些方面的假设做出合理解释假设检验的程序是,先根据实际问题的要求提出一个论断,称为零假设(nullhypothesis)或原假设,记为H0(一般并列的有一个备择假设(alternativehypothesis),记为H1

)然后根据样本的有关信息,对H0的真伪进行判断,做出拒绝H0或不能拒绝H0的决策。第76页/共519页77假设检验的基本思想是概率性质的反证法。概率性质的反证法的根据是小概率事件原理。该原理认为“小概率事件在一次实验中几乎是不可能发生的”。在原假设H0下构造一个事件(即检验统计量),这个事件在“原假设H0是正确的”的条件下是一个小概率事件,如果该事件发生了,说明“原假设H0是正确的”是错误的,因为不应该出现的小概率事件出现了,应该拒绝原假设H0

。第77页/共519页78假设检验有两种方法:置信区间检验法(confidenceintervalapproach)和显著性检验法(testofsignificanceapproach)。显著性检验法中最常用的是t检验和F检验,前者是对单个变量系数的显著性检验,后者是对多个变量系数的联合显著性检验。第78页/共519页79(一)t检验下面我们具体介绍对方程(2.3)的系数进行t检验的主要步骤。(1)用OLS方法回归方程(2.3),得到β的估计值及其标准差。(2)假定我们建立的零假设是:,备则假设是(这是一个双侧检验)。第79页/共519页80则我们建立的统计量服从自由度为T-2的t分布。(3)选择一个显著性水平(通常是5%),我们就可以在t分布中确定拒绝区域和非拒绝区域,如图2-5。如果选择显著性水平为5%,则表明有5%的分布将落在拒绝区域第80页/共519页81

图2-5双侧检验拒绝区域和非拒绝区域分布第81页/共519页82(4)选定显著性水平后,我们就可以根据t分布表求得自由度为T-2的临界值,当检验统计值的绝对值大于临界值时,它就落在拒绝区域,因此我们拒绝的原假设,而接受备则假设。反之则相反。可以看到,t检验的基本原理是如果参数的假设值与估计值差别很大,就会导致小概率事件的发生,从而导致我们拒绝参数的假设值。第82页/共519页83(二)置信区间法仍以方程2.3的系数β为例,置信区间法的基本思想是建立围绕估计值

的一定的限制范围,推断总体参数β是否在一定的置信度下落在此区间范围内。

置信区间检验的主要步骤(所建立的零假设同t检验)。第83页/共519页84(1)用OLS法回归方程(2.3),得到β的估计值及其标准差。(2)选择一个显著性水平(通常为5%),这相当于选择95%的置信度。查t分布表,获得自由度为T-2的临界值。(3)所建立的置信区间为(,)(2.41)第84页/共519页85(4)如果零假设值落在置信区间外,我们就拒绝的原假设;反之,则不能拒绝。需要注意的是,置信区间检验都是双侧检验,尽管在理论上建立单侧检验也是可行的。第85页/共519页86

(三)t检验与置信区间检验的关系在显著性检验法下,当的绝对值小于临界值时,即:(2.42)时,我们不能拒绝原假设。对式(2.41)变形,我们可以得到:(2.43)可以看到,式(2.43)恰好是置信区间法的置信区间式(2.41),因此,实际上t检验法与置信区间法提供的结果是完全一样的。第86页/共519页87

(四)第一类错误和第二类错误如果有一个零假设在5%的显著性水平下被拒绝了,有可能这个拒绝是不正确的,这种错误被称为第一类错误,它发生的概率为5%。另外一种情况是,我们得到95%的一个置信区间,落在这个区间的零假设我们都不能拒绝,当我们接受一个零假设的时候也可能犯错误,因为回归系数的真实值可能是该区间内的另外一个值,这一错误被称为第二类错误。在选择显著性水平时人们面临抉择:降低犯第一类错误的概率就会增加犯第二类错误的概率。第87页/共519页88(五)P值P值是计量经济结果对应的精确的显著性水平。P值度量的是犯第一类错误的概率,即拒绝正确的零假设的概率。P值越大,错误地拒绝零假设的可能性就越大;p值越小,拒绝零假设时就越放心。现在许多统计软件都能计算各种统计量的p值,如Eviews、Stata等。第88页/共519页89第三节多变量线性回归模型的统计检验一、多变量模型的简单介绍考察下面这个方程:

t=1,2,3….T(2.44)对y产生影响的解释变量共有k-1(x2t,x3t…,xkt)个,系数(β1’β2’…..βk)分别衡量了解释变量对因变量y的边际影响的程度。第89页/共519页90方程(2.44)的矩阵形式为

这里:y是T×1矩阵,X是T×k矩阵,β是k×1矩阵,u是T×1矩阵(2.46)第90页/共519页91在多变量回归中残差向量为:(2.47)

残差平方和为:

(2.48)第91页/共519页92可以得到多变量回归系数的估计表达式

(2.49)同样我们可以得到多变量回归模型残差的样本方差(2.50)参数的协方差矩阵(2.51)第92页/共519页93二、拟合优度检验在多变量模型中,我们想知道解释变量一起对因变量y变动的解释程度。我们将度量这个信息的量称为多元判定系数R2。在多变量模型中,下面这个等式也成立:TSS=ESS+RSS(2.52)其中,TSS为总离差平方和;ESS为回归平方和;RSS为残差平方和。第93页/共519页94与双变量模型类似,定义如下:即,R2是回归平方和与总离差平方和的比值;与双变量模型唯一不同的是,ESS值与多个解释变量有关。R2的值在0与1之间,越接近于1,说明估计的回归直线拟合得越好。(2.53)第94页/共519页95可以证明:(2.54)因此,(2.55)第95页/共519页96三、假设检验(一)、t检验在多元回归模型中,t统计量为:……(2.56)

均服从自由度为(n-k)的t分布。下面的检验过程跟双变量线性回归模型的检验过程一样。第96页/共519页97(二)、F检验F检验的第一个用途是对所有的回归系数全为0的零假设的检验。第二个用途是用来检验有关部分回归系数的联合检验,就方法而言,两种用途是完全没有差别的,下面我们将以第二个用途为例,对F检验进行介绍。第97页/共519页98为了解联合检验是如何进行的,考虑如下多元回归模型:

(2.57)这个模型称为无约束回归模型(unrestrictedregression),因为关于回归系数没有任何限制。第98页/共519页99假设我们想检验其中q个回归系数是否同时为零,为此改写公式(2.57),将所有变量分为两组,第一组包含k-q个变量(包括常项),第二组包含q个变量:

(2.58)第99页/共519页100如果假定所有后q个系数都为零,即建立零假设:,则修正的模型将变为有约束回归模型(restrictedregression)(零系数条件):

(2.59)第100页/共519页101关于上述零假设的检验很简单。若从模型中去掉这q个变量,对有约束回归方程(2.59)进行估计的话,得到的误差平方和肯定会比相应的无约束回归方程的误差平方和大。如果零假设正确,去掉这q个变量对方程的解释能力影响不大。当然,零假设的检验依赖于限制条件的数目,即被设定为零的系数个数,以及无约束回归模型的自由度。第101页/共519页102检验的统计量为:

(2.60)在这里,分子是误差平方和的增加与零假设所隐含的参数限制条件的个数之比;分母是模型的误差平方和与无条件模型的自由度之比。如果零假设为真,式(2.60)中的统计量将服从分子自由度为q,分母自由度为N-K的F分布。第102页/共519页103对回归系数的子集的F检验与对整个回归方程的F检验做法一样。选定显著性水平,比如1%或5%,然后将检验统计量的值与F分布的临界值进行比较。如果统计量的值大于临界值,我们拒绝零假设,认为这组变量在统计上是显著的。一般的原则是,必须对两个方程分别进行估计,以便正确地运用这种F检验。第103页/共519页104F检验与R2有密切的联系。回想,则,(2.61)两个统计量具有相同的因变量,因此将上面的两个方程代入(2.60),检验的统计量可以写成:(2.62)第104页/共519页105第四节预测一、预测的概念和类型(一)预测的概念金融计量学中,所谓预测就是根据金融经济变量的过去和现在的发展规律,借助计量模型对其未来的发展趋势和状况进行描述、分析,形成科学的假设和判断。第105页/共519页106(二)预测原理条件期望(conditionalexpectations),在t期Y的t+1期的条件期望值记作,它表示的是在所有已知的t期的信息的条件下,Y在t+1期的期望值。假定在t期,我们要对因变量Y的下一期(即t+1期)值进行预测,则记作。

第106页/共519页107

在t期对Y的下一期的所有预测值中,Y的条件期望值是最优的(即具有最小方差),因此,我们有:

(2.65)第107页/共519页108(三)预测的类型:(1)无条件预测和有条件预测所谓无条件预测,是指预测模型中所有的解释变量的值都是已知的,在此条件下所进行的预测。所谓有条件预测,是指预测模型中某些解释变量的值是未知的,因此想要对被解释变量进行预测,必须首先预测解释变量的值。第108页/共519页109(2)样本内(in-sample)预测和样本外(out-of-sample)预测所谓样本内预测是指用全部观测值来估计模型,然后用估计得到的模型对其中的一部分观测值进行预测。样本外预测是指将全部观测值分为两部分,一部分用来估计模型,然后用估计得到的模型对另一部分数据进行预测。第109页/共519页110(3)事前预测和事后模拟顾名思义,事后模拟就是我们已经获得要预测的值的实际值,进行预测是为了评价预测模型的好坏。事前预测是我们在不知道因变量真实值的情况下对其的预测。第110页/共519页111(4)一步向前(one-step-ahead)预测和多步向前(multi-step-ahead)预测所谓一步向前预测,是指仅对下一期的变量值进行预测,例如在t期对t+1期的值进行预测,在t+1期对t+2期的值进行的预测等。多步向前预测则不仅是对下一期的值进行预测,也对更下期值进行预测,例如在t期对t+1期、t+2期、…t+r期的值进行预测。第111页/共519页112二、预测的评价标准1、平均预测误差平方和(meansquarederror,简记MSE)平均预测误差绝对值(meanabsoluteerror,简记MAE)。变量的MSE定义为:MSE=(2.66)其中―的预测值,―实际值,T―时段数第112页/共519页113变量的MAE定义如下:

MAE=,变量的定义同前(2.67)可以看到,MSE和MAE度量的是误差的绝对大小,只能通过与该变量平均值的比较来判断误差的大小,误差越大,说明模型的预测效果越不理想。第113页/共519页1142、Theil不相等系数其定义为:(2.68)注意,U的分子就是MSE的平方根,而分母使得U总在0与1之间。如果U=0,则对所有的t,完全拟合;如果U=1,则模型的预测能力最差。因此,Theil不等系数度量的是误差的相对大小。第114页/共519页115Theil不等系数可以分解成如下有用的形式:其中分别是序列和的平均值和标准差,是它们的相关系数,即:

(2.69)

第115页/共519页116定义不相等比例如下:(2.70)

(2.71)

(2.72)第116页/共519页117偏误比例表示系统误差,因为它度量的是模拟序列与实际序列之间的偏离程度。方差比例表示的是模型中的变量重复其实际变化程度的能力。协方差比例度量的是非系统误差,即反映的是考虑了与平均值的离差之后剩下的误差。理想的不相等比例的分布是。比例分别称为U的偏误比例,方差比例,协方差比例。它们是将模型误差按特征来源分解的有效方法()。第117页/共519页118第五节:模型选择一、“好”模型具有的特性1、节省性(parsimony)一个好的模型应在相对精确反应现实的基础上尽可能的简单。2、可识别性(identifiability)对于给定的一组数据,估计的参数要有唯一确定值。第118页/共519页1193、高拟合性(goodnessoffit)回归分析的基本思想是用模型中包含的变量来解释被解释变量的变化,因此解释能力的高低就成为衡量模型好坏的重要的标准。4、理论一致性(theoreticalconsistency)即使模型的拟合性很高,但是如果模型中某一变量系数的估计值符号与经济理论不符,那么这个模型就是失败的。第119页/共519页1205、预测能力(predictivepower)著名经济学家弗里德曼(M.Friedman)认为:“对假设(模型)的真实性唯一有效的检验就是将预测值与经验值相比较”。因此一个好的模型必须有对未来的较强的预测能力。第120页/共519页121二、用于预测的模型的选择因为R2将随着模型解释变量的增多而不断增加,按照此标准我们将不会得到最佳的预测模型。因此必须对由于解释变量增多而造成自由度丢失施加一个惩罚项,其中的一个标准就是:第121页/共519页122对自由度丢失惩罚更为严格的标准:

Akaike的信息准则(Akaikeinformationcriterion,简记为AIC)和Schwarz的信息准则(Schwarzinformationcriterion,简记为SC)

第122页/共519页123其中是方程随机误差项方差的估计值,k是解释变量的个数,T是样本容量。可以看到,AIC和SC的惩罚项、比更为严厉,而且相对来说SC标准对自由度的惩罚比AIC更为严厉。无论是AIC标准还是SC标准,从预测的角度来看,度量值越低,模型的预测会更好。第123页/共519页124本章小节

本章内容在计量经济学中是最基础也是最重要的部分。在这一章中,我们首先介绍了最小二乘法及其估计量的性质和分布。在此基础上我们对一元线性回归模型的统计检验进行了详细讨论,接着将模型扩展,讨论了多元线性回归模型。在用模型进行预测时,主要有两种情况:即有条件预测和无条件预测。最后一小节我们简单介绍了模型的选择。

第124页/共519页125第三章异方差和自相关第125页/共519页126本章要点异方差的定义、产生原因及后果异方差的检验方法异方差的修正方法自相关的产生原因忽略自相关的严重后果自相关的检验自相关的修正第126页/共519页127在前面的章节里我们已经完成了对经典正态线性回归模型的讨论。但在实际中,经典线性回归模型的基本假定经常是不能得到满足的,而若在此状况下仍应用OLS进行回归,就会产生一系列的问题,因此我们就需要采取不同的方法对基本假定不满足的情况予以处理。在本章中,我们将着重考虑假定2和假定3得不到满足,即存在异方差和自相关情况下的处理办法。

第127页/共519页128第一节异方差的介绍一、异方差的定义及产生原因异方差(heteroscedasticy)就是对同方差假设(assumptionofhomoscedasticity)的违反。经典回归中同方差是指随着样本观察点X的变化,线性模型中随机误差项的方差并不改变,保持为常数,即

i=1,2,…,n(3.1)如果的数值对不同的样本观察值各不相同,则称随机误差项具有异方差,即常数i=1,2,…n(3.2)第128页/共519页129图3-1异方差直观图

第129页/共519页130为什么会产生这种异方差性呢?一方面是因为随机误差项包括了测量误差和模型中被省略的一些因素对因变量的影响,另一方面来自不同抽样单元的因变量观察值之间可能差别很大。因此,异方差性多出现在横截面样本之中。至于时间序列,则由于因变量观察值来自不同时期的同一样本单元,通常因变量的不同观察值之间的差别不是很大,所以异方差性一般不明显。第130页/共519页131

二、异方差的后果

一旦随机误差项违反同方差假设,即具有异方差性,如果仍然用OLS进行参数估计,将会产生什么样的后果呢?结论就是,OLS估计量的线性和无偏性都不会受到影响,但不再具备最优性,即在所有线性无偏估计值中我们得出的估计值的方差并非是最小的。所以,当回归模型中随机项具有异方差性时,OLS法已不再适用。第131页/共519页132第二节异方差的检验

由于异方差的存在会导致OLS估计量的最佳性丧失,降低精确度。所以,对所取得的样本数据(尤其是横截面数据)判断是否存在异方差,是我们在进行正确回归分析之前要考虑的事情。异方差的检验主要有图示法和解析法,下面我们将介绍几种常用的检验方法。第132页/共519页133

一、图示法

图示法是检验异方差的一种直观方法,通常有下列两种思路:(一)因变量y与解释变量x的散点图:若随着x的增加,图中散点分布的区域逐渐变宽或变窄,或出现了偏离带状区域的复杂变化,则随机项可能出现了异方差。(二)残差图。残差图即残差平方(的估计值)与x的散点图,或者在有多个解释变量时可作残差与y的散点图或残差和可能与异方差有关的x的散点图。具体做法:先在同方差的假设下对原模型应用OLS法,求出和残差平方,再绘制残差图(,)。第133页/共519页134

二、解析法

检验异方差的解析方法的共同思想是,由于不同的观察值随机误差项具有不同的方差,因此检验异方差的主要问题是判断随机误差项的方差与解释变量之间的相关性,下列这些方法都是围绕这个思路,通过建立不同的模型和验判标准来检验异方差。

第134页/共519页135

(一)Goldfeld-Quandt检验法

Goldfeld-Quandt检验法是由S.M.Goldfeld和R.E.Quandt于1965年提出的。这种检验方法以F检验为基础,适用于大样本情形(n>30),并且要求满足条件:观测值的数目至少是参数的二倍;随机项没有自相关并且服从正态分布。统计假设:零假设:是同方差(i=1,2,…,n)备择假设:具有异方差第135页/共519页136Goldfeld-Quandt检验法涉及对两个最小二乘回归直线的计算,一个回归直线采用我们认为随机项方差较小的数据,另一个采用我们认为随机项方差较大的数据。如果各回归直线残差的方差大致相等,则不能拒绝同方差的原假设,但是如果残差的方差增加很多,就可能拒绝原假设。步骤为:第136页/共519页137第一步,处理观测值。将某个解释变量的观测值按由小到大的顺序排列,然后将居中的d项观测数据除去,其中d的大小可以选择,比如取样本容量的1/4。再将剩余的(n-d)个数据分为数目相等的二组。第137页/共519页138第二步,建立回归方程求残差平方和。拟合两个回归模型,第一个是关于较小x值的那部分数据,第二个是关于较大x值的那部分数据。每一个回归模型都有(n-d)/2个数据以及[(n-d)/2]-2的自由度。d必须足够小以保证有足够的自由度,从而能够对每一个回归模型进行适当的估计。对每一个回归模型,计算残差平方和:记值较小的一组子样本的残差平方和为=,值较大的一组子样本的残差平方和为=。第138页/共519页139第三步,建立统计量。用所得出的两个子样本的残差平方和构成F统计量:若零假设为真,则上式中n为样本容量(观测值总数),d为被去掉的观测值数目,k为模型中自变量的个数。第139页/共519页140第四步,得出结论。假设随机项服从正态分布(并且不存在序列相关),则统计量/将服从分子自由度和分母自由度均为()的F分布。对于给定的显著性水平,如果统计量的值大于上述F分布的临界值,我们就拒绝原假设,认为残差具有异方差性。否则,就不能拒绝原假设。第140页/共519页141(二)Spearmanrankcorrelation检验法

首先引入定义Spearman的等级检验系数:其中表示第i个单元或现象的两种不同特性所处的等级之差,而n表示带有级别的单元或现象的个数。在这里,我们假设模型为:第141页/共519页142第一步,运用OLS法对原方程进行回归,计算残差=,i=1,2…n。第二步,计算Spearman等级相关系数。将和解释变量观察值按从小到大或从大到小的顺序分成等级。等级的大小可以人为规定,一般取大小顺序中的序号。如有两个值相等,则规定这个值的等级取相继等级的算术平均值。然后,计算与的等级差,=的等级-的等级。最后根据公式计算Spearman等级相关系数。第142页/共519页143第三步,对总体等级相关系数进行显著性检验:=0,:0。样本的显著性可通过t检验按下述方法加以检验:

t=对给定的显著水平,查t分布表得的值,若>,表明样本数据异方差性显著,否则,认为不存在异方差性。对于多元回归模型,可分别计算与每个解释变量的等级相关系数,再分别进行上述检验。第143页/共519页144(三)Park检验法

Park检验法就是将残差图法公式化,提出是解释变量的某个函数,然后通过检验这个函数形式是否显著,来判定是否具有异方差性及其异方差性的函数结构。该方法的主要步骤如下:第一步,建立被解释变量y对所有解释变量x的回归方程,然后计算残差(i=1,2,…,n)第二步,取异方差结构的函数形式为=,其中,和是两个未知参数,是随机变量。写成对数形式则为:=。第144页/共519页145第三步,建立方差结构回归模型,同时用来代替,即=。对此模型运用OLS法。对进行t检验,如果不显著,则没有异方差性。否则表明存在异方差。

Park检验法的优点是不但能确定有无异方差性,而且还能给出异方差性的具体函数形式。但也有质疑,认为仍可能有异方差性,因而结果的真实性要受到影响。第145页/共519页146(四)Glejser检验法

这种方法类似于Park检验。首先从OLS回归取得残差之后,用的绝对值对被认为与密切相关的X变量作回归。有如下几种函数形式(其中是误差项):

第146页/共519页147Glejser检验方法的优点是允许在更大的范围内寻找异方差性的结构函数。缺点是难于确定的适当的幂次,这往往需要进行大量的计算。从实际方面考虑,该方法可用于大样本,而在小样本中,则仅可作为异方差摸索的一种定性技巧。第147页/共519页148(五)Breusch-Pagan检验法

该方法的基本思想是构造残差平方序列与解释变量之间的辅助函数,得到回归平方和ESS,从而判断异方差性存在的显著性。设模型为:(3.7)并且(3.8)在式(3.8)中表示是某个解释变量或全部。

第148页/共519页149提出原假设为,具体步骤如下:第一步,用OLS方法估计式(3.7)中的未知参数,得(3.9)

和(n为样本容量)(3.10)第二步,构造辅助回归函数(3.11)式中为随机误差项。第149页/共519页150第三步,用OLS方法估计式(3.11)中的未知参数,计算解释的平方和ESS,可以证明当有同方差性,且n无限增大时有

第四步,对于给定显著性水平,查分布表得,比较与,如果

>,则拒绝原假设,表明模型中存在异方差。

第150页/共519页151(六)White检验

White检验的提出避免了Breusch-Pagan检验一定要已知随机误差的方差产生的原因,并且要求随机误差服从正态分布。White检验与Breusch-Pagan检验很相似,但它不需要关于异方差的任何先验知识,只要求在大样本的情况下。下面是White检验的基本步骤:设二元线性回归模型为(3.12)第151页/共519页152异方差与解释变量的一般线性关系为

第一步,用OLS法估计式3.3的参数。第二步,计算残差序列和。第三步,求对,,,,的线性回归估计式,即构造辅助回归函数。第四步,计算统计量,其中n为样本容量,为辅助回归函数中的决定系数。第152页/共519页153第五步,在的原假设下,服从自由度为5的分布,给定显著性水平,查分布表得临界值,比较与,如果前者大于后者,则拒绝原假设,表明式(3.12)中随机误差存在异方差。此外,由于金融问题研究中经常需要处理时间序列数据,当存在异方差性的时候,可考虑用ARCH方法检验。检验异方差的方法多种多样,可以根据所研究问题的需要加以选择,也可以同时选择不同的方法,对检验结果进行分析比较,以求得出更准确的结论。第153页/共519页154第三节异方差的修正

异方差性虽然不损坏OLS估计量的无偏性和一致性,但却使它们不再是有效的,甚至不是渐近(即在大样本中)有效的。参数的显著性检验失效,降低了预测精度。故而直接运用普通最小二乘法进行估计不再是恰当的,需要采取相应的修正补救办法以克服异方差的不利影响。其基本思路是变异方差为同方差,或者尽量缓解方差变异的程度。在这里,我们将会遇到的情形分为两种:当误差项方差为已知和当为未知。第154页/共519页155

一、当为已知:加权最小二乘法

(weightedleastsquares,WLS

在同方差的假定下,对不同的,偏离均值的程度相同,取相同权数的做法是合理的。但在异方差情况下,则是显而易见的错误,因为的方差在不同的上是不同的。比如在递增异方差中,对应于较大的x值的估计值的偏差就比较大,残差所反映的信息应打折扣;而对于较小的x值,偏差较小,应给予重视。第155页/共519页156所以在这里我们的办法就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。第156页/共519页157可以考虑用作为的权数。于是加权最小二乘法可以表述成使加权残差平方和达到最小。第157页/共519页158

二、当为未知

已知真实的可以用WLS得到BLUE估计量。但现实中多数情况下是未知的,所以还要考虑别的方法来消除异方差。一般来讲,可以将异方差的表现分为这样几种类别。我们以为模型。

(一)正比于:可对原方程做如下变换:

第158页/共519页159(二)正比于:就可将原始的模型进行入下变换(三)正比于Y均值的平方:将原模型进行如下变换:第159页/共519页160在上述变换中,都可以看到对的形式采取的是一种猜测的态度,即我们也不能肯定采取哪种变换更有效。同时这些变换可能还有其他的一些问题:1.当解释变量多于1个时,也许先验上不知道应选择哪一个X去进行变换;2.当无法直接得知而要从前面讨论的一个或多个变换中做出估计时,所有用到t检验F检验等的检验程序,都只有在大样本中有效。3.谬误相关的问题。第160页/共519页161

三、模型对数变换法

仍以模型为例,变量和分别用和代替,则对模型

进行估计,通常可以降低异方差性的影响。原因?第161页/共519页162第四节金融实例分析[例3-1]纽约股票交易所(NYSE)与美国证券交易委员会(SEC)关于经济佣金率放松管制的争论,其中异方差的检验与修正在证明规模效应存在与否起着重要的作用。第162页/共519页163下面通过一个具体金融案例来讨论异方差的检验与修正过程:根据北京市1978-1998年人均储蓄与人均收入的数据资料,若假定X为人均收入(元),Y为人均储蓄(元),分析人均储蓄受人均收入的线性影响,可建立一元线性回归模型进行分析。设模型为第163页/共519页164图3-3Eviews回归结果1用OLS估计法估计参数第164页/共519页165图3-4残差图(1)图示法第165页/共519页166

(2)Goldfeld-Quandt检验按前述检验方法,对1978~1985与1991~1998年时间段的数据进行OLS方法检验,求出F统计量,查表得是否存在异方差第166页/共519页167(3)ARCH检验

图3-5ARCH检验结果第167页/共519页168异方差的修正:WLS法图3-6WLS估计结果第168页/共519页169对数变换法

图3-7对数变换估计结果第169页/共519页170第五节自相关的概念和产生原因

为了能更好地说明自相关问题,我们以一个金融案例来开始本章余下三节的学习,并将在下面反复用到这个例子。例:利率的变化我们将用工业生产指数(IP),货币供应量增长率(GM2),以及通胀率(GPW)的函数来解释国债利率R的变化。第170页/共519页171R=3个月期美国国债利率。为年利率的某一百分比IP=联邦储备委员会的工业生产指数(1987=100)M2=名义货币供给、以十亿美元为单位PW=所有商品的生产价格指数(1982=100)

第171页/共519页172用于回归模型的货币与价格变量是:回归方程是:(括号中为t统计量)

(2.84)(8.89)(3.91)(6.15)

=0.22DW=0.18S=2.458Mean=6.07第172页/共519页173

一、滞后值与自相关的概念

在阐释自相关概念之前,先介绍滞后值的概念。一个变量的滞后值是这个变量在一段时间前的取值。举个例子:滞后一期的取值,记为。y的一阶差分,记为,是用y的当期值减去前一期的值:,以此类推,可以得到滞后二期,滞后三期值。第173页/共519页174

表3-1当期值、滞后值、差分的关系

1990.10.8————1990.21.30.80.51990.3-0.91.3-2.21990.40.2-0.91.11990.5-1.70.2-1.9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论