自回归过程模型.doc_第1页
自回归过程模型.doc_第2页
自回归过程模型.doc_第3页
自回归过程模型.doc_第4页
自回归过程模型.doc_第5页
免费预览已结束,剩余20页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自回归移动平均(ARMA)模型及其应用中文摘要本文主要介绍自回归移动平均(ARMA)模型的基本思想,基本理论以及一般模型,文中用ARMA模型对1995至2005年全国钢铁综合价格进行时间序列分析,用EViews软件检验模型个可行性,并进行预测应用。结果表明,基于ARMA模型的中国钢铁价格的模拟值和真实值比较吻合。关键词:时间序列 自回归移动平均模型 钢铁综合价格 预测 AbstractThis paper mainly introduces the basic philosophy, the basic theory and the general model of ARMA model. By ARMA model, this paper analyses the comprehensive price of steel from 1995 to 2005 in China and verifies the model is practical by EViews.The results show that the forecast simulation value of comprehensive price of steel is closed to the real value. In application of ARMA model has an important role in decision-making for merchants.Key words:Time-series ,ARMA model,Blend price of steel,Forecast目 录中文摘要1Abstract2目 录31.理论部分41.1计量经济学的基本概念41.2计量经济学建模过程41.2.1模型的设定41.2.2样本数据的收集51.2.3模型参数的估计51.2.4模型的检验52.自回归移动平均模型的基本原理62.1回归分析的概念62.2一元线形回归模型62.2.1随机误差项的假定条件72.2.2最小二乘法72.3多元线性回归模型92.3.1多元线性回归模型的基本概念92.3.2模型的假定102.4时间序列模型112.4.1时间序列的定义112.4.2时间序列模型的分类112.4.2.1自回归过程112.4.2.2移动平均过程122.4.2.3自回归移动平均过程132.4.2.4差分142.4.2.5ARMA过程的自相关函数142.4.2.6 ARMA过程的偏相关函数152.4.3 ARMA模型的建立与预测162.4.3.1 ARMA模型的建立162.4.3.2 ARMA模型的预测163.模型的应用183.1背景资料183.2数据来源183.3数据的拟合与讨论184.总结23参考文献241.理论部分1.1计量经济学的基本概念 计量经济学的概念:计量经济学是统计学、经济学、数学相结合的一门综合性学科,是一门从数量上研究物质资料生产、交换、分配、消费等经济关系和经济活动规律及其应用的科学;计量经济学本质上是属于经济学的范畴,经济学定量研究中离不开数学、统计学和经济理论这三个方面,但单独一方面都不应与计量经济学相混淆。数学、统计学和经济理论这三者的结合才构成了计量经济学。其核心任务是研究建立、估计和检验经济模型的方法计量经济学自从20世纪30年代形成以来,发展很快,已在经济学科中占有很重要的地位,在经济领域得到了广泛的应用。尤其是计算机的飞速发展,使计量经济学的发展和应用进入了一个新的阶段。人们不仅在微观经济领域,而且在宏观经济领域,建立了大量计量经济模型并用于预测,解决了实际经济问题。不可否认,计量经济学模型应用的重点从80年代起就逐步转向了检验经济理论和宏观经济政策假设,转向了结构分析、政策模拟和政策评价,并由此成为计量经济模型应用的主流方向。1.2计量经济学建模过程 计量经济学模型分析本身的结构不会很复杂,但其所涉及到的具体计算过程也许会复杂些,这就要对模型分析者运用计算机和操作专用软件的能力以及数值计算的能力提出了一定的要求。计量经济模型分析的全部过程可以从以下四个方面说明:1.2.1模型的设定理论模型的建立主要依据有关生产、消费、投资、国际贸易与国际收支、金融市场、工资与价格、就业与通货膨胀等经济行为理论。如果模型是单个方程,则首先要确定被解释变量和所有可能的解释变量,然后再确定被解释变量和所有可能的解释变量之间的函数关系,最后确定被解释变量和所有可能的解释符合经济意义的系数符号和系数大小范围。如果模型是由多个方程构成的经济系统,则首先要确定内生变量和外生变量,然后再确定各个方程内生变量和外生变量之间的函数关系,最后确定各个方程内生变量和外生变量符合经济意义的系数符号和系数大小范围。 例如,研究某地区消费需求函数,根据消费需求行为的经济假说,居民的消费支出(C)直接依赖其可支配收入(Y)、金融资产的存量(M)、消费水平的刚性C和价格水平P(-1)于是该地区消费需求函数的形式为:对于该函数中变量系数的符号,我们这样来确定:可支配收入、金融资产的存量的多少直接决定消费支出的多少,它们呈同向变动,而人们的消费习惯形成后也很难改变,这就是消费水平的刚性,因此这三个变量的系数符号为正;而价格水平的提高无疑会抑制消费支出的增加,所以价格水平系数符号为负;我们还应该注意影响消费支出的其他微小因素,诸如消费者心理与偏好,人们对未来的预期等,所以我们最后加上了一个随机干扰项,这正是计量经济学模型与数理经济学模型的根本差别。前者研究的是经济变量的不确定性关系,后者研究的是经济变量之间的确定性关系。提出这种差别并从理论上加以解决的著名学者就是挪威经济学教授、1989年诺贝尔经济学奖获得者哈维尔莫。1.2.2样本数据的收集样本数据的收集是计量经济建模的基础。时间序列数据适合短、中长期弹性的估计。收集样本数据首先要注意有研究目的的选择样本数据,当以预测为目的时,所选择的样本数据要保证参数估计的最小方差和给定的预测精度;其次要注意样本数据的质量,样本数据要具备完整性、准确性、可比性和一致性。1.2.3模型参数的估计在获得经济样本数据,确定了实际模型以后,接下来就要进行模型参数的估计,它是计量经济学的核心问题,其中要涉及到各种经典统计学方法和现代统计学方法的选择问题。1.2.4模型的检验模型建立后能否解释人们所研究的经济现象的本质特征或所研究的经济活动中各因素之间的关系,必须通过各种检验加以确定。计量经济建模需要通过四个方面的检验:1) 经济意义的检验,就是观察模型参数估计值的正、负符号与数值大小是否符合先前理论模型和实际模型设定时的预期。2) 统计检验,就是观察模型参数估计值的可信程度,通常人们必须进行模型的拟合优度检验、解释变量参数的显著性检验和模型的显著新检验等。只有通过这些检验的计量经济模型才能实施应用与分析。3) 计量经济学检验,由计量经济学理论确定的准则给出的,主要包括随机干扰项的序列相关检验、异方差性检验和解析变量的多重共线性检验等。模型一旦检验存在序列相关、异方差性或多重共线性,则必须通过各种统计和数据处理方法加以消除,否则会导致计量经济模型在应用和分析中产生失真。4) 模型的预测检验,主要是检验参数估计值的稳定性和测定样本数据变化时的敏感性,从而确定所建立的模型是适合内插,还是适合外推,或者两种功能兼之。2.自回归移动平均模型的基本原理2.1回归分析的概念回归分析是处理变量与变量之间关系的一种数学方法。经济变量之间的关系一般分两类:一类是变量间存在确定的关系。例如某企业的销售收入Yi等于产品价格P与销售量的乘积,表示为:另一类是非确定的依赖关系,例如某企业资金的投入与产出,一般来讲,资金投入越多,产出也相应提高,但由于生产过程中各种条件的变化,使得不同时间内同样的资金投入会有不同的产出,这种不确定性,因而不能给出类似于函数的精确表达式。用表示其它影响因素,将这两个变量之间的关系表示成:2.2一元线形回归模型为了说明一元线形回归模型,举一个某商品需求函数的例子。为了研究某市每年鲜蛋的需求量,首先考察消费者年人均可支配收入对年人均鲜蛋的需求量的影响,由经济理论知,人均可支配收入提高时,鲜蛋的需求量也相应地增加。但鲜蛋需求量还受到其自身价格、人们的消费习惯及其它一些随机因素的影响。为了表示鲜蛋需求量与消费者可支配收入之间非确定的依赖关系,我们将影响鲜蛋需求量的其它因素并到随机变量中,建立这两变量之间的数学模型: (1)其中:某市居民人均鲜蛋需求量,称作被解释变量; 某市居民人均可支配收入,称作解释变量; 随机误差项(随机扰动项或随机项、误差项); 称为回归系数(待定系数或待定参数)。在数学模型(1)中,当发生变化时,按照一定的规律影响另一变量,而的变化并不影响。亦即的变化是变化的原因,与之间具有因果关系。(1)称为回归模型,因只有一个解析变量,变量间的关系又是线性关系,故(1)称为一元线性回归模型。2.2.1随机误差项的假定条件线性回归模型是以某些假定条件为依据德。在一元线性回归模型中,这些假定条件主要设计随机扰动项u的分布以及u与解析变量X之间的关系。有了这些假定条件,就可以用普通最小二乘法估计回归模型的参数。 (2)(2)式表示在已知的条件下,随机误差项可以取不同的值,如果考虑所有可能的值,它们的期望值等于零。于是Yi的期望值为(3)式表示,每个对应得随机误差项具有相同的常数方差,称为同方差性。与有相同的方差,即上式表示,任意两个和所对应的随机误差项和是不相关的,称为随机误差项无序列关。上式表示,解释变量X是确定变量,与随机项不相关,此假定保证解释变量X是非随机变量。 服从正态分布,由(1)、(2)知,。2.2.2最小二乘法 给定一元线性回归模型该式两边取期望值可得到总体回归方程(总体回归线)。假如从总体中得到X,Y所有可能的数值才能求出的值,这实际上是不可能的。我们只能用抽样的方法取得X,Y的样本观测值,用样本回归线去推断总体回归线。假如给出了样本观测值(,),i=1,2,n,n称为样本容量。则可建立样本回归模型 (4)显然并不等于,因它们是由一组样本建立的样本回归模型的回归系数。称分别为的估计值或估计量。也不等于,称为残差项(拟合误差),是的估计值。 称为样本回归方程。叫做样本观测值的估计值。样本观测值与估计值的残差为为了研究总体回归模型中变量X于Y之间的线性关系,需要求一拟合直线。一条好的的拟合直线应该是使残差平方和达到最小,依此为准则,确定X于Y之间的线性关系。这就是著名的“普通最小二乘法”(Ordinary Least Squares),也叫最小二乘法,简称OLS。下面用最小二乘法求总体回归系数的估计值。即令 (5)(为了方便,以下均将记为)根据微积分学多元函数极值原理,要使Q()达到最小,(5)式对的一阶偏导数都等于零,即由于所以即求得的表达式分别为2.3多元线性回归模型在实际的经济问题中,一个经济变量往往受多个因素的影响。例如,商品的需求量不但要受商品本身的价格的影响,而且还要受到消费者偏好、收入水平、其他相关商品价格等诸多因素的影响。在分析这类经济问题时,仅用一元线性回归模型已远远满足不了我们的要求,因此需要引入含有两个或两个以上解释变量的多元线性回归模型。多元线性回归模型的基本原理和基本方法与一元线性回归模型完全类似,只是在计算上复杂得多。2.3.1多元线性回归模型的基本概念假设被解释变量Y是解释变量和随机误差项的线性函数,它们可以表示为如下形式 (6)称(6)式为多元总体线性回归模型。设,i=1,2n是对总体的n次独立样本观测值,将他们代入(6)式,得 ,i=1,2,n (7)该式是样本数据结构形式的多元总体线性回归模型,它是由n个方程、k+1个未知参数组成的一个线性方程组,即这个模型相应的矩阵表达形式是其中 , , 这里:Y被解释变量样本观测值的n1阶列向量; X解释变量样本观测值的n(k+1)阶矩阵, 未知参数的(k+1)1阶列向量; U随机误差项的n1阶列向量。由于参数都是未知的,我们可以利用样本观测值对它们进行估计。,假设计算得到的样本统计量为,它们是相应的未知参数的估计值,于是得到了与(7)式相应的估计的回归方程 (8)称(8)式为多元样本线性回归方程;称为的样本回归值或样本拟合值。2.3.2模型的假定多元线性回归模型的基本假定与一元线性回归模型的那些假定相似E()=0,i=1,2,n即随机误差项是一个期望为零的随机变量。对于解释变量的所有观测值,随机误差项有相同的方差,即i=1、2n2.4时间序列模型时间序列分析方法是伯克斯(Box)和詹金斯(Jenkins)于1976年提出的。目前这种方法已广泛应用于自然科学和社会科学的各个领域,特别是经济领域。这种建模方法的特点是不考虑其他解释变量的作用,而是依据变量本身的变化规律,利用外推机制描述时间序列的变化。当时间序列非平稳时,首先要通过差分使序列平稳后再建立时间序列模型。2.4.1时间序列的定义随机过程:随时间由随机变量组成的一个有序序列称为随机过程。用x,tT表示。简记为。时间序列:随机过程的一次观测结果称为时间序列。也用表示。白噪声过程:对于一个随机过程,如果(t+k)T,k0,则称为白噪声过程。白噪声是平稳的随机过程,其均值为零,方差为固定值。随机变量之间非相关。2.4.2时间序列模型的分类时间序列模型一般可以分为四种类型。它们是自回归过程(AR)、移动平均过程(MA)、自回归移动平均过程(ARMA)和单整自回归移动平均过程(ARIMA)。在介绍时间序列模型之前,首先给出滞后算子的符号并介绍一种最基本的随机过程。用L表示一阶滞后算子,定义则k阶滞后算子定义为2.4.2.1自回归过程如果一个线性随机过程可表示为 (9)其中 i=1,2,p是回归参数,是白噪声过程,则这个线性过程称为P阶自回归过程,用AR(p)表示。用滞后算子可以表示为 (10)其中=称为自回归算子或自回归特征多项式。与自回归模型常联系在一起的是平稳性问题。对于自回归过程AR(p),如果特征方程=0的所有根的绝对值都大于1,则该过程是一个平稳的过程。对于一般的自回归过程AR(p),特征多项式可以分解为= =其中是特征方程=0的根。由(10)式,可表达为其中是待定系数。具有平稳性的条件是必须收敛,即应有,=1,2,p。而是特征方程的根,所以保证AR(p)过程具有平稳性的条件是特征方程的全部根必须在单位圆(半径为1)之外,即。保证AR(p)过程平稳的一个必要但不充分条件是p个自回归系数之和要小于1。即2.4.2.2移动平均过程如果一个线性随机过程可用下式表达其中,是回归参数,是白噪声过程,则称这个线性随机过程为q阶移动平均过程,记为MA(q)。上式用滞后算子可写为或其中,称为移动平均算子或移动平均特征多项式。由定义知任何一个q阶移动平均都是由q+1个白噪声变量的加权和组成的,所以任何一个有限阶移动平均过程都是平稳的过程。与移动平均过程相联系的一个重要概念是可逆性。移动平均过程具有可逆性的条件是特征方程=0的全部根的绝对值必须大于1。由式,有。由于可表示为所以可见,保证MA(q)过程可以转换成一个无限阶自回归过程,即MA(q)具有可逆性的条件是收敛。即必须有,j=1,2,q成立。而是特征方程的根,所以MA(q)过程具有可逆性的条件是特征方程的根必须在单位圆之外。2.4.2.3自回归移动平均过程由自回归和移动平均两部分共同构造的随机过程称为自回归移动平均过程,记为ARMA(p,q),其中p,q分别表示自回归和移动平均分量的最大滞后阶数。ARMA(p,q)的一般表达式是或其中和分别表示关于L的p,q阶特征多项式,分别称为自回归算子和移动平均算子。ARMA(p,q)过程的平稳性只依赖于其自回归部分,即=0的全部根取值在单位圆之外(绝对值大于1)。其可逆性则依赖于移动平均部分,即的根应在单位圆之外。以ARMA(1,1)为例或 很明显,只有当和时,上述模型才是平稳的、可逆的。2.4.2.4差分用变量 的当期值减去其滞后值从而得到新序列的方法称为差分。若减数为滞后一期则称为一阶差分,若减数为滞后k期变量则称为k阶差分。2.4.2.5ARMA过程的自相关函数以上介绍了随机过程的几种模型。实际中单凭对时间序列的观察很难确定其属于哪一种模型,而自相关函数和偏相关函数是分析随机过程和识别模型类别的有力工具。对于平稳的随机过程,其期望为常数。这里用表示,即,1,2平稳随机过程的方差也是一个常量,即用来度量随机过程中变量取值对其均值离散程度。相隔k期的两个随机变量与的协方差,即滞后k期的自协方差,定义为自协方差序列称为随机过程的自协方差函数,其中K一般为有限值。当k=0时退化为方差。自协方差是有量纲的,它的测量单位与变量的测量单位有关。为了消除量纲,给出更方便的自相关系数定义 (11)是无量纲的。 因为对于一个平稳过程,有所以(11)可以改写为由于,上式可以表示为当k0时,有(自相关系数为1)。以滞后期k为变量的自相关系数列,k0,1,K称为自相关函数,其中K为有限值。对于ARMA(1,1)过程,自相关函数从开始指数衰减。的大小取决于和。的符号取决于()。若1,指数衰减是平滑的,或正或负。若T+1,预测式是,t=T+2,T+3,其中是相应上一步的预测结果。3.模型的应用3.1背景资料近年来,随着国家对基础产业的政策倾斜性扶持,国内钢铁需求量激增,钢铁价格也随之攀升,特别是2004年以来,由于煤矿瓦斯保等特大事故频频发生,国家强制性关闭中小煤矿,作为钢铁产业的原料的煤的价格也随之上涨,钢铁价格升企业是在所难免的。国家出台了一系列的政策来压制钢铁价格的不合理上涨,从而能使钢铁价格在一个合理的和市场可用接受的范围波动,不至于造成市场混乱。本文试图通过对10年中国每月历史数据的分析、拟合、并进行短期预测,从而为正确判断未来价格趋势,制定相应策略来应对变化,对国家来说可以及时调整相关的钢铁政策,进一步对价格进行宏观调控;对企业来说,可以及时调整来达到自己利益的最大化。3.2数据来源自从1985年国家主持编制中国钢铁工业年鉴以来,年鉴的编制一直持续下来,未曾中断。但是直到1988年,国家才对工业产品的价格进行市场化试点,经历两年之后国家工业产品的价格才逐步放开,并且逐步融入到市场中,1992年工业产品价格的市场化才初步步入正轨。本文的资料:1995年至2004年的钢铁综合价格直接取自中国钢铁工业年鉴的月综合价格,2005年及以后的价格根据国家编制综合价格的方法对原始数据计算得到的,原始数据取自中国物质商情网。表一1995年2006年钢铁季度综合价格年份季综合格格年份季综合价格年份季综合价格年份季综合价格199513940.43199813671.09200113463.69200414524.2724141.4323559.5723451.3024584.9734326.0533446.5733396.4134702.0744397.8143357.3343293.4144780.40199614364.38199913306.91200213203.81200514991.1024368.8123254.8623306.8125143.1334286.9533218.8633391.5734728.5344195.2943196.5743494.9544002.70199714045.66200013206.63200313833.67200613840.4323952.3823502.0323885.0923993.4033812.6733474.4134065.2933687.9043737.6243463.8044283.0043305.503.3数据的拟合与讨论 首先对原始数据进行初步分析,检验时间序列,常用的方法是绘制数据趋势图,如图1可以发现,从1996年第一季度到1999年第四季度,钢铁价格呈平稳下降趋势,然后经历两年的波动之后明显上升,从2002年第一季度逐渐上升,2005年第一季度达到顶峰,之后又平稳下降。但钢铁价格除出现波动现象外,总体上是呈缓慢上升趋势,时间序列为非平稳序列。 图1 钢铁价格序列钢铁价格一阶差分()序列图见图2。 图2 钢铁价格一阶差分序列下面通过对钢铁价格差分序列和钢铁价格一阶差分序列的自相关图、偏相关图分析判别其平稳性以及识别模型形式。图3由两部分组成。左半部分是序列的自相关和偏相关分析图,右半部分包括五列数据。第一列的自然数表示滞后期k,AC是自相关系数,PAC是偏相关系数。最后两列是对序列进行独立性检验的Q统计量和相伴概率。序列的平稳性可以用自相关分析图判断:如果序列的自相关系数很快地趋于0,即落入随机区间,时间序列是平稳的,反之非平稳。图4是用EViews得出的钢铁价格差分序列的自相关图和偏相关图。的相关图衰减得很快,说明是一个平稳序列。 图3 的相关图、偏相关图经过图3分析,序列的样本自相关系数呈衰减正弦波趋于零;在偏自相关分析图中,序列的样本偏自相关系数同样衰减趋于零,观察图3,p可以取1,q也可以取1。 图4 ARMA(1,1)模型的EViews估计结果模型参数的估计使用最小二乘法,可得:从图4可见,ARMA(1,1)模型的滞后多项式倒数根也都落入单位圆内,满足过程平稳的基本要求。因为变量差分后损失了很多信息,估计的序列模型的可决系数一般不可能很高。图5给出ARMA(1,1)模型残差序列的相关图和偏相关图,最后两列用于检验,包括统计量和检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论