时间序列.doc_第1页
时间序列.doc_第2页
时间序列.doc_第3页
时间序列.doc_第4页
时间序列.doc_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

时间序列本节主要介绍SPSS中时间序列建模操作。一 数据的预处理SPSS无法自动识别时间序列数据并且时间序列数据在处理的过程中必须明确考虑时间序列的非平稳性,因此在进行时间序列分析前,我们必须对时间序列进行预处理。1. 定义时间变量 “数据”,“定义日期”,设置,在“个案为”列表中选择要定义的时间格式,在“第一个个案为”中定义数据开始的具体时间。2. 时间序列数据的平稳化处理“转换”,“创建时间序列”,选择变量,从源变量列表中选择需要进行平稳化处理的变量,然后选 入“变量-新名称”列表中。在“名称和函数”中可以对平稳处理后生成的新变量重命名并选择平稳化处理的方法,设置完毕后单击“更改”按钮就完成了新变量的命名和平稳化处理方法的选择。SPSS提供8种平稳处理方法:差值、季节差分、中心移动平均、先前移动平均、运行中位数、累计求和、滞后、提前、平滑。3. 案例操作数据说明:记录了从1960年到2008年美国的工业生产总值数据、美国10年期国库券利率与联邦基金利率差额。变量id和SPREAD分别表示美国的工业生产总值数据、美国10年期国库券利率与联邦基金利率差额。时间序列分析.sav具体操作:确定后运算结果如下:然后:运算结果:创建序列序列名非缺失值的个案数有效个案数创建函数第一个最后一个1ip_113588576SDIFF(ip,1,12)DATE序列即新定义的时间变量序列,ip_1序列就是对ip序列进行季节差分平稳处理后生成的新序列。由于采用的是一阶季节差分方法,因此ip_1序列的前12个值是缺失的。二 指数平滑模型可以将不规则的时间序列数据加以平滑,从而获得其变化规律和趋势,并以此对未来的经济数据进行推断和预测。指数平滑模型是在移动平均模型基础上发展起来的一种时间序列分析预测法,其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。指数平滑模型的思想是对过去值和当前值进行加权平均、以及对当前的权数进行调整以前抵消统计数值的摇摆影响,得到平滑的时间序列。指数平滑法不舍弃过去的数据,但是对过去的数据给予逐渐减弱的影响程度(权重)。指数平滑法的估计是非线性的,其目标是使预测值和实测值间的均方差(MSE)为最小,其中主要有三种方法:简单、Holt 线性趋势、Winters,这些模型在其趋势和季节构成方面是不同的,根据对趋势和季节的不同假设,可从中选择一个相应的模型对不规则构成的时间序列进行平滑处理。简单法:是在移动平均法的基础上发展而来的一次指数平滑法,假定所研究的时间序列数据集无趋势和季节变化;Holt双参数线性指数平滑法适用于有线性趋势、无季节变化的时间序列的预测;Winters 线性和季节性指数平滑法适用于对含有季节性因素的时间序列的预测。在不同的模型中,有不同的参数,参数的取值范围在0到1之间。当参数取值为1时,预测值等于最近的观测值,调节参数值的大小可得到不同的预测结果,判断预测结果的好坏标准可看输出结果中方差(SSE)的大小,方差越小,预测值同实测值拟合度越高。1. 案例1数据说明:记录了从1960年到2008年美国的工业生产总值数据、美国10年期国库券利率与联邦基金利率差额。变量id和SPREAD分别表示美国的工业生产总值数据、美国10年期国库券利率与联邦基金利率差额。指数平滑.sav操作:先对数据进行预处理。参考上节“案例操作”。模型描述模型类型模型 IDUS spread模型_1简单季节性模型的8个拟合优度指标,其中平稳的R方值为0.556,而R方值为0.898,这是由于因变量数据为季节性数据,因此平稳的R方更具有代表性。从两个R方值来看,该指数平滑模型的拟合情况比较良好。模型统计量模型预测变量数模型拟合统计量Ljung-Box Q(18)离群值数平稳的 R 方统计量DFSig.US spread-模型_10.556123.81916.0000给出了模型的拟合统计量和Ljung-Box Q统计量,平稳的R方值为0.556,与模型拟合图中的平稳的R方一致。Ljung-Box Q统计量值为123.819,显著水平为0.000,因此拒绝残差序列为独立序列的原假设,说明模型拟合后的残差序列是存在自相关的,因此建议采用ARIMA模型继续拟合。指数平滑法模型参数模型估计SEtSig.US spread-模型_1无转换Alpha (水平).999.04224.018.000Delta (季节).00112.2915.429E-51.000给出了指数平滑法模型参数估计值列表。从该图可以看到实验拟合的指数平滑模型的水平Alpha值为0.999,P值为0.000,不仅作用很大而且非常显著。而季节Delta值为0.001,该值不仅很小而且没有显著性,因此可以判断SPREAD尽管为季节性数据,但该序列几乎没有任何季节性特征。给出了SPREAD的指数平滑模型的拟合图和观测值。SPREAD序列整体上成波动状态,拟合值和观测值曲线在整个区间中几乎重合,因此可以说明指数平滑模型对SPREAD的拟合情况非常良好。通过指数平滑模型的拟合图我们可以发现联邦基金利率差额在48年中出现过两次剧烈波动下行,并且总体上前二十年的波动较为剧烈,而最近二十年波动相对平缓。2. 案例2数据记录了某化工厂生产过程中每分钟的温度读数:文件:wendujilu.savtemperamminute_date_26.601127.0022.26.401010.temperam 代表温度的测量值,minute 代表测量的时间。第二个数据记录了某工厂从1977年到2000年生产机器的销售量:文件:jiqixiaoshouliang.savsalesYEAR_DATE_143.0019771977152.0019781978.sales 表示的是机器销售量,YEAR 代表年份。实验的目的是对第一个数据做简单指数平滑,对第二个数据做Holt 指数平滑。对第一个数据进行操作:运行结果:模型描述模型类型模型 ID温度模型_1简单模型统计量模型预测变量数模型拟合统计量Ljung-Box Q(18)离群值数平稳的 R 方统计量DFSig.温度-模型_10-.014215.91317.0000对第二个数据进行操作:画散点图探索:有线性趋势,用Holt指数平滑。计算结果:后四个变量分别是:模型描述模型类型模型 ID销售量(万件)模型_1Holt模型统计量模型预测变量数模型拟合统计量Ljung-Box Q(18)离群值数平稳的 R 方统计量DFSig.销售量(万件)-模型_10.76520.11516.2150三 ARIMA模型全称为自回归集成滑动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),是由博克思(Box)和詹金斯(Jenkins)于70年代初提出一著名时间序列预测方法1 ,所以又称为box-jenkins模型、博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归阶数; MA为移动平均,q为移动平均阶数,d为时间序列成为平稳时所做的差分次数。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。ARIMA模型(自回归(集成)移动平均模型),是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型将预测指标随时间推移而形成的数据序列看作是一个随机序列,这组随机变量所具有的依存关系体现着原始数据在时间上的延续性,它既受外部因素的影响,又有自身变动规律。ARIMA(p,q)模型的数学表达式如下:其中参数为自回归参数,为移动平均参数,是模型的待估计参数。用来处理包含季节趋势的时间序列。1. 步骤(1) 对数据求差分直到它是平稳的,这可以通过检查各种差分序列的相关图(包括偏相关图)直到找出一个“急速”下降于零,且从此任何季节效应已经大大消除的序列来完成分析时间序列的随机性、平稳性及季节性。对于非季节数据,通常求一阶差分就足够了。(2) 选定一个特定的模型拟合所分析的时间序列数据,模型识别是Box-Jenkins 方法中的很重要的一环,是否合适的比较标准是:对一般ARMA模型中的一些特征,分析其理论特征,把这种特定模型的理论特征作为鉴别实际模型的标准,观测实际资料与理论特征的接近程度。根据这种分类比较分析的结果,来判定实际模型的类型。(3) 用时间序列的数据,估计模型的参数,并进行检验,以判定该模型是否恰当,如不恰当,则返回第二步,重新选定模型。2. 相关概念介绍(一)模型1、AR(p)(p阶自回归模型)其中ut白噪声序列,是常数(表示序列数据没有0均值化)AR(p)等价于AR(p)的特征方程是:AR(p)平稳的充要条件是特征根都在单位圆之外。2、MA(q)(q阶移动平均模型)其中ut是白噪声过程。MA(q)平稳性MA(q)是由ut本身和q个ut的滞后项加权平均构造出来的,因此它是平稳的。MA(q)可逆性(用自回归序列表示ut)可逆条件:即收敛的条件。即(L)每个特征根绝对值大于1,即全部特征根在单位圆之外。3、ARMA(p,q)(自回归移动平均过程)ARMA(p,q)平稳性的条件是方程(L)=0的根都在单位圆外;可逆性条件是方程(L)=0的根全部在单位圆外。4、ARIMA(p,d,q)(单整自回归移动平均模型)差分算子:对d阶单整序列xtI(d)则wt是平稳序列,于是可对wt建立ARMA(p,q)模型,所得到的模型称为xtARIMA(p,d,q),模型形式是由此可转化为ARMA模型。(二)模型识别要建立模型ARIMA(p,d,q),首先要确定p,d,q,步骤是:一是用单位根检验法,确定xtI(d)的d;二是确定xt AR(p)中的p;三是确定xt MA(q)中的q。平稳序列自相关函数0=1,-k=k(对称)1、平稳AR(p)的自相关系数和偏自相关系数(1)平稳AR(p)的自相关系数i0,k0平稳AR(p)的自相关系数是,k0(2)k阶平稳自回归过程AR(k)的偏自相关系数两边同除以0对任意j0都成立。根据和对称性,得到Yule-Walker方程组对于给定的k,1,2,k已知,每个方程组最后一个解就是相应的偏自相关系数:11,22的,kk。3是k=3的自相关系数,意义:度量平稳序列xt与xt-3的相关系数,至于中间xt-1,xt-2起什么作用无法顾及。33的k=3的偏自相关系数。意义:剔除中间变量xt-1,xt-2的影响后,度量xt与xt-3的相关程度。2、平稳MA(q)的自相关系数和偏自相关系数(1)MA(q)自相关系数当kq时,k=0,xt与xt+k不相关,这种现象称为截尾,因此可根据自相关系数是否从某一点开始一直为0来判断MA(q)模型的阶数q。(2)MA(q)偏自相关系数MA(q)模型对应一个AR(),通过AR()来解决3、ARMA(p,q)有拖尾特征,p和q的识别通过从低阶逐步试探直到合适的模型为止。1.2关于ARIMA模型ARIMA模型全称为差分自回归移动平均模型。是由博克思和詹金斯于70年代初提出的一著名时间序列预测方法,博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。1.3 时间序列的AR、MA和ARIMA建模自回归过程令Yt表示t时期的GDP。如果我们把Yt的模型写成其中是Y的均值,而ut是具有零均值和恒定方差的不相关随机误差项(即ut是白噪音),则成Yt遵循一个一阶自回归或AR(1)随机过程。P阶自回归函数形式写成:模型中只有Y这一个变量,没有其他变量。可以理解成“让数据自己说话”。移动平均过程上述AR过程并非是产生Y的唯一可能机制。如果Y的模型描述成其中是常数,u为白噪音(零均值、恒定方差、非自相关)随机误差项。t时期的Y等于一个常数加上现在和过去误差项的一个移动平均值。则称Y遵循一个一阶移动平均或MA(1)过程。q阶移动平均可以写成:自回归于移动平均过程如果Y兼有AR和MA的特性,则是ARMA过程。Y可以写成其中有一个自回归项和一个移动平均项,那么他就是一个ARMA(1,1)过程。是常数项。ARMA(p,q)过程中有p个自回归和q个移动平均项。自回归求积移动平均过程 上面所做的都是基于数据是平稳的,但是很多时候时间数据是非平稳的,即是单整(单积)的,一般非平稳数据经过差分可以得到平稳数据。因此如果我们讲一个时间序列差分d次,变成平稳的,然后用AEMA(p,q)模型,则我们就说那个原始的时间序列是AEIMA(p,d,q),即自回归求积移动平均时间序列。AEIMA(p,0,q)=AEMA(p,q)。二、 基本思路和基本程序2.1 基本思路步骤一:识别。找出适当的p、d、和q值。通过相关图和偏相关图可以解决。步骤二:估计。估计模型周所含自回归和移动平均项的参数。有时可以用最小二乘法,有时候需要用非线性估计方法。(软件可以自动完成)步骤三:诊断(检验)。看计算出来的残差是不是白噪音,是,则接受拟合;不是,则重新在做。步骤四:预测。短期更为可靠。2.2 基本程序第一步,根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间序列都不是平稳序列。第二步,对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。 第三步,根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。第四步,进行参数估计,检验是否具有统计意义。第五步,进行假设检验,诊断残差序列是否为白噪声。第六步,利用已通过检验的模型进行预测分析。三、举例说明上述步骤3.1 识别可以通过观察相关图中自相关函数(ACF)和偏相关函数(PACF)得出数据适用于AR、MA还是ARIMA模型,并通过图形形状来判断P,d,q。首先我们说明一下图形判断的标准。ACF与PACF的理论模式模型种类ACF的典型模式PACF的典型模式AR(p)指数衰减或衰减的正弦波或两者显著的直至滞后q的尖柱MA(q)显著的直至滞后q的尖柱指数下降ARMA(p,q)指数衰减指数衰减注:指数衰减和几何衰减意义相同 注意AR(P)过程的ACF和PACF,和MA(q)过程的ACF和PACF相比,有相反的模式;对于AR(p)清醒,AC按几何或者指数规律下降(描述为拖尾者),而PACF则在一定滞后次数滞后突然截尾(断尾者)。对于MA(q)情况相反。我们用1970年第一季度至1991第四季度美国GDP举例说明。(可以在后期改成产业安全方面的,现在暂时没找到典型的的替代数据。)首先将数据处理成平稳数据,d=1即可。从上图可以看到ACF一直到滞后4是指数衰减的。此外,除了在滞后1、8和12两除外,其余自相关都是不显著的(系数不显著不等于0),图中两边的两条虚线是95%置信限。偏自相关在之后1、8和12出现尖柱,其余都不显著。所以得出结论,GDP的一阶差分模型是最多为AR(12),同时由于除了1、8、12外都不显著,一次函数形式,只存在1、8、12的滞后项。3.2模型估计通过上述判断可以运用软件得出一下AR模型。(其实AR模型只是ARIMA的特殊形式,特殊在MA变量的系数都为0,d为1)。Y*为Y的一阶差分。3.3诊断检查一种简单的办法就是看求出的残差直至滞后25的ACF和PACF。如图所示。没有任何ACF和PACF是显著地,估计出来的残差是纯随机的,此模型拟合达到标准。3. 案例1例:数据说明:记录了从1960年到2008年美国的工业生产总值数据、美国10年期国库券利率与联邦基金利率差额。变量id和SPREAD分别表示美国的工业生产总值数据、美国10年期国库券利率与联邦基金利率差额。ARIMA模型.sav先对数据进行预处理。参考上节“案例操作”。平稳的R方值0.376,R方值0.233,这是由于因变量数据为季节性数据,因此平稳的R方更具有代表性。给出了参数估计值。AR自回归部分的四项显著性水平分别为0.002,0.075,0.000,0.000,而MA移动平均部分的两项的显著性水平为0.784,0.274,AR(3)和MA(1),MA(2)不是十分显著,其他项都非常显著。因此,ARIMA(4,1,2)模型比较合适。给出了SPREAD的ARIMA(4,1,2)模型的拟合图和观测值。SPREAD序列整体上呈波动状态,拟合值和观测值曲线在整个区间整体上拟合情况良好,但是明显可以看出拟合值的波动性要小于实际观察值。因此可以说明ARIMA(4,1,2)模型对SPREAD的拟合情况一般,需要进一步探索其他的ARIMA模型。4. 案例21770年到1869年的100年中,各年的太阳黑子数被记录在数据集中,部分数据如下:taiyangheizi.savYear 表示的是年份,Sunspot 表示的是观测到的太阳黑子的数目。本次实验的内容是建立自回归集成移动平均模型,预测1870年的太阳黑子数。其中p,d,q分别为1,1,0。默认都是0,这样运行会提示错误。运算结果:模型描述模型类型模型 IDSunsport模型_1ARIMA(1,1,0)模型统计量模型预测变量数模型拟合统计量Ljung-Box Q(18)离群值数平稳的 R 方统计量DFSig.Sunsport-模型_10.31244.20517.0000平稳的R方是0.312,Ljung-Box Q统计量为44.205,自由度(DF)为17,显著性水平(SIG.)为0.000,离群值数为0.预测模型1870Sunsport-模型_1预测95UCL132LCL58对于每个模型,预测都在请求的预测时间段范围内的最后一个非缺失值之后开始,在所有预测值的非缺失值都可用的最后一个时间段或请求预测时间段的结束日期(以较早者为准)结束。四 季节分解模型季节变动趋势是时间序列的四种主要变动趋势之一,季节变动是指由于季节因素导致的时间序列的有规则变动。引起季节变动的除自然原因外,还有人为原因,如节假日、风俗习惯等。季节分解主要方法包括按月(季)平均法和移动平均趋势剔除法。时间序列的变化受多种因素的影响,一般可将这些因素分为以下4种:长期趋势因素(T),季节变动因素(S),周期变动因素(C),不规则变动因素(I)。当将时间序列分解成以上四个因素后,可将时间序列Y看成这4个因素的函数,即。常用的时间序列季节分解的模型有加法模型和乘法模型:加法模型为乘法模型为相对而言,乘法模型比加法模型用得多,在乘法模型中,时间序列值和长期趋势用绝对值表示,季节变动、周期变动和不规则变动用相对值(百分数)表示。1. 案例1例:数据记录了从1995年到1999年中国某城市的月度平均气温。本实验利用季节性分解对该城市气温进行分析,利用季节分析气温除去季节因素影响外的内在规律。时间1995年1996年1997年1998年1999年1-0.7-2.2-3.8-3.9-1.623456789101112-0.40.9-1.50.1-0.6在SPSS中建立变量“气温”,操作:运算结果:模型描述模型名称MOD_1模型类型可加序列名称1气温季节性期间的长度12移动平均数的计算方法跨度等于周期加 1,端点权重为 0.5正在应用来自 MOD_1 的模型指定。季节性因素序列名称:气温期间季节性因素1-15.860072-11.635073-6.2069441.5138957.24826611.76910713.50556812.2388997.14306101.0763911-7.6173612-13.17569因为季节性因素的存在使得气温在不同的月分呈现出相似的性质,因此该季节性因素相当于周期内季节性影响的相对数。可见,在每年的1、2、3、11、12月份的季节性因素为负值,使得这5个月份的气温相对较低。数据文件新增加变量。增加了四个序列:ERR_1、SAS_1、SAF_1和STC_1。其中:ERR_1表示“气温”序列进行季节性分解后的不规则或随机波动序列;SAS_1表示“气温”序列进行季节性分解除去季节性因素后的序列;SAF_1表示“气温”序列进行季节性分解产生的季节性因素序列;STC_1表示“气温”序列进行季节性分解出来的序列趋势和循环成份。2. 案例2某公司1986年到1997年间某种产品季度销售量,部分数据如下:year 表示年份,season 表示季度,只取1、2、3、4四个值,分别表示第一、二、三、四季度,sales 表示某种产品的季度销售量,实验的内容是用季节分解的方法将时间序列中季节因素进行剔除并对剔除季节因素后的序列进行平滑处理,最终得到只包含趋势和周期因素的时间序列。jiduxiaoshouliang.sav模型描述模型名称MOD_1模型类型可乘序列名称1销售量季节性期间的长度4移动平均数的计算方法跨度等于周期,并且所有点具有相同的权重正在应用来自 MOD_1 的模型指定。季节性因素序列名称:销售量期间季节性因素 (%)1111.82109.2375.84103.2新增4列数据,分别是:ERR_1表示序列的残差因子;SAS_1表示经过季节调整后的序列(Seasonally adjusted series);SAF_1表示季节调整因子(Seasonal adjustment factors);STC_1表示平滑后的趋势与周期成分(Smoothed trend-cycle component)。例如:对于1986年第一季度的销售量3017.60,经过剔除季节因素的季节调整后的销售量为2698.66383,季节调整因子为1.11818,需要注意的是此值越接近1,说明季节因素越小,需要调整的幅度也越小。平滑后的趋势与周期成分为2739.4211333644635,这是将SAS_1序列又进行平滑后得到的,是最终的经过季节调整并且平滑后的时间序列,仅包含了趋势和周期的成分,这就是我们需要的最终的时间序列数据。五 MATLAB中实现时间序列建模与预测(1) 对这一生产过程建模;(2)对这一生产过程进行 10 步预测。解:通过计算自相关函数和偏相关函数,确定取 d = 1。利用 AIC 准则定阶,取ARIMA(3,1,3) 模型。计算得MATLAB程序:clc,cleara=textread(hua.txt); %把原始数据按照原来的排列格式存放在纯文本文件 hua.txta=nonzeros(a); %按照原来数据的顺序去掉零元素r11=autocorr(a) %计算自相关函数r12=parcorr(a) %计算偏相关函数da=diff(a); %计算 1 阶差分r21=autocorr(da) %计算自相关函数r22=parcorr(da) %计算偏相关函数n=length(da); %计算差分后的数据个数for i=0:3for j=0:3spec= garchset(R,i,M,j,Display,off); %指定模型的结构coeffX,errorsX,LLFX = garchfit(spec,da); %拟合参数num=garchcount(coeffX); %计算拟合参数的个数%compute Akaike and Bayesian Information Criteriaaic,bic=aicbic(LLFX,num,n);fprintf(R=%d,M=%d,AIC=%f,BIC=%fn,i,j,aic,bic); %显示计算结果endendr=input(输入阶数 R);m=input(输入阶数 M);spec2= garchset(R,r,M,m,Display,off); %指定模型的结构coeffX,errorsX,LLFX = garchfit(spec2,da) %拟合参数sigmaForecast,w_Forecast = garchpred(coeffX,da,10) %计算 10 步预报值x_pred=a(end)+cumsum(w_Forecast) %计算原始数据的 10 步预测值六 练习1. 练习1调查者记录了某旅游景点从1999年1月到2002年12月的门票收入数据。部分数据如下:年份月份门票收入(万元)19991701999293.2002.(1) 试对该数据定义时间变量,时间频率为月度数据;(2) 对该数据进行平稳化处理。2. 练习2利用练习1门票收入数据,试对该数据做进一步分析:(1) 试建立季节分解模型,提取该数据的季节性因素;(2) 建立季节分解模型后,同时提取该数据的随机因素,并保持到原数据文件。3. 练习3数据文件骄傲发生种粒子不同时间的相对位置的数据。试建立ARIMA模型对该粒子的位置进行分析与预测。部分相关数据如下:观测标号粒子位置1-0.874703053557.(1) 采用ARIMA模型分析拟合粒子的相对位置走势;(2) 绘制ARIMA模型的拟合图和观测值图表。4. 练习4给出了1978-1998年我国钢铁产量的数据,用指数平滑的方法分析拟合钢铁产量的稳定长期的走势。部分数据如下:年份钢铁产量(百万吨)19786761979825.19851524(1) 采用指数平滑法分析拟合钢铁产量的稳定长期的走势;(2) 绘制指数平滑模型的拟合图和观测值图表。5. 练习5:Winters 线性平滑方法应用Winters 线性和季节性指数平滑法适用于含有季节性因素的时间序列的预测。练习5.sav中记录了按千人计的英国1955年到1963年间的季度失业人数以及国人生产总值。un 代表失业人数,gdp 代表国内生产总值。试用Winters 方法对数据进行指数平滑并预测1964年第4季度的失业人数和国内生产总值。6. 练习6:ARIMA 模型应用我国90年代以来出口额增长迅速,数据练习6.sav给出了我国1993年到2002年的出口总额的月度数据,sum 代表的就是出口总额。试用ARIMA 模型分析1993-2002年的出口总额数据,并对2003年的出口总额做出预测。7. 练习7:对季度数据进行分析运用上一题数据,首先将月度数据转换成季度数据,然后运用季节分解方法对季度数据进行分析,最后输出经过季节调整并且平滑后的时间序列数据。七 附:模型定阶的AIC准则AIC 准则又称 Akaike 信息准则, 是由日本统计学家 Akaike 于 1974 年提出的。 AIC准则是信息论与统计学的重要研究成果,具有重要的意义。AIC 准则起源于 KullbackLeibler 信息量。设 X 是随机变量,它的概率密度是f (x) ,其中含有 k 个未知参数,设未知参数向量为。 f (x) 属于分布族 g(x | ) ,其中 = (1,2,.,k )T。显然clc,clearrandn(state,sum(clock); %初始化随机数发生器elps=randn(1,10000); %产生 10000 个服从标准正态分布的随机数x(1)=0; %赋初始值for j=2:10000x(j)=0.8*x(j-1)+elps(j)-0.4*elps(j-1); %产生样本点endfor i=0:3for j=0:3spec= garchset(R,i,M,j,Display,off); %指定模型的结构coeffX,errorsX,LLFX = garchfit(spec,x); %拟合参数num=garchcount(coeffX); %计算拟合参数的个数%compute Akaike and Bayesian Information Criteriaaic,bic=aicbic(LLFX,num,10000);fprintf(R=%d,M=%d,AIC=%f,BIC=%fn,i,j,aic,bic); %显示计算结果endend其中的一次计算结果如下:R=0,M=0,AIC=32484.707852,BIC=32499.128533R=0,M=1,AIC=30332.919112,BIC=30354.550133R=0,M=2,AIC=29494.702222,BIC=29523.543583R=0,M=3,AIC=29123.131961,BIC=29159.183663R=1,M=0,AIC=29124.394412,BIC=29146.025433R=1,M=1,AIC=28620.943324,BIC=28649.784685R=1,M=2,AIC=28622.928551,BIC=28658.980253R=1,M=3,AIC=28624.851198,BIC=28668.113240R=2,M=0,AIC=28696.403650,BIC=28725.245012R=2,M=1,AIC=28622.928290,BIC=28658.979992R=2,M=2,AIC=28624.372827,BIC=28667.634869R=2,M=3,AIC=28626.264289,BIC=28676.736671R=3,M=0,AIC=28639.063004,BIC=28675.114706R=3,M=1,AIC=28624.860895,BIC=28668.122937R=3,M=2,AIC=28626.271477,BIC=28676.743860R=3,M=3,AIC=28617.468215,BIC=28675.150938计算结果显示应为 ARMA(1,1) 序列。若实际序列是 ARMA( p,q) 序列,应对各种可能的 p, q 值计算其 AIC。因此,计算量较大。只有认真反复计算,才能求得真阶 p 和 q 。八 附:ARIMA 序列及其预报九 附:weka中时间序列分析及预测数据有七个属性,包括:日期(Date)、开盘价(Open)、最高价(High)、最低价(Low)、收盘价(Close)、平均成交量(Avg Vol)以及调整后的收盘价(Adj Close)。一共有153个样本。选择Forecast 预测,选择预测变量close收盘价,在Number of time units to forecast中选择预测时间为5天,时间戳Time stamp 选择Date,预测Periodicity选择Daily,在Skip list 中填写路过的几天,都是周末:weekend,2011-01-17yyyy-MM-dd,2011-02-21,2011-04-22,2011-05-30,2011-07-04然后运行start,启动预测学习。输出:在Output中:= Run information =Scheme:LinearRegression -S 0 -R 1.0E-8 -num-decimal-places 4Lagged and derived variable options:-F Close -L 1 -M 7 -G Date -dayofweek -weekend -skip weekend,2011-01-17yyyy-MM-dd,2011-02-21,2011-04-22,2011-05-30,2011-07-04Relation: AppleStocksInstances: 153Attributes: 7 Date Open High Low Close Volume Adj CloseTransformed training data: Close DayOfWeek Weekend Date-remapped Lag_Close-1 Lag_Close-2 Lag_Close-3 Lag_Close-4 Lag_Close-5 Lag_Close-6 Lag_Close-7 Date-remapped2 Date-remapped3 Date-remapped*Lag_Close-1 Date-remapped*Lag_Close-2 Date-remapped*Lag_Close-3 Date-remapped*Lag_Close-4 Date-remapped*Lag_Close-5 Date-remapped*Lag_Close-6 Date-remapped*Lag_Close-7Close:Linear Regression ModelClose = 1.6971 * DayOfWeek=tue + 0.1139 * Date-remapped + 0.9839 * Lag_Close-1 + 0.1828 * Lag_Close-2 + -0.3186 * Lag_Close-3 + 0.2237 * Lag_Close-4 + -0.1742 * Lag_Close-5 + 0.2412 * Lag_Close-6 + -0.1904 * Lag_Close-7 + 0 * Date-remapped3 + -0.0004 * Date-remapped*Lag_Close-1 + -0.0001 * Date-remapped*Lag_Close-2 + 0.0002 * Date-remapped*Lag_Close-3 + -0.0001 * Date-remapped*Lag_Close-4 + -0.0001 * Date-remapped*Lag_Close-5 + 0.0002 * Date-remapped*Lag_Close-6 + -0.0001 * Date-remapped*Lag_Close-7 + 18.8757= Future predictions from end of training data =Time Close 2011-01-03 329.6 2011-01-04 331.3 2011-01-05 334 2011-01-06 333.7 2011-01-07 336.1 2011-01-10 342.4 2011-01-11 341.6 2011-01-12 344.4 2011-01-13 345.7 2011-01-14 348.5 2011-01-18 340.6 2011-01-19 338.8 2011-01-20 332.7 2011-01-21 326.7 2011-01-24 337.4 2011-01-25 341.4 2011-01-26 343.8 2011-01-27 343.2 2011-01-28 336.1 2011-01-31 339.3 2011-02-01 345 2011-02-02 344.3 2011-02-03 343.4 2011-02-04 346.5 2011-02-07 351.9 2011-02-08 355.2 2011-02-09 358.2 2011-02-10 354.5 2011-02-11 356.8 2011-02-14 359.2 2011-02-15 359.9 2011-02-16 363.1 2011-02-17 358.3 2011-02-18 350.6 2011-02-22 338.6 2011-02-23 342.6 2011-02-24 342.9 2011-02-25 348.2 2011-02-28 353.2 2011-03-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论