时间序列分析总复习_第1页
时间序列分析总复习_第2页
时间序列分析总复习_第3页
时间序列分析总复习_第4页
时间序列分析总复习_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

§6诊断与检验完成模型的识别与参数估计后,应对估计结果进行诊断与检验,以求发现所选用的模型是否合适。若不合适,应该知道下一步作何种修改。这一阶段主要检验拟合的模型是否合适。一是检验模型参数的估计值是否具有显著性;二是检验残差序列的随机性。参数估计值的显著性检验是通过t检验完成的,而模型拟合的优劣以及残差序列随机性的判别可按下列方法进行:散点图法(SCATTERPLOT)作对和对的散点图,进行独立性分析;相关系数法(CORRELATION)估计相关系数法:计算和对的相关函数及的自相关函数;F检验法(F-TEST)F检验法:把的独立性检验问题转化成模型拟合是否充分的问题,从而可以利用前面所介绍的F-统计量进行有关的检验问题;卡方检验法(F-TEST)是用Box-Pierce(1970)提出的Q统计量进行检验完成的。将的自相关函数记为,自协方差函数记为,则(1)(2)可以证明,当N很大时,并且这k个量近似为相互独立的正态分布,于是检验序列的独立性问题转化为检验(3)式中,,假设,则在原假设成立的条件下,有(4)若拟合的模型合适,统计量Q=N(5)近似服从2(K-p-q)分布,其中N表示样本容量,rk表示用残差序列计算的自相关系数值,K表示自相关系数的个数,p表示模型自回归部分的最大滞后值,q表示移动平均部分的最大滞后值。这时的零假设(H0)是“残差序列是白噪声过程”。用残差序列计算Q统计量的值。显然若拟合的模型不合适,残差序列中必含有其他成份,Q值将很大,反之Q值将很小。判别规则是:若Q<2(K-p-q),则接受H0。若Q>2(K-p-q),则拒绝H0。其中表示检验水平。残差序列的独立正态性或者依据或者依据Jarque-Bera检验:;或者依据非参数的检验方法。按照原则应该有即检验这个的绝对值是否有95.5%个小于2,若有,则独立;否则,可判定不独立。实例【例4-3】某市1985-1994年各月工业生产总值。以1985-1993年数据建模,1994年数据留作检验模型的预测效果。第一步:零均值化与平稳化第二步:模型识别大致可以将模型识别为AR类。第三步:模型定阶AR(1)或AR(2)第四步:参数估计第五步:诊断检验【例4-4】某车站1993-1997年各的列车运行数量共60个数据,试建立其时间序列模型。第一步:零均值化与平稳化水平序列显然是不平稳的,对水平序列作一阶差分,得到差分序列是平稳的,并且也是零均值的。,第二步:模型识别SPACF呈现出拖尾性,SACF呈现出截尾性拖尾性与截尾性在本例中已经不是十分明显,模型的建立并没有唯一的标准答案,模型只有优劣之分,没有对错之别。拖尾性与截尾性在本例中已经不是十分明显,模型的建立并没有唯一的标准答案,模型只有优劣之分,没有对错之别。第三步:模型定阶可以验证SACF呈现出3阶截尾性,因而可以初步识别为MA(3)。第四步:参数估计第五步:诊断检验【本章思考题】1.对于零均值化的处理方式;2.如何进行模型的识别与定阶,最佳准则函数的构造考虑了哪两点;3.模型的适应性检验包括哪些内容;4.时间序列模型建立的过程;【作业】P125:3、5平稳时间序列预测本章论述平稳时间序列的预测,学习的重点是条件期望预测。序言预测就是根据现在与过去序列的样本取值,对未来某一时刻的随机变量进行估计。问题的提出平面M可能的预测:(1)预测表达式是时间序列过去取值的线性组合;(2)具有最小的预测方差。平面M问题的求解对于作一平稳的时间序列模型,我们都可以将它转化成移动平均过程:由于是相互正交的,因而形成平面M的一组正交基。预测函数(2)式意味着可由线性表出,因此可由正交基线性表出:因而,求解的问题就转化为求解。而是在平面M上的正投影相对于平面M的一组正交基的坐标,比较容易求解。解之得这是从几何角度解决了预测的问题,还可以从代数角度上解决,详见教材P128。:这是从几何角度解决了预测的问题,还可以从代数角度上解决,详见教材P128。注:由于该预测使得与的均方误差最小,因而将其称为最小均方误差预测。综上所述,的最小均方误差预测预测误差预测误差为:方差为:由(7)式可以看出步线性最小方差预测误差的方差和预测步长有关,而与预测的时间起点t无关,这一点也体现了预测的平稳性质。同时预测的步长越长,预测误差的方差也越大,即预测的准确性越差。表各种预测方法及其特点方法时间范围适用情况应做工作定性预测法短、中、长期对缺乏历史统计资料或趋势面临转折的事件进行预测需做大量的调查研究工作一元线性回归预测法短、中期自变量与因变量两个变量之间存在着线性关系为两个变量收集历史数据,此项工作是此预测中最费时的事情多元线性回归预测法短、中期因变量与两个以上的自变量之间存在着线性关系为所有变量收集历史数据是此项工作是此预测中最费时的事情非线性回归预测法短、中期因变量与一个自变量或多个其它自变量之间存在着某种非线性关系必须收集历史数据,并用几个非线性模型试验趋势外推法中期到长期当被预测项目的有关变量用时间表示时,用非线性回归只需要因变量的历史资料,但用趋势图作试探时很费时间分解分析法短期适用于一次性的短期预测或在使用其它预测方法前消除季节变动的因素只需要序列的历史资料移动平均法短期不带季节变动的反复预测只需要因变量的历史资料,但初次选择权数时很费劲指数平滑法短期具有或不具有季节变动的反复预测只需因变量的历史资料,是一切反复预测中最简单的方法,但建立模型所费的时间与自适应过滤不相上下自适应过滤法短期适用于趋势形态的性质随时间而变化,而且没有季节变动的反复预测只需要因变量的历史资料,但制定并检查模型规格很费时间博克斯—詹金斯法短期适用于任何序列的发展形态的一种高级预测方法计算过程复杂、繁琐景气预测法短、中期适用于时间序列趋势延续及转折预测收集大量历史资料和数据并需进行大量计算灰色预测法短、中期适用于时间序列的发展呈指数型趋势收集对象的历史数据状态空间模型和卡尔漫滤波短、中期适用于各类时间序列的预测收集对象的历史数据并建立状态空间模型实际中预测值的计算前面从理论得到时间序列的步最小方差预测包含无穷项求和,而实际中我们只可能有有限的数据,因此,只能用充分多项的有穷和近似,即因为格林函数是指数衰减的,T的取值只要使小于允许的值即可。(8)中的格林函数可递推计算;随机扰动项也可递推计算详见王振龙:《时间序列分析》P129。。详见王振龙:《时间序列分析》P129。第二节条件期望预测条件期望预测的实质:它是根据差分方程形式来进行预测,该算法直接从所建立的模型出发能够求出步线性最小方差预测的值。条件期望所谓条件期望,是指在一定条件下的期望值。例如,在已知的条件下,的期望值称为的条件期望,记为:或。它具有如下的性质:性质1:性质2:性质3:性质1表明:条件期望满足线性运算法则;性质2表明:现在或过去观察值的条件期望是其本身,未来取值的条件期望是其预测值;性质3表明:现在或过去的残差的条件期望是它的估计值,未来残差的条件期望则为零。用模型的逆转形式进行预测任一ARMA模型可用逆转形式来表示,即将xt表示为过去观测值的线性组合再加一个随机扰动: 用差分方程形式进行预测AR(1),MA(1)的预测详见教材P130。下面以ARMA(1,1)模型为例具体介绍预测方法。其他形式时间序列模型的预测方法与此类似。设对时间序列样本{xt},t=1,2,…,T,所拟合的模型是 上式中at需要通过递推计算。······即当l>1时,预测值满足模型自回归部分差分方程利用做为初始值,解此差分方程得预测值为 ARMA(m,n)模型的预测 ①一步预测(l=1)②二步预测(l=2)③步预测当时当时其中对于,。滑动平均部分全部消失,预测值满足自回归部分的差分方程。结论:对一般的ARMA(n,m)模型,自回归部分决定了预测函数的形式,而滑动平均部分用于确定预测函数中的系数。ARMA(n,m)模型的预测区间由于,所以的分布完全由所决定按照原则,得到l步预测的68.3%和95.5%的预测区间分别为:和在实际计算过程中,理论上的用预测的稳定性格林函数与预测值满足同样的关系式,由第三章的内容可知格林函数描述了系统的记忆性,而预测所依赖的正是这种记忆性,因而预测值的变化趋势与格林函数的变化是一致的,预测的稳定性依赖于格林函数的稳定性或系统的稳定性。实例【例4-5】利用例4-1所建立的模型进行预测,详见教材P133、P134。解:(1)实际计算,见教材P135;(2)软件中的预测预测和模拟(一)在估计的单方程基础上进行预测;(二)合并成多方程模型进行预测(solve);(三)几种指数平滑预测法。1.单个估计方程的预测有两种方法:其一,Dynamic法,利用滞后左手变量以前的预测值计算当前样本区间的预测;其二,Static法,使用的是实际值而不是预测值。NOTE:两种方法在多步预测的第一步给出相同的结果,当方程中不含滞后被解释变量和ARMA项时,二者相同。2.预测的标准差和置信区间。预测误差来源于:方程的新息(残差)未知;系数的不确定性。3.预测精度与预测评价预测研究的一个重要任务是为各具物色的不同预测对象寻找合适的预测方法,使得预测结果具有更高的可靠性和精确度。预测精度的一般含义是指预测模型拟合的好坏程度,即由预测模型所产生的模拟值与历史实际值拟合程度的优劣。对于时间序列预测,研究者可以利用历史数据的一部分建立模型。然后预测其余的历史数据,以便更直观地研究预测精度。但对于预测用户而言,预测未来的精度是重要的,至于该预测模型过去的预测精度如何则没有什么意义。在对话框中选择了ForecastEvaluation,并且被预测变量在预测期内有实际值,那么得到一个评价预测的统计结果。这个结果包括:均方根预测误差、平均绝对预测误差、平均相对预测误差和Theil不等系数及其分解。指标①①、②和③属于绝对指标,其它属于相对指标建议使用。①平方和误差:;②平均绝对误差:;③均方根误差:;④平均绝对百分比误差一般认为如果MAPE的值低于10,则认为预测精度较高。:;一般认为如果MAPE的值低于10,则认为预测精度较高。⑤均方百分比误差:;⑥Theil不等系数根据均方误差的分解,还可以定义三个与希尔不等系数相关的指标。偏差率BP反映了预测值均值和实际值均值间的差异;方差率VP反映了它们标准差的差异;协变率CP反映了剩余的误差。值得说明的是:CP=1-BP-VP,当预测是比较理想时,均方误差大多数集中在协变率上,而其余两项都很小。:根据均方误差的分解,还可以定义三个与希尔不等系数相关的指标。偏差率BP反映了预测值均值和实际值均值间的差异;方差率VP反映了它们标准差的差异;协变率CP反映了剩余的误差。值得说明的是:CP=1-BP-VP,当预测是比较理想时,均方误差大多数集中在协变率上,而其余两项都很小。4.预测图第三节实时修正预测问题的提出任何模型的建立都是依据当时的条件,即现有的信息量决定了模型的表达形式。随着时间的推移,不断地有新信息产生,原有的模型可能不能反应现实的情况,要想真实再现时间序列的变化趋势,有必要重新建立时间序列模型。然而,前面的学习发现,时间序列模型的建立过程比较复杂,有没有一种新办法能够解决无须重新建立模型就能够准确地刻划新形式下时间序列的变化趋势。回答是肯定的,实时修正预测就是在原先预测结果的基础之上,加进一些新的信息,就能得到与重新建立模型进行预测等价的效果。具体做法对于一个ARMA过程,由(5)得:(6)(7)(6)式反应了在时刻,对未来进行步预测,为在新息产生条件下的预测结果;(7)式反应了在时刻,对未来进行步预测,为没有考虑新息时的预测结果;同时由(6)式和(7)式,我们还可以得到如下结论:(8)式中,为一步预测误差。(8)式表明:新的预测值是在旧的预测值基础上加一个修正项,而这一修正项比例于旧的一步预测误差,比例系数随预测超前步数而变化。实例【例4-6】对例4-5,假如我们已知道观测值,试计算和。解:可列表计算表实时修正预测计算过程超前期123……格林函数0.790.4040.145预测特性95%置信区间只要预测的步数没有改变,预测误差的标准差就不会发生变化。只要预测的步数没有改变,预测误差的标准差就不会发生变化。4.8026.126.42tXt2493.78原点2504.582513.000.2132.7872521.3621.1942530.4160.332540.029第四节指数平滑预测——ARMA模型特例1.问题的提出由前面的讨论,我们已经知道,预测值实际上是过去的观察值及部分预测值的一种平滑,特别是超前一步预测值是,的一种平滑,那么指标平滑预测与ARMA模型预测之间到底存在着什么样的联系。2.指数平滑预测设有时间序列,对其未来发展变化趋势作预测。①最朴素的动态思想认为现象的未来行为和现在的行为有关,因而用现在值作为下一期的预测;②序列的预测值用平均值来代替;③在取所有资料的平均数不尽合理时,利用了“移动平均数”;④作同等的权重不合适,指数平滑法作为权数,,(9)由于(9)中不再是加权平均数,因而用作为权数,这时有预测公式为:(10)(10)为著名的指数加权移动平均数(EWMA),它有两个极为重要的公式:(11)(12)(11)式表明下期的预测值是本期实际与本期预测的加权平均数;(12)式使用的倍数的预测误差对模型加以修正。3.指数平滑与ARMA模型的关系结论:指数平滑预测与ARMA(1,1)模型在时的特殊情况下的预测等价。填空题1、拿到一个观察值序列之后,首先要对它的平稳性和纯随机性进行检验,这两个重要的检验称为序列的预处理。2、白噪声序列具有性质纯随机性和方差齐性。3、平稳AR(p)模型的自相关系数有两个显著的性质:一是拖尾性;二是呈负指数衰减。4、MA(q)模型的可逆条件是:MA(q)模型的特征根都在单位圆内,等价条件是移动平滑系数多项式的根都在单位圆外。5、AR(1)模型的平稳域是。AR(2)模型的平稳域是二、单项选择题1、频域分析方法与时域分析方法相比(D)A前者要求较强的数学基础,分析结果比较抽象,不易于进行直观解释。B后者要求较强的数学基础,分析结果比较抽象,不易于进行直观解释。C前者理论基础扎实,操作步骤规范,分析结果易于解释。D后者理论基础扎实,操作步骤规范,分析结果易于解释。2、下列对于严平稳与宽平稳描述正确的是(D)A宽平稳一定不是严平稳。B严平稳一定是宽平稳。C严平稳与宽平稳可能等价。D对于正态随机序列,严平稳一定是宽平稳。3、纯随机序列的说法,错误的是(B)A时间序列经过预处理被识别为纯随机序列。B纯随机序列的均值为零,方差为定值。C在统计量的Q检验中,只要QQUOTE时,认为该序列为纯随机序列,其中m为延迟期数。D不同的时间序列平稳性检验,其延迟期数要求也不同。4、关于自相关系数的性质,下列不正确的是(D)A.规范性;B.对称性;C.非负定性;D.唯一性。5、对矩估计的评价,不正确的是(A)A.估计精度好;B.估计思想简单直观;C.不需要假设总体分布;D.计算量小(低阶模型场合)。6、关于ARMA模型,错误的是(C)AARMA模型的自相关系数偏相关系数都具有截尾性。BARMA模型是一个可逆的模型C一个自相关系数对应一个唯一可逆的MA模型。DAR模型和MA模型都需要进行平稳性检验。7、MA(q)模型序列的预测方差为下列哪项(B)A、B、C、D、8、ARMA(p,q)模型的平稳条件是(B)A.的根都在单位圆外;B.的根都在单位圆外;C.的根都在单位圆内;D.的根都在单位圆内。9、利用自相关图判断一个时间序列的平稳,下列说法正确的是(A)A自相关系数很快衰减为零。B自相关系数衰减为零的速度缓慢。C自相关系数一直为正。D在相关图上,呈现明显的三角对称性。10、利用时序图对时间序列的平稳性进行检验,下列说法正确的是(C)A如果时序图呈现明显的递增态势,那么这个时间序列就是平稳序列。B如果时序图呈现明显的周期态势,那么这个时间序列就是平稳序列。C如果时序图总是围绕一个常数波动,而且其波动范围有限,那么这个时间序列是平稳序列。D通过时序图不能够精确判断一个序列的平稳与否。三、概念解释1、AR模型的定义具有如下结构的模型称为阶自回归模型,简记为AR(p)2、偏自相关系数对于平稳AR(p)序列,所谓滞后k偏自相关系数就是指在给定中间k-1个随机变量的条件下,或者说,在剔除了中间k-1个随机变量的干扰之后,对影响的相关度量。用数学语言描述就是3、MA模型的定义具有如下结构的模型称为阶自回归模型,简记为MP(q)ARMA(p,q)模型的可逆条件:q阶移动平均系数多项式的根都在单位圆外,即ARMA(p,q)模型的可逆性完全由其移动平滑部分的可逆性决定。四、计算题1、求平稳AR(1)模型的协方差递推公式平稳AR(1)模型的方差为协方差函数的递推公式为2、计算下列MA(q)模型的可逆性条件解:逆函数逆转形式逆函数、逆转形式3、求ARMA(1,1)模型中未知参数的矩估计。解:根据ARMA模型Green函数的递推公式,可以确定该ARMA(1,1)模型的Green函数为:推导出:则:整理方程组得:考虑可以条件:得到未知参数矩估计的唯一解:五.证明题1、证明AR(2)模型的平稳的充要条件为且2.设时间序列来自过程,满足,其中,证明其自相关系数为 注:为延迟算子,使得;为差分算子,。1.若零均值平稳序列,其样本ACF和样本PACF都呈现拖尾性,则对可能建立(B)模型。A.MA(2)B.ARMA(1,1)C.AR(2)D.MA(1)2.下图是某时间序列的样本偏自相关函数图,则恰当的模型是(B)。A.B.C.D.3.考虑MA(2)模型,则其MA特征方程的根是(C)。(A)(B)(C)(D)4.设有模型,其中,则该模型属于(B)。ARMA(2,1)B.ARIMA(1,1,1)C.ARIMA(0,1,1)D.ARIMA(1,2,1)5.AR(2)模型,其中,则(B)。A.B.C.D.对于一阶滑动平均模型MA(1):,则其一阶自相关函数为(C)。A.B.C.D.7.若零均值平稳序列,其样本ACF呈现二阶截尾性,其样本PACF呈现拖尾性,则可初步认为对应该建立(B)模型。A.MA(2)B.C.D.ARIMA(2,1,2)8.记为差分算子,则下列不正确的是(C)。A.B.C.D.填空题(每题3分,共24分);1.若满足:,则该模型为一个季节周期为__12____的乘法季节模型。2.时间序列的周期为s的季节差分定义为:_____________________________。3.设ARMA(2,1):则所对应的AR特征方程为________________,其MA特征方程为_____________________。4.已知AR(1)模型为:,则=_______0_____________,偏自相关系数=__________________________,=________0__________________(k>1);5.设满足模型:,则当满足________________时,模型平稳。6.对于时间序列为零均值方差为的白噪声序列,则=___________________________。7.对于一阶滑动平均模型MA(1):,则其一阶自相关函数为_______________________________________________。一个子集模型是指_形如__模型但其系数的某个子集为零的模型_。已知某序列服从MA(2)模型:,若预测未来2期的值;求出未来两期预测值的95%的预测区间。解:(1)==(2)注意到,。因为故有,。未来两期的预测值的的预测区间为:,其中。代入相应数据得未来两期的预测值的的预测区间为:未来第一期为:,即;未来第二期为:,即。设时间序列服从AR(1)模型:,其中是白噪声序列,为来自上述模型的样本观测值,试求模型参数的极大似然估计。解:依题意,故无条件平方和函数为易见(见p113式(7.3.6))其对数似然函数为所以对数似然方程组为,即。解之得。五、计算题(每小题6分,共12分)判定下列模型的平稳性和可逆性。(a)(b)解:(a)其AR特征方程为:,其根的模大于1,故满足平稳性条件,该模型平稳。其MA特征方程为:,其根的模大于1,故满足可逆性条件。该模型可逆。综上,该模型平稳可逆。(b)其AR特征方程为:,其根为,故其根的模为小于1,从而不满足平稳性条件。该模型是非平稳的。MA特征方程为:,其有一根的模小于1,故不满足可逆性条件。所以该模型不可逆。综上,该模型非平稳且不可逆。计算题(每小题5分,共10分)某AR模型的AR特征多项式如下:写出此模型的具体表达式。此模型是平稳的吗?为什么?解:(1)该模型为一个季节ARIMA模型,其模型的具体表达式是(其中B为延迟算子)或者。(2)该模型是非平稳的,因为其AR特征方程=0有一根的模小于等于1,故不满足平稳性条件。七、计算题(此题10分)设有如下AR(2)过程:,为零均值方差为的白噪声序列。写出该过程的Yule-Walker方程,并由此解出;(6分)求的方差。(4分)解答:(a)其Yule-Walker方程(见课本P55公式(4.3.30))为:解之得。(b)由P55公式(4.3.31)得。北京师范大学珠海分校2008-2009学年第一学期期末考试(B卷)答案开课单位:应用数学系课程名称:时间序列分析任课教师:吴春松考试类型:闭卷考试时间:120分钟学院应用数学系06级姓名__________学号_____________班级________题号一二三四五六总分得分阅卷人试卷说明:(本试卷共4页,满分100分)一、填空题(每空3分,共30分);1.所谓时间序列分析是指:对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势(就是时间序列分析)。2.给出一个简单的时间序列实例:某同学一周七天每天花费的基本生活费15,13,16,17,15,18,20(单位:元)。3.平稳时间序列自相关图的特点:平稳序列通常具有短期相关性,用自相关系数来描述就是随着延迟期数k的增加,平稳序列的自相关系数会很快衰减向零。4.已知AR(1)模型为:,则=___0__,偏自相关系数=________0.8_____。5.设{为一时间序列,B为延迟算子,则。6.假设线性非平稳序列{形如:,,则。7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论