时间序列分析报告报告材料地介绍和应用的_第1页
时间序列分析报告报告材料地介绍和应用的_第2页
时间序列分析报告报告材料地介绍和应用的_第3页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、时间序列分析时间序列通常是对某一统计指标,按照相等时间间隔测量的一系列数据点,它反映的是某变量在时间上的一系列变化。大量社会经济统计指标都依年、季、 月或日统计其指标值,随着时间的推移,形成了统计指标的时间序列。例如,过去每年国内生产总值数据、过去十年内年度增值税收入数据、过去五年内季度关 税数据等等。时间序列分析就是估算和研究某一时间序列在长期变动过程中所存 在的统计规律,具体是指,我们只知道需要预测的那个变量 (简称预测变量)在历 史上的一系列观察值,通过分析这些观察值所显示出来的规律,如长期变动趋势、 季节性变动规律、周期变动规律,然后把这个规律外推到预测期,从而获得该预 测变量的值或分

2、布,并进一步预测今后的发展和变化。一、时间序列的变动因素一般认为,一个时间序列中包含四种变动因素: 长期趋势变动、季节性变动、 周期性变动和不规则变动。换言之,时间序列通常是上述四种变动因素综合作用 的结果。1、长期变动趋势(T: Secular Trend )长期变动趋势是指变量值在一个长时期内的增或减的一般趋势。长期变动趋 势可能呈现为直线型变动趋势,也可能呈现曲线型变动趋势,依变量不同而异。2、季节性变动(S: SeasonaI Variation )季节性变动是指变量的时间序列值因受季节变化而产生的变动。季节变动是一种年年重复出现的一年内的季节性周期变动,即每年随季节替换,时间序列值

3、呈周期变化。3、周期性变动(C: Cyclical Variation )周期性变动又称循环变动,它是指变量的时间序列值相隔数年后所呈现的周 期变动。在一个时间序列中,循环变动的周期可以长短不一,变动的幅度也可大 可小。4、不规则变动(I: Irregular Variation )不规则变动是指变量的时间序列值受突发事件,偶然因素或不明原因所引起的非趋势性、非季节性、非周期性的随机变动,因此,不规则变动是一种无法预 测的波动。图1显示的是我国1997年1月至2007年12月的月度消费者价格(CPI) 指数(同比)。由图中,我们可以看出明显的季节性(月度)和年周期性变动, 对长期变动趋势,图表

4、显示自2004年有较为明显的增长趋势,而 2007年的数 据的相对平稳则反映了国家价格宏观调控政策的成效。图1:我国消费者价格指数(同比)变动情况(月度)CPI一个时间序列通常包含上述四种变动因素, 但不是所有的时间序列都含有这 四种变动因素。例如,年份统计表数据就不存在季节性变动因素, 而按季统计的 数据不一定就存在周期性变动因素。在某些时间序列中,季节变动和周期性变动 可能同时存在,亦可能不同时存在。二、时间序列的分析模型时间序列预测是指使用一个模型,在未来数据被实际测量之前,利用过去已 知的数据对其作出预测。比如,依据股票过去的表现预测股票的开盘价格, 依据 汇率的过去数值推导未来的预期

5、汇率值,在今年的预算程序中预测明年的税收收 入等等。时间序列法的显著特征是它只使用以前时间段的信息进行预测。 除了它自己 过去的数值之外,时间序列预测独立于所有的变量。 因此,用时间序列法进行的 税收收入预测不需要其他经济变量如 GDP的预测。时间序列分析模型可以有许多种形式,基本形式有变动因素分析法、趋势分 析法和自回归法。(一)变动因素分析法一个时间序列通常包括上述四种或其中几种变动因素, 趋势分析法的基本思 路就是将其中的变动因素一一分解出来, 测定其变动规律,然后再综合反映它们 的变动对时间序列变动的影响。采用何种方法分析和测定时间序列中各因素的变动规律取决于对四种变动 因素之间相互关

6、系的假设。一般可对时间序列各变动因素关系做二种不同的假 设,即加法关系假设或乘法关系假设,由此形成了相应的加法模型或乘法模型。1、加法模型加法模型假设时间序列中四个变动因素之间是相互独立且其数值可依次相 加,即Yt = T t + St +C t +11其中:Yt表示变量在t时间的取值;Tt表示变量在t时间的长期趋势值;St、Ct和It分别表示季节变动、周期变动和不规则变动与长期趋势 值的离差。显然,加法模型假设季节因素,周期因素和不规则因素的变动均围绕长期趋 势值上下波动,它们可表现为正值或负值,以此测定其在长期趋势值的基础上增 加或减少若干个单位,并且反映其各自对时间序列值的影响和作用。2

7、、乘法模型乘法模型假设时间序列中四个变动因素之间为相乘关系,即变量的时间序列 值是各因素的连乘积。以公式表示Yt = T t * St*Ct *It其中:Yt表示变量在t时间的取值;Tt表示变量在t时间的长期趋势值;St、Ct和It分别表示季节变动、周期变动和不规则变动与长期趋势 值的变动率。显然,乘法模型也假设季节因素,周期因素和不规则因素的变动围绕长期趋势值上下波动,但这种波动表现为一个大或小于1的系数或百分比,以此测定其 在t时间的长期趋势值的基础上增加或减少的相对程度, 并且反映其各自对时间 序列值的影响和作用。(二) 趋势分析法趋势分析通常以年度或季度数据为基础。以年度数据为例,假设

8、在预测年(t )中具体税收收入(丫)是前一年度收入的函数,Y f (Yt i,Yt 2,)。趋势 分析可以假设预测年税收收入绝对增长幅度和过去年度一样,用公式表示为Yt Yt1 (Yt1 Yt 2);或假设增长幅度为以前年的一个百分比,用公式表示为X Yt1*(Yt1/Y2);或假设和过去几年的平均百分比一样,用公式表示为Yt Yt 1* 均值(Yt 1/Y 2)," 2/Y 3),.,(丫 n 1/Y n);或假设税收收入以时间函数,即简单趋势线,用公式表示为Yt f (时间)。趋势分析方法的优点是:第一,对数据的要求较少,仅要求要进行预测的数 据序列,而且时间序列也不用太长。第二

9、,简单,模型很容易建造和运行。但其 缺点也同样明显。该方法利用历史数据估计模型的参数, 其参数的稳定性依赖于 历史的宏观经济政策。如果宏观经济政策发生变动,这些参数也会变动。根据趋 势外推而得出的预测,特别是长期预测,必然误差较大。如果将趋势分析方法应用于税收收入预测,需要注意的是该方法一般只适用 征收相对稳定的税种、或长期以来征收额稳定增长的税种、 或在预测期内没有发 生税率或规则改变的税种的税收收入的预测。由于该方法忽视其他经济变量的信 息和预测,对依靠经济环境变化的许多税种都不适合。 不过,当发生税率或规则 改变时,如果考虑变化因素并对历史数据进行调整的话, 还是可以使用趋势分析 法的。

10、(三) 自回归技术1. 几个重要的概念1.1弱平稳性对时间序列数据进行回归分析,必须要求该数据是平稳序列。因此,我们首先要做的工作是确定该数据平稳与否。平稳性是指该系列数据达到统计平衡状 态,其统计特性不随时间而变化。完全平稳(严平稳)的条件十分苛刻,所以, 一般只要求时间序列分布的主要统计特征相同即可。实践中常用的平稳概念实际是二阶平稳,称为弱(宽)平稳。在以下论述中,如不特别说明,所涉及的平稳 的概念均为弱(宽)平稳。弱平稳要满足如下三个条件:(1) E(Xt) = ,即均值与t无关(2) Var(Xt) = /,即方差与t无关(3) Cov(Xt, Xs)是t-s的函数,但不是t或s的函

11、数,即协方差是t-s的函 数。如果某时间序列数据满足以上三个条件, 我们称该数据具有平稳性特征,或 直接称之为平稳数据。1.2自相关函数(ACF)自相关函数定义:设Xt为平稳序列,则对任意 整数r:COV Xt,Xt r E XtXt r2E XtXt rR r自相关函数为:R rrR 0样本自相关函数为:ACF ?n k,t1(Xt X)(Xtk X)n 2t1(Xt X)2n其中 Xt1Xt/n样本自相关函数?可以说明不同时期的数据之间的相关程度, 其取值范围在-1到1之间,绝对值越接近于1,说明时间序列的自相关程度越高1.3偏自相关函数(PACF)偏自相关函数是给定了 Xt 1,Xt 2

12、,-,Xt k 1的条件下,Xt和之后k期的Xt-k的相关性。样本的偏自相关函数(PACF)计算公式如下,< A"1Ait-1dr k = 2,3,Ly-i其中,矶=%-ij 宓用n *其中,?为样本自相关函数。偏自相关函数表示给定其他时期数值,两 个时期之间的相关系数,系数越高,则表明关联度越高。1.4 白噪声(white noise )如果一个平稳序列具有如下特征,则称为白噪声(white noise )序列:对所有 s t, Cov(Xs,XJ 0由此,我们可以看出白噪声序列的自相关函数为:R rcov Xt,Xt r2,r 00,r0r1,r00,r0白噪声满足弱平稳的

13、三个前提条件,因此,白噪声具有平稳性特征。1.5随机游走(random walk )序列下面我们介绍一典型的非平稳序列:随机游走(random walk )序列。该序列(Xt)表示为:X t X t i u t ut为白噪声X1 u1X 2u1u2X 3 Ui U2 U3tXtUjj 1var X t很明显,随机游走序列不满足平稳序列条件(2 )。2. 平稳性检验对平稳性进行检验,通常有三种做法:直接观察、自相关函数和单位根检验。 在进行时间序列分析时应随时保持对非平稳性的警惕。当对非平稳序列错误的应 用平稳时间序列模型时有一些表征可以帮助进行初步判断 :1)时间序列的偏相关系数函数图递减速度

14、较普通稳定序列慢。2) 自回归项的系数值的和接近 1 (如和等于0.98 )或大于等于1,而且回 归系数的t值非常大,显得非常显著这是因为估计值理论上是超一致的 ,估计值的方差(或标准差)大样本下趋于0,产生一个所谓退化的分布。由于t值等于估计值除以标准差,标准差接近 0将使t值特别大,这是所谓伪回归的一种表现。 O3)模型的R方特别大,超过90%,接近1,如96% 这也是伪回归下参数估计超一致性产生的一种假象。2.2自相关函数法一般来说,平稳序列自相关系数递减较快,而非平稳序列递减非常慢。但这 条规则也不绝对。表1显示的是我国1997年1月至2007年12月的月度消费 者价格(CPI)指数(

15、同比)的自相关函数(ACF)和偏自相关函数(PACF)。 可以看出该时间序列的ACF具有一定延续性,尤其是在滞后11,12和13期还 有影响。因此,很难由该表给出的数据推导出该时间序列是否平稳。如果一个序列为白噪声,其滞后1期以上的自相关系数应该等于 0,所以一 般通过检验前m个相关系数均为0这一原假设来判断一个序列是否为白噪声。对白噪声检验常用的统计量有 LB统计量。LB统计量(Ljung & Box )公式。在这些情况一种或 几种出现的时候,虽然不完全就是因为序列不稳定,但这时序列不稳定的概率很 大,因此必须保持必要的警惕,对序列进行平稳性检验。2.1直接观察法直接观察法是指通过对

16、数据图表的直接观察初步确定其规律,如图2所示。相对于右图而言,左图所代表的数据具有相对稳定性。 由此,我们可以初步判断右图数据不具有平稳性特征,而左图数据则更有可能具有平稳性特征。直接观察 法做出的是一个初步的估计,不能作为判断依据,必须借助于规范的统计分析工 具,才能做出准确判断。图2 :数据特征初步确定表示为:Q n(n 2)?k2k1 n该统计量在大样本下也服从自由度为 m的卡方分布。即使在小样本条件下, LB统计量表现也较好。如果拒绝原假设(原假设为由1阶到m阶均不存在自相 关性),意味着前m期自相关系数中,至少有一个不等于 0,认为该序列不是白 噪声。如果为白噪声,意味着没有建模的必

17、要,所以,白噪声检验也是建模的先 期工作之一。表1:我国月度消费者价格(CPI)指数(同比)的自相关分析Sample: 1997M01 2007M12Included observations: 132AutocorrelationPartial CorrelationACPACQ-StatProb|* |* |10.5760.57644.8010.000.|* |.|. |20.316-0.02358.4090.000.|* |.|* |30.2330.08965.8280.000.|* |.|. |40.1830.02770.4500.000.|* |.|. |50.109-0.03172

18、.0940.000.|. |.|. |60.059-0.00872.5760.000.|. |.|. |70.0700.05073.2740.000.|* |.|. |80.0980.05274.6490.000.|* |.|. |90.1030.02976.1900.000.|* |.|* |100.1400.08479.0120.000.|* |.|* |110.3520.33797.1490.000|* |* |120.7100.613171.560.000.|* |*| |130.303-0.785185.210.000.|. |.|. |140.066-0.033185.850.00

19、0.|. |*|. |15-0.021-0.153185.920.000*|. |*|. |16-0.078-0.080186.860.000*|. |.|. |17-0.1510.015190.350.000*|. |.|. |18-0.192-0.018196.090.000*|. |.|. |19-0.179-0.040201.110.000*|. |.|. |20-0.1490.040204.620.000*|. |.|* |21-0.1280.091207.220.000*|. |.|* |22-0.0750.088208.120.000.|* |.|. |230.1430.0222

20、11.430.000|* |.|. |240.4890.063250.580.000.|* |.|. |250.1430.046253.980.000.|. |*|. |26-0.053-0.117254.450.000*|. |.|* |27-0.1130.083256.590.000*|. |.|* |28-0.1360.083259.720.000*|. |.|. |29-0.1720.029264.820.000*|. |.|. |30-0.1840.030270.690.000*|. |.|* |31-0.1450.084274.380.000*|. |.|. |32-0.0970.

21、002276.050.000.|. |.|. |33-0.063-0.039276.760.000.|. |.|. |34-0.0020.022276.760.000.|* |.|. |350.2200.058285.620.000|* |.|. |360.551-0.006341.660.0002.3 单位根检验(unit root test )2.3.1 DF 检验(Dickey - Fuller test )XtXt i Ut等价于Xt Xt 1(1)XtiUtXtXt i ut其中1。如果存在单位根,即1,那么 0。因此定义原假设H0:0 (非平稳时间序列)等价于Ho:1似乎可以直接对

22、XtXt 1 Ut进行OLS线性回归,并对系数 进行t检验,但是这是不对的。因为在原假设为真时,存在单位根,系数的t统计量不再服从常规的t分布了,需要构造特殊临界值才能检验。给定样本大小的临界值 最早由Dickey和Fuller( 1979 )提出,所以单位根检验的统计量习惯称为DF统计量。不同的模型临界值是不同的,如果序列发展有明显的确定趋势,应该选用后XtXtXt两种模型进行检验:X t 1 ut0 X t 1 ut01tX t 1 ut得到的DF统计量越小越好,当小于临界值时,可以拒绝原假设,认为不存在单位根。对于方程1,说明序列为平稳序列。对于方程 2、3,说明序列在剔除确定趋势后为平

23、稳序列DF检验临界值(大样本)模型1%5%10%X t X t 1 ut-2.56-1.94-1.62X t0X t 1u t-3.43-2.86-2.57X t01tXt 1Ut-3.96-3.41-3.13标准临界值-2.33-1.65-1.282.3.2 ADF 检验(Augmented Dickey Fuller test )由于很难保证随机误差项是白噪声,所以Dickey和Fuller对检验进行改进,允许随机误差项服从一个移动平均过程:Utcj t jj 0修改后的模型为:mXtXt 1i Xt iuti 1mXt0Xt 1iX t i uti 1mXt01tX t 1i Xti 1

24、ut用上述模型进行的单位根检验称为 ADF检验(augmented dickey-fuller ), 临界值与DF检验相同。使用Eviews进行单位根检验,Eviews提供了如下三种检验形式:无常数项 和线性时间调整项、包含常数项和包含常数项和线性时间调整项。选择 Quick/Series Statistics/Unit Root test ,输入序列名即可。表2给出消费者价格指数(同比)的 ADF检验结果。可以看出t统计值以2%的显著水平拒绝原假设,即 CPI不存在单位根,该时间序列为平稳数据。表2: ADF检验结果(CPI)Null Hypothesis: CPI has a unit r

25、ootExoge no us: Con sta ntLag Length: 12 (Automatic based on SIC, MAXLAG=12)t-StatisticProb.*Augme nted Dickey-Fuller test-3.20862statistic10.0219Test criticalvalues:1% level-3.4860645% level-2.88586310% level-2.579818*MacKi nnon (1996) on e-sided p-values.3 时间序列模型3.1平稳时间序列模型自回归移动平均模型(ARMA )是平稳时间序列分

26、析模型的普遍形式,自回 归模型(AR)和移动平均(MA )是它的特殊情况。就这几类模型的研究,是时 间序列分析的重点内容。其主要分析包括,模型的平稳性分析、模型的识别和模 型的估计。其中模型的平稳性通过它所生成的时间序列的平稳性来判断。过程:P 阶自回归模型(Autoregressive Process )Xt1 Xt 12X t 2 .p Xt p Ut其中ut是白噪声,即均值为0,同方差,无自相关。AR(P)模型的特征是除 了滞后的X之外,没有其他的解释变量。如果该AR(P)过程生成的时间序列是平 稳的,那么该AR(P)模型是平稳的。引入滞后算子(Lag Operator )L,LXt =

27、 Xt-1 ,L2Xt = Xt-2,,LpXt = X t-p,由此,AR(P)过程表示为,(1 丄 2L2 .pLp)Xtut记(L) 1 丄 2L2 .pLp,称该式为多项式方程。(L) 1 丄2L2 .pLp 0为AR(p)的特征方程。AR(p)模型的平稳性条件要求Xt的均值和方差和自协方差都是有限的常数。可以证明,这要求多 项式方程(L)0的根的模都大于1。例1. AR (1 )模型的平稳条件对一阶自回归模型AR (1)XtXt 1 ut其中ut是白噪声定理:若| 1,则AR(1)过程是平稳过程。因为(3)cov(Xt,Xth) 12 Ih|2图3给出了根据随机过程产生的数据所绘制的

28、图形(给定X1 = 0)。通过比较可以看出,当P小于1时,生成的数据具有稳定性特征。对于高阶自回归模型来说,多数情况下没有必要直接计算其特征方程的特征根。但一些有用的规则可用来检验高阶的稳定性,(1)AR(p)模型稳定的必要条件是(2)由于2. p可正可负,AR(p)模型稳定的充分条件是图3: 一阶自回归随机过程数据图xt+i =5+0.8*x t+2* utxt+i =5+0.95*x 汁2* utxt+i =5+0.15*x t+2* utxt+i =5+1.0*x t+2* ut3.1.2. MA(q)过程:移动平均模型(Moving Average )Xt Ut1Ut 12Ut 2 -

29、qUt q其中ut是白噪声,即均值为0 ,同方差,无自相关。与AR模型不同,MA(q)模型始终是平稳的,但是出于实际应用分析的需要,我们一般也要求MA模型对应的多项式方程 (L) 0的根的模都大于1。该条件保证了 MA模型的所谓可逆性,这是我们可以对一个 MA模型使用实际观察到的数据进行估计分析的前提条件。EXtEut1Eut 12Eut 2q Eut qvar(Xt) (112.q2)cov(Xt,X)()2q 1 q ucov(Xt,Xt q 1)q COV(Xt,Xt q)当滞后期大于q时,Xt的子协方差系数为0。有限阶移动平均模型总是平稳的。3.1.3. ARMA(p, q)过程:自回

30、归移动平均模型(ARMA)自回归移动平均模型(ARMA )是自回归模型(AR)和移动平均(MA )的组合,因此,ARMA(p, q)用公式表示为X t1X t 12 X t 2 -pX t p ut M 12W 2 - qut q由于MA(q)总是平稳的,模型的平稳性则取决于AR(P)部分的平稳性。当AR(P)部分平稳时,该ARMA(p, q)模型是平稳的。对于平稳序列而言,三个模型具有如下等价转换关系:AR (有限阶)MA (无限阶)MA (有限阶)AR (无限阶)ARMA (有限阶)AR (无限阶)ARMA (有限阶)MA (无限阶)3.2 非平稳时间序列模型:ARIMA(p, d, q)

31、过程积分过程(integratedprocess ),也被称为“单整过程”。如果Xt是非平稳过程,但是一阶差分以后Xt (1 L)Xt Xt 是平稳过程,则称Xt为一阶积分过程,记为I(1)。如果dXt (1 L)dXt是平稳过程,也即一个序列进 行d次差分后,可以成为平稳序列,则称Xt为D阶积分过程,记为I(d)。显然, I(0)过程是平稳序列。当回归模型中含有非平稳的I(d)序列时,常规的统计推断都不再成立,因此, 我们须将一个非平稳时间序列通过d次差分,将它变为平稳的,然后用一个平稳 的ARMA(p,q)模型作为它的生成模型,我们就说该原始时间序列是一个自回归 单整移动平均(ARIMA,

32、autoregressive integrated moving average)时间序列,记为ARIMA(p,d,q)。例如,一个ARIMA(2,1,2)时间序列在它成为平稳序 列之前先得差分一次,然后用一个 ARMA(2,2)模型作为它的生成模型的。当然, 一个ARIMA(p,0,0)过程表示了一个纯AR(p)平稳过程;一个ARIMA(0,0,q)表示 一个纯MA(q)平稳过程。3.3. 模型的构建Box-Jenkins建模的特点是:不寻找解释变量,直接根据预测变量自身以往的表现,寻找规律,进行预测。它不以任何经济理论为基础。Box-Jenkins建模的主要思路是:研究平稳序列的建模,对于

33、非平稳序列,先变为平稳序列再使用 平稳序列的模型。将不平稳序列变为平稳的手段有差分、剔除趋势或取对数。基本模型类别包括AR(p)? MA(q)? ARMA(p, q)? ARIMA(p, d, q)模型识别的依据包括自相关函数和偏自相关函数。自相关分析法是进行时间 序列分析的有效方法,它简单易行,较为直观,根据绘制的自相关分析图和偏自 相关分析图,我们可以初步地识别平稳序列的模型类型和模型阶数。基本判断原则如下,? 自相关函数拖尾、偏自相关函数截尾,为AR序列,p阶截尾就为AR(p);?自相关函数截尾、偏自相关函数拖尾,为 MA序列,q阶截尾就为MA (q);? 自相关函数、偏自相关函数均拖尾

34、,为 ARMA序列对ARMA模型,需要使用AIC (赤池信息准则)和SIC (施瓦茨准则) 等准则进行判断34模型的估计和预测ARIMA模型预测的基本程序(1)根据时间序列的散点图、自相关函数和偏自相关函数图、 以ADF单位 根检验其趋势及其季节性变化规律, 对序列的平稳性进行识别。一般来讲,经济 运行的时间序列都不是平稳序列。(2 )对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分、剔除趋势或取对数处理。(3 )根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏自相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合 AR模型;若平

35、稳 序列的偏自相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA 模型;若平稳序列的偏自相关函数和自相关函数均是拖尾的, 则序列适合ARMA 模型。同时根据信息标准 AIC和SIC来协助判断阶数。(4)进行参数估计,检验是否具有统计意义。(5)进行假设检验,诊断残差序列是否为白噪声。(6)利用已通过检验的模型进行预测分析。3.5时间序列分析的总结和一些建模经验指导现代时间序列分析技术主要以 Box和Jenkins提出的工作步骤为基础。简 单来说Box-Jenkins时间序列分析方法涉及以下四个步骤:模型设定、模型估 计、模型适用性检查和应用模型统计推断与预测。我们前面讲解的知识都是紧

36、紧 围绕这四个部分来进行的,每一类知识都是为这四个步骤中的一步或多步服务, 而各类相关知识也就通过这四个步骤而串联起来。我们在这里总结了这四个步骤主要的内容和一些经常需要考虑的问题和经验,以供读者建模时参考。我们对这部分一些实际操作时特别需要注意的具体问题标了黑体字,希望读者注意。请记住,任何统计模型都是对不确定性事件的研究,时间序列模型是对随机过程中不确定性的近似,因此没有人能确定地说某一个模型就是一定正确的,但 是模型的确定必须要服从一些必要的统计规律。在确定一个模型是否可用时首先要通过统计证据说服自己这个模型是可行的,并随时保持对模型错误的警惕。另外,在时间序列建模需要注意两个总的原则:

37、1)模型的参数个数在模型满足统计推断要求的情况下应尽量少,即可达到同样统计目的的两个模型参数少 的一个为佳。这是因为增加参数增加了模型估计的难度和估计的不确定性。2)大部分时间序列模型理论建立在大样本的前提上,因此时间序列模型的建模通常要求样本量足够大。保守地说,样本量小于30个产生的时间序列模型估计一般 认为是不可靠的。第一步、模型设定。对于单变量的时间序列,常用的时间序列模型有p阶自回归模型【AR(p )】、 q阶移动平均模型【MA (q )】、和p阶自回归q阶移动平均模型【ARMA (p, q)】。模型设定的任务即选择一种合适的模型和阶数。进行Box-Jenkins 时间序列分析最重要的

38、前提是被研究的时间序列必须是 弱稳定的。整个Box-Jenkins时间序列分析的一系列统计理论都基于弱稳定这 个前提条件,对一个非弱稳定的时间序列应用针对弱稳定时间序列的理论进行统 计推断是不正确的需要注意的是,当对含有单位根的序列不做差分就应用平稳时间序列模型时,由于估计值是大样本超一致 的(super consistency),单纯应用于点预测是允许的,但预测置信区间可无穷大,因此一般不推荐这样做。方法上,非弱稳定的序列自回归项含有单位根,因此可以使用单位根检验(常用的是 ADF检验)来区分一个序列是否稳定。若检验发现 序列不稳定,我们可通过一些技术如对序列差分来得到一个弱稳定的序列,然后

39、再进行下一步分析。对于稳定的时间序列,模型设定要求我们对使用什么模型和模型阶数进行判断。这时我们可以使用的判断方法有两种:(1 )观察自相关系数图和偏自相关系数图;(2 )查看信息准则。通过对理论上ARMA模型自相关系数和偏自相关系数的推导可以发现, AR(p)模型的偏自相关系数图在p+1阶时为零;而MA( q )模型的自相关系数 图在q+1阶时为零。理论上的发现为实际数据分析提供了指导。在弱稳定性前 提下,我们可以使用样本估计序列的自相关系数和偏自相关系数。通过观察这两个样本系数图的显著性来确定模型类型和阶数。我们也可以通过被称之为“信息标准”的一系列准则来判断模型的阶数,这 些信息准则常用

40、的包括 AIC(赤池信息准则)和SIC(施瓦茨准则)。使用不同的 模型阶数,我们可以得到不同的AIC或SIC值(一般软件都直接计算给出了值), 我们选取产生最小AIC值或SIC值的阶数作为模型阶数。在模型设定时,几个经验性的原则可供参考:1)第一步的模型设定只是提供了初步的模型设定,模型必须通过第三步的模型适用性检查。一般来说, 要求模型残差呈现白噪声的形态。2)在使用两种相关系数图进行判断时,一般 以AR模型为首选项,MA模 型为次选项,最后再使用 ARMA模型。这是因为AR模型系数估计比其他两种 模型容易和精确。而且使用相关系数图对 ARMA模型的阶数进行判断通常不容3)在使用AIC和SI

41、C进行阶数判断时,AIC倾向于多选阶数,而SIC倾向 于少选阶数,不论用那种方法都是可行的,但是最终确定的模型必须通过适用性 检验。一般来说,如使用AIC进行判断,则可以观察模型系数的t值,删除一些 不显著的参数,并进行适用性检验,这是因为AIC倾向多选阶数;而如果使用SIC,则应观察模型残差是否是白噪声,若不是则可尝试增加阶数,这是因为SIC 倾向少选阶数致使残差互相相关。4 )不论是使用相关系数进行判断,还是使用信息准则判断,都只是给出了初步判断,模型的最终确定要通过第三步的模型适用性检查。5)不论是使用相关系数进行判断,还是使用信息准则判断,都要先确定一 个最大可能阶数,并使用同样长度的

42、样本量进行估计。 例如,我们希望判断一个 样本X1,,Xioo的AR模型阶数。对这个样本量为100的序列使用AIC准则判 断时,我们先确定最大可能阶数为 10。那么我们将使用AR (1 )到AR (10) 的模型去模拟序列,计算 AIC值,选取最小AIC值对应的模型。但请注意,使 用AR (10)的模型我们需要10个初始值(即X1,X10),最后估计使用的样本 是后90个值(即X11,X100 )。为保证计算AIC值时使用的样本是同一个样本, 在计算AR (9)的模型时我们需要9个初始值,这时应使用X2,X10作为初始 值,而不是使用(X1,X9),这么做可以保证最后对 AR(9)模型估计时使

43、用的样 本仍然是相同的后90个值(即X11,X100)。另外,最大阶数的判断并没有确定 的方法,一般来说应足够大以把模型真实阶数包含在内,因此如以上示例发现AIC选择的阶数为10的时候,应扩大最大阶数(如设为15,固定使用X15,X100 的样本估计)重新进行AIC的计算。第二步、模型估计。一系列时间序列ARIMA模型的估计可用条件极大似然估计法。 因为目前的 各种时间序列分析软件都能直接估算并给出参数估计值,本文没有就估计的情况 做更详细的介绍。但我们指出一个重要结论,可以证明 AR模型条件极大似然估 计等价于最小二乘法(OLS)。注意这个结论的前提是样本量够大,没有足够的 样本由于无法消除

44、初始值的影响是不能得到该结论的。这也说明了为什么时间序列模型建模要求数据足够多。另外,由于 MA项不能直接观察到,估计 MA或 ARMA的模型不能使用最小二乘法,必须使用极大似然估计法,这样相对较复 杂,而且估计的不确定性较 AR模型增大,因此一般推荐使用 AR模型为先。第三步、模型适用性检查。在模型参数估计出来后,我们可以就模型对数据的适用性进行一些分析检查。模型检查主要是检验模型的一些假设条件是否被满足。一般来说,最重要是检查残差是不是白噪声,这可以通过残差序列的自相关系数检验和 LB统计检验 (又叫Q检验)来验证。此外,还可检验残差序列是不是满足正态分布的假设, 这个通过JB检验来完成。

45、若模型适用性检验不能满足,那么我们应回到第一步,重新建立模型、估计、 检验,直到找到模型通过适用性检查。第四步、应用模型统计推断与预测。当找到通过模型适用性检验的模型后,我们可以用于统计检验和预测。预测 可以通过迭代法完成,而且根据估计值的标准差还可以建立预测区间估计。三、时间序列分析的应用我们将以上介绍的时间序列分析方法具体应用于国内增值税(1999年1月 到2009年4月的月度数据)的研究分析。具体而言,以实际税收数据为例,依 据时间序列模型分析顺序,逐一说明和解释数据处理、模型设定、模型估计、模 型适用性检验和模型预测等步骤,以增强时间序列分析方法的实际操作性。图4显示的是增值税数据的散

46、点图。我们可以看出我国增值税税收收入呈现 明显的逐年递增趋势。月度间数据的差异也较为明显,但该波动并不具有明显的 规律性。由此,该数据具有长期变动趋势,但季节性和周期性变动不显著。我们 在模型设定上就应该要考虑数据的长期递增特征。图4:增值税数据的散点图(月度)对数据进行平稳性检验。所运用的计量工具是 ADF检验。表3给出增值税月度数据的ADF检验结果。结果显示,尽管对数据作了一阶差分处理,并加入常数项和线性时间调整项后,检验结果依然显示数据具有单位根。 处理后的时间序列数据依然是不平稳的。由此,我们认为有必要对数据先取对数,以求在一定程度上平缓数据波动。表4为取自然对数处理之后增值税数据的A

47、DF检验结果。数据作了一阶差分处理,并加入常数项后,该数据显示具有平稳性。由此,取自然对数并作一阶 差分处理后的增值税数据,将成为我们分析的基础数据。表5显示的是处理之后的增值税数据的自相关分析结果。Eviews的操作步骤是点击view/correlogram 。结果表明该平稳序列的自相关和偏自相关函数均 有一定的拖尾,其中自回归(AR)应考虑滞后1、2、3和12期的影响,移动平均 (MA)应考虑滞后1和2期的影响。由此,我们初步选取自回归移动平均模型 ARMA,并将 AR(1)、AR(2)、AR(3)、AR(12)、MA(1)和 MA(2)项作为影响因 子。表6是建立在该ARMA模型基础上的

48、估算结果。其中Inverted AR Roots 表示根的倒数,因此必须模小于1才符合平稳性条件。通过计算我们发现该ARMA模型满足平稳性条件和可逆性条件。|.96+.00 |= 0.96 < 1|.83-0.49i |=0.9638 < 1|.48+.84i |=0.9725 < 1|.00+.97i|=0.97 < 1对估计参数进行分析,我们发现AR(1)、AR(2)、AR(3)和MA(2)项的参数的 t检验值非常不显著。在之前的介绍中,我们已经强调模型的参数个数在模型满 足统计推断要求的情况下应尽量少,即可达到同样统计目的的两个模型参数少的 一个为佳。因此,我们考

49、虑将 AR(1)、AR(2)、AR(3)和MA(2)这4项从模型中 删除。如果新模型可以带来同样满意的统计结果,我们将倾向于使用新模型。首先,AIC和SIC信息标准被用来判断这两个模型更符合数据特征。表 7给 出了建立在新模型基础上的估算结果。我们发现,表 7中给出的AIC和SIC均 小于表6中给出的相应数值。因此,从该信息标准角度分析,新模型优于原有模 型。其次,也是更为重要的,新模型能不能通过假设检验或适用性检查。表7中的In verted AR Roots部分给出的根的倒数,|.97+.00 |= 0.97 < 1|.48+.84i |=0.9725 < 1与表6中一样,这些

50、根的倒数的模都小于1,这说明新模型同样满足平稳性 条件和可逆性条件。当然最为重要的是检验新模型的残差是不是白噪声。表8是新模型残差序列的自相关检验结果。结果显示不能拒绝原假设,也就是说残差不存在相关性,残差为白噪声时间序列。由此,我们最终得出最能解释数据并运用于分析的时间序列模型,自回归移 动平均模型ARMA,其中解释因子为AR(12)和MA(1)两项。对模型的应用和预测部分将在此忽略。这是因为之后将有课程对时间序列模 型的预测做重点讲解。表3 :增值税平稳性检验(ADF )Null Hypothesis: D(VAT) has a unit rootExogenous: Constant,

51、Linear TrendLag Length: 11 (Automatic based on SIC, MAXLAG=12)Augmented Dickey-Fuller test statistict-Statistic-3.102961Prob.*0.1108Test critical values:1% level-4.0428195% level-3.45080710% level-3.150766*MacKinnon (1996) one-sided p-values.Augmented Dickey-Fuller Test EquationSample (adjusted): 20

52、00M02 2009M04Included observations: 111 after adjustments表4 :增值税平稳性检验(ADF )Null Hypothesis: D(LNVAT) has a unit rootExogenous: ConstantLag Length: 11 (Automatic based on SIC, MAXLAG=12)Augmented Dickey-Fuller test statistict-Statistic-3.762518Prob.*0.0044Test critical values:1% level-3.4902105% level-2.88766510% level-2.580778*MacKinnon (1996) one-sided p-values.Augmented Dickey-Fuller Test EquationSample (adjusted): 2000M02 2009M04Included observations: 111 after adjustments表5:我国增值税自相关分析(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论