信息分析方法__市场时间序列分析预测法_第1页
信息分析方法__市场时间序列分析预测法_第2页
信息分析方法__市场时间序列分析预测法_第3页
信息分析方法__市场时间序列分析预测法_第4页
信息分析方法__市场时间序列分析预测法_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章市场时间序列分析预测法(三)市场随机时间序列预测法在第七、八章我们讨论的是市场确定性时间序列分析预测法,用一个确定性的模型去拟 合所研究的市场现象。实际上,人们所遇到的市场变量时间序列,就其本质而言,绝大多数并非是确定性的而是由随机过程产生的。时间序列中,单个数值的出现具有不确定性,但整个时间序列却存在一定的统计规律性。把时间序列作为随机变量序列加以处理,建立随机时序模型进行预测的方法,称之为随机时间序列预测法。在市场预测中,应用较多的随机时间序列预测法主要有灰色预测法、博克斯詹金斯法和马尔柯夫法三种。下面分别予以介绍。 第一节灰色预测法灰色预测法是我国学者邓聚龙教授于20世纪80年代初

2、提出的一种新的预测方法。它是以灰色系统理论为基础,通过建立灰色动态模型(Grey Dynamic Model简记为GM)对现象未来进行预测的。由于这种方法具有所需要的数据少、预测精度高等优点,目前正被广泛用于市场预测,并已取得了良好的预测效果。 灰色预测法是以灰色系统理论为基础的。灰色系统理论认为,一切随机变量都是在一定范围内、一定时间上的灰色量在系统论与控制论中,常用颜色来形容信息的完备程度。一般情况下,“白色”指信息完全确知,“黑色”指信息一无所知,“灰色”则介于前两者之间,指信息不完备或不确知。一个信息不完备的数,称为灰数;一个信息不完备的系统,称为灰色系统。在灰色预测中,把所使用的原始

3、数据看作是灰数。一切随机过程都是灰色过程。表面上看,灰色量的变化是乱而无序的,但实际上,其背后却潜藏着一定的规律性。只要对灰色量作累加生成处理,就可以弱化其变动的随机性,显示出其固有的变动规律性,并且这种规律性可以利用微分方程予以揭示和反映。灰色预测法就是利用累加生成的数据而非原始序列数据,建立一个微分方程形式的时间连续函数模型GM(n,h)(n表示微分方程的阶数,h表示变量的个数),并据此作出预测。 在市场预测中,最常用的为一阶单变量灰色动态模型,即GM(1,1)模型。本节主要介绍的就是GM(1,1)模型的建立、检验和预测方法。 一、GM(1,1)模型的建立 GM(1,1)模型的微分方程形式

4、为 (9-1) 上式中,为一次累加生成数;t为时序;、为待估模型参数。 GM(1,1)模型的建立,一般经过如下步骤: 第一步,选择一原始时间序列X(0)X(0)=X(0)(1),X(0)(2),X(0)(t),X(0)(N) 向量中元素X(0)(t)表示序列第t期(项)原始数据,右上角括号中的数字0表示原始数据。一般要求数据个数N4。 第二步,对原始序列作一次累加生成,得序列X(1) X(1)=X(1)(1),X(1)(2),X(1)(t),X(1)(N) 上向量中元素X(1)(t)表示序列第t期一次累加生成数据,右上角括号中数字1表示一次累加生成,且X(1)(t)= (9-2) 第三步,构造

5、累加矩阵B与常数项向量YN 第四步,用普通最小平方法估计微分方程模型参数,则 (9-3) 第五步,将求出的参数代入(9-1)式,且令X(1)(0)=X(0)(1),将微分方程转化为如下时间函数。 (9-4) (9-4)式是根据一次累加生成序列建立的预测模型,不能直接用于预测,尚须作逆累加生成处理,予以还原。第六步,对进行还原。用相邻两期的相减,即 (9-5) (9-5)式为最终所要求的GM(1,1)预测模型,经检验合格后,方可用于预测。 在利用(9-5)式求原始序列的追溯预测值时,一般令=,序列第2期及以后的追溯预测值按(9-5)递推计算。 下面以示例说明GM(1,1)的建模过程。 【例1】某

6、地区19992005年农村居民消费水平数据如表9-1栏所示,试建立GM(1,1)模型并预测其2006年的消费水平。 表9-1某地区农村居民消费水平数据表单位 :元 年份1999200020012002200320042005时序t1234567消费水平X(0)(1)6837629731251166919452275解:1.对原始数据作一次累加生成X(1)(1)=X(0)(1)=683X(1)(2)=X(0)(1)+X(0)(2)=683+762=1445X(1)(3)=X(0)(1)+X(0)(2)+X(0)(3)=X(1)(2)+X(0)(3)=1445+973=2418 X(1)(4)=X

7、(0)(1)+X(0)(2)+X(0)(3)+X(0)(4)=X(1)(3)+X(0)(4) =2418+1251=3669 同理X(1)(5)=5338,X(1)(6)=7283,X(1)(7)=9558 则X(1)=683,1445,2418,3669,5338,7283,9558 2.构造累加矩阵B和常数项向量YN = 3.利用普通最小平方法求解参数 BTB= = = = = =则参数、的估计值为 = =代入(9-1)式,得微分方程 =601.2607 代入(9-4)式,得时间函数 =3567.9374e0.208416t-2884.9374 6.6.对上式进行还原,得预测模型 =356

8、7.9374(e0.208416t-e0.208416(t-1) 这就是该地区农村居民消费水平GM(1,1)预测模型。 二、GM(1,1)模型的检验 GM(1,1)模型建立以后,还不能直接用于预测,尚必须对其拟合精度进行检验。只有当拟合精度符合一定要求以后,才能用于预测。GM(1,1)模型精度检验的方法有三种:残差检验法 、关联度检验法和后验差检验法。实践中可根据具体情况加以选用。 (一)残差检验法残差检验法就是利用建立的GM(1,1)预测模型,求出原始序列各期的拟合值,进而求出序列各期的绝对预测误差或者相对预测误差,看其是否满足所要求的允许误差范围。若落在允许的误差范围之内,那么所建立的GM

9、(1,1)模型,可用于预测,否则不能用于预测。 (9-6) 100% (9-7) 上式中:、q(t)分别表示序列第t期的绝对预测误差和相对预测误差;、分别为序列第t期的实际观察值和追溯预测值。 在实际应用中,不仅要看序列各期的、q(t)是否落在允许误差范围之内,要重要的是关注近期的、q(t)数值大小。一般情况下,尽管有少数远期的、q(t)落在允许误差范围之外,但如果近期的、q(t)的数值很小且符合要求,所建立的GM(1,1)模型亦可用于预测。 在上例中,利用(9-5)、(9-6)、(9-7)式计算的序列各期的追溯预测值、绝对预测误差相对预测误差q(t)结果如下:=826.76 e(2)=-64

10、.78 q(2)=-8.5% =1018.37 e(3)=-45.37 q(3)=-4.66% =1254.35 e(4)=-3.35 q(4)=-0.27% =1545.02 e(5)=123.98 q(5)=7.43% =1903.03 e(6)=41.97 q(6)=2.16% =2344.02 e(7)=-69.02 q(7)=-3.03% 如果认为近期相对预测误差落在5%以内即可满足要求的话,那么上述建立的GM(1,1)预测模型就可以用以预测。 (二)关联度检验法 在建立GM(1,1)预测模型时,可以使用原始序列的全部数据,也可以使用原始序列部分数据,那么根据哪些数据建立的模型优呢?

11、这可以根据所建立的每个模型产生的序列拟合值与序列原始数据关联程度的大小作出判断,关联程度大的模型为优。具体步骤是: 第一步,利用建立的GM(1,1)模型计算出序列各期的追溯预测值与对应原始数据离差的绝对值。 =- (t=1 ,2,N) (9-8)第二步,在序列中,找出最大值。 第三步,计算序列各时期的关联系数L(t) L(t)= (t=1,2,3,N) (9-9 ) 上式中:L(t)表示第t时期的关联系数,且1/2L(t)1。 第四步,计算GM(1,1)模型的关联度 (9-10) 第五步,比较不同GM(1,1)模型的关联度,大者为优,并且根据经验,当较优模型的关联度大于0.7时,就可利用此模型

12、进行预测。 在上例中,利用19992005年数据建立的GM(1,1)模型,关联度的计算如下: =-=683-683=0 =-=762-826.78=64.78 =-=973-1018.37=45.37 =-=1251-1254.35=3.35 =-=1669-1545.02=123.98 =-=1945-1903.03=41.97 =-=2275-2344.02=69.02从(t)中找出:=123.98L(1)=123.98/(0+123.98)=1 L(2)=123.98/(64.78+123.98)=0.6568 L(3)=123.98/(45.37+123.98)=0.7321同理,得L

13、(4)=0.9737,L(5)=0.5,L(6)=0.7471,L(7)=0.6424 关联度为 =(1+0.6568+0.7321+0.9737+0.5+0.7471+0.6424)/7 =0.7503 在上例中,也可以利用部分原始数据建模,如利用20012005年数据建立的GM(1,1)模型为 =6522.5227e0.18451476t-5549.5227 还原模型为 =6522.5227(e0.18451476t-e0.18451476(t- 1) 利用上式计算出的序列各期预测值为 =1321.69, =1589.51 , =1911.6, =2298.96 与上计算过程相同,得关联度

14、=0.7004 由于,所以两者比较而言,利用20012005年的原始数据建立的GM(1,1)模型进行预测。 关联度检验法,即可以用于判断不同样本期序列数值建立的GM(1,1)模型何者为优,而且可以根据其大小判断模型对原始数据的拟合程度。关联度愈接近于1,所建立的GM(1,1) 模型拟合程度越高。 (三)后验差检验法 这种检验法是根据原始序列均方差与残差绝对值序列均方差的比率以及小概率,判定GM(1,1)模型精度等级的。具体步骤是: 1.计算原始序列的均方差S1 (9-11) 其中=2.计算残差绝对值序列的均方差S2 其中=3.计算均方差比C C=S2/S1 (10-13) C越小越好。C值小,

15、意味着原始序列离散性大,预测误差离散性小,预测精度高。 4.计算小误差概率 P=P(t)- 0.6745S1 P越大越好。P值越大,表明模型对原始数据的拟合程度越高。 5.判定模型精度等级判定模型精度等级按如下经验标准: CP精度等级0.95好0.80合格0.650.70勉强0.650.70不合格当模型精度等级达到合格以上时才能用于预测。 对上例利用19992005年数据建立的GM(1,1)模型作后验差检验: =(683+762+973+1251+1669+1945+2275)=1365.43 S1= =612.69 = (0+64.78+45.37+3.35+123.98+41.97+69.

16、02)=49.78S2=42.42 C=S2/S1=0.0692 (1)-=49.78 (2)-=15 (3)-=46.43(4)- =74.2 (5)-=7.81 (6)-=19.24 0.6745S1=0.6745612.69=413.26 由于所有的(t)-均小于0.6745S1,因此P=1 由于C0.35,P0.95,故所建立的GM(1,1)模型预测精度等级为好,可以用以预测。 当t=7时,可预测出2006年该地区农村居民水平,即 =3567.9374(e0 .2084167-e0.2084166) =2887.18(元) 三、残差修正的GM(1,1)模型 在市场预测中,由于受不规则变

17、动因素的影响,某些市场现象时间序列中有时包含有显著的随机变动,利用前述方法建立的GM(1,1)模型检验不合格或预测精度不甚理想。为增强GM(1,1)模型的实用性,保证取得良好的预测效果,此时必须对原GM(1,1)模型产生的预测误 差进行分析,建立残差的GM(1,1)模型,并复合到原来的GM(1,1)上,从而得到残差修正的GM (1,1)模型。具体步骤如下: (一) 根据原来建立的GM(1,1)模型,求出原始数据的残差序列e(0) e(0)=( e(0)(1), e(0)(2), e(0)(t), e(0)(N) 其中e(0)(t)= -建立残差GM(1,1)模型时,可以利用原始数据序的所有残差

18、数据,也可以利用距预测期最近的几项原始序列残差数据。假定所使用的残差数据为 =, , 其中=- =t- i;i=N-n (二)对残差序列作一次累加生成 =, (三)根据前述步骤建立残差的GM(1,1)模型 =(- )+ (9-14) (四)将残差GM(1,1)模型添加到原来建立的GM(1,1)模型上,得到残差修正GM(1,1)模型即=() + (- )+ (9-15) 其中,= i=N-n对(9-15)式作逆累加生成处理的后,就可以进行预测了。 即=- 【例2】根据表9-1已知数据,建立残差修正GM(1,1)模型,并后用验差检验法检验,预测2006年该地区农村居民消费水平。 解:1.在例1中已

19、建立的GM(1,1)模型为 =3567.9374e0.208416t-2884.9374 2.依据上模型所形成的原始数据的残差序列为 e(0)=0,-64.78,-45.37,-3.35,123.98,41.97,-69.02 3.对上原始残差序列作一次累加生成 e(1)=0,-64.78,-110.15,-113.5,10.48,52.45,-16.57 4.利用前面所述步骤建立的残差GM(1,1)模型为 =126.2112e-0.0316534t-126.2112 5.将残差GM(1,1)模型添加到原来建立的GM(1,1)模型上,得到残差修正GM(1,1)模型 =3567.9374e0.2

20、08416t-2884.9374+126.2 112e-0.0316534t-126.2112 对上式作逆累加生成予以还原 =- =3567.9374(e0.208416t-e0.208416(t-1)+126.2112(e-0.031653t -e-0.031653(t-1) 6.令=, =0 利用还原后的残差修正GM(1,1)预测模型以及(9-6)、(9-7)式分别计算出序列各期的追溯 预测值 、绝对预测误差e(t)、相对预测误差q(t),结果如下: =683 e(1)=0 q(1)=0 =822.85 e(2)=-60.85 q(2)=-7.99% =1014.56 e(3)=-41.5

21、6 q(3)=-4.27% =1250.66 e(4)=0.34 q(4)=0.03% =1541.44 e(5)=127.56 q(5)=7.64% =1899.57 e(6)=45.43 q(6)=2.34% =2340.66 e(7)=-65.66 q(7)=-2.89% 由上可以看出,利用残差修正GM(1,1)模型计算的e(t)和q(t),除e(5)、q(5)、e(6)、q(6)外,其它均比利用原来的GM(1,1)模型计算的e(t)和q(t)有很大改善。利用残差修正GM(1,1)模型所得出的追溯预测值更接近于实际观察值。 7.利用后验差检验法对残差修正模型进行预测精度检验 由于(t)=

22、e(t),则 (1)=0 (2)=60.85 (3)=41.56 (4)=0.34 (5)=127.56 (6)=45.43 (7)=65.66 =1365.43 = 612.69 =48.76 =43.64 C=S2/S1=0.07120.6745S1=0.6745612.69=413.26 (1)-=48.76 (2)-=12.09 (3)-=7.2(4)-=48.42 (5)-=78.8 (6)-=3.33 (7)-=16.9 所有的(t)- 均小于0.6745S1,因此p=1 由于c0.35,p0.95,故所建立的GM(1,1)模型预测精度等级为好,可以用于预测。 8.进行预测。 将t

23、=7分别代入残差修正GM(1,1)预测模型,可得出2006年该地区农村居民消费水平,即=356 7.9374(e0.2084167-e0.2084166)+126.2112(e-0.0316537-e-0.0316536) =2887.18-3.25=2883.93(元) 四、灰色预测法的软件实现灰色预测法用手工计算工作量较大,但利用计算机软件则较为便捷。GM(1,1)模型实现的软件已由李超同志借助EXCEL软件中的VBA开发出来,可以在网站上直接下载。现利用例1说明其具体操作步骤:打开灰色预测软件的EXCEL文件,如果遇到EXCEL提示的安全性警告框,则调整EX

24、CEL中宏的安全级别,选择菜单“工具宏安全性”,后调整安全级别为中级。再次打开EXCEL,遇到关于宏的对话框,则点击“启用宏”按钮。启动灰色预测软件,直接进入界面(如下图),在工作簿中直接输入需要预测的指标数据。选定消费水平数据区域,出现如下输入范围对话框:也可以在对话框内手工输入数据范围,例如B2:B8,随后出现预测期数对话框(如下图)输入需要向下预测的期数,如本例为1,得到预测结果对话框(如下图)。点击“确定”按钮后,在“预测模型及检验”工作簿中显示具体的预测模型及相关的三种检验结果。得到预测模型为:=3567.9374(e0 .2084167-e0.2084166)软件计算结果与手工计算

25、结果相同。计算得到的三种检验结果为:参差检验绝对误差序列为:0, 64.782, 45.368, 3.349, 123.986, 41.967, 69.013 相对误差序列为:0%, 8.50%, 4.66%, 0.27%, 7.43%, 2.16%, 3.03% 关联度检验原始数列与其拟合模型数列在 0.5 时的关联度为0.631。后验差检验原数列的标准差 S1=612.6864 参差数列的标准差 S2=42.45762 C=S2/S1=6.929748E-02 S0=413.257参差与参差均值的离差的绝对值序列ek为-49.781 15.001, -4.413, -46.432, 74.

26、205, -7.813, 19.233 检验结果与手工计算相同。五、灰色预测法的特点和适用条件 建立GM(1,1)模型的灰色预测法仍属于趋势预测法的范畴,但与第八章所介绍的趋势预测法相比,这种方法具有以下特点: (一)需要的原始数据较少运用其它趋势预测法进行市场预测,往往需要搜集大量的市场数据 ,以便分析发现市场现象的变动规律性,而灰色预测法需要的原始数据较少,它只要根据实际情况选择适量数据作累加生成处理,即可发现市场现象的变动规律。甚至拥有4项原始数据,就能得到满意的预测结果。 (二)计算简单虽然建立GM(1,1)模型需要较高得的数学知识,但它的计算步骤并不繁琐。由于其所使用的原始数据较少,

27、多数可用手工完成。当然借助于电子计算机可以更迅速地计算出结果。目前这方面的计算机程序已被开发研制出来。 (三)不需要对序列变动的趋势类型事先作出判断其它趋势预测法在估计趋势预测模型参数之前,必须借助于图形识别法或阶差判别法判断时间序列呈何种趋势变动类型,属于哪种直线或曲线类型。而灰色预测法不需要事先判定时间序列变动的趋势类型,因为它建立的是关于时间t的连续指数函数,一般情况下无论时间序列中含有何种趋势变动,它都可以用指数曲线予以逼近。 (四)预测误差较小一般而言,与其它趋势预测方法相比,灰色预测法所产生的预测误差较小。请读者根据表9-1已知资料,运用灰色预测法、最小平方法和指数平滑法计算的序列

28、绝对预测误差绝对值、相对预测误差绝对值和均方误差,可以清楚地看到这一点。GM(1,1)模型的适用条件。在灰色预测法中,由于GM(1,1)模型建立使用的是累加生成数据,而对于非负的时间序列,累加生成数据具有单调递增变化特点,因而GM(1,1)模型仅适用于配合呈单调趋势变化的时间序列。若时间序列中含有非单调趋势变动或者周期性变动,利用 GM(1,1)模型进行预测,将会产生很大的预测误差。 第二节博克斯詹金斯法博克斯詹金斯法,是以美国统计学Geogre E.P.Box和英国统计学家Gwilym M.Jenkins 的名字命名的一种高级时间序列分析预测法,所以又简称为BJ法。由于这种方法是在对时间序列

29、特性分析的基础上,建立ARMA模型逐步递推预测的,因此,有时也将其称为ARMA模型法。博克斯詹金斯法是一种计算复杂、费用昂贵但预测精度高的短期预测方法,它特别适宜于哪些复杂的、包含多种变动模式的时间序列的预测。目前电子计算机的普及运用, 为这种方法的复杂计算提供了技术支持,从而使其在市场预测应用的范围、机会日益扩大和增多。由于博克斯詹金斯法涉及较多、较深的数学知识,本书仅对其基本原理作简单介绍,对有关公式的导出过程不作说明。一、BJ法的基本模型,应用前提条件和预测程序(一)BJ法的基本模型 BJ法将预测对象随时间变化形成的数据序列视为随机序列,并认为序列数据的内在结构、复杂特性及其变动规律可以

30、用相应的数学模型加以近似描述,而且可以依据此模型对预测对象在未来的表现作最小方差意义下的预测。BJ法所使用的模型主要有三个:( 1)自回归模型(Auto Regressive model,简称AR模型);(2)移动平均模型(Moving Average model简称MA模型);(3)自回归移动平均模型(Auto Regressive Moving Average model,简 称ARMA模型)。 自回归模型的公式为 (9-16)上式中:1,2,p为模型参数;p为自回归模型的阶数; yt为时间序列第t期的观察值;et为误差,表示不能用模型说明的随机因素。(9-16)式为p阶的自回归模型,简记

31、为AR(p)模型。该式说明,影响预测对象变动的主要不是外界因素,而是其本身。由于(9-16)式的形式是yt关于它自己滞后期数据的回归,所以称为自回归。 移动平均模型的公式为 yt=et-1et-1-2et-2-qet-q (9-17) 上式中:yt为时间序列第t期的观察值;et为序列模型在第t期的误差;q为移动平均模型的阶数;1,2,q为模型参数。 (9-17)式为q阶的移动平均模型,简记为MA(q)。该式说明yt为其过去若干期误差的函数 。由于yt是根据序列过去的误差项移动平均得到的故称(9-17)式移动平均模型。 自回归移动平均模型的公式为 yt=1yt-1+2yt-2+pyt-P+et-

32、1et-1-qet-q (9-18) (9-18)式是AR(p)模型和MA(q)模型的有机结合,因此称为自回归移动平均模型,并简记为ARMA(p,q)模型。 在建立随机时间序列模型时,应根据序列呈现的特性不同,对上三式加以选用。 (二)BJ法的应用前提条件 BJ法的应用需要满足一定的前提条件,即作为预测对象的时间序列必须是一零均值的 平稳随机序列。也就是说,它要求使用的时间序列必须具有零均值性、平稳性和随机性三个特性。当给定的时间序列不同时具有这三个特性时,就不能直接用于建立ARMA模型作出预测。 零均值性是指时间序列各期观察值的均值为零。若给定的时间序列均值不为零,则需对其作 零均值化处理。

33、即将均值不为零的时间序列Xt中的每项数值Xt都减去该序列的平均数,构成一个均值为零的新的时间序列Yt,用公式表示,则 (9-19) 上式中:,n为样本时间序列数据个数。 平稳性是指时间序列不含有明显地上升或下降趋势,各观察值围绕其均值作上下波动。当给定的时间序列含有明显地上升或下降趋势时,应对其作差分平稳化处理,即计算时间序列的一阶差分、二阶差分,,d阶差分。设Xt为非平稳时间序列一阶差分 (9-20) 二阶差分 (9-21) d阶差分 (9-22) 对于不含有季节变动的非平稳序列,一般情况下经过一阶差分或二阶差分后都可以实现平稳化。对于同时含有季节变动的时间序列,应滞后一个或几个季节变动周期

34、长度,进行季节差分,使序列平稳化,图9-1为非平稳序列曲线图,图9-2为平稳序列曲线图。 Xt 0 t 图9-1非平稳时间序列曲线图 Yt 0 t图9-2平稳时间序列曲线图随机性是指时间序列各项数据之间没有任何相关关系的特性。在B-J法中的随机性指的是残差序列各项数据之间不存在相关关系的特性。 所使用的样本时间序列是否具有平稳性和随机性,通常借助于自相关分析法进行判别。(三)BJ法的预测程序 应用BJ法进行预测,一般应遵循如下程序: 第一,对给定的样本时间序列进行特性分析,测定其是否具有零均值性、平稳性和随机 性。若序列不具有上述性质,需对其作零均值化及平稳化等处理。 第二,利用自相关分析,进

35、行模型识别。即根据时间序列的自相关系数和偏自相关系数的截尾性及拖尾性,在ARMA模型体系中初步选择一个特定的模型,并确定模型的阶数。 第三,估计模型参数。即在已识别的模型及其阶数的基础上,运用一定的参数估计方法,对模型参数进行估计,求出初始模型。 第四,模型检验。即用统计检验的方法对初始模型的合理性进行检验。若检验通不过,需重新进行模型识别,进一步改进模型。 第五,进行预测。若模型通过检验,即可用此模型对序列的未来值进行预测。 二、ARMA模型的识别 模型识别是BJ法中至关重要的一步,其任务是判别所给定的样本时间序列是否适宜配合随机时间序列模型以及适宜配合何种随机时间序列模型,其阶数是多少。进

36、行模型识别的常用方法是对样本时间序列作自相关分析。 (一)自相关分析 自相关分析就是对时间序列求其本期与不同滞后期的一系列自相关系数和偏自相关系数,并据以识别时间序列的特性。 1.自相关系数 自相关系数是反映某一时间序列与其滞后若干期形成的序列之间相关程度的统计分析指标, 计算公式为 (9-23) 上式中:yt为时间序列第t期的观察值;k为滞后期数;rk为滞后k期的自相关系数 ;n为时间序列数据个数;为时间序列各期数据的平均值。 此处的自相关系数与一般回归分析中的相关系数既有区别又有共同之处。区别在于:前者反映的是同一变量在不同时期的数据之间的相关程度,后者反映的是两个不同变量之间的相关程度。

37、共同之处在于:两者的取值范围均在-1至1之间。即-1rk1,rk越接近于1,说明序列自相关程度越高。 【例3】表9-2第(2)栏数据为一时间序列yt,试计算其自相关系数r 1,r2,r3,r4。 表9-2 tytyt-1yt-2yt-3yt-4(1)(2)(3)(4)(5)(6)1122912316912451691258516912610851697810851681281085解:原序列yt分别滞后一期、二期、三期、四期所形成的序列yt-1、yt-2、yt-3、 yt-4见表9-2第(3)(6)栏所示。 原序列的平均值 r1= =-32/78=-0.4103 r2=9/78=0.1154

38、r3=-2/78=-0.0256 r4=-26/78=-0.3333 运用EVIEWS软件可以同时给出时间序列的自相关和偏自相关数值及分析图。在主菜单选择Quick/Series Statistics/Correlogram ,在屏幕出现的对话框中输入准备分析的序列名称,如Y,点击OK。如图9-3。图9-3结果见表9-3Correlogram of YAutocorrelationPartial Correlation滞后期AC PAC Q-Stat Prob . *| . | . *| . |1-0.410-0.4101.92350.165 . |* . | . *| . |20.115-0

39、.0642.10110.350 . | . | . | . |3-0.026-0.0022.11160.550 . *| . | . *| . |4-0.333-0.4084.33380.363AC为Y的自相关系数。自相关系数可以提供时间序列及其模式构成的有关信息。当序列各阶的自相关系数接近或等于零时,该序列为一随机序列;当序列各阶的自相关系数显著不为零或周期性不为零时,则表明该序列包含有长期趋势变动或季节及循环变动。因此,自相关系数可以用来揭示时间序列的特性,有助于为其配合一个合适的模型。 2.偏自相关系数 偏自相关系数是时间序列yt在给定了yt-1、yt-2、yt-k+1的条件 下,反映y

40、t与yt-k之间的条件相关程度的统计分析指标。 其计算公式为 (9-24) k1 k2,3, 式中ki=k-1,i-kkk-1,k-i i=1,2,k-1 由式(9-24)可知,偏自相关系数是以自相关系数为计算基础的,在计算其之前,需把有关自相关系数计算出来。 【例4】根据表9-2第(2)栏已知序列数据,试计算偏自相关系数11 ,22。 解:在例9-3中,已计算出自相关数r1=-0.4103,r2=0.1154,r3=-0.0256,r4=-0.3333 根据(9-24)式,得 11=r1=-0.4103 =-0.0637 在B-J法中,偏自相关系数和自相关系数结合在一起,可以识别ARMA模型

41、的类型及其阶数 。用EVIEWS软件计算方法同上例,结果列于表9-3中,PAC值为偏自相关系数。(二)时间序列特性的测定 前已说明,B-J法要求使用的时间序列必须具有零均值性、随机性和平稳性等特性,对于所给定的样本时间序列是否具有这些特性,在建立ARMA模型之前必须予以测定。这里,仅利用自相关系数测定时间序列的随机性和平稳性。 数理统计理论证明:随机序列自相关系数近似于以0为均值,以1/为标准差的正态分布(n为样本数据个数),对于给定的置信概率F(t)可构成一个置信区间t, 即(-t ,+t)。一般取F(t)=95.45%,则t=2,置信区间为(-2/, 2/)。时间序列随机性和平稳性的测定,

42、就是观察时间序列的自相关系数落入上述置信区间内的情况。基本判定准则是:当落入置信区间内的残差序列自相关系数个数大于F(t)n时,该残差时间序列具有随机性;当落在置信区间外的残差自相关系数个数大于(1-F(t)n时,该残差时间序列不具有随机性。 在滞后期k=3以后,若时间序列yt的自相关系数rk有F(t)(n-3)个落在置信区间内,并逐渐趋于零,则该时间序列具有平稳性;若时间序列yt的自相关系数落在置信区间之外 的个数超过(1-F(t)(n-3),则该时间序列就不具有平稳性,需要对序列yt进行差分平稳化处理。 (三)模型识别 模型识别,就是判别零均值随机平稳时间序列适宜配合何种随机时序模型及其阶

43、数多少的问题。在BJ法中,ARMA模型的识别,是根据时间序列的自相关系数rk和偏自相关系数kk在某步是否截尾来辨认的。 在一定置信概率F(t)下,当kk0时,rk显著不为零,当kk0时,rk均在零附近波动,且rkt/ ,则称自相关系数rk在k0处截尾。n为时间序列数据个数,m为最大时滞数。 在一定置信概率F(t)下,当kk0时,kk显著不为零,当kk0时,kk 均在零附近波动,且kkt/,则称偏自相关系数kk在k0处截尾。 根据时间序列的自相关系数和偏自相关系数在某步的截尾性,对ARMA模型及其阶数可以作如下识别: 若时间序列的自相关系数rk随着时滞k的增长而逐渐衰减,而其偏自相关系数kk 在

44、P步截尾,则该序列宜配合自回归模型,其自回归阶数为P,即配合AR(P)模型。若时间序列的偏自相关系数kk随着时滞k的增加而逐渐衰减,而其自相关系数rk 在q步截尾,则该序列宜配合移动平均模型,其移动平均阶数为q,即配合MA(q)模型。 若时间序列的自相关系数rk和偏自相关系数kk在p、q步都不截尾,则该序列宜配合自回归一移动平均混合模型,其阶数为p、q,即配合ARMA(p、q)模型。 三、模型的参数估计 在时间序列的模型结构和阶数确定以后,接下来就要采用一定的方法把模型参数估计出来。 估计ARMA模型参数的方法有多种,有矩估计、最小二乘估计、极大似然估计等,但实践中最为常用的是矩估计。 所谓矩

45、估计,就是利用自协方差函数和自相关函数估计模型参数的方法。 (一)AR模型参数的矩估计设时间序列Yt经识别后适宜配合AR(p)模型,即 (9-25)对于k=1,2,p,对(9-25)式两边同时乘以yt-k,得 ytyt-k=1yt-1yt-k+2yt-2yt-k+ +pyt-pyt-k+yt-ket (9-26) 对(9-26)式两边同时取期望值,则 E(ytyt-k)=1E(yt-1yt-k)+2E(yt-2yt-k)+pE(yt-pyt-k)+E(yt-ket) (9-27) 由于et为随机误差项,且与yt-k相互独立,所以 E(yt-ket)=0 若以k表示时间序列yt的自协方差函数,则

46、(9-27)式可写为 k=1k-1+2k-2+pk-p (9 -28) 对(9-28)式两边同时除以0,根据自协方差函数与自相关函数的关系关于自协方差函数以及与自相关函数的关系,请参阅有关书籍,在此不作介绍。可得 rk=1rk-1+2rk-2+prk-p (k0) (9-29)因为k=1,2,P,将(9-29)式展开,则得方程组 (9-30) 这就是著名的Yule-Walker方程。解此方程组可求得参数1,2,p的估计值。 将(9-30)式可改写为矩阵形式,有 = (9-31) 根据(9-31)式求得的=(1,2,p),称为参数的 Yule-Walker估计。对于一阶自回归模型AR(1),由(

47、9-31)式知 1=r1 (9-32) 对于二阶自回归模型AR(2),由(9-31)式解得 (9-33) (二)MA模型参数的矩估计 设时间序列yt经识别后适宜配合MA(q)模型,即 yt=et-et-1-et-2-et-q (9-34) 对于滞后k期序列yt-k,则 yt-k=et-k-et-k-1-et-k-q (9-35)将(9-34)式与(9-35)式两边同时相乘并取期望值,得到 E(ytyt-k)=E(et-et-1-et-q)(et-k -et-k-1-et-k-q)(9-36)根据序列自协方差函数与自相关函数的关系,由(9-36)式推得 (9-37) 对于MA(1)模型,由(9-37)式知 整理得r12+r1=0 解此方程得 (9-38) 根据1的要求,由式(9-38)得到的值,即为MA(1)模型参的估计值。 对于MA(2)模型,由(9-37)式知 (9-39)解上方程组,可得MA(2)模型参数、的估计值。ARMA模型参数的矩估计十分复杂和繁琐,在此不作介绍。实际应用中,可借助于EVIEWS软件来完成。 四、模型的检验 ARMA模型参数估计出来以后,还不能直接利用该模型进行预测,尚需对模型产生的残差序列et进行检验,检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论