(数量经济学专业论文)经济时间序列ARMA模型的贝叶斯分析及其应用.pdf_第1页
(数量经济学专业论文)经济时间序列ARMA模型的贝叶斯分析及其应用.pdf_第2页
(数量经济学专业论文)经济时间序列ARMA模型的贝叶斯分析及其应用.pdf_第3页
(数量经济学专业论文)经济时间序列ARMA模型的贝叶斯分析及其应用.pdf_第4页
(数量经济学专业论文)经济时间序列ARMA模型的贝叶斯分析及其应用.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(数量经济学专业论文)经济时间序列ARMA模型的贝叶斯分析及其应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士学位论文 摘要 在经济领域中,运用时间序列模型来进行客观经济过程的描述和预测是一个 非常重要的方法然而在实际应用中,由于经济领域的特殊性,利用传统的频率 统计方法进行经济时闻序列模型分析时往往会碰到很多困难因此,本文引入 种新的经济时间序列模型分析方法一贝叶斯分析方法。贝叶斯分析方法提供了 个更合理的经济时间序列模型分析框架 本文主要研究了稳健a r m a 模型、a r f l m a 模型以及v a r f i m a 模型的贝 叶斯推断理论及其应用 首先,进行了时间序列稳健a r m a 模型的贝叶斯分析。从分析稳健a r m a ( p ,q ) 模型的统计结构开始,构建了稳健a r m 钗p ,q ) 模型的似然函数和参数的先验分布, 严密地推导了模型参数的条件后验分布密度函数,并利用中国1 9 4 9 2 0 0 5 年的人 口数据,通过w i n b u g s 软件包进行仿真分析。 其次,展开对单变量长记忆时间序列a r n m a 模型的贝叶斯分析从分析 a r f l m a 他d ,q ) 模型的统计结构开始,构建了a r h m a d ,q 模型的似然函数和参 数的先验分布,严密地推导了模型参数的条件后验分布密度函数;利用一组用 e x c e l l 软件模拟的f d n 序列和一列某地区的石油价格数据,分别通过w i n b u g s 进行仿真分析。 最后,进彳亍了多变量长记忆时间序列v a r f l m a 模型的贝叶斯分析从分析 娘f l m a ( p ,d ,q ) 模型的统计结构开始,构建了模型的似然函数和参数的先验分 布,严密地推导了模型参数的条件后验分布密度函数;利用一组用e x c e l l 软件 模拟的二维长记忆时间序列,通过w i n b u g s 进行仿真分析。 关键词:时间序列;贝叶斯推断;m c m c 仿真;g i b b s 抽样;w i n b u g s 经济时间序列a r m a 模型的贝叶斯分析及其应用 a b s t r a c t i ne c o n o m i cf i e l d t h ct i m e 耻r i e sm o d e l s 盯ei m p o n 卸tm c t h o d si l ld e 辩r i b i n g 柚d f o r c c a s l i n gt h eo b j c c t i v cc c o m i cp m c e s s h o w e v e f ,w h e np m t h e mi m oa p p l i c a t i o n , b c c 卸辩o ft h ep a n i c u l a r i t yo fc c o m i cf i e l d ,w eo f i e ne 邶。蛐t e rm a n yd i f 6 c u l t i e si n t h ct i m e 辩r i c si d e l s 卸a l y s i sb yu s i n gt h et r a d i t i o n a l 丘e q u e n c ys t a t i s t i c a lm e t h o d t h e r e f o r c t h i sp a p e fd e s c r m e sat e c h n i q u e ,c c o m i cf o r c c 勰t i n gw i t hb a y e s i a nt i m e f i c sm o d c l s ,w l l i c hh 猫p m v e do v e rt h ep a 醴v e r a ly e a f st ob ca na t t r a c t i v e a l l 啪a t i v ci nm a n ys i t u a t i o 璐t ot h eu s eo ft r a d i t i o n a le c o n o m t r i cm o d e l so ro t h e rt i m e s e r i e st e c h n i q u e s t 1 l i sp a p c rm a i n l yd e a l sw i t ht h ee s t i m a t e dp m c c d u r cf o rt h er o b u 吼a r m a m o d e l ,t h ea r f i m am o d e la n dt h cv a r f i m ai d e lu n d e rb a y e s i a ni n f c r e n c e 仃a m e w o r l 【,a n d t h e i r a p p l i c a t i o nw “hp o s t e r i o rc o m p u t a t i o n s i s p e r f o r m e db y m c m cm e t h o d f i f s t l y ,t h cb a y e s i a nt h e o r ya b o u tl h er o b u s la r m a ( p q ) i d e l i sc x p l o r e d t h i s p a r l 柚a l y s i st h cm o d e l ,ss i a t i s t i c a l 吼m c t u r e 柚di t sl j l 【e l i l l o o df l i n c t i o n ,c o 璐t n i c t st h e p 缸a m e t e r s p 凼rd i s t r i b u t i 柚dm a l 【e s 蛐i l l f c r e 邶cf o r t h ep a r a m e l e f s n d i t i o n a l p o s t e f i o fd i s t f j b u l i o n ;t h e nt h m u g l las e r i e so f1 9 4 9 2 0 0 5c l l i n e s ep o p u l a t i o nd a t a , i m p l c m e m e sb a y e s i a nr o b u s ta r m a p ,q ) m o d e ls i m u l a t i w i t hw i n b u g s s e c o n d l y ,w e 锄a l y z e sa r f l m 纵p ,d q ) m o d e lw i t hb a y e s i 觚m e t l l o d w b 柚a l y s i s t h em o d e l ,ss t a t i s t i c a ls t m c t m ca n di t s1 i 1 【e l i h o o df i l n c t i o l l c o n s t 九i c tt h c p 盯a m e t e r s ,p r i o rd i s t r i b u t i 鲫柚dm a l ( e 柚i n f c r e ef o f t h ep a r a m e t e r s c o n d “i o n a l p 0 蛐盱i o rd i s t r i b l l t i o n e n m p k sw i t hs i m u l a t e d 粕da c t u a le c o m i cd a t a 甜e p f c m e d f i n a l l y ,t h eb a y e s i 柚i n f e f e n c et h c o r ya b o u tl h e 讯f i m a ( p ,d ,q ) m o d c li s e x p l o 代正1 i l i sp a na n a l y s i s e s t h em o d e l ,s 吼a t i s t i c a ls t 九l c t u r e 觚di t sl 呔e l i h o o d f i l l l c t i o l i ,c o n s t 邝c t st h ep a r a m e t e r s p r i o rd i s t r i b u t i o n 锄dm a l 【e sa ni n f c r e n c ef o ft h e p 甜a m e t e r s c o n d i t i o n a lp o s t e r i o rd i s t r m u t j o n ;t h e nt h r o u 曲as e r i e ss i m u l a t e db yt h e e x c e li m p l c m e n t e sb a y e s i 锄坻f 1 m a ( p ,d ,q ) m o d c ls i m u l a t i o nw i t hw i n b u g s k e yw o r d :面m e 辩r i e s ;b a y e i a ni n f c f e n c e ;m c m cs i m u l a t i o n ;g j b b ss a m p l i n g ; w i n b u g s 硕士学位论文 图2 1 图2 2 图2 3 图2 4 图2 5 图2 6 图2 7 图2 8 图2 9 图2 1 0 图2 1 1 图2 1 2 图3 1 图3 2 图3 3 图3 4 图3 5 图3 6 图3 7 图3 8 图3 9 图3 1 0 图3 1 1 图3 1 2 图3 1 3 图3 1 4 图3 1 5 图3 1 6 图3 1 7 图3 1 8 图3 1 9 多层迭代的链轨迹 插图索引 如多层迭代的链轨连 1 2 一1 2 q 多层迭代的链轨迹1 2 吃多层迭代的链轨迹 如收敛性统计诊断图 如收敛性统计诊断图1 3 b 收敛性统计诊断图1 3 吃收敛性统计诊断图。 如后验分布的仿真图 晚后验分布的仿真图1 4 q 后验分布的仿真图1 4 吃后验分布的仿真图 d 多层迭代的链轨迹 百1 多层迭代的链轨迹 f 多层迭代的链轨迹 2 2 2 3 y 多层迭代的链轨迹2 3 d 收敛性统计诊断图2 3 百收敛性统计诊断图2 3 f ;1 收敛性统计诊断图 y 收敛性统计诊断图 d 的后验分布仿真图一 f f l 的后验分布仿真图一 f ;1 的后验分布仿真图 v 的后验分布仿真图 2 4 妒收敛性统计诊断图2 6 8 收敛性统计诊断图2 6 d 收敛性统计诊断图2 6 q 收敛性统计诊断图 收敛性统计诊断图 妒的后验分布仿真图 日的后验分布仿真图 2 6 :! ( ; 经济时间序列a r m a 模型的贝叶斯分析及其应用 图3 2 0 图3 2 1 图3 2 2 图4 1 图4 2 图4 3 图4 4 图4 5 图4 6 图4 7 图4 8 图4 9 图4 1 0 图4 1 1 图4 1 2 图4 1 3 图4 1 4 图4 1 5 图4 1 6 图4 1 7 图4 1 8 图4 1 9 图4 2 0 图4 2 1 图4 2 2 图4 2 3 图4 2 4 图4 2 5 图4 2 6 图4 2 7 d 的后验分布仿真图 f i 的后验分布仿真图 2 7 吃的后验分布仿真图 多层迭代的链轨迹 2 7 2 7 8 多层迭代的链轨迹 吨多层迭代的链轨迹 3 7 如多层迭代的链轨迹 f “多层迭代的链轨迹 h :多层迭代的链轨迹。 f z l 多层迭代的链轨迹 吒:多层迭代的链轨迹 3 7 3 7 3 8 3 8 3 8 3 8 k 多层迭代的链轨迹3 9 妒收敛性统计诊断图。 一收敛性统计诊断图 收敛性统计诊断图 如收敛性统计诊断图 f u 收敛性统计诊断图 f l :收敛性统计诊断图一 3 9 3 9 f :。收敛性统计诊断图 吃:收敛性统计诊断图 f 。收敛性统计诊断图 妒后验分布的仿真图一 6 l j 舌验分布的仿真图 3 9 3 9 后验分布的仿真图 以后验分布的仿真图 f 。后验分布的仿真图 f l :后验分布的仿真图 f :。后验分布的仿真图。 f 。:后验分布的仿真图 f 。后验分布的仿真图 4 0 4 0 4 1 硕士学位论文 表2 1 表2 2 表3 1 表3 2 表3 3 表3 4 表4 1 表4 2 表4 3 附表索引 1 9 4 9 年至2 0 0 5 年我国人口自然增长率 参数的贝叶斯估计值 a r f i m 钺0 ,一o 3 ,o ) 模型仿真序列 a r f i m 钺o ,一0 3 ,o ) 模型参数的估计值 2 2 2 4 1 9 8 9 年至1 9 9 7 年欧洲地区l s f 的月平均价格2 5 参数的贝叶斯估计值 幔f l m a ( p ,d q ) 模型仿真分量序列y l 讯f l m 钗p d ,q ) 模型仿真分量序列y 2 2 6 3 6 3 6 参数的贝叶斯估计值4 0 湖南大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的 研究成果除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或 集体己经发表或撰写的成果作品对本文的研究做出重要贡献的个人和集体,均 已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担 作者签名; 日期; 年 月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保 留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。 本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印,缩印或扫描等复制手段保存和汇编本学位论文。 本学位论文属于 1 保密口,在年解密后适用本授权书 2 不保密口 ( 请在以上相应方框内打”,) 作者签名: 导师签 日期: 日期: 年 矩 月 月 日 日 硬士学位论文 1 1 选题背景及其意义 第1 章绪论 随着科学技术的进步和社会经济的发展,在经济金融领域,人们日益重视对 各种经济现象的定量观测和有关数据的收集和分析。这些数据一般按时间顺序排 列,由于受到多种偶然因素的影响,往往表现出某种随机性,且观测到的数据之 间存在着互依赖关系。研究平稳经济时间序列时,如果是要寻找序列变量之间或 者序列变量前后之间的联系,就考虑建立自回归模型( a u t or e 伊e 龉i v em o d e l ,a r ) 模型:如果是要寻找序列变量与白噪声之问的联系,就考虑建立移动平均模型 ( m o v i n ga v e r a g em o d e l ,m a ) 模型;如果既要寻找序列变量前后之间的联系又要寻 找序列变量与白噪声之间的联系,就考虑建立自回归移动平均模型 ( a u t o r e g r c 龉i v em o 、r i n ga v e r a g em o d e l ,a r m a ) 模型由于被研究对象本身受各 种偶然非正常的因素的影响或采样中的误差,我们选取的经济金融时间序列中会 出现极少数观测值远离序列的一般水平的异常点,这些异常点会严重影响建模过 程中模型的识别和参数的估计,从而影响模型的拟合精度,对预测分析造成一定 影响。针对异常点对a r m a 模型参数估计的影响,很多学者提出了不同的解决方 法。基于频率统计理论检验时间序列中的异常点并对其进行处理的方法大致有两 类,一类是根据观测值构造各种不同的统计量进行检查,如果某一时刻的数值超 出了一定的范围,则认为该点是一个异常点,并用一定的方法进行剔除。我们可 以看到,这种方法虽然能够准确识别异常点的位置,但是无法辨别异常点的类型。 另一类处理时间序列中异常点的方法是首先利用时间序列建立模型,然后通过不 断迭代来识别异常点的位置和类型。目前这类方法中使用最广泛的是c h u n gc h e n l l l 和l 0 n m ul i u 提出的联合估计法。事实上,在这种方法中,首先进行的模型选择和 参数的估计受到还没有辨别出来的异常点的影响;接下来用受到异常点影响的参 数估计值去确认和辨别异常点,这会影响确认和辨别异常点的灵敏度。 作为传统经济时间序列分析的建模工具的a r 模型、m a 模型、a r m a 模型及 a r i m a 模型都是建立在“时间序列中相距较远的两个观测值间完全独立或几乎独 立”的基础上的。这类时间序列是具有自相关函数呈指数率迅速衰减性质的短记忆 时间序列。近年来。人们从对失业率、g n p 、汇率等多种数据的研究中发现,经济 时间序列中普遍存在着这样一种现象:远距离观测值间的相依性尽管很小,但仍 不能被忽视这类时间序列的自相关函数呈负幂指数率衰减,具有这种性质的时 间序列被称为长记忆性时间序列1 2 l 。因此,传统时问序列分析中的建模工具已不能 经济时问序列a r m a 模型的贝叶斯分析及其应用 满足研究需要。基于频率统计理论对分析长记忆时间序列的a r f i m a 模型的参数 估计首先估计长记忆参数d ,然后再用a r m a 模型去拟合消除长记忆性的时间序 列 与基于频率统计理论的时间序列建模方法相比用贝叶斯的方法进行时间序列 模型分析有其独到的特点:第一,它的方法更为普遍,能运用到更加广泛的统计 领域中第二,它允许合理地利用先验信息,而因此更为直接,明确地分析具体 问题。第三,它相对于传统的统计方法能更明确合理地处理不确定因素问题。 贝叶斯方法主要集中在二次损失函数的设定下的后验期望的估计上,这种估 计需要进行从一维甚至到上千维的积分计算。计算后验分布期望的传统数值计算 方法有数值积分、拉普莱斯近似计算和蒙特卡罗( m o m ec 甜1 0 ) 重复抽样等。数值 积分在中等维数( 最大为1 0 维) 问题上非常有效而蒙特卡罗重复抽样是利用传 统方法计算后验分布期望最常用的方法。这种方法可以计算维数很大的问题,并 且有着很高的计算精度目前,马尔可夫链蒙特卡罗( m a r k o vc h a i nm o m e c a r b ,m c m a 方法已经成为一种主要的贝叶斯计算方法l 射。一方面是由于它处理 非常复杂问题的效率,另一方面是因为它的编程方法相对容易目前,在贝叶斯 分析应用中最为广泛的m c m c 方法主要有g j b b s 抽样( g j b b s 鼢m p l e f ) 方法和 m e t r o p l i s - h a s t i n g s 方法m c m c 的研究对推广贝叶斯方法的应用开辟了广阔的前 景 1 2 国内外研究现状 贝叶斯时间序列建模分析是统计学中具有重要理论意义和实用价值的国际前 沿性课题。在国外,尤其是欧美国家,学者对贝叶斯时间序列建模研究起步较早。 二十世纪七十年代,著名的美国统计学家、芝加哥大学的z e l l n c r 【4 1 教授研究了计 量经济学中的贝叶斯理论,包括回归模型、完全递归模型和分布滞后模型的贝叶 斯方法研究;二十世纪八十年代,美国学者l i t t e r m a n 【5 】利用贝叶斯方法,对 m i n n e 舯l a 州的生产总值等七个指标进行预测,并取得了很好的效果;此后,贝叶 斯方法在商业经济预测和政府宏观经济预测的研究逐年增多,如w e s t 【6 】研究了动 态经济计量模型的贝叶斯理论,b e w l e y 【7 1 和g r i 自f i t h s 研究了对数扩散模型的贝叶 斯预测方法;l ( a 舳v a 【8 l 和t a n e m m a 利用后验信息准则和m o n t ec a r l o 方法研制了 一个小型的贝叶斯日本经济预测模型,p h i l l i p s 【9 l 运用贝叶斯方法对澳大利亚宏观 经济时间序列进行了模型构建和预测。在利用贝叶斯理论处理有异常点时间序列 的各种方法中,最早提出异常点诊断贝叶斯方法的是b o x l l0 1 和t j ;a b r a n h a m l 儿】 和c h u a n g 对其进行了拓展,并针对a 0 和1 0 两种类型的异常点将其应用于时间 序列方法中。随着m c m c 方法在贝叶斯分析上的应用,许多学者开始利用m c m c 2 硕士学位论文 方法解决a r m a 模型参数的估计问题m c u l l o c h l l 2 l 和b 盯n e t t 【1 3 1 用基于g i b b s 抽 样的贝叶斯方法分别估计了同时考虑异常点的a r 模型和a r m a 模型中的参数, 但是由于它们复杂的理论推导和缺乏容易操作的软件支持,这种方法一直没有得 到广泛的使用。 h l l r s t 【1 4 l 对潮汐数据的研究中发现了水利时间序列中存在的长记忆性。由此引 发人们对长记忆分析的关注近年来,对长记忆性的研究已经取得了很大的进展: 1 9 6 8 年m 锄d e l b r o t 【1 5 l 在他开创性的工作中首次引进了分数布朗运动及分形的定 义,奠定了长记忆分析的坚实的数学基础;1 9 8 0 年g r a n g e r f l 6 j 针对长记亿时间序 列的特点提出分数差分噪声( f f a c t i o n a ld i f c r e n c e dn o i s e ,f d n ) 模型。f d n 模型只 考虑了时间序列的长记忆性,忽略了时间序列的短记忆性,为了弥补f d n 模型的 不足,g r a n g e f 【1 6 】和h o s k i n g l l 7 】分别提出了应用性更广泛的a r f i m a 模型。在 a r f i m a 模型的参数估计方面,g e w e k e l l 8 】用半参数的方法估计了估计了长记忆时 间序列模型的参数,并用消费价格数据进行了实证分析;b r o c k w e l l 【2 l 和 d a v i s ,h o s k i n g 【1 9 1 ,s o w e l l 【2 0 1 分别用极大似然法估计模型中的参数;p a i 【2 1 1 用基于 m c m c 的贝叶斯方法估计了长记忆时间序列模型的参数,c 撕l j n 【2 2 1 ,k o o p 【2 3 l 等都曾 经在不同的前提条件下用贝叶斯方法对a r f i m a 模型的参数进行了分析 a r f i m a 模型的应用非常的广泛,d i e b o l d l 和r u d e b u s c h s o w e l l 【2 5 】用真实的 g n p 数据,b 【2 6 】利用股票价格数据,c h e u n g 【2 7 1 用汇率数据和h o s k i n g l l 9 j 利用水流 和温度数据分别进行了a r f l m a 的建模分析。在向量长记忆时间序列建模分析的 方法中,h e y d e i 勰1 和g a y ,h o y a l 2 9 1 介绍了在非高斯状态下利用w h i t t l e 准极大似 然法,l o b a t o 【删介绍了用基于w h i i t l c 似然的半参数法,r o b i n n 【3 1 l 用谱回归方法, s e t h u r a m 锄【3 2 l 用渐近极大似然估计法,r a v i s h a i l l 【e r l 3 3 】用贝叶斯方法分别估计 v a r f i m a 模型的参数 在国内,我国学者对贝叶斯统计推断理论与方法的研究相对较晚,并取得了 一系列的成果【球3 5 孤3 7 3 ”但是,从总的情况来看,尤其是与西方国家相比较, 贝叶斯统计在我国的应用与发展尚属于起步阶段这主要有以下几个方面的原因: 首先在国内,目前绝大多数的统计专著或学术论文大多采用频率学派的观点,严 密系统地论述贝叶斯方法的文献很少,贝叶斯方法还不为大家所熟悉;其次,计 算复杂,特别是在高维数据分析问题中尤其如此,缺乏相应的软件支撑,这妨碍 了贝叶斯方法在实际问题中的应用。 本文的研究开辟贝叶斯统计研究的新领域,而且也有利于缩短我国学者在贝 叶斯理论研究与国外的差距,同时对推动贝叶斯分析方法在实践中的应用也具有 十分重要的意义。 3 经济时问序列a r m a 模型的贝叶斯分析及其应用 1 3 本文的研究内容安排 考虑到国内外学者现有的研究现状、已有的研究基础,本学位论文主要应用 贝叶斯分析方法研究三类时间序列模型:稳健a r m a 模型、a r f i m a 模型和 恨f i m a 模型,以及这些模型的数据仿真全文分为五章,各章的研究内容安排 如下; 第1 章:绪论。本章主要论述贝叶斯理论进行时间序列分析的背景:理论与实 际意义;国内外研究现状;最后介绍本文的研究内容安排。 第2 章:时间序列稳健a r m a 模型的贝叶斯分析本章分析了时间序列稳健 a r m a 模型的数学模型及其条件似然函数,根据该似然函数的统计结构构造了模 型参数的先验分布,研究了在该参数先验分布情况下模型的贝叶斯推断理论,包 括模型自回归系数、移动平均系数和精度参数条件后验分布的统计推断,并确定 和辨别出了时间序列中的a o 和l o 两类异常点的类型最后,利用w i n b u g 仿真软 件作数值分析 第3 章:时问序列a r f i m a 模型的贝叶斯分析本章主要分析了时间序列 a r f i m a 模型的数学模型及其条件似然函数,根据该似然函数的统计结构构造了 模型参数的先验分布,研究了在该参数先验分布情况下模型的贝叶斯推断理论, 推导其参数的条件后验密度:数据仿真分析中,利用w i n b u g 仿真软件作数值分 析 第4 章:时间序列球f i m a 模型的贝叶斯分析。本章进行时阈序列v a r f l m a 模型的贝叶斯分析主要以前一章所做a r f i m a 模型的贝叶斯分析为基础,构建了 模型的条件似然函数和参数的先验分布,推导其参数的条件后验密度;在数据仿 真分析中,利用一组e x c e l 软件模拟的时间序列,通过w i n b u g s 软件进行其数 值分析。 最后,对学位论文的研究内容、创新之处和进一步研究展望作一个概括性的 总结 4 硕士学位论文 第2 章时间序列稳健a r m a 模型的贝叶斯分析 2 1 引言 a r m a 模型是时间序列分析中的一类基本模型,它是研究经济金融问题的主 要手段之一。由于被研究对象本身受各种偶然非正常的因素的影响或采样中的误 差,我们选取用来建立a r m a 模型的经济金融时间序列中的极少数观测值远离序 列的一般水平,我们称这样的观测值为异常点。时间序列中的异常点会严重影响 建模过程中模型的识别和参数的估计,从而影响模型的拟合精度,对预测分析造 成一定影响。针对异常点对a r m a 模型参数估计的影响,很多学者提出了不同的 解决方法联合估计法1 1 l 是利用频率统计理论检验时间序列中的异常点并对其进 行处理的使用最广泛的方法之一然而,这种方法有一定的缺陷:首先进行的模 型选择和参数的估计受到还没有辨别出来的异常点的影响;接下来用受到异常点 影响的参数估计值去确认和辨别异常点,这会影响确认和辨别异常点的灵敏度。 在利用贝叶斯理论处理利用有异常点的时间序列建模的各种方法中,b o x 【1 0 】和 t m o 首先提出异常点诊断贝叶斯方法;a b f 柚l l a m 【1 1 l 和c h u a n g 对其进行了拓展。 随着m c m c 方法在贝叶斯分析上的应用,许多学者开始利用m c m c 方法解决 a r m a 模型参数的估计问题。m c u l l o c h 【1 2 】和b a m e t t 【1 3 】用基g i b b s 抽样的贝叶斯 方法分别估计了同时考虑异常点的a r 模型和a r m a 模型中的参数,但是由于它 们复杂的理论推导和缺乏容易操作的软件支持,这种方法一直没有得到广泛的使 用 本文建立考虑两类异常点的稳健a r m a 模型,改进了b a m e n 的复杂的理论 推导,运用基于g i b b s 抽样的贝叶斯方法估计稳健a r m a 模型的参数,并同步确 认和辨别出时问序列中的异常点类型,利用w i n b u g s 软件包进行实例分析,证 明了该模型的直观有效性。 2 2 稳健a r m a 模型的统计结构分析 设 2 , 是平稳时间序列,且满足 妒( 曰) z ,- 8 ( 曰) 口, 其中 妒( 曰) 一1 一 曰一一妒p 曰 日( 丑) 一1 一q 口一一曰9 5 ( 2 1 ) 经济时问序列a r m a 模型的贝叶斯分析及其应用 a ,九,以为模型自回归系数,p 为自回归阶数;q ,吃,吒模型为模型移动平均 系数,口为移动平均阶数;曰为滞后算子即& ,一z 。;随机误差项吒,口:,口。相互 独立,并且均服从正态分布( 0 ,f 1 ) ,f ,0 为模型误差项口,的精度,即方差仃2 的 逆。 假设由于外部的某种偶然非正常因素的影响,使得平稳序列亿 产生了几个 异常点,因此我们实际观测到的序列为 只 根据异常点产生的特点,f o x 【3 9 1 把时 间序列中的异常点分为a o 和i o 两类。a o 是由于f 时刻外部可测量的误差项0 f 影 响此时刻的观测值造成的,它的出现并不波及到邻近的观测值。因此,用时间序 列 y , 建立只考虑a o 的稳健a r m a 模型可以写作如下形式: y l z t + o t ,f 一1 ,2 ,斤( 2 2 ) 其中满足a r m a ( p ,q ) 模型。设外部的误差项q 满足 o ,一k 6 ,屯2 0 ,( 2 3 ) 其中 6 ,一( 0 ,f - 1 ) 则o f 服从均值为o ,方差为瑶f 。1 的正态分布,即o i 一( 0 ,瑶f - 1 ) 。 由( 2 3 ) 式可得:若一o 则q o 即不存在外部因素对f 时刻的观测值的影 响,那么此时刻的观测值为正常值;若气,o 则q ,o 即外部因素对f 时刻的观测 值产生影响,那么f 时刻的观测值是一个a o 产生l o 的主要原因是f 时刻外部的非正常因素n 影响平稳时间序列满足 a r m a 慨q ) 模型中的误差项q ,从而波及到它邻近的一批观测值,使得这些观测 值表现出异常。因此,用时间序列 只 建立只考虑l o 的a r m a 模型有如下形式 y ,一1 ;f ,( 口y ,+ 4 ,) ,f 一1 ,乏,露( 2 4 ) 其中 妒) 一妒“p 妒p ) 设 lr ,+ qi 七2 t 4 ,七2 ,2 1( 2 5 ) 则 q 一( o ,磋f 。) 由( 2 5 ) 式可得,若乞一1 ,则p ,一4 ,一 r ( o f - 1 ) ,因此可知f 时刻的观测值为正 常值;若乞,1 ,则f 时刻的误差项受到了外部非正常因素的影响,那么f 时刻的 观测值表现出异常。 由以上分析可得,用时间序列 y ,建立同时考虑两类异常的稳健a r m a q ) 的模型为 二k ,一 g 6 , l 妒( 曰) y ,一日( 曰) 巳, f 一1 ,一 、7 6 硕士学位论文 2 3 稳健a r m a 模型参数的贝叶斯分析 2 3 1 稳健a r m a 模型的似然函数分析 用l ,- ( y 。,) ,) 7 表示观测值向量,设模型的参数向量为呀一仰,口,墨f ) ,其中 妒一协,啦) 是自回归参数向量,一一 ,巳) 是移动平均参数向量, 鬈一( k ,恐,x ) ,k 一。,乞) ;前样本观测值向量为y 一一( y o ,y 。,_ ) ,p + 。) , 前样本误差项向量为p 一一( ,t i ,巳。i ) 由以上分析可得模型( 2 6 ) 的条件似然函数为【4 0 l ,彤i r ,p 。,功一,魄i r ,f ,叼) ,d :i m ,r ,e 一,们,( ki 咒,儿, ) ,r ,e 一,忉 一伽一厂“如如一屹尸2 唧 i 詈鱼譬 ( 2 7 ) 。( 2 疗1 厂”恢如一屹广2 e x p _ i 妻舌 其中 心一耋虫只- i 一霪巳,f 一1 ,2 ,露 6 - 只一蓦晚只4 + 霪日肛一协“,一 ( 2 8 ) 若把( 2 8 ) 式中的参数如,8 ,f 一1 2 b j 一1 2 ,鼋看作未知数,则q 分别是参 数识,f 一1 ,2 ,b 的一次函数,分别是参数p j ,一1 ,2 ,q 的最高次项为f 的多项式。 2 3 2 参数先验分布的设置 贝叶斯学派的基本观点是:任何一个未知量都可以看作一个随机变量并且可 以用一个概率分布去描述它,这个概率分布称为先验分布。以下是模型( 2 6 ) 中包 括的所有的参数的先验分布: 2 3 2 1 参数砚的先验分布的设置 对自回归参数哦,f 一1 ,p 做变换【1 3 礼4 2 4 3 l 6 ;一4 j + 包仍,f 一1 ,2 p ( 2 9 ) 其中砚服从( 一l ,1 ) 上的均匀分布,口i 和趣是与仍相互独立的常数; 2 3 2 2 参数:的先验分布的设置 对移动平均参数8 j ,j - 1 ,q 做变换i l ,1 4 2 船】 8 ,一c j + q ,j 一1 ,鼋( 2 1 0 ) 7 经济时问序列a r m a 模型的贝叶斯分析及其应用 其中哆服从( 一1 ,1 ) 上的均匀分布,巳和f j 是与相互独立的常数。 2 3 2 3 参数k 的先验分布的设置 设墨一( k ,屯) ,其先验分布为二维离散分布1 1 ,1 2 3 2 4 参数f 的先验分布的设置 根据b r o e m e l j n g l 4 4 1 的观点,取g a 珊瑚( n ,声) 分布为精度f 的先验分布, 即 玎( f ) f 4 - 1e l 甲 印 2 3 3 参数条件后验分布的贝叶斯推断 设经过变换后的参数向量为万一( 仍m ,墨f ) ,其中妒一( 吼,仍,) , m 一( q ,吨,) 在已知时间序列 y , 和各个参数的先验分布后,由贝叶斯理论 砺l y ) 一 他l 厩如甑) ,l 覆胍玩 * ,0 7 l 厩觚) ( 2 1 1 ) 刚以得剑参毅哌的后验分布,其中玩代表参数向量牙一瓴甜,墨力中的任一参 数。下面是模型( 2 6 ) 中各个参数的条件后验分布: 2 3 3 1 参数仍的条件后验分布 由( 2 8 ) 式可知是蛾的一次函数,而由( 2 9 ) 式对参数噍进行的变换可得,也 是锻的一次函数,则饿的条件后验密度为 ,晚l l r ,r ,鸭k d * ,l y ,口,牙弦娩) 唧 ;砉挚 * 唧 - 三“j + a 概+ c u 开) g 1 2 ) 一唧 - 譬锄+ 去) 2 m ,p 其中a 。,执。,c u 中不包含参数 由以上分析可知,对于给定参数吼;,鸭k ,f 的值,识的条件分布为均值、方 差分别为 卜娩l y ,y - ,鸭k f ) 一一是 1 晚i y ,r 芦一,鸬k 咖若 8 硕士学位论文 的正态分布 2 3 3 2 参数哆的条件后验分布 由( 2 8 ) 式可知q 是b 的最高次为f 次的多项式,而由( 2 1 0 ) 式对参数见进行的 变换可得,巳也是的哆最高次为f 次的多项式,则哆的条件后验密度为 ,鸭iy y 一,e ,毋棚k ,k _ r ) * ,彤i y ,r ,西期吨) 唧嵫掣娜m ,吁 g j 3 由以上分析可知,对于给定参数魄j ,k ,f 的值,j 的条件后验罾厦小具硐一股的 分布形式。 2 3 3 3 参数墨的条件后验分布 由于设置k 的先验分布是离散形式的,所以k 的条件后验分布也是离散形 式。根据贝叶斯定理和给定仍,f 的值,可得墨的条件后验分布为 ,假iy ,y 一,。一,毋鸭,刁善坐匕型唑进卜n 一( 2 “) 朋i y ,y - ,f ,枷假) ,i i 2 3 3 4 精度f 的条件后验分布 ,pi y ,y 一,e 一,妒,k ) * ,( yl y 一,e 一,彳) 靠 ) * f 三e 印 一三羹苦卜”l e 印( 一垆) ( 2 1 5 ) f2 唧 一二、f _ k e 】【p ( 一筇)f 2 1 5 1 * p 一唧 一三( 薹苦删) f 尹”1e x p 卜三( 亨善+ 2 卢) 从上式中可以看出,对于给仍啦k 的值,随机误差项的精度f 的条件后验分 布为形状参数、位置参数分别是三+ 口,三( 砉苦+ 2 卢) 的g a m m a 分布;根据g a m m a 分布的统计性质,可以得到精度f 的条件后验期望和方差为 , p r e 一绎茹 p 一,舭即茹 9 经济时间序列a r m a 模型的贝叶斯分析及其应用 一r p 一一髦 v矗,。7:l,一,p一,。n。,。,i契 2 4m c m c 方法在估计模型参数的后验均值和方差中的应用 m c m c 方法的基本思想是【4 5 帕l :建立一个马尔科夫链对未知变量玑进行模 拟,当链达到稳态分布时即得所求的后验分布随机点以来自于分布玎( 【厂) ,由 不同的抽样方法得到了不同的m c m c 方法,如m c t r o p o l i s _ h a s t i n 铲方法、g i b b s 抽样方法以及各种复合方法。 g i b b s 抽样是最简单也是应用最广泛的一种抽样方法,同时也是w i n b u g s 软 件的基础,其本质上是m e t f o p o l i s - h 髂t i n g s 方法的一种特例。在上述假设条件下, 首先给定各个参数的初始值彳卿一印即,n j ( 0 ) ,足仰,f 卿) ,然后从上面的分析得到的 各个参数识,墨f 的条件后验密度中循环抽取的n 次,g i b b s 抽样的第一次迭代如 下 面p f 国。溺,两,、 而f 嫡2 | 自p 赢萄粤、 i 两一f 哂。i 群,;i 譬而文,洒、 i 町9 一,( 叩。讲”,叼尹,叼墨) 其中表示左边从右边抽取。以上完成了一次g i b b s 迭代过程,即完成了由 石卿- 印 ,即,k ,f 吣) 到牙一仰,n ,k f ) 的转移。经过万次迭代,则可 以得到各参数的n 次抽样值 ,i “,矿i ( ”,彳l ( 。 彳”,窄”,矿。) ; 彳 ( ”,玎f ”,彳_ i ! 【。 ; 矿j ( ”,j ( ”,彳。) 当马尔可夫链在循环迭代m ( m n ) 次后收敛时,由蒙特卡罗积分公式可以得到 各个参数的后验均值和方差分别为 硕士学位论文 e 瓴,一击,耖, 哳阶点,弘,) ) 2 一亡,驷2 其中玩表示参数向量疗一( 仍鸭k ,f ) 中的任一参数。 。2 5 实证分析 2 5 1 数据 下面用1 9 4 9 年至2 0 0 5 年我国人口自然增长率( 表2 1 ) 来建立稳健a r m a 模型并估计其参数。 表2 1l 4 ,年至2 0 惦年我国人口自然增长率 年代 y 1 9 4 91 6 1 9 0 02 0 2 0 o o2 3 0 02 4 0 02 0 3 22 0 5 02 3 2 31 7 2 4 1 9 5 91 0 1 9- 4 5 73 7 82 6 9 93 3 3 32 7 “2 8 3 82 6 2 22 5 5 32 7 。3 8 1 9 6 92 6 0 82 5 8 32 3 3 32 2 1 62 0 8 91 7 4 81 5 6 91 2 6 61 2 0 61 2 o o 1 9 7 91 1 6 11 1 8 71 4 5 51 4 4 91 1 5 4l o 8 11 3 0 81 4 2 61 5 5 71 6 6 1 1 9 8 91 5 7 31 5 0 41 4 3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论