(应用数学专业论文)两类时间序列模型预测的分析与研究.pdf_第1页
(应用数学专业论文)两类时间序列模型预测的分析与研究.pdf_第2页
(应用数学专业论文)两类时间序列模型预测的分析与研究.pdf_第3页
(应用数学专业论文)两类时间序列模型预测的分析与研究.pdf_第4页
(应用数学专业论文)两类时间序列模型预测的分析与研究.pdf_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 自然科学和社会科学各个领域中都会遇到大量的时间序列,对这些时间序列进行分析、 建模和预测对于人们更好的掌握和控制未来行为有着重要的现实意义。本文首先介绍了时 间序列分析的相关概念,其次介绍了几种传统的时间序列模型,并选用股价数据实例分析 了基于a r i m a 模型的建模和预测方法,结果表明a r i m a 模型在描述股票市场价格波动 特征方具有一定借鉴性,拟和预测的结果在定程度上可以代表股票价格的走势,但它只 在短期趋势预测方面有一定可行性,对于长期趋势以及突然上涨或下跌,就会表现出局限 性。文章为了进一步提高预测精度,针对股票价格数据有很频繁的小幅波动不具有分析和 预测价值,根据小波在信号消噪方面的应用,提出了一种基于小波消噪的数据预处理方法。 将处理后的数据用于a r i m a 模型预测,并将其与原预测模型进行比较。比较试验结果发 现,采用处理后的数据做模型预测的相对误差更小,从而精度更高。 进一步的,针对右删失数据条件下的a p ( p ) 模型,为了提高模型的预测准确度,文章 介绍了e m 算法及其改进并给出了基于e m 算法及其改进的右删失数据条件下a r ( 1 ) 模型 的具体算法,最后作出实际模拟,结果显示补值效果良好。 关键词:时间序列,模型预测,小波消噪,右删失,e m 算法 a b s t r a c t t h e r ea r em a n yt i m es e r i e si nn a t u r a la n ds o c i a ls c i e n c ea r e a s f o rb e t t e rm a s t e r i n ga n d c o n t r o l l i n gt h ef u t u r e ,i th a sa l li m p o r t a n tp r a c t i c a ls i g n i f i c a n c et oa n a l y z et h e s ed a t aa n dg i v ea p r e d i c t i o nm o d e l t h i sp a p e rf i r s ti n t r o d u c e ss o m er e l a t e dc o n c e p t so ft i m es e r i e sa n a l y s i sa n dp r e s e n t ss o m e t r a d i t i o n a lt i m es e r i e sm o d e l s t h e n ,t h i sp a p e rm a i n l ya n a l y z e sa r i m am o d e lw i t hs t o c kp r i c e d a t aa n dd i s c u s s e st h em o d e l i n ga n dp r e d i c t i o nt e c h n o l o g yo ft h i sm o d e l t h ea d v a n t a g e sa n d d i s a d v a n t a g e so ft h i sm o d e li sa l s op o i n t e do u t t h er e s u l ts h o w sa l t h o u g ha r i m am o d e lc a n d e s c r i b et h ef l u c t u a t i o nc h a r a c t e r i s t i c so fs t o c kp r i c ed a t aw e l l ,t h e r ea r es t i l lf l u c t u a t i o nw i t h i na n a r r o wr a n g ei ns t o c kp r i c ed a t aw h i c hw i l lr e d u c et h ea c c u r a c yo f a r i m am o d e l i no r d e rt or a i s et h ep r e d i c t i o na c c u r a c yo fa r i m am o d e l ,an e wm o d e lw i t hd a t a p r e p r o c e s s i n gm e t h o db a s e do nw a v e l e td e - n o i s i n gi sp r o v i d e di nt h i sp a p e r c o m p a r e dw i t ht h e r e s u l t so ft h ea r i m am o d e lw i t h o u tp r e p r o c e s s i n g , t h en e wm o d e lh a sah i g h e rp r e d i c t i o n p r e c i s i o n a c c o r d i n gt oa r ( p 1p r o c e s sw i t l lt h er i g h tc e n s o r e d ed a t a , t h i sp a p e rp r o v i d e se ma l g o r i t h m a n di t ei m p r o v e m e n tf o rah i g h e rp r e d i c t i o np r e c i s i o n t h ec o n c r e t ea l g o r i t h mi sg i v e nf o ra r ( 1 ) s i m u l a t i o nr e s u l t ss h o wt h a tt h em e t h o dw o r k sw e l l k e y w o r d :t i m es e r i e s ,p r e d i c t i o nm o d e l ,w a v e l e td e n o i s i n g ,r i g h tc e n s o r e d e ,e ma l g o r i t h m 学位论文独创性声明 本人郑重声明: 1 、坚持以“求实、创新”的科学精神从事研究工作。 2 、本论文是我个人在导师指导下进行的研究工作和取得的研究成果。 3 、本论文中除引文外,所有实验、数据和有关材料均是真实的。 4 、本论文中除引文和致谢的内容外,不包含其他人或其它机构已经发 表或撰写过的研究成果。 5 、其他同志对本研究所做的贡献均已在论文中作了声明并表示了谢意。 伪。毒 作者签名:矗i 叠 日 期: q 望:j 学位论文使用授权声明 本人完全了解南京信息工程大学有关保留、使用学位论文的规定, 学校有权保留学位论文并向国家主管部门或其指定机构送交论文的电子版 和纸质版:有权将学位论文用于非赢利目的的少量复制并允许论文进入学校 图书馆被查阅:有权将学位论文的内容编入有关数据库进行检索:有权将学 位论文的标题和摘要汇编出版。保密的学位论文在解密后适用本规定。 作者签名:盔! 菱 日 期: 垒21 两类时间序列模型预测的分析与研究硕士学位论文 第一章绪论 1 1 时间序列分析方法综述 1 1 1 时间序列的含义 时间序列是按照时间顺序取得的一系列观测值。这些观测值是按时间顺序排列的,时 间点之间的间隔是相等的,可以是年、季度、月、周、日或其它时间段。这些时间序列由 于受到各种偶然因素的影响,往往表现出随机性,彼此之间存在着统计上的相互依赖关系。 很多数据是以时间序列的形式出现的,如按日统计的股票市场的波动,按月统计的商品销 量、销售额或库存量,按年统计的一个省市或国家的国民生产总值、人口出生率等等。 从系统运行的观点来看,时间序列就是某一系统在不同时间地点、条件等的响应。从 这个意义上来看,时间序列是按一定顺序排列而成,这里的“一定顺序”既可以是时间顺 序,也可以是具有各种不同意义的物理量,如代表温度,速度或其他单调递增地取值的物 理量。可见,时间序列只强调顺序的重要性,而并非强调必须以时间顺序排列。 人们希望通过对时间序列的分析,从中发现和揭示某一现象的发展变化规律,或从动 态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多得从 中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未来行为。从 经济到工程技术,从天文地理到气象,几乎在自然科学和社会科学各个领域中都会遇到时 间序列,因此对时间序列进行研究具有重要意义。 1 1 2 时间序列分析方法的发展概况i z l 时间序时间序列( t i m es e r i e s ) 分析是概率统计学科的一个分支,是动态数据分析处 理的一种重要的方法,是以概率统计学作为理论基础来分析随机数据序列或称动态数据序 列,并对其建立数学模型,即对模型定阶、进行参数估计,以及进一步应用于预测、自适 应控制等诸多方面,是一个具有相当高的实际价值的应用研究领域。 时间序列分析方法最早起源于1 9 2 7 年,数学家耶尔( y u l e ) 提出建立自回归( a r ) 模型预测市场变化规律。接着,在1 9 3 1 年,另一位数学家瓦儿格( w a l k e r ) 在( a r ) 模 型的启发下,建立了滑动平均( m a ) 模型和自回归、滑动平均( a r m a ) 混合模型,初步 奠定了时间序列分析的方法,当时的主要应用在经济分析和市场预测领域。 2 0 世纪6 0 年代,时间序列分析理论和分析有了新的突破,伯格( b u r g ) 在分析地震 两类时间序列模型预测的分析与研究硕士学位论文 信号时最早提出最大熵谱( m e s ) 估计理论,将时间序列分析方法扩展到了频域内,得到 了更加广泛的运用,特别是在各种工程领域内应用谱功率分析的概念更加方便和普遍。 到2 0 世纪7 0 年代以后,随着信号处理技术的发展,时间序列分析方法不仅在理论上 更趋完善,尤其是在参数估计、定阶方法及建模过程等方面都得到了许多改进,目前,有 关的新算法、新理论和新的研究方法层出不穷,同时结合各种人工智能方法的时序分析模 型的研究也在不断的深入。目前,时间序列分析方法已经广泛运用于预报预测领域,例如 气象预报、市场预测、地震预报、人口预测等;精密控制领域,例如精密仪器测量、航空 航天轨道跟踪和监控、精密机械制造、精细化工控制等,同时还可于安全检测和质量控制 领域。 1 1 3 时间序列分析方法的分类 按研究领域的不同可以将时间序列分析方法分为两大类,时域分析方法和频域分析方 法。 1 时域分析方法 时域分析是时间序列分析的主流方法,主要是对时间序列的数据生成过程的研究,力 求找到能够更好数据生成的过程,主要是从序列自相关的角度揭示时间序列的发展规律。 时域分析方法具有理论完善,算法清晰,结果易分析等特点,己广泛应用于自然科学和社 会科学的各个领域。 时域分析方法的基本思想是承认事物发展的延续性。应用过去数据,就能推测事物的 发展趋势。二是考虑到事物发展的随机性。任何事物发展都可能受偶然因素影响,为此要 利用统计分析对历史数据进行处理,分析的重点就是寻找这种规律,并拟合出适当的数学 模型来描述这种规律,进而利用这个拟合模型来预测序列未来的走势。 时域分析方法具有相对固定分析步骤 ( 1 ) 考察观测值序列的特征; ( 2 ) 根据序列的特征选择适当的拟合模型; ( 3 ) 根据序列的观测数据确定模型的参数; ( 4 ) 检验和优化模型: ( 5 ) 利用拟合好的模型来推断序列其他的统计性质或预测序列未来的发展。 时域分析方法的产生最早与1 9 2 7 年英国统计学家耶尔( y u l e ) 提出建立自回归( a r ) 模型预测市场变化规律。不久之后,英国数学家、天文学家瓦儿格( w a l k e r ) 在分析印度 大气规律时使用了移动平均( m a ) 模型和自回归、滑动平均( a r m a ) 混合模型,这些模 2 两类时间序列模型预测的分析与研究硕士学位论文 型奠定了时间序列时域分析方法的基础。 1 9 7 0 年,美国统计学家g e p b o x 与英国统计学家j m j e n k i n s 在他们共著的t i m es e r i e s a n a l y s i s - f o r c a s t i n ga n dc o n t r o l 一书中系统阐述了对差分自回归移动平均( a r i m a ) 模型 的识别、估计、检验及预测的原理及方法,这些知识是时域分析方法的核心内容,被称为 经典时间序列分析方法, 2 谱分析方法 频域分析方法也被称为“频谱分析或“谱分析”方法。早期的频域分析方法假设任 何一种无趋势的时间序列都可以分解成若干不同频率的周期波动,借助傅里叶分析从频率 的角度揭示时间序列的规律,后来又借助了傅里叶变换,用正弦、余弦项之和来逼近某个 函数。2 0 世纪6 0 年代,伯格( b u r g ) 在分析地震信号时提出最大嫡谱估计理论,该理论 克服了传统谱分析所固有的分辨率不高和频率漏泄等缺点,使谱分析进入一个新阶段,我 们称之为现代谱分析阶段。 目前谱分析方法主要运用于电力工程、信息工程、物理学、天文学、海洋学、和气象 科学等领域,它是一种非常有用的纵向数据分析方法。但是由于谱分析过程一般都比较复 杂,研究人员通常要具有很强的数学基础才能熟练使用它,同时它的分析结果也比较抽象, 不易于进行直观解释,导致谱分析方法的使用具有很大的局限性。 3 小波分析方法: 这里我们把时间序列的小波分析方法单独列出来,是考虑到该方法的独特性,即同时 具有时频两域表征信号局部特征的能力。 很多时间序列表现出较强的非平稳性和长记忆性,这使得许多传统的单独集中于时域 或频域研究的分析方法已经不再适用了。而小波分析作为一种新型的信号分析方法,因其 在时频两域都具有表征信号局部特征的能力,非常适用于分析非平稳信号【2 1 。小波分析是 近年发展起来的新兴的数学分支,已经在图像和信号处理、地震勘探、气象水文分析、模 式识别、语音识别等众多学科中得到了广泛应用。近年来,小波分析在金融时间领域内的 应用也越来越受到人们普遍关注, 1 2 国内外研究现状 自从b o x 和j e n k i n s 共著的t i m es e r i e sa n a l y s i s f o r c a s t i n ga n dc o n t r o l 一书出版以来, 在时域领域内时间序列分析逐渐形成了一整套模拟、估计、建模、预测和控制的理论和方 法,在动态数据的处理分析、复杂信息的加工提取、预测未来和在线控制等方面显示出传 3 两类时间序列模型预测的分析与研究硕士学位论文 统的数理统计静态处理手段无可比拟的优越性。线性模型和非线性模型概念清晰,发展已 比较成熟,例如国内年安鸿志、陈兆国的专著时间序列的分析与应用【3 】和年杨叔子等 著的时间序列分析的工程应用【4 j ,同时国内外己有许多用线性模型进行预测的实例。 针对时间序列的时变方差性,1 9 8 2 年r o b e r te n g l e 提出“自回归条件异方差模型”a r c h ( a u t o r e g r e s s i v e c o n d i t i o n a lh e t e r o s k e d a s t i c ) 模型 ,其后的1 9 8 6 年b o l l e r s l e v t o 】又在其基础 上提出了g a r c ( g e n e r a l i z e da r c h ) 模型。最近2 0 年中,许多学者在模型的基础上,针对 不同的问题提出了相应的模型扩展,形成了a r c h 模型族。在时间序列预测方面,研究成 果也比较丰硕:对单变量模型,人们提出了“门限自回归模型【7 】,、“双线性模型【8 】,、马 尔科夫转换过程【9 】、“平稳转换和混沌模型【1 0 】”,“人工神经网络逼近【1 1 】”,“随机方差模型 等模型。对多变量模型还有“一般动态回归”、“多变量回归f 1 2 j ”,“自变量回归【1 3 j ”、“共同 周期趋势分析1 1 4 等理论。2 0 0 3 年,克莱夫一格兰杰( c l i v e g r a n g e r ) 和罗伯特一恩格尔 ( r o b e r t - e n g e l ) 以他们在时间序列计量经济学里的贡献获得2 0 0 3 年度的诺贝尔经济学奖。他 们分别用“随着时间变化的易变性”和“共同趋势”两种新方法分析经济时间序列,从而 给经济学研究和经济学发展带来巨大影响。 随着时间序列分析从传统理论到现代研究的一步步拓展,对于时间序列均值和方差甚 至是更高阶矩的研究也不断深入【l5 1 。大量的实证分析告诉我们,很多时间序列数据是不稳 定的随机序列,其分布未必是正态分布,这在经济时间序列中尤为明显,用传统的时间序 列分析方法难以精确描述。而常适用于分析非平稳信号的小波分析在时间序列分析中的运 用有了明显的发展。1 9 8 6 年,m e y e r 证明了一维小波基的存在,构造了第一个真正的小波 基,国际上从此开始形成研究小波的热潮。1 9 9 0 年,崔锦泰和王建忠构造了基于样条函数 的单正交小、波【1 6 】。1 9 9 1 年,a l p e r t 和r o k h l i n 通过构造r ( r 2 ) 个尺度函数,形成了多小 波理论的思想。1 9 9 4 年g o o d m a n 等人基于r 重多分辨分析,建立了多小波的基本理论框架。 至此经典小波分析理沦己基本成熟,近年来高维小波理论己逐步被人们所关注【。丌,如国家自 然科学基金委“九五”重大项目金融数学、金融工程、金融管理的项目研究人员已经 开始采用小波分析方法对诸多金融问题进行深入的定量研究。 1 3 研究意义及主要研究内容 1 3 1 研究的意义 时间序列分析方法已日趋成熟,其应用领域也越来越广泛,需要建立精度高的时间序 列模型,但是其过程是相当复杂的,对模型的建立和参数的估计都提出了较高的要求。小 4 两类时间序列模型预测的分析与研究硕士学位论文 波分析由于在时频两域都具有表现局部特征的能力,可以很好的处理非平稳性和长记忆性 的时间序列数据,众多的经济、金融数据都具有这样的特点,所以时间序列的小波分析也 是值得深入研究的课题。同时,由于数据采集过程中不可避免的因素影响,如失访、改变 防治方案、研究时间结束时事件尚未发生、采集数据机器故障等情况,使得所采集的数据中 许多应该采集而未能采集,应提交而未在一些时点上提交造成数据不完全,对这类时间序列 数据模型的建立也值得研究。 1 3 2 研究的主要内容 本文主要做了以下几个方面的研究工作: 1 系统讨论了时间序列模型及建模技术,包括描述平稳时间序列的a r 模型、m a 模 型和a m r a 模型以及描述非平稳序列的a r i m a 模型,重点讨论了a r i m a 模型,建立了 基于金融数据的a r i m a 模型,实证分析了该模型具有良好的效果。 2 系统地讨论了小波分析般理论,并根据小波在信号消噪方面的应用,结合时间序 列的预测模型,提出了一种基于小波分解的消噪预测模型,并将其与原预测模型进行比较。 比较试验结果发现,应用消噪后的数据进行模型预测比原始数据进行直接预测相对误差更 小,从而精度更高。实证分析此方法是有效的。 3 讨论了a r 序列 置) 被另一a r 序列 z ) 删失的右删失时间序列模型以及基于e m 算法及其改进的a r ( 1 ) 模型的预测问题。 1 3 论文组织结构 第一章介绍了本文的研究背景和研究意义并对国内外研究现状做了详细阐述,最后对 本文的主要研究内容做了概括性说明。 第二章系统介绍了描述时间序列的主要模型的理论基础,对基于随机过程的时间序列 分析预测理论做了详细研究。最后,实证分析a r i m a 模型的建模方法并建立了基于股价 数据的a r i m a 模型并将该模型用于预测,预测结果显示效果良好。 第三章在a r i m a 模型的基础上,利用小波分析和金融时间序列的理论并结合文章第 二章中的模型提出股价数据消噪预处理方法,并实证分析了该方法用于预测模型的优越性。 第四章讨论了基于e m 算法及其改进的右删失数据条件下a r ( 1 ) 模型的预测问题, 实证分析了基于e m 算法及其改进的模型预测效果。 第五章对本文工作的总结及对未来研究工作的展望。 5 两类时间序列模型预测的分析与研究 硕士学位论文 第二章时间序列预测模型及建模技术 2 1 时间序列分析的相关概念 2 1 1 时间序列的数学描述1 1 8 l : 按时间次序排列的随机变量序列 彳l ,x 2 , ( 1 1 1 ) 称为时间序列。如果用 五,乇,x n ( 1 1 2 ) 分别表示随机变量五,五,x 的观测值,就称( 1 1 2 ) 是时间序列( 1 1 1 ) 的n 个 观测样本,这里n 是观测样本的个数。如果用 而,恐9 o ( 1 1 3 ) 表示,置,的依次观测值,就称( 1 1 3 ) 是( 1 1 1 ) 的一次实现或一条轨道。 2 1 2 时间序列的平稳性 如果时间序列 置:f 满足 ( 1 ) 对v f n ,珥 是白噪声删( 0 ,仃2 ) ,实数q ,口2 ,a p ( a p 0 ) 使得多项式彳( z ) 的零点都 在圆夕 彳( z ) = 1 - 口z 7 0 ,iz i 1 ( 2 1 1 1 ) 吉1 就称p 阶差分方程墨= a j x , 一,托,t ez ( 2 2 2 ) l 是一个p 阶自回归模型,简称为a r ( p ) 模型,满足a r ( p ) 模型( 2 2 2 ) 的平稳时间序列 t ) 称为a r ( p ) 序列。称口= ( q ,a 2 ,a p ) r 是a r ( p ) 模型的自回归系数,称条件( 2 1 1 ) 是稳定性条件或最小相位条件。 p 阶自回归模型a r ( p ) 是一种在描述时间序列方面特别有效的随机时间序列模型, 7 两类时间序列模型预测的分析与研究硕士学位论文 它是一种动态数据模型,该模型所描述的 e ) 是对其自身过去数值进行回归,故称它为自 回归( a u t o - r e g r e s s i v e ) 模型。 利用时间t 的向后推移算子,可以将a r ( p ) 模型( 2 2 2 ) 改写成 彳( b ) 五= s ,f z ( 2 2 3 ) 其中,a ( b ) - - 1 - a b 7 ,旭z 产1 2 2 2 移动平均( m a ) 模型 设 q ) 是白噪声嬲、厂( 0 ,仃2 ) ,实数6 l ,b 2 ,b q 0 。0 ) 使得多项式: q b ( z ) = 1 + b j z 7 0 , j = t l z l 1 ( 2 2 4 ) 五= q + 屯s 叫,t e z ( 2 2 5 ) j = l 是q 阶滑动平均模型,简称m a ( q ) 模型,而称由( 2 2 5 ) 决定的平稳序列 置) 是滑动 平均序列,简称m a ( q ) 序列。 利用时间的向后推移算子b ,可以将m a ( q ) ( 2 2 5 ) 写成: 五= b ( b ) e ,t z( 2 2 6 ) 2 2 3 自回归移动平均( a r m a ) 模型 设 q ) 是白噪声删( o ,仃2 ) ,实系数多项式么( z ) 和b ( z ) 没有公共根,满足 b o = 0 ,o p 0 和 我们称差分方程 z i 1 ( 2 2 6 ) 五:p 日置一+ 壹吃印,f z ( 2 2 7 ) j = lj = o 是一个自回归移动平均模型,简称为a r m a ( p ,q ) 模型,称满足( 2 2 7 ) 的平稳序列 五) 为 a r m a ( p ,q ) 序列。 8 0 1 ,刀 z j 口 , p 同中 一 ,弋,一曲 卜 。间 = | | 力 力,l,l 4 艿 ,j,【 两类时间序列模型预测的分析与研究硕士学位论文 利用推移算子,可以将( 2 2 7 ) 写成 彳( b ) z = b ( b ) e ,t z( 2 2 8 ) 自回归移动平均( a r m a ) 模型表示时间序列的现在值,不仅与其以前时刻的自身值 有关,而且还与其过去时刻进入系统的扰动存在一定依存关系,模型中既包含自回归部分 也包括滑动平均部分,使得模型在拟合实际数据时具有更大的灵活性。 a r ( p ) 模型可以视为a r m a ( p ,q ) 模型当p = o 时的特殊形式,m a ( q ) 模型则可 以视为a r m a ( p ,q ) 模型当q = 0 时的特殊形式。 2 2 4 模型的识别 在时间序列分析中还有一些在稳随机过程中所没有的特征函数,如自相关函数、相关 偏相关函数、格林函数、逆函数、功率谱函数等,它们从不同的侧面反映了时间序列模型 的特性,对于模型的识别很有帮助,这里只介绍一下本文所用到的自相关函数、相关偏相 关函数。自相关函数p k 和偏自相关函数丸可作为识别时间序列模型的基本标志。 1 自相关函数 构成时间序列的序列值之间的简单相关关系可以用自相关函数来描述,也就是度量同 一事件在两个不同时期的相互影响程度。由于能够得到的只有随机变量的样本观测值,因 此通常用自相关系数来作为实际应用时自相关函数的估计值。 一一k ( 五一i ) ( 工m i ) 延迟k 阶的样本自相关函数为: 二一i = l n = 1 ,其中i 为样本均值。 ( 毛一i ) 2 i = l 随着时间的推移,a 在k 大于某一常数后就恒为零,就认为具有截尾性;否则就可认 为有拖尾性。但是由于样本的随机性,不会出现严格的截尾性,可以通过假设检验是否显 著为零来进行判别。 2 偏相关函数 在求出延迟阶自相关系数时,实际上得到的并不是薯和薯“之间单纯的相关关系,还 会受到中间k - 1 个随机变量+ l ,薯+ 2 ,x t “一l 的影响。引入偏相关函数,就是为了测出 和“之间单纯的相关关系。它剔除了中间k - 1 个个随机变量的干扰后的延迟k 阶自相关 函数,通常用偏相关系数来作为实际应用时偏相关函数的估计值。 9 两类时间序列模型预测的分析与研究硕士学位论文 延迟阶偏相关系数为:丸= 告,v 。 j i q 事的自相关方程组来求解庐1 ,口,即 卦 p c q ) 声( g + 1 ) 声( 9 1 ) p ( q ) p ( q 一+ 1 p ( qp ) 一+ ) p ( q p + 2 p ( qp ) 一 + j p ( q + p - 1 ) p ( q + p - 2 ) p ( g ) 1 0 p ( q + 1 ) 卢( g + 2 ) 声( g + p ) 两类时间序列模型预测的分析与研究 硕士学位论文 在这里,没有考虑1 - q 时的方程式,也就是暂时不考虑滑动平均部分的作用,因此解出 的西,是一种近似值; ( 2 ) 令只= t + 矗一一i + + 庐p x t 一,其自相关函数为 尺,o ) = e ( 只只+ ,) = e ( x ,+ 妒l x t l + + 庐口一p ) ( 一+ ,+ 妒l 五+ ,一l + + 庐口x t + ,一p ) 】 :壹玩驴,r ( ,+ _ ,一f ) ,t r i o = 1 i , j = 0 i g n r 以孟代替,代入上式作为r ,的样本函数爻,即盖y p ) :p 谚吐友o + _ ,一f ) i , j = 0 ( 3 ) 把咒近似看做m a ( m ) 过程,即只a f + 日l a h + o q a 卜4 利用关于m a 参数的估计方法解下列方程 f 毫( o ) = ( 1 + 砰+ + 爵) 【皮,( ,) = 司( 成+ 子。醒。+ + 6 州爵) r = l ,2 ,q 经过以上三步,就可以得到a r m a ( p ,q ) 模型中所有模型参数,但由于它们都是近似值, 所以估计精度不是很高,而且计算涉及到矩阵求逆,算法也比较复杂。 2 a r m a ( p ,q ) 模型参数的最小二乘估计 a r m a ( p ,q ) 模型可以写成:a t = 薯+ p r x t l + + 五一,一0 1 a t l o q a f 一口。利 用逆转关系可以将a t 一,( f = 1 ,聊) 4 9 成x , 印x t 斗1 的线性组合,因此最终得到的方程式 对于参数( 仍,0 ,) 来说必然是非线性的。总之,在一般情况下有 a t = x t z ( 吼,b ,t ) ,其中t = 1 , 2 ,n 或f = p + l ,p + 2 , ( 2 2 9 ) 这里z 是对于参数的非线性函数关系。若根据n - n 个实际观测值,可以将( 2 2 9 ) 表示成 jy = 【h 】,啊2 ,h 2 向量形式e = y f ( x ,p ) ,式中 f = 【+ l ,乃+ 2 ,厶】r 。 【e = 【口川,口肿,a 】7 另外,x 表示观测值五,x u ;p 表示参数仍,1 9 1 ,巳( 当取n 个观测值时,) y ,f ,e 诸元素的下标从1 开始到n 。 此时残差平方和为q = y f ( x ,p ) 】7 【y f ( x ,p ) 】,由于f 不是p 的线性函数,所以不 能根据使q 达到极小来求p ,有必要采用求解非线性最小二乘问题。通常采取线性化的方 1 1 两类时间序列模型预测的分析与研究硕士学位论文 法,将非线性函数展开后仅取线性部分来近似,然后使残差平方和最小。最小二乘估计法 是常用的最佳估计法,由于充分利用了序列值的信息,因而精度很高。 3 a r m a ( p ,q ) 模型参数的极大似然估计 设 置) 是零均值、正态a r m a ( p , q ) 序列,其概率密度函数被模型参数 9 l ,9 。,o l9 * io o q 及c y :唯一确定。引入参数向量记号 = 仍,9 。】1 0 = 0 1 ,0 q 7 p 7 = 【a t , b7 】仅7 = p t ,仃。2 】 记x = i x l ,x 2 ,x , 7 ,则( x i , x 2 ,h ) 的概率密度为 例a ) - ( 2 腼:痔m 舾1 p - 警 ( 2 2 1 0 ) 其中m = 仃。ik - j 1 ,而r = e x x 品】是样本协方差矩阵。对数似然函数可以写成 ,( a l 葺,h ) = 一1 9 2 x + 三1 9 l m l i nl g 吒2 一三蔓罢孝享鳖旦( 2 2 j - ) 由于公式复杂,无法得出求解极限的解析表示,用数值法来解也过于复杂。事实上,很少 采用严格的最大似然估计,而是用近似的估计值来代替。 由( 2 2 i i ) 可以看出,右边第一项只与n 有关,而和参数a 无关。另外,可以证明 右边的第二项中的l m l 具有与n 无关的上界,而后两项是和n 同阶的。因此,只要n 充 分打时,( 2 2 1 1 ) 是否达到最大值取决于右边后两项,即一譬l g 仃:一圣等,也就 是说,z ( aj 五,h ) 取最大值的点,当n 充分大时与 扣:+ 警 娩2 胞, 取最小值的点几乎是一样的。对( 2 2 1 2 ) 求最小值而得到的估计& ,就是在给定样本 五,h 时a r m a ( p ,q ) 模型参数的近似最大似然估计。 可以看出,x t v m x ,仅与参数p 有关,而和d ;无关,通常将它记做q ( b ) ,并称其 为平方和函数。因为 q ( p ) = x t m x = 钟 ( 2 2 1 3 ) f 蕾 1 2 两类时间序列模型预测的分析与研究硕士学位论文 其中么是在给定参数值和有限个样本( x l ,x 2 ,x ) 下口f 的最小方差估计,记作 而b 是方程 岛( q i x ,) = ( 口,j 而,而,h ) ( 2 2 1 4 ) a q a b ( p ) i i i = l i - 0 p = p ( 2 2 1 5 ) a b 的解。由此可得使q ( p ) 达到最小的参数估计值p 和彦:,当样本充分大时,该估计近似的 等于参数的最大似然估计。 适合于( 2 2 1 5 ) 的参数p 使平方和函数q ( p ) 达到极小,称之为最小平方和估计。对 于正态a r m a ( p ,q ) 序列而言,参数的最小平方和估计是极大似然估计的极好近似。 极大似然估计充分利用了序列值的信息,精度较高,是渐进无偏、渐进一致和渐进有 效的。但由于公式复杂,似然方程组由p + q + 1 个超越方程构成,需要经过复杂的迭代才能 求解,因此,事实上是用平方和函数来近似参数的极大似然估计的。 2 3 非平稳时间序列模型体裂2 0 】 2 3 1 自回归求和滑动平均( a r i l v l a ) 模型 设d 使一个正整数,如果 d z = ( 1 - a ) j 置= 畔( 一1 ) 七置书t z ( 2 3 1 ) k = 0 是一个a r m a ( p ,q ) 序列,就称 墨) 是一个求和a r i m a ( p ,d ,q ) 序列,简a r i m a ( p ,d ,q ) 序列,其中磷是二项式系数,于是a r i m a ( p ,d ,q ) 序列满足的模型是 么( b ) ( 1 一b ) d t = b ( b ) e ,z , ( 2 3 2 ) 其中的实系数多项式a ( z ) 和曰( z ) 满足条件多项式的零点都在单位圆外,b 为时间推移算 子。 自回归求和滑动平均( a r i m a ) 模型和它的变形,即求和滑动平均( i m a ) 模型都属 于非平稳的时间序列模型,它们和线形平稳的a r m a 模型有本质的区别,但是将a r i m a 模型或i m a 模型经过一次或多次差分处理后就可以用a r m a 模型来描述。差分运算是实 现平稳化得一种特殊措施,这对建立具有季节性数据趋势项的时间序列模型是相当有效地 方法。但是对于一般情况下的非平稳序列就没有那么简单,需要更加复杂的模型或寻求其 1 3 两类时间序列模型预测的分析与研究硕士学位论文 它建模方法。 2 3 2 季节a r i b l a 模型 季节时间序列的提点是明显的季节性,例如旅游景点的参观人数通常在公休日和旅游 季节会增加,仓储超市的销售额也会在每个周末不同于普通工作日,这样的时间序列数据 显然不平稳。由于序列周期性变化,因此在每个周期特定时刻的数据基本上处于同一水平, 若将某一时刻的观测数据与下一周期对应时刻的观测数据相减,就可能将周期性变化消除 掉,使新序列接近于平稳序列。 定义季节差分算子: v ;= 1 一b 5( 2 3 3 ) 从而 v ,x t = ( 1 一b 5 ) 薯= x t 一五一,( 2 3 4 ) 有时由于长期趋势的关系,还要考虑d 次季节差 v ;d _ = ( 1 - b ) d = v ? x t v f 一1 一, ( 2 3 5 ) 若( v ,d ,丁,s z + ,d n ,de ) 稳定,则满足( 2 3 6 ) 的模型称为季节a r i m a 模型 v ,d 五= o ( b 5 ) 刁( 2 3 6 ) 其中 :蓦三:二詈三二 ! 二二乏竺,而 z t , t etb bb ,为a m 柚序列, io ( b ) = 1 一o l5 一0 2n 一o q d ”。 一7 1 枇吃叫脚心里蕊:二茗二警二i i 心肭 白噪声序列。 将( 2 3 6 ) 代入( 2 3 5 ) 得到一般乘积季节模型: 妒p ( b ) j d ( b 5 ) v d v ? 薯= 0 q ( b ) i 9 口( b 。) q ( 2 3 7 ) 这里加了下标p ,q ,只q , 是为了注明注明各算子的阶数,可以将得到的乘积季节模型简 记为a r i m a ( p ,q ,d ) ( 只q ,d ) s 2 3 3 模型的参数估计 一般而言,a r i m a 模型的参数可以采用非线性的最小二乘法( n o n l i n e a rl e a s ts q u a r e l 进行估计。非线性最小二乘法仍然是以误差平方总和最小为估计准则,用于更加精确的估 计非线性模型的参数。假设非线性系统模型为:y = f ( x ,卢) ,非线性模型f 的形式己知, 1 4 两类时间序列模型预测的分析与研究硕士学位论文 参数卢未知,经过n 次试验,得到n 组数据( y 1 ) ,( 毛) ,则有 l = y k - f ( x t 一卢) 】2 七= l ,2 ,n 。估计准则即为选取使l 最小的p 。一般非线 性最小二乘估计需要用优化算法求解,常用算法有搜索法和迭代法两种。在此我们选用迭 代法计算,其步骤主要是先猜想一组估计的初值,然后由此组初值出发,确定一个向量为 可接受的方向和步长,使参数依某种法则按照使误差平方总和减小的方向变化,得到使误 差平方总和较小的一组参数值,再以此点作为新的出发点进行迭代,直进行到在预先给 定的误差范围内,平方和不会再减小为止。此时的参数最终数值即为模型的最优估计值。 2 3 4a r i m a 模型建模流程 匮丽囹 2 4a r i m a 模型对金融数据短期预测的实证研究 2 4 1 数据获取 文章选取自2 0 0 7 年6 月1 日至2 0 0 7 年1 2 月2 4 日上交所浦发银行( 6 0 0 0 0 0 ) 当日收 盘股价数据,样本容量为1 1 6 个,数据来源为上交所股票交易系统,数据的处理分析主要 运用s a s 9 1 软件。 2 4 2 模型的识别和选取1 2 1 1 1 2 2 1 1 2 3 l x 图一:浦发银行股价数据时序图 1 5 两类时间序列模型预测的分析与研究硕士学位论文 u l o r m f “i 口b c ( r t t r i mc o r r e l l t i - i ,0765 4021ol 2845i7lii敏1 1e r r o r i ; 。i t r k s t 图二:浦发银行股价序列自相关图 序列的时序图( 图一) 显示出的带长期递增趋势的周期性质,自相关图( i 虱- - ) 显示序列 自相关系数长期位于零轴的一边,这是具有单调趋势序列的典型特征。自相关图显示出来 的性质与该序列的时序图是非常吻合的,由此表明该序列是非平稳的。 将数据做一阶差分,通过a d f 单位根检验( 图三) 表明,一阶差分后的数据具有平稳 性。 t y p e l l t r s z e r o - 蝴0 1 s i n g l e 0 1 t r e n d0 2 4 3 模型的定阶 a t n e n a n t e dd e k 掌r - f u ii o r 嘶i tp o o rt e s t s 褂p r 尉t up r f 图三:一阶差分后序列a d f 单位根检验图 赤池信息量准则( a k a i k e si n f o r m a t i o nc r i t e r i o n ,a i c ) 是赤池宏次( h a k a i k e ) 吲【6 l 在研究信息论特别是解决时间序列定阶问题中提出来的,在统计模型的选择中有着广泛的 应用。我们在判断模型的自回归阶数p 和移动平均阶数q 时,常常会用到该准则,它可以 对模型参数给出最佳的极大似然估计,达到减少模型预测误差的目的。 a i c 准则用近似公式表示为:a i c ( p ,q ) = l n ( 占2 ) + 2 ( p + q ) t ,其中t 为样本长度, 占2 是对噪声项方差估计,如果模型中含有参数项,就用p + q + 1 代替m 。选定p 和q ,就 可以得到个a i c 值,由于样本长度有限,p 和q 越大,估计精度越低,占2 增加,因此 a i c 值也开始增加,所以要选择使a i c 值最小的p 和q 。 1 6 0柏矾昭蛐”砧碍驰引柚盯驰帱砧踮耵柚博他“吓ii5;l 2j,2;l:;l 5 口i;i:;i;4 4 肼i到:2 2 3 3 3 3 3 3 3 3 4i4 4 4 4 4 4 5口口ol 3 3lll !iill;l 7mom二il;i!;-,8 m”tnrii;j,8 j;16b i 8i|!;:5 0 9 qrl;lll 5l,;3 3 8 333330;,il;l;7 28mv 4l;9i;i 0 83 0 li 6ll;0 2 5iiml=_l 5 0;iil1日口;,4l!ll;l|ij;3 l;|;ll 4“bimnm15;j,j,;l;2 “ !0堙侣伍体仃仆伸卸引龆船“ n u 0 0 0仰0 0 0 0如惦的轴盯 船柚 0 0 0 0 0 0叩仰 是残差 序列。通过对差分后的平稳序列v z 进行预测,然后在对v z 进行d 次求和,就可以得到 1 7 两类时间序列模型预测的分析与研究硕士学位论文 原序列r 的预测结果。 运用s a s 9 1 软件,我们得出浦发银行( 6 0 0 0 0 0 0 ) 股价时间序列的五个预测值,它们 与真实值之间的比较如下表 表2 - 3 浦发银行( 6 0 0 0 0 0 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论