已阅读5页,还剩56页未读, 继续免费阅读
(系统工程专业论文)多变量混沌时间序列预测及其在股票市场中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多变量混沌时间序列预测及在股票市场中的应用 研究生:方芬导师:王海燕( 教授)东南大学 摘要 本文主要研究了多变量混沌时间序列相空间重构参数的选取和多变量混沌 时间序列的预测方法,在已有的多变量混沌时间序列相空间重构参数选取方法的 基础上,提出了两种改进方法;在此基础上,提出了多变量混沌时间序列的局部 多项式和正则化局部多项式预测方法。通过l o r e n z 系统等混沌模型仿真证实了这 些改进方法比目前的常用方法具有更好的预测精度,然后将这些方法应用于上海 股票市场中指数时间序列的预测。论文安排如下: 首先,概述了股票市场指数时间序列分析中应用混沌时序预测理论的背景和 研究现状,介绍了目前混淹时间序列预测法的研究进展。在混沌时问序列预测中, 相空间重构理论是基础,而嵌入维数和时间延迟是相空间重构中的两个重要参 数,本文在对这两个参数选取法进行综述的基础上,提出了两种新的算法,这两 种算法是对常用的虚假最近邻点法和预测误差最小法的改进,改进方法减少了参 数确定过程中的主观性。通过对l o r e n z 系统产生的多变量混沌时间序列仿真检验 证实了这两种算法的有效性。 其次,在多变量混沌时序相空间重构理论的基础上,提出了多变量时间序列 的局部多项式预测法,该预测法是对单变量时间序列局部多项式预测法的推广, 仿真检验表明该预测法优于单变量时间序列的局部多项式预测法。同时,研究了 多变量时间序歹0 局部线性预测法和径向基函数预测法,并总结出多变量混沌时间 序列的通用线性回归模型,指出了线性回归模型中存在的多重共线性问题。 为了克服多变量混沌时问序列的通用线性回归模型中利用最小二乘法确定 参数时会产生多重共线性的缺陷,在一般的多变量时间序列局部线性预测法和多 变量时间序列局部多项式预测法中对最小二乘法进行改进,即引入正则化估计, 提出了正则化的多变量时间序列局部线性预测法和正则化的多变量时序局部多 项式预测法。仿真结果验证了这两种预测法的优越性。 最后,将本文提出的改进的多变量时间序列相空间重构参数选取方法、多变 量时间序列的局部多项式预测法、正则化的多变量时间序列局部线性预测法和正 则化的多变量时间序列局部多项式预测法应用于上海股票市场综合指数的预测 取得了比常用预测方法更好的预测效果。 关键词:多变量时间序列;混沌时间序列;相空间重构;预测;线性 回归;, - f 贝i i 化线性回归;上海股票市场综合指数 p r e d i c t i o nt om u l t i v a r i a t ec h a o t i ct i m es e r i e sa n d i t sa p p l i c a t i o nt os t o c km a r k e t g r a d u a t e :f a n gf e n s u p e r v is o t :w a n gh a i - y a n s o u t h e a s tu n i v e r s i t y a b s t r a c t i nt h i sd i s s e r t a t i o n , w em a i n l ys t u d yt h ep r e f e r e n c e si nt h ep h a s e s p a c er e c o n s t r u c t i o na n d t h ep r e d i c t i o nm e t h o d so ft h em u l t i v a r i a t ec h a o t i ct i m es e r i e s b a s e do nt h ec u r r e n tp r e f e r e n c e s s t u d y , t w on e wc o m p u t i n gm e t h o d sa r eb r o u g h tf o r w a r da f t e ra m e l i o r a t i o n ,w h i c h ,a f t e r w a r d s ,a r e n a m e dw i t ht h el o c a lm u l t i v a r i a t ep o l y n o m i a lp r e d i c t i o nm e t h o da n dt h er e g u l a r i z e dm u l t i v a r i a t e l o c a lp o l y n o m i a lp r e d i c t i o nm e t h o d a n dt h ee m u l a t i o n a lm s u l t so f t h em u l t i v a r i a t et i m es e r i e so f l o r e n zs y s t e mp r o v et h a tt h e s em e t h o d sa r em u c hm o r ee f f e c t i v ea n dp r e c i s et h a nc o m m o no n e s , f i n a l l yt h e ya r ea p p l i e dt op r e d i c tt h ec o m p o s i t ei n d e xt i m es e r i e si ns h a n g h a is t o c km a r k e t t h e d i s s e r t a t i o ni sa r r a n g e da sf o l l o w : f i r s t l y , t h et h e o r e t i c a lb a c k g r o u n da n ds i l l d ys t a t u sq u o a tp r e s e n ti nt h ef i e l do f t h ea p p l i e d c h a o t i ct i m es e r i e sp r e d i c t i o nt h e o r i e s 血s u m m a r i z e d a n ds o m en e w e s tc h a o t i ct i m es e r i e s p r e d i c t i o nm e t h o d sa r ei n t r o d u c e dw h i l et h et h e o r yo f t h ep h a s e - s p a c er e c o n s t r u c t i o ni st h eb a s e o ft h ec h a o t i ct i m es e r i e sp r e d i c t i o nm e t h o d s t h ee m b e d d i n gd i m e n s i o na n dt i m e - d e l a ya r et w o i m p o r t a n tp a r a m e t e r si nt h et h e o r y t h e r e f o r e ,t od e t e r m i n et h e s et w op a r a m e t e r s ,t w on e w c o m p u t i n gm e t h o d s ,w h i c hc a l lr e d u c es u b j e c t i v i t yd u r i n gt h ec o u r s eo fp a r a m e t e r sc o n f i r m a t i o n a st h ei m p r o v e m e n to ft h ef a l s en e i i g h b o rm e t h o da n dt h el e a s tp r e d i c t i o ne r r o rm e t h o d ,a r ep u t f o r w a r da f t e rc u r r e n tp r e f e r e n c e sm e t h o d sa r es t u d i e d a n dt h et w on e wc o m p u t i n gm e t h o d sa r e p r o v e dt ob ee f f e c t i v eb yt h ee m u l a t i o n a lr e s u l t so f t h em u l t i v a r i a t et i m es e r i e so f l o r e n zs y s t e m s e c o n d l y , o nt h eb a s i so ft h ep h a s e s p a c er e c o n s t r u c t i o nt h e o r yo f m u l t i v a r i a t ec h a o t i ct i m e s e r i e s ,al o c a lm u l t i v a r i a t ep o l y n o m i a lp r e d i c t i o nm e t h o d i s p u tf o r w a r d e d ,w h i c h i sa g e n e r a l i z a t i o no fl o c a lp o l y n o m i a lp r e d i c t i o nm e t h o do ft h eu n i v a r i a t et i m e s e r i e s a n dt h e e m u l a t i o n a lr e s u l t ss h o wt h a tt h em e t h o da d v a n c e dh e r ei sb e t t e rt h a nt h a to ft h eu n i v a r i a t et i m e s e r i e s a tt h es a l n et i m e ,t h el o c a ll i n e a rp r e d i c t i o nm e t h o da n dr b fm e t h o da r es t u d i e d ,a n da u n i v e r s a ll i n e a rr e g r e s s i o nm o d e lo ft h em u l t i v a r i a t ec h a o t i ct i m es e r i e si ss u m m a r i z e d ,t h e nw e p o i n to u tt h em u l t i c o l l i n e a r i t yp r o b l e mi nt h el i n e a rr e g r e s s i o nm o d e l s i i i a n di no r d e rt oo v e r c o m et h es h o r t c o m i n go fm u l t i c o l l i n e a r i t yw h e nu s i n gt h em e t h o do f l e a s ts q u a r ei nt h eu n i v e r s a ll i n e a rr e g r e s s i o nm o d e lo ft h em u l t i v a r i a t ec h a o t i ct i m es e r i e s ,t h e l e a s ts q u a r em e t h o di si m p r o v e db yi n t r o d u c i n gr e g u l a r i z e de s t i m a t o r sb o t hi nt h eg e n e r a l i z e d m u l t i v a r i a t el o c a ll i n e a lp r e d i c t i o nm e t h o da n di nt h eg e n e r a l i z e dm u l t i v a r i a t el o c a lp o l y n o m i a l p r e d i c t i o nm e t h o d t h e nt h er e g u l a r i z e dm u l t i v a r i a t el o c a ll i n e a lp r e d i c t i o nm e t h o da n dt h e r e g u l a r i z e d m u l t i v a r i a t el o c a l p o l y n o m i a lp r e d i c t i o nm e t h o da r ep u tf o r w a r d e d a n d t h e e m u l a t i o n a lr e s u l t sa l s op r o v et h es u p e r i o r i t yo f t h e s et w om e t h o d s f i n a l l y , t h em u l t i v a r i a t el o c a lp o l y n o m i a lp r e d i c t i o nm e t h o d ,t h er e g u l a r i z e dm u l t i v a r i a t e l o c a ll i n e a lp r e d i c t i o nm e t h o da n dt h er e g u l a r i z e dm u l t i v a r i a t el o c a lp o l y n o m i a lp r e d i c t i o nm e t h o d p r o p o s e di nt h i sd i s s e r t a t i o na r ea p p l i e dt op r e d i c tt h ec o m p o s i t ei n d e xo fs h a n g h a is t o c km a r k e t , a n dt h ep r e d i c t i o nr e s u l t sa r ea l lp r e f e r a b l e k e y w o r d s :m u l t i v a r i a t et i m e p r e d i c t i o n ;l i n e a r s e r i e s ;c h a o t i ct i m e r e g r e s s i o n ;r e g u l a r i z e d o f s h a n g h a is t o c km a r k e t s e r i e s ;p h a s e - s p a c er e c o n s t r u c t i o n ; l i n e a lr e g r e s s i o n ;t h ec o m p o s i t ei n d e x 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标明和致谢的地方外,论文中不包含其他人已经发表或撰 写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 研究生签名:互茎日期 东南大学学位论文使用授权说明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印 件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质 论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括 刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权东南大学研究生院办理。 研究生签名:j l i l 导师签 日期 东南大学硕士学位论文第一章绪论 第一章绪论 实际问题中的复杂系统往往表现为多变量动态演化行为和多层次结构,由于 获取的信息通常是不完备的且具不确定性,系统的结构参数和边界条件具有时变 性和复杂性,因此,研究一个诸如股票市场这样具有混沌特性的复杂系统,往往 很难构造一个精确的解析形式的数学模型。因此,常用非线性动力学中的混沌时 间序列分析法来研究这类复杂系统,也即从复杂系统中通过观测或实验手段获取 时间序列,由此来研究原复杂系统。通过观测或实验手段获取的时间序列对原复 杂系统的演化发展进行预测已成为目前的一个研究热点。 1 1 问题的提出及选题的意义 1 1 1 问题的提出 传统的经济预测理论是基于有效市场假说( e m h ) 之上的,该假说认为价 格反映了所有的公开信息,价格只有收到新的信息才会变动,价格的变化是一个 随机游走,投资者都是理性的,他们认为股票市场的分布是服从正态分布。然而, 大量的研究证明,美国股票市场收益率就不是呈正态分布的,f a r m e r ( 1 9 6 5 ) 对 日收益率的研究、夏普( 1 9 7 0 ) 在其资产组合理论和资本市场书中、特纳和 魏格尔用1 9 2 8 年1 月至1 9 8 9 年1 2 月的s & p 5 0 0 指数的日收益率进行了易变性 研究均发现收益率的肥尾现刻“。e m h 理论的失灵就在于e m h 是以对社会的线 性视点为基础的,是一个线性范式。而股市的巨大幅度下跌以及时间序列的高度 自相关性清楚地表明这是一种非线性效应,股票市场本质上是一类非线性的经济 系统,经济预测研究的对象通常是由相互之间非线性作用的多种因素构成的开放 的复杂系统,简单、线性、封闭的系统只是极少数,其行为大多是动态、不稳定、 不连续、不可逆的,稳定、平衡只是少数、暂时的现象怛j 。 自2 0 世纪8 0 年代以来,随着计算机技术和混沌、分形等非线性理论的发展, 大量的研究证明股票市场价格的波动具有混沌的特性,即将股票价格的波动看成 一个混沌时间序列,它貌似随机杂乱,而背后蕴涵着确定性的机制。文献 3 ,4 ,5 , 6 1 给出了国外证券市场可以用混沌吸引子来研究股票价格变动规律的可能性以 东南大学硕士学位论文 第一章绪论 及存在吸引子的证据;文献【7 ,8 ,9 ,1 0 也给出了中国股票市场混沌的判据。而证 明股市价格波动具有混沌特性的最具代表性的理论是p e t e r s 在文献f 1 1 ,1 2 】中提 出的分形市场理论。因而,近年来越来越多的学者突破传统线性范式的束缚,将 对股票市场行为的预测研究纳入非线性混沌动力学的范畴。 近十几年来,国内外学者对混沌时间序列的建模理论及预测方法进行了研 究,并取得了不少成果【1 3 。2 5 】。但是,这些研究大都以单变量时间序列作为研究对 象,而实际问题中的复杂系统往往是由多个变量描述的,并且可以通过观测或实 验获取多个变量的时间序列,例如经济系统中股票指数可以同时记录下综合指 数、成交量指数、最高价指数、最低价指数等等。理论上,由t a k e n s 的延迟嵌 入定理,只要嵌入维数足够大,单变量时间序列足以重构原动力系统。然而在实 际问题中,情形并非完全如此,文献 2 6 】中用l o r e n z 方程得到的三个交量的时间 序列重构原动力系统就比用个或两个变量的时间序列重构效果好,文献 2 7 ,2 8 , 2 9 提出了多变量时间序列相空间重构理论并证明多变量混沌时间序列预测法要 比单变量混沌时间序列预测法要好。到目前为止,将单变量混沌时间序列预测方 法用于中国股票市场的应用的研究较多3 3 1 ,而将多变量混沌时间序列预测方法 应用于中国股票市场的研究还不多见。基于这样的背景,本文选择研究多变量混 沌时间序列预测方法及在股票市场中的应用。 1 1 2 选题的意义及研究的对象 在当今社会经济生活中股票市场占有十分重要的地位。宏观上,股价指数是 一个国家经济发展的一个重要指标;微观上,作为一个理性的投资者,都希望在 风险一定的情况下,尽可能的获得高收益的回报。因此,利用非线性混沌理论分 析股票市场的行为,比较准确地预测股价的走势,将对中国政府加强宏观调控和 监管和引导投资者正确的进行投资有重要的参考意义。 众所周知,股票价格经常表现出非常复杂的行为,准确地预测其运动趋势是 比较困难的。为了建立一个好的预测模型,影响股票价格运动变化的变量的选取 非常重要。在传统的预测股价指数的研究中,大都只选取收益率或综合股指单个 变量来建立模型,预测股价走势。而股票指数还可以同时记录下成交量指数、最 高价指数、最低价指数、成交金额指数等等,其中的任何一种指数都将对投资者 东南大学硕士学位论文 第一章绪论 的决策产生较大的影响。因此,利用综合股指、成交量指数等建立多变量混沌时 间序列的预测模型来预测股价走势是必要的。 目前我国有两个独立的股票交易市场,即上海证券市场和深圳证券市场。本 文选用流动量相对较大的上海证券市场,以股票市场的综合指数、成交量指数等 等作为研究对象,应用多变量混沌时间序列预测理论预测上证股价指数的走势。 1 2 混沌时间序列预测方法的研究现状 混沌是j h a d a m a r d 在1 9 世纪末研究h a m i l t o n 系统时发现的,混沌是确定 性系统变化极端复杂和行为不可预测的同义词,混沌研究更表明了非线性问题普 遍存在的原理,混沌必然是非线性的,混沌运动是由系统本身的内在随机性所产 生,混沌现象是一种貌似无规则运动的伪随机过程。混沌是2 0 世纪人类三大科 学成就之一,它的出现为人们预测未来提供了新的思路和理论基础。对系统未来 发展和变化的预测,由于混沌吸引子内在的分形结构使得短期预测是可行的,而 由于“蝴蝶效应”,也即敏感依赖于初始条件又使得长期预测是不可行的。 2 0 多年来,混沌科学越来越渗透到各个学科中,在数学、物理学、生命科 学、地球科学、信息科学、天文学以及经济学等等领域均得到了广泛应用。但是 混沌科学在基础理论方面还未有突破性的进展,还有许多问题有待解决,因此通 过观察或实验获得的单变量或多变量时间序列对混沌动力系统的未来演化发展 进行预测的方法混沌时间序列预测法仍然是主要采用的方法。 1 2 1 混沌时间序列预测法的理论基础 单变量混沌时间序列预测方法的理论基础是目前广泛采用的由p a c k a d 等人 提出,t a k e n s 定理证明的延迟嵌入状态空间重构法p4 1 。即将一维的时间序列嵌 入到肌维的相空间中,采用延迟重构技术重构相空间,在重构相空间时时间延迟 f 和嵌入维数m 这两个参数的选取十分重要,其精度直接关系到相空间重构后描 述奇异吸引子特征不变量的准确度。时间延迟太小会使得嵌入空间中冗余度增 大,造成信息的丢失,而时间延迟太大,状态向量的分量之间在统计意义上完全 独立,形同噪声。对于嵌入维数,t a k e n s 证明了对于无限长的、无噪声干扰和无 限精确的理想状态情况下,只要m ,2 d + 1 ( d 是系统吸弓1 子维数) ,重构相空问中 东南大学硕士学位论文 第一章绪论 吸引子的几何特征与原动力系统中的吸引子的几何特征等价,相空间的演化反映 了原动力系统的演化。因此,嵌入维数太小,即m “2 d + l ,会造成原动力系统中 的吸引子不能完全打开,重构的相空间不能刻划原动力系统;嵌入维数太大,虽 然满足m * 2 d + l ,但是会大大增加计算量。目前对f 和m 的选取现在主要有两种 观点:第一种认为两者是互不相关的,即f 和m 的选取可以独立进行( t a k e n s 证明了对于无限长的、无噪声干扰的时间序列,其f 和m 是相互独立的) ,但实 际应用中一般都是先确定f ,再确定m 。现有的时间延迟的选取方法主要有自相 关函数法3 5 1 、平均互信息法【3 6 1 、平均位移法【3 7 1 、s v f 法【3 8 l 、复自相关法和去偏 复自相关法口卅等。选取m 的方法主要有奇异值分解澍4 0 1 、通过计算某些几何不 交量( 如关联维数,l y a p u n o v 指数) 的方法【4 1 l 、虚假最近邻点澍3 4 ,4 2 1 、误差最 小法m 3 1 。第二种观点则认为f 和m 是相互关联的,因为现实中的时间序列都是有 限长且不可避免地受到各种噪声的影响。因此相应地产生了f 和m 的联合算法, 如时间窗口、法【删、重构展开一虚假零点法【4 5 】、复自相关法和f - - t e s t 结合法 4 6 】 等。 多变量混沌时间序列预测方法理论基础目前主要是t a k e n s 延迟嵌入状态空 间重构法的推广口7 2 8 , 2 9 。在多变量重构相空间时,时间延迟f 。和嵌入维数m 的 选取现在大都是先确定f 。再确定m 。f 的选取方法与单变量的情形相同。m 主 要有虚假最近邻点法的推广 2 8 , 4 7 】和预测误差最小法【2 7 】。 1 2 2 混沌时间序列预测法的分类 混沌时间序列预测方法按照拟合点的选取方式,可分为局域预测法和全局预 测法两大类。局域预测法,只利用被预测点周围的邻域点的信息来拟合预测函数 厂,由此来预测未来;全局预测法需要利用全部数据的信息来拟合预测函数, 由此来预测未来。 局域预测法柔性较好,拟合速度较快且预测十分简洁,但需实时地拟合系数。 局部方法虽然在每一步都可能是线性的,但从整体上看却是非线性的。局域预测 法主要包括局部平均预测法( c o m 法) 、局部线性预测法( l l 法) 、局部多项 式预测法。 东南大学硕士学位论文 第一章绪论 全局预测法在概念上很清楚,但计算量很大,要求有足够的样本点,而且仅 适用于光滑函数。全局预测法主要包括多项式逼近预测法,神经网络预测法。其 中神经网络预测法主要包括b p 神经网络预测法、径向基函数预测法和模糊神经 网络预测法。 目前单变量混沌时间序列的局部平均预测法( c o m 法) 、局部线性预测法 ( l l 法) 、b p 神经网络预测法、径向基函数预测法、小波神经网络分析法均已 被延拓到多变量的情形【2 8 ,4 8 , 4 9 】。并且在模拟仿真或应用中均证明这些多变量混 沌时序预测法比相应的单变量预测法预测效果好。 1 2 3 混沌时间序列预测法中正则化回归的应用现状 不管是单变量还是多变量混沌时间序列预测方法中,局部线性预测法、局部 多项式预测法和径向基函数预测法中,当利用最小二乘法求模型参数中数据矩阵 x 不是列满秩或者x 的条件数过大,也即出现多重共线性时,会导致线性最小 二乘法估计的参数不可信,这样将直接的影响参数估计的稳健性,从而影响方法 的预测效果。而统计学中的正则化回归方法能有效减小数据矩阵对预测结果的不 良影响,正则化回归方法是为处理病态线性回归问题( 即数据矩阵是病态) 而发 展起来的,基本思想是引入正则化估计( 即有偏估计) ,将均方误差作为评价一 个估计优劣的标准,引进有偏估计使得方差部分大幅度减少,最终降低均方误差。 预测中应用较多的正则化方法有岭回归、主成分回归和偏最小二乘回归。这些方 法能有效的降低噪声对预测的影响。在对含噪声的数据进行局部线性预测时,普 通最小二乘解法会出现很大的方差,但正则化方法具有很强的抗噪性,因此能够 给出更好的预测结果。到目前为止,将正则化方法用于单变量或多变量混沌时间 序列的局部预测中进行研究还不多见,1 9 9 8 年d k u g i u m t z i s 等人在文献【5 0 】中才 作了单变量混沌时间序列正则化的局部线性预测较全面的研究。有鉴于此,正则 化回归法用于多变量混沌时间序列局部预测法仍有很大的研究空间。 1 3 本文的主要内容 基于以上分析,本文的主要研究内容有: ( 1 ) 第二章提出多变量相空间重构理论中f ,和m ,的两种改进算法。这两种 东南大学硕士学位论文 第一章绪论 算法是针对原有的选取方法虚假最近邻点法和误差最小法的缺点提出的,并 通过仿真实例验证了改进算法的有效性。 ( 2 ) 第三章提出了多变量混沌时间序列局部多项式预测方法。这种预测法 是在多变量相空间重构理论基础上对单变量混沌时间序列局部多项式法的推广。 在这一章还总结了多变量混沌时间序列预测中的通用线性回归模型,并指出了线 性回归模型中存在的多重共线性问题。 ( 3 ) 第四章在奇异值分解的框架下给出正则化的多变量混沌时间序列局部 线性预测法和正则化的多变量混沌时间序列局部多项式预测法,解决了线性回归 模型中存在的多重共线性问题,仿真检验证明了这两种方法的优越性。 ( 4 ) 第五章利用前几章得到的多变量混沌时间序列相空间重构参数的选取 方法和三种多变量混沌时间序列预测方法应用于上海股票市场综合指数的预测, 得到了较好的预测结果。 本文主要工作见图1 1 。 世h雠州议幡_【一匝 料臣瓣 料拣 料撩 智舁事褂1妊 似秘坦士卅匿扑k怔长 东南大学硕士学位论文 第二章多变量混沌时间序列相空间重构理论 第二章多变量混沌时间序列相空间重构理论 许多实际问题中的复杂系统,通过实验或观测的方法,不仅可以测量或观测 到该系统的单变量时间序列,而且可以测量或观测到该系统的多变量时间序列, 例如,生态系统、水文系统、电力系统、经济系统等等。通常非线性时间序列分 析方法几乎都集中在单变量时间序列上,而实际问题中并不能保证任何给定的单 变量时间序列都足以重构原动力系统 2 9 1 。且实际问题中的复杂系统往往有噪声, 使用几个不同的时间序列构成的多变量时间序列会有降低噪声的作用,更有利于 对复杂系统进行研究口7 1 。近几年来,一些研究人员已开始了多变量时间序列分 析法的研究,文献 2 6 ,2 7 ,2 9 ,4 7 对多变量时间序列相空间的重构进行了研究, 文献f 5 l ,5 2 ,5 3 ,s 4 对多变量时间序列非线性检验进行了较深入的研究,文献 2 8 , 4 8 ,4 9 ,5 5 ,5 6 ,5 7 分别在经济、生态、水文和交通系统中采用多变量时问序列以 局域模型和小波分析模型做预测,结果均优于单变量时间序列的预测效果。这些 多变量时间序列预测均是建立在多变量相空间重构的基础之上的,因此,在研究 多变量时间序列的预测方法之前,首先讨论多变量时间序列相空间重构问题。 2 1 多变量时间序列相空间重构 设观测到的 不维多变量混沌时间序列为 _ ) 笔,= ( _ ,x :,x 。) 二,如 同单变量时间序列情形( 扛1 ) ,作嵌入延迟重构 k = f 五置,n ,一,( 卅f 一1 ) f j ;屯屯,2 ,x 2 ,h 川; ;, ,x m ,h ,( 一1 ) 胛= 厶,山+ 1 ,;,。= 煳,一1 弦,+ i ( 2 1 其中r ,珊,( f = 1 , 2 ,m ) 分别表示延迟时间间隔和嵌入维数,类似与f t a k e n s 的 延迟嵌入定理,一般地如果m = m ,或者每个川,足够大,则存在映射 f :r - - f f r “,使得 k + = r ( v o ) ( 2 2 ) 东南大学硕士学位论文第二章多变量混沌时间序列相空间重构理论 或者得到某个函数,:r “斗r ,满足 葺。= z ( k ) ,i = 1 ,2 ,。,m ( 2 3 ) 这样状态k 到状态k + ,的演化反映了原始未知动力系统的演化,这表明原动力吸 引子的几何特征等价于重构的m 维状态空间中的吸引子的几何特征,因此原动力 系统中任何微分或拓扑不变量可以在重构的状态空间中计算。 目前对多变量时间序列的研究,都是在最简单的重构方式下讨论的,即式 ( 2 1 ) 中= m :一一m 。= 1 ,也就是说每一变量作为重构的多维空间中的一 个分量,重构空间的维数与变量个数相等,与延迟时间无关,这样做的好处就是 避免了重构参数的选取问题。但当测量的变量个数小于原动力系统的实际维数 时,这样做显然会失去某些信息,重构的空间不等价于原动力系统。 在按式( 2 1 ) 重构后,面临的问题是如何选取延迟时间间隔,i = 1 ,2 ,m 和嵌入维数,i = 1 ,2 ,m ,使式( 2 2 ) 或( 2 3 ) 成立。 在多变量时间序列中,由于变量之间的性质不同,反应在数值上差异可能比 较大,因此f ,的选取采用单变量时间序列中的方法,即对每一个分量时间序列 t 。 2 ,分别确定,可以用自关联函数最小法 3 5 , 5 s l 或互信息最小法 3 6 1 确定。 r ”中k 到的距离记为慨一i i ,可以由厶或匕范数定义。 2 2 确定参数的方法 在多变量时间序列重构相空间时,目前时间延迟f 。和嵌入维数的选取大 都是先确定时间延迟再确定嵌入维数。参数的选取方法与单变量的情形相同 主要有自相关函数法和平均互信息法;参数研,主要有虚假最近邻点法【2 8 ,4 7 1 和预 测误差最小法【2 7 l 。 2 2 1 虚假最近邻点法 文献【2 8 ,4 7 在对多变量时间序列进行相空间重构时,确定嵌入维数的方法 9 东南大学硕士学位论文 第二章多变量混沌时间序列相空间重构理论 是单变量时间序列相空间重构情形下的虚假最近邻点法的直接推广。文献【4 7 中 虚假最近邻点法的基本思想是当嵌入维数聊变成聊+ 1 时,考察信号k 的邻点 中哪些是真实的,哪些是虚假的邻点,当没有虚假邻点时,可以认为几何结构完 全被打开,此时的卅即为所求的最佳嵌入维数。设k 的最近邻点为俐,当m 增大到碍+ l 时,重新计算两个信号之间的距离并求与原距离之间的比值。如果 距离变化的比值大于阈值盯,则俐是圪的虚假邻点。对于( m l ,m m m ) 从 ( 1 ,1 ,1 ) 开始,每次增加1 ,直到虚假邻点的比例小余万,则可以认为吸 引子的几何机构完全打开,此时的( 聊i ,一,) 为最佳嵌入维数。 该算法有两个重要的参数盯和j ,盯的选取过大会区分不了真实的邻点和虚 假的邻点,而过小又会受到噪声的干扰。j 是用来标记虚假邻点所占比例的,理 论上j = 0 表示所有虚假邻点消失,但是实际上由于实际系统受到噪声的干扰,万 无法收敛到0 。仃和占都是根据经验来选取,这无疑是这一算法的缺点。 文献 2 8 】中虚假最近邻点法的基本思想与 4 7 】中类似,也要用经验来选取同 样的参数阈值盯,因此,这种算法也有同样的缺点。 2 2 2 预测误差最小法 预测误差最小法是由l i a n g y u ec a o 等于1 9 9 8 年提出的2 7 1 ,其基本思想是利 用式( 2 3 ) 中的z ,i = 1 ,2 ,m 的连续性。直觉上,由于,的连续性,当m ,为合 适的嵌入维数时,若k 与充分靠近,则薯川与誓j + ,也将充分靠近。 对已确定的时间延迟间隔t ,i = 1 ,2 ,m 及任意给定的嵌入维数 m ,i = 1 ,2 ,m ,按式( 2 1 ) 重构向量k ,设k 的最近邻点为,即 0 k v 俐0 = ,嚣粤。| 1 _ 一一0 ( 2 4 ) 定义下面的一步预测误差 e - m 一,州”) = 高可渺n 一飞c 础小黔西,一,) r ,+ t ( 2 s ) 东南大学硕士学位论文第二章多变量混沌时问序列相空间重构理论 对于较小的m a ,:,”,由于没有合适地嵌入,预测较差,所以e ( # r 6 ,研:,聊。) 较大;当m ,m :,增加到合适的嵌入所需的最小值时,由函数,的连续性 e ( 啊,m :,) 减少,如果系统有正的l y a p u n o v 指数及噪声,则继续增加 m l ,m 2 ,会使e ( m l ,埘2 ,) 也继续增加,因此可选取使e ( 一,m 2 ,) 最 小的那组卅l ,m :,m m 为最小嵌入维数,即 c m ,脚:,掰m ,= a 唱m t n c 埘,聊。,m 。,l c m ,州:,m 。,e z ”,善优,;。l c z - 6 , m 其中z ”= i - i z ,z 表示所有非负整数。 ,= l 注:( 1 ) 代替一步预测误差式( 2 5 ) ,可以定义最大误差或均方根误差。 ( 2 ) 代替利用最近邻点( 局部常数) 定义一步预测,也可以定义多步预测或 其它预测,然后再定义预测误差。但用最近邻点定义的一步预测计算快 速简便,且不需要估计参数。 ( 3 ) 实际应用中,可限定在某一范围内搜索,使e ( ,m :,冲h ) 达到最小的 嵌入维数,即先确定某一最大维数i m 。,考虑 ( 朋1 ,m2 ,聊m 。) = a 唱m m 耳脚,历:,聊。,1 0 s m l - d 一,= 啦,m ,善m ,;。 c z , 预测误差最小法克服了虚假邻点法中主观因素影响的不足,是一种较好的算 法。但是该算法仍需首先确定t ,而t ,的选取如果有大的误差则会导致计算出的 m ,不十分精确,预测的误差也会变大。而嵌入维数和时问延迟的选取是十分重 要的,其精度直接关系着相空间重构后描述奇异吸引子特征不变量的准确度,从 而影响对未知系统未来预测的精度。因此,要对该算法进行改进。 2 3 改进的确定参数法 由于虚假最近邻点法和预测误差最小法在确定多变量时间序列相空间重构 东南大学预士学位论文 第二章多变量混沌时间序列相空问重构理论 的嵌入维数时都存在不足,本文在参考单变量时间序列相空间重构时嵌入维数选 取的相关方法的基础上,提出下面的两种改进算法。 2 3 1 虚假最近邻点法的改进 对每个状态向量k ,找到它的最近邻点( 。) ,聊f i 。,”) ,也就是 _ g ) = a r g m i n 限一_ :j = j 。,一 。此处我们使用无穷范数 = m a x l a , l l l g i m 。时,巨( m ) 平稳,则m 。+ 1 为最小嵌入维数。 然后计算使得e 最小化的t ,m ,r o m e ,即 e ( m ,一。,聊m ) 2 弧。嘴刚叫) ( e ( 啊,啊,r a m ) ) 2 - 1 1 则一,是由肘维多变量时间序列 _ 竺,= ( x 。,_ - ,嘞,。) 二。重 东南大学硕士学位论文 第二章多变量混沌时间序列相卒间重构理论 2 3 2 预测误差最小法的改进 在单变量时序重构相空间中,嵌入维数m 和时间延迟f 的选取目前主要有两 种观点。根据t a k e n s 定理,无限长且无噪声的时间序列,时问延迟和嵌入维是 相互独立的,因此一种观点认为两者互不相关,其选取可以独立进行。但是现实 中的时间序列往往是有限长且不可避免地有噪声的影响,因此另一种观点认为两 者的选取是相互关联的,其选取要联合计算。多数研究人员认为,后一种在工程 实践中更实用、合理【舶】。因此,在实际系统中,同单变量时间序列重构相空间 类似,寻找更实用合理的f 和m ,的联合算法是混沌时间序列分析的新课题。下 面,在预测误差最小法的基础上,给出一种改进的联合算法,可以同时确定时间 延迟和嵌入维数。 研究表明,对于特定的单变量时间序列,其重构相空间的时间窗是相对固定 的i 4 4 ,5 9 1 ,因此嵌入维数m 和时间延迟f 都是有一定范围的。同样对于多变量时 间序列,其重构相空间的时间延迟和嵌入维数m 。也有各自的取值范围。因此, 对预测误差最小法做如下改进:不再首先确定t 。而是对每个单变量时间序列 t 。) 二。,f = l ,2 ,m ,给定时间延迟f 。,t 2 ,o 和嵌入维数珊,m m ,式( 2 ,4 ) 改为 玎( ”) = a r g m i n 胍吣,= m 。a 。x ( m ,- 1 ) t + l ,” ( 2 1 2 ) ( 2 5 ) 式改为误差 e ( 一骱面,咖,屯) 2 而l 孑荟nk ,1 酬+ 0 j o2 嬲( 辞- 1 ) + j ( 2 1 3 ) ( 2 6 ) 式改为 ( ,r e ,j 啊,t n m ) = 蛐e i l i f 2 , m :dj ,d 2 - d m l 。? ,。曼l | 蔓 ? 。d d ? s d ? j ,。i = 2 2 ,a 赴 ( 2 1 4 ) 其中,t i ,。分别是t ,的下界和上界;d i ,d 分别是吐的下界和上界。 东南人学硕士学位论文第二章多变量混沌时间序列相空间重构理论 且t ir a i nt i 。,一,z 均是非负整数。 这样同时确定了最佳时间延迟r 。,乇,和m 维多变量时间序列重构时各 独立系统的子相空间最佳嵌入维数m 。,m :,m m 。 2 4 仿真检验 为了验证改进后的算法,对加入5 正规白噪声的l o r e n z 系统进行仿真检验。 设l o r e n z 系统 鲁= 。吨一再) ,鲁= 玉僻一西) - 是,鲁= x i x 2 - 如 ( z ,s ) 其中盯= 1 q r = 2 s 6 = 8 3 ,取初值,。= 1 5 3 4 , x 2 ,o = 1 3 6 8 , x 3 ,。= 3 7 9 1 ,利用四阶 r u n g e - k u t e 积分法,积分步长为h = 0 0 4 ,得1 2 1 0 0 个数据,取1 0 0 0 1 至1 2 1 0 0 之间的2 1 0 0 个数据参加实验,对多变量时间序列戤,x :。) :。,分别利用虚假 邻点法【2 8 】、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 地砖铺装服务合同范本
- 土方运输服务合同范本
- 墙面大白施工合同范本
- 培训机构晚托合同范本
- 国外设备采购合同范本
- 地铁阀门采购合同范本
- 土地授权代理合同范本
- 大型商场加盟合同范本
- 土地协议终止合同范本
- 场地租赁扩建合同范本
- 人教版(2024新版)七年级上册英语课文英文原文和翻译
- 中国妊娠期糖尿病母儿共同管理指南(2024版)解读
- 企业所得税培训班教学课件
- 人工智能时代高校毕业生就业观的引导路径研究
- 东南大学版三基内科
- 2024-2025学年北京市朝阳区北京中学八年级上学期期中考试物理试题(含答案)
- 锂离子电池相关项目实施方案
- 中学生天文知识竞赛考试题库500题(含答案)
- 《接触网施工》课件 3项目一 软横跨安装
- 2024年天津市河北区高一年级上期中-英语试卷
- 创新方法大赛理论知识考核试题题库及答案
评论
0/150
提交评论