




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 摘要:时间序列是根据动力系统观测得到的数据,作为研究系统内部规律的依据。 目前时间序列分析已经在多个领域的应用中取得了极大的进展。本文尝试将奇异 值分解方法应用于时间序列分析中,从而为时间序列分析的进一步研究在探索新 的方向上奠定一定的基础。 本文主要针对科学研究中常常要对原始时间序列进行加趋势或滤波预处理的 情况,对原始时间序列和加趋势或滤波处理后的时间序列应用奇异值分解方法, 考察经过处理后时间序列的奇异值有何变化发现规律。考虑到理论与实际可能存 在差别,文中分别对两组时间序列进行了研究,一组为计算机模拟生成的数据, 一组为实验观察所得数据。首先对原始时间序列做适当的加趋势或滤波处理,结 合互信息法和c a o 方法求出时间延迟和嵌入维数,对时间序列进行相空间重构, 从而对重构的时间序列应用奇异值分解方法。重点考察了时间序列在加趋势或滤 波处理后奇异值的变化情况,包括数值、分布形态和前后关系。最后将奇异值分 解方法与经验模式分解方法相结合,深入讨论时间序列的本征函数其奇异值分布 特征。基于以上内容本文的结构如下: 第一章,引言。 第二章,滤波对分形时间序列奇异值分解的影响。 第三章,趋势对分形时间序列奇异值分解的影响。 第四章,经验模式分解和奇异值分解在时间序列中的综合应用。 关键词:时间序列;奇异值分解( s v d ) ;趋势;滤波;经验模式分解( e m d ) 分类号:0 2 9 a bs t r a c t a b s t r a c t :t i m es e r i e sa r ed a t ag e n e r a t e db yt h ed y n a m i c a ls y s t e m s ,t h e ya l w a y s c a nb eu s e dt ou n d e r s t a n dt h e u n d e r l y i n gm e c h a n i s m s s of a rt h et i m es e r i e sa n a l y s e s h a v em a d ear a p i dp r o g r e s si nm a n yf i e l d s t h i sp a p e ra i m sa t a p p l y i n gs v dt o i n v e s t i g a t et h ef r a c t a lt i m es e r i e s ,s oa st op r o v i d es o m eb a s i ct h e o r yf o rf u r t h e rs t u d v o ft h et i m es e r i e sa n a l y s i s 。 i nt h i sp a p e r , w eu s es v dt oi n v e s t i g a t et h es e r i e sw h i c hh a v eb e e n p r e p r o c e s s e d , b e c a u s et h e s ep r o c e s s e sa r ec o m m o ni ns c i e n t i f i cr e s e a r c h ,s u c ha sa d d i n gat r e n dt ot h e o r i g i n a ls e r i e so rm a k i n gat r a n s f o r m a t i o n t h e nw e c o m p a r et h es i n g u l a rv a l u e so ft h e s e r i e sb e f o r ea n da f t e rt h ep r e p r o c e s s e dt of i n dt h ec h a r a c t e ra n dr e g u l a r i t y t h e r e m a y b es o m ed i f f e r e n c e sb e t w e e nt h e o r ya n dp r a c t i c e ,w ea n a l y z et w ok i n d so f d a t a , o n e a r ed a t ag e n e r a t e db yc o m p u t e r , t h eo t h e r a r em e a s u r a b l e s y s t e m so u t p u t w i t h m u l t u r e l n f o r m a t i o nm e t h o da n dc a o m e t h o d ,w ec a ng e tt h ed e l a yt i m ea n de m b e d d i n g d i m e n s i o nf o rt h ep h a s e s p a c er e c o n s t r u c t i o n s ow ei n v e s t i g a t eh o wv a r i o u s p r e p r o c e s s i n ga f f e c tt h es i n g u l a rv a l u e s a tl a s tw eu s es v dt oa n a l y z et h ei n t r i n s i c m o d ef u n c t i o n so ft h es e r i e st of i n dt h e i rr e l a t i o n s h i pw i t ht h eo r i g i n a ls e r i e s b a s e do n t h et o p i c sa b o v e , t l l i sp a p e rc o n s i s t so ff o u r p a r t sa sb e l o w : c h a r p t e r l :i n t r o d u c t i o n c h a r p t e r 2 :e f f e c to ff i l t e r so ns i n g u l a rv a l u eo f t h et i m es e r i e s c h a r p t e r 3 :e f f e c to f t r e n d so l ls i n g u l a rv a l u eo f t h et i m es e r i e s c h a r p t e r 4 :e m p i r i c a lm o d ed e c o m p o s i t i o na n ds i n g u l a r - v a l u ed e c o m p o s i t i o ni n t i m es e r i e s k e y w o r d s :t i m e s e r i e s ;s i n g u l a r - v a l u ed e c o m p o s i t i o n ( s v d ) ;t r e n d ;f i l t e r ; e m p i r i c a lm o d ed e c o m p o s i t i o n ( e m d ) ; c i 。a s s n o :0 2 9 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:磊毽 导师签名: 签字日期:如圹年多月石日 两朋舢 签字日期:2 吖年多月矿日 , 一 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除 了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也 不包含为获得北京交通大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的 同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 学位论文作者签名:椭 签字日期: 反丫年乡月纩日 致谢 经过许多酸甜苦辣和重重磨砺,终于完成了硕士学位论文。在此,谨向所有 关心和帮助过我的老师和同学表示深深地感激之情! 本论文的工作是在我的导师商朋见教授的悉心指导下完成的,商朋见教授严 谨的治学态度和科学的工作方法给了我极大的启发和影响,在学习上和生活上也 给予了我很大的关心和帮助,在此衷心感谢商朋见老师对我的关怀和指导。 感谢关注我们成长的学校及学院领导,感谢他们对我在各方面的培养和帮助。 感谢同门的师兄师姐,还有同学伙伴们,在共同学习和相互鼓励中一同进步。 另外也感谢父母及家人,他们的理解和支持使我能够在学校专心完成我的学 、i k 。 1 引言 实际中我们想了解和刻画一个复杂动力系统的特征是一件比较困难的事情, 通常的做法是通过分析和假设,建立数学模型来研究系统的演化规律。而实际问 题中,如生理系统、社会系统、经济系统等,在我们缺乏对系统性质了解的情况 下要建立模型是非常困难的。一种有效的方法就是对系统产生的时间序列进行分 析,因为这些时间序列反映了系统的状态。 第一个将分形理论用于时间序列分析的科学家正是分形理论之父曼德勃罗。 在过去的十几年中,研究发现自然界中的很多时间序列都具有分形的特征,如地 理时间序列( 温度、风速) 、医学时间序列( 心跳、血压) 、科技时间序列( 网络 流量、交通流量) 、金融时间序列等等。目前,对于时间序列的分形性研究已经提 出许多方法,如谱分析法、自相关函数法、消除趋势振动分析方法( d f a ) 等等。 奇异值分解是线性代数中一种重要的矩阵分解方法,奇异值是矩阵的一个良 好特征。在矩阵理论中,奇异值分解实际上是“对称矩阵正交相似于对角矩阵 的推广。由于奇异值的良好性质,它在各个领域有着广泛的应用,如在计算机科 学领域,通过奇异值分解可以达到降维的目的,从而可以降低计算机对存贮器的 要求。根据奇异值可以很容易得到矩阵的低维数的一个最佳逼近矩阵,这特征 可以应用于信号的分解和重构、提取有用信息、消除信号噪声等方面。此外,奇 异值分解在图像压缩、数字水印、文章分类、及数据融合、目标识别、信号突变 检测、神经网络等方面也都有较好的应用1 钊。 对于具有分形特征的时间序列,迫切地希望能够有进一步的研究,希望通过 时间序列的研究对系统进行预测,或者观察系统对外部扰动或条件变化的反应。 这些研究对于实际应用将更有实用价值。基于这一目标,本文将奇异值分解方法 应用于分形时间序列的研究中,主要考查外部变化:对时间序列进行滤波和加趋 势处理后,将怎样影响分形时间序列的奇异值特征,为时间序列的更深入研究奠 定基础。 论文框架和主要内容: 第一部分:研究背景及所用算法的简要介绍,以及滤波对时间序列奇异值分 解的影响。第二部分:给时间序列附加趋势考察奇异值的变化情况。第三部分: 综合应用经验模式分解方法和奇异值分解方法,特别考察时间序列本征函数的奇 异值相比原时间序列的奇异值有何变化和关系。 2 滤波对分形时间序列奇异值分解的影响 2 1 模拟生成时间序列滤波的奇异值分解 2 1 1 分形理论的概述 分形理论是研究非线性问题的一门学科,是由数学家曼德勃罗在2 0 世纪7 0 年代提出的,一经提出便在物理、地质、材料科学以及工程技术中有了广泛的应 用。特别是随着电子计算机的迅速发展和广泛应用,分形思想和方法在模式识别、 自然图像的模拟、信号处理等领域都取得了极大的成功。 迄今为止,分形还没有一个严格的定义。无限的自相似是分形的精髓。通俗 一点讲,多重分形是许多个单一分形在空间上的相互缠结、镶嵌,它通常所描述 的是定义在某一面积或体积中的一种度量。通过这种度量值或数值的奇异性可将 所定义的区域分解成一系列空间上镶嵌的子区域,每一个子区域均构成单个分形。 多重分形通常被用来研究非均匀的现象曲儿引。 时间序列的重分形研究开始于2 0 世纪9 0 年代初,该技术目前广泛应用于经 济学、医学、生物学、地质学、计算机科学等众多领域。目前,时间序列重分形 研究方法中,比较有效的工具是消除趋势分析( d f a ) 方法,在我们以下的研究中 将借助d f a 方法对时间序列进行重分形性的判断口1 。 2 1 1 1 时间序列的重分形性判帅f a 方法 本文采用消除趋势振动分析方法( d f a ) 对时间序列的分形( 多重分形) 性进 行判断和验证。 d f a 算法步骤 对序列 石( f ) ,用d f a 方法进行分析的步骤如下: ( 1 ) 计算时间序列的 石( f ) ,汪1 9 o*o n 的累积离差y ( i ) , y ( i ) = ( 坛一;) 扣1 ( 1 ) 其中x 2 硝l , z x , ; ( 2 ) 把y ( f ) 等分成m 个不重叠的等时间长度s 的区间,其中m = 【j 】( 取整) , 由于序列长度并不总是时间长度的倍数,因此y ( i 1 将有一段剩余,为了使序列的 2 全部数据均进入计算,对该序列的逆序歹0 进行i 司样的操作,共司得到2 m 个等长的 ( 3 ) 用最小二次拟合法求均方误差f 2 ( s , ,) 。设儿( i ) 是第y 个小区间的拟合多项 式,当y = l ,m 时,有 f 2 ( 掣) = 窆 】, ( y 一1 ) s + f 一只( f ) ) ( 2 ) 当v = m + 1 ,m + 2 ,2 m 时,有 ,2 ( 盘,1 ,) 2 詈喜 】, 一( 1 ,一m ) s + f 一y v ( f ) ( 3 ) 这里拟合多项式可以是一次的,二次的,还有目前经过改进的三角拟合多项 ( 4 ) 对于2 m 个区间,求f 2 ( s ,1 ,) 的平均值,得q 阶波动函数c ( s ) , c s ,= 丢毒善 f 2c j ,y , ) 石 。4 , ( 5 ) 确定波动函数的标度性。如果波动函数c ( s ) 和时间尺度之间存在幂律关系 即:f ( j ) s 6 钉 ( 5 ) 这里 ( g ) 成为广义赫斯特( h u r s t ) 指数,作出l o g ( s ) l o g ( s ) 的函数关系图, 求出l o g f 。( j ) 相对于1 0 9 ( s ) 的变化斜率,其斜率即为标度指数。 当j j l ( g ) 独立于g 为一常数时,序列 石( f ) 为单分形的,当j i l ( g ) 依赖于g ,为q 的函数时,序列 石( f ) 为多重分形,从而可以用来判断时间序列的分形性。 2 1 2 数据介绍及重分形判断 时间序列,( f ) 的生成方法介绍: 仿效不均匀的c a n t o r 棒的生成方法,将长度为1 ,质量为1 的直棒折断,并 压缩成长度分别为z 1 ,2 ,3 ,1 4 ,0 l l + 1 2 + 1 3 + 1 4 1 ,其中,1 ,2 ,3 ,4 随机产生,质量 分别为m l = o 6 9 ,m 2 = 一0 4 6 ,m 3 = o 4 6 ,m 4 = o 3 1 ,满足朋1 + 朋2 + 朋3 + m 4 = 1 的四段 短棒,然后对每一段短棒按上述方法折断并压缩。如此产生了3 0 0 0 点数据,作为 我们将要研究的原始时间序列,记为f ( f ) ,t = l ,2 3 0 0 0 。图1 给出了原始时间序列 f ( f ) 的图像。 3 图1 计算机模拟生成的原始时间序列,( f ) d f a 方法判断重分形性 按照上面给出的d f a 方法,我们来检验生成的数据是否具有重分形性。通过 计算,下图给出了广义h u r s t 指数j i l ( g ) 与g 的关系。其中拟合区间s 的取值为 1 0 s 1 0 0 ,q 的取值为一5 0 ,= r a n k ( a ) , 称【,、y 为矩阵么的奇异向量。q ,吼,皿称为矩阵彳的奇异值。 假如我们考虑协方差矩阵么,那么彳r a = v u r u v r = 矿2 v r ,这种形式 下,奇异值分解实际上是和以下两种常用的数据分析方法是一致的。一种方法是 统计学中的主成分分析法或因子分析法,此时y 的列向量为彳r 么的特征矢量: v = ( m ,屹,) 它们构成一组正交基,彳在这组正交基上的投影a v 被称为么的 主成分。彳经过正交变换后,就旋转到了新的位置,a v 保持了彳的基本性质。也 就是说它与彳是拓扑等价的。另一种是工程学中的k a r h u n e n l o e v e 展开及其推广, 这种方法被广泛应用于信号处理、模式识别、特别是特征提取中。 2 1 4 时间序列的相空间重构方法 要运用奇异值分解方法研究时间序列,就必须首先对时间序列进行相空间重 构,因为奇异值分解方法是应用于矩阵分析中的。所以,将一维时间序列进行相 空间重构是进行奇异值分解的必要步骤n 。 目前广泛采用的方法是由p a c k a r d 等人提出的相空间重构理论:延迟坐标系状 态空间重构法。对于一维的时间序列 石( f ) i j f = 1 ,2 ,栉) ,用相空间重构方法将其 扩展到三维甚至更高维的空间中去,可以把时间序列中蕴藏的信息充分暴露出来。 设时间序列: x ( f ) ( t = 1 ,2 ,刀) ,适当选取嵌入维数m 和时间延迟f ,重构 相空间: y ( f ) = x ( f ) ,z ( f + f ) ,x ( i + 2 f ) ,石( f + ( 朋一1 ) f ) , ( 7 ) 其中i = 1 ,2 ,n = 疗一( m 1 ) f 。 由此可见,如何选取适当的时间延迟和嵌入维数是关键所在。 重构参数的选取 2 1 4 1 时间延迟r 的计算 我们采用互信息法计算时间延迟。互信息方法是估计重构相空间时间延迟的 一种有效方法,在相空间重构中有广泛应用。s h a w 首先提出以互信息第一次达到 5 最小时滞时作为相空间重构的时间延迟,f r a s e r 给出了互信息计算的递归算法。 互信息的递归算法: 设时间序列 z ( f ) o = 1 ,2 ,刀) ,时间延迟f ,嵌入维数m ,重构相空间得 r ( t ) = 石( f ) ,x ( f + f ) ,x ( i + 2 f ) ,x ( i + ( m - 1 ) f ) , ( 8 ) 则系统对变量x 的平均信息量为系统的熵h h ( 石) = 一p a z , ) l o g p a x , ) t ( 9 ) 记【z ,g 】_ 石( f ) ,x o + f ) 】,考虑一个总的耦合系统( x ,q ) ,假定x 已知为薯,则q 的不 定性为 嘶卜p 棚州引护一对掣 l o g 掣 , 其中乞k ( q jl t ) 是条件概率。 因此 日( q i x ) = 一军只( 薯) 日( q l ) = 一荨毛( x t , q j ) l o g 墨毒篆笋 = 日( x ,q ) 一日( x ) 这里 h ( x ,q ) = 一岛( ,q j ) l o g p 叼( x t ,q j ) ( 1 1 ) 其中h ( x ,q ) 是孤立的q 的不定性,h ( q i x ) 是已知石的q 的不定性。所以,x 的已 知减少了q 的不定性,即互信息为: ,( q ,x ) = 日( q ) 一l 叮( e l x ) = h ( q ) + 日( x ) 一h ( x ,q ) = x ( x ,q ) ( 1 2 ) 对于一般情况,互信息为: 1 , ( x o ,五,x n ) = h ( x j ) - h ( x o ,五,) ( 1 3 ) 如果向量是一个延迟时间重构,则l ( f ) 第一次达到最小时的时滞可作为相空间重 构的时间延迟。 我们利用互信息法求重分形时间序列f ( f ) 的时间延迟。从图3 我们可以看到, 原始时间序列的时间延迟选择为2 ,因为此时互信息量取值为局部最小值。 l a g 图3 原始时间序列f ( f ) 互信息法计算时间延迟 6 2 1 4 2 嵌入维数m 的计算 我们采用c a o 方法计算嵌入维数。c a o 方法是由c a ol i a n g y u e 提出的改进的 虚假最邻近法( f a l s en e a r e s tn e i g h b o r sf n n ) ,由此称为c a o 方法,这种方法计算 时只需要延迟时间一个参数。 虚假邻近法( f n n ) 的基本思想是,在嵌入维小于吸引子真实维数的时候会 出现很多虚假邻近点,即在低维情况下某点是邻近点,但随着嵌入维的增加,该 点已经不是邻近点了。当维数从m 变到m + 1 时,判断轨迹上的某一点是真邻近点 还是假邻近点,如果是真邻近点,则表明m m f ,其中m e 为最小嵌入维数,如果 是假邻近点,则m :仃,做出一的分布图。 图6 对原始时间序列 薯) 进行线性滤波如+ 6 之后的奇异值分布图 9 图( a ) 、( b ) 、( c ) 、( d ) 对应的b 值分别为0 、2 - 5 、2 - 1 和1 从图( a ) 可以看到滤波1 0 0 x ,只是使奇异值在数值上比原来扩大了1 0 0 倍, 奇异值的分布情况没有任何改变,说明奇异值分解对于一般的乘积滤波保持了运 算不变性。观察图( b ) ,( c ) ,( d ) ,发现随着b 的增大,较大的奇异值个数由原来 的2 个变为3 个,增加了1 个,并且最大奇异值的数值也明显增大,但是奇异值 的分布形态没有明显变化。对于图( c ) 和( d ) ,发现在去掉第一个最大奇异值之 后,剩下的奇异值在数值与分布上同图( a ) 几乎保持不变,可见这个最大奇异值 的出现是由b 带来的影响。 2 1 6 时间序列对数滤波的奇异值分解 对数滤波作为一种非线性滤波在数据及信号预处理中常被应用,如复杂系统 输出信号的规范化等等。这一部分我们讨论对原始时间序列进行对数滤波后的奇 异值分解的变化情况。为了保证数据为非零正数,在做对数滤波之前我们首先对 原始时间序列进行简单变换, 而 j 五+ ,其中= 一+ g ,x m ;。为原始时间 序列 薯 的最小值,g 为一个正的常数。这样就可以对原始时间序列进行对数滤波 了:l o g 。 ( 墨一x m i 。+ s ) 图7 对原始时间序列 蕾 进行对数滤波l o g 。 ( 誓一b + 占) 之后的奇异值分布图 图( a ) 为原始时间序列的奇异值分布图,图( b ) 、( c ) 、( d ) 分别对应占的值为2 _ 5 、2 一、 l o 2 - 5 的对数滤波后的奇异值分解。 从图中可以看出,对数滤波明显改变了时间序列奇异值的分布形态。原始时 间序列的奇异值分布为:存在2 个较大奇异值,但总体上,奇异值呈现平稳下降 趋势,并且中间部分奇异值变化平缓,数值非常接近;而经过对数滤波后的时间 序列的奇异值只有1 个大的奇异值,并且数值远远大于其后的奇异值,从分布情 况看呈现崩溃现象,即一个很大的奇异值之后拖着长尾。观察图( b ) 、( c ) 、( d ) , 发现随着s 的增大,最大奇异值的数值在逐渐减小,g 与最大奇异值呈反相关性。 下面对应给出以上经过对数滤波后的时间序列图。可以看到,进行滤波之后 的时间序列在整体形态上没有明显变化,但是出现了一些极端值,并且随着占的增 大,这些极端值的绝对值在减小。 山山。k l k 。l 址h l 。u 。k h h 。i a 。l 。k l 【。l 。 旷陌f旷r 吖p 吖r 1 : k址。 h k l i 虬。虹h 。h h j 孵丌 p ”。1 8 i 05 咖1 锄抛掷姗 图8 对原始时间序列 誓) 进行对数滤波1 0 9 。 ( x ,- x m ;。+ ) 后的时间序列图 图( a ) 为原始时间序列,图( b ) 、( c ) 、( d ) 仍然对应占的值为2 - 1 5 、2 - 9 、2 一。 2 2 分形布朗运动时间序列滤波的奇异值分解 布朗运动是1 8 2 7 年英国植物学家r b r o w n 在研究花粉时发现的。它是一种 随机运动,花粉微粒的运动方向是随时改变的,其运动轨迹是一条无规则的折线, 不受什么约束和支配。二十世纪六十年代,m a n d e l b r o t 和n e s s 通过对布朗运动的 扩展,提出了分形布朗运动的概念和模型,从而为分形理论的产生奠定了基础。 现在,以分形布朗运动为基础的随机性分形已经成为分形理论的重要组成部分。 分形布朗运动还具有很强的实用性,它可以用来描述诸如山脉、云彩、地形地貌 等许多分形对象,是常用的分形模型。目前,随着计算机技术的快速发展,分形 布朗运动f b m ( f r a c t a lb r o w n i a nm o t i o n ) 已经广泛的应用到计算机图形、图像处理、 信息安全、虚拟现实和经济等许多领域中。 这里利用m a t l a b 数学软件,计算机模拟产生一列分形布朗运动数据 引 f ) ,t = ( 1 n ) ,从奇异值分解的角度研究分形布朗运动数据,对分形布朗运动数 据加趋势和滤波,考察经过处理后的数据其奇异值分布的变化情况。 2 2 1 分形性的判断 图1 3 分形布朗运动b ( f ) 下图给出了利用d f a 方法得到的分形布朗运动时间序列b ( t ) 的j j i ( g ) 与q 的关 系图,尽管h ( q ) 随着g 的变化也在变化,但可以看出其重分形性并不十分明显。( 纵 坐标的数值变化) 。 1 2 图1 4 分形布朗运动时间序列占( f ) 的 ( g ) 与q 的关系图 1 相空间重构参数的确定 仍然借助互信息法和c a o 方法判断时间延迟和嵌入维数,从图中可以判断出 时间延迟确定为3 0 ,嵌入维数确定为6 。 互信息法求时延c a 0 7 b 法求嵌入维 l a gd i m e n s i o n ( m ) 图1 5 计算分形布朗运动时间序列b ( f ) 的延迟时间和嵌入维数 2 2 2 分形布朗运动时间序列对数滤波的奇异值分解 对分形布朗运动时间序列曰( f ) 进行对数滤波:l o g 。 ( + g ) ) ,占为正常数。改 变s ,考察滤波后时间序列的奇异值分布情况。 图1 6 对分形布朗运动数据对数滤波后新时间序列的奇异值分布图。 图( a ) 为原分形布朗运动时间序列b ( t ) 的奇异值分布图,图( b ) 、( c ) 、( d ) 分别对应占= o , 2 5 , e 3 滤波。 进行对数滤波后的分形布朗运动时间序列的最大奇异值的数值增大了,但与原 始时间序列的最大奇异值不是对数关系。同时结合第一部分图7 可以看到,尽管 是不同的原始时间序列,但是经过对数滤波之后的时间序列在奇异值分布形态上 是相似的。 2 3 金融时间序列对数滤波的奇异值分解 “上证指数”全称“上海证券交易所综合股价指数 ,是国内外普遍采用的反 映上海股市总体走势的统计指标,由上海证券交易所编制,于1 9 9 1 年7 月1 5 日 公开发布。上证指数从总体上反映了上海证券交易所上市股票价格的变动情况。 我们选取了2 0 0 0 年1 月4 日至2 0 0 8 年1 2 月2 6 日共计2 3 3 6 天的上证指数日收盘 价时间序列作为原始时间序列进行研究。 1 4 股票市场中,无论对于投资者还是融资者更关心的是股票的收益情况,因此, 常常会对收盘价作滤波,得到股票收益率来进行研究。下面将研究由股票日收盘 价变换为股票收益率的滤波是如何影响时间序列的奇异值分解的。 2 重分形的判断 图1 7 上证指数日收盘价波动图 图1 8 上证指数时间序列的h ( q 1 与q 的关系图 通过h u r s t 指数h ( g ) 与q 的关系图,可以判断上证指数时间序列是重分形时间 序列。 3 重构相空间参数的确定 时间延迟选取为3 4 ,嵌入维数选取为7 。 互信息法求时延c a o 方法求嵌入维 d i m e n s i o n ( m ) 图1 9 计算上证指数时间序列的延迟时间和嵌入维数 我们知道股票收益率的算法为:l o g ( x ,+ 。) - l o g ( x ,) , 薯) 为股票指数收盘价。 所以下面就针对股票收盘价进行上述滤波,考察滤波前后时间序列奇异值分解变 化情况。 图2 0 图( a ) 为原始收盘价时间序列的奇异值分布图,图( b ) 为滤波后时间序列 的奇异值分布图。 可以看到滤波前后时间序列的奇异值分布变化非常明显。由原来存在异常大 的奇异值为峰点,变为分布紧密均匀,数值递减均匀,平缓,呈阶梯状分布。 下面再用一列股票时间序列进行研究,作为对比验证。道琼斯指数是世界上 历史最为悠久是世界上最有影响、使用最广的股票指数,它的全称为股票价格平 均指数,以在纽约证券交易所挂牌上市的一部分有代表性的公司股票作为编制对 象,这些公司都是本行业具有重要影响的著名公司,其股票行情为世界股票市场 所瞩目,各国投资者都极为重视。该指数目的在于反映美国股票市场的总体走势, 涵盖金融、科技、娱乐、零售等多个行业。它的细微变化,带给亿万人惊恐或狂 喜,它已经不是一个普通的财务指标,而是世界金融文化的代号。 我们选取了1 9 9 7 年1 月2 8 同至2 0 0 8 年1 2 月2 6 日共计3 0 0 0 天的道琼斯指 1 6 数日收盘价时间序列作为原始时间序列,同上面的上证指数一样做相同的滤波, 考察时间序列奇异值分解的变化情况。 2 重分形的判断 图2 1 道琼斯指数日收盘价波动图 图2 2 道琼斯指数时间序列的五( g ) 与g 的关系图 通过h u r s t 指数h ( g ) 与q 的关系图,可以判断上证指数时间序列是重分形时间 序列。 1 重构相空间参数的判断 时间延迟选取为1 5 ,嵌入维数选取为9 。 1 7 互信息法求时延 c a o 方法求嵌入维 d i m e n s i o n ( m ) 图2 3 计算上证指数时间序列的延迟时间和嵌入维数 图2 4 图( a ) 为原始收盘价时间序列的奇异值分布图,图( b ) 为滤波后时间序列 的奇异值分布图。 通过图2 0 和图2 4 可以看到,尽管一个是我国的股票时间序列,个是美国 的股票时间序列,但是他们的奇异值分解结果是相似的,并且在经过相同的滤波 处理之后,新的时间序列奇异值的分布变化情况也是相似的。说明通过求股票收 益率这种滤波,即股票收益率时间序列的奇异值分布变得更均匀,呈现明显的阶 梯状逐渐递减趋势。 3 趋势对分形时间序列奇异值分解的影响 除了滤波,时间序列中存在趋势几乎是不可避免的情况,在物理、生物等系 统中非常的普遍。例如,空气密度受重力的影响在不同的海拔处呈现趋势性;不 同地理位置的气温和水流受季节变化的影响呈现周期性趋势;某一地区地震发生 的频率在不同时期存在趋势性;由于辐射源的能量在逐步降低,由辐射源在单位 时间内放射的粒子的个数呈现衰减的趋势。由此,我们想了解时间序列,特别是 分形时间序列在趋势存在的情况下,它的奇异值分解会有怎样的变化。我们主要 研究两种趋势的情况:线性趋势和周期趋势。将对原始时间序列与附加趋势后时 间序列的奇异值分解结果进行比较研究n 棚。 3 1 重分形时间序列加趋势的奇异值分解 3 1 1 时间序7 j l j 力【l 线性趋势的奇异值分解 首先我们考虑最简单的一种情况,就是给原始时间序列f ( t ) 附加线性趋势, 由一个变量刻画的趋势:u ( i ) = a i ,扛l ,2 ,以,a 为斜率。下面通过改变斜率彳考 察线性趋势对时间序列奇异值分解的影响。 图2 5 对原始时间序列 薯) 加线性趋势“( f ) 之后的奇异值分布图。 1 9 图( a ) 为原始时间序列奇异值分布图,图( b ) 、( c ) 、( d ) 分别对应所加趋势a = 2 - 2 2 、2 _ 1 9 、 2 _ 1 2 的时间序列的奇异值分布图。 从图中可以看到随着所加趋势斜率彳的增大,时间序列的非零奇异值的个数 在减少,当所加趋势相对于原始时间序列较小时,时间序列的奇异值分布情况没 有明显变化,如图( b ) 、( c ) 。当趋势增加为u ( 0 = 2 - 1 2i 时,如图( d ) ,时间序列 的奇异值分布中出现一个数值明显很大的奇异值。将图( d ) 中最大的奇异值去掉 后再做图,得到图2 6 。 图2 6 可见此图与原始时间序列的奇异值分布图相比,除了在奇异值的个数上减少 了,在分布形态上没有实际变化,说明趋势是出现大的奇异值的原因。当所加趋 势为线性趋势,并且所加趋势相对于原始时间序列较大时,可以在奇异值分布上 将其分离开来。可以猜想,一个时间序列叠加一个如同“( f ) 构造的序列后,表现在 奇异值上是两个时间序列奇异值的并。同时,可以用奇异值分解来考察一个时间 序列或信号是否具有线性趋势,即观察是否有数值明显很大的奇异值存在。 3 1 2 重分形时间序列加周期趋势的奇异值分解 给原始时间序列f ( t ) 附加一个周期趋势考察新序列的奇异值分布会有哪些变 化。我们选择所加周期序列为三角函数构造的趋势:v ( i ) = s i n ( 2 ;r i t ) ,i = 1 ,2 ,刀, t 为周期。为方便讨论这里选择原始时间序列为 1 0 0 x ,) 。 2 0 图2 7 对原始时间序列 1 0 0 x , ) j n n 期趋势1 ,( f ) 之后的奇异值分布图。 图( a ) 为原始时间序列的奇异值分布图,图( b ) 、( c ) 、( d ) 分别对应所加趋势t = 2 、2 8 、 2 0 的新时间序列奇异值分布图。 在附加周期趋势1 ,( f ) 后,时间序列的奇异值分布情况有了明显的变化,由原来 中间部分奇异值集中分布,缓慢递减,变为明显的阶梯状递减,在图( b ) 、( d ) 中还可看到存在成对的奇异值,他们在数值上很接近。随着周期的减小,最小奇 异值附加 2 l 图2 8 图( a ) 仍为原时间序列图,图( b ) 、( c ) 、( d ) 仍然对应所加趋势 r = 2 、2 8 、2 6 。 3 2 分形布朗运动时间序列加趋势的奇异值分解 给原始分形布朗运动时间序列b ( f ) 附加趋势,对加趋势后的时间序列进行相 空间重构,从而应用奇异值分解考察新的时间序列的奇异值分布的变化情况。 3 2 1 分形布朗运动时间序列加线性趋势的奇异值分解 如同第一部分的处理方法,给分形布朗运动时间序列附加一个线性趋势: 甜( f ) = a i ,净l ,2 ,刀 么为斜率。改变么,考察奇异值变化情况。 图2 9 加线性趋势后分形布朗运动时间序列的奇异值分布图。 图c a ) 为原始分形布朗运动时间序列b ( t 1 奇异值分布图,图( b ) 、( c ) 、( d ) 分别对应所加 趋势为彳= 2 、2 - 5 、2 - 4 的时间序列的奇异值分布图。 从整体上看,附加线性趋势后的时间序列,其奇异值分布形态没有什么变化, 只是最大奇异值的数值随着所加趋势的增大而增大了。说明附加线性趋势后时间 序列的奇异值保持了原来的分布特性。 3 2 2 分形布朗运动时间序列加周期趋势的奇异值分解 加周期趋势:v ( i ) = a s i n ( 2 7 r i d ,i = l ,2 ,n ,t 为周期。根据原始时间序列的 均值,适当选取a = 2 7 ,改变r ,考察奇异值分布的变化情况。 图3 0 原始分形布朗运动加周期趋势 ,“) 之后的奇异值分布图。 图( a ) 为原分形布朗运动时间序列召( t ) 奇异值分布图,图( b ) 、( c ) 、( d ) 分别对应附加周 期为t = 27 、2 6 、2 5 的趋势后新序列的奇异值分布图。 附加s i n 周期趋势后的时间序列,其奇异值分布情况比较原始分形布朗运动时 间序列的奇异值分布情况有了显著的变化。首先,较大奇异值的个数由原来的1 个增加为3 个;从分布的形态上来看,由原来从数值很大的奇异值迅速变为很小 奇异值的直线下降隋形变为阶梯状逐渐递减。在图( b ) ,( c ) 中也可明显看到存 在成对的奇异值,他们在数值上很接近。这些变化同第一部分中的重分形时间序 列f ( f ) 加s i n 趋势后的效果是一致的。我们可以推断,附加适当大小的s i n 周期趋 势后的时间序列,其奇异值变化特点对原始时间序列似乎不存在依赖性。 下面固定周期丁,改变振幅么,考察奇异值变化情况。 图3 1图( a ) ,( b ) 对应所加趋势为:固定周期t = 2 5 ,振幅分别为彳= 2 7 ,2 5 图3 2 图( a ) ,( b ) 分别对应所加趋势为t = 2 6 ,振幅a = 2 7 , 2 9 可以看到,以上两种情况尽管周期r 不同,但随着振幅么的增大,原始时间 序列奇异值分布的特性逐渐消失,较大奇异值个数在增加,同时分布呈逐渐递减 的性质也越来越明显。 3 3 气象时间序列加周期趋势的奇异值分解 以上是对两组计算机模拟生成的时间序列进行了研究,下面针对实际工作和 生活中的数据进行实证分析。 1 气温时间序列 气温是气候现象中的一个要素,与我们的日常生活和生产息息相关,小到我 们每日的衣食住行:健康、出行、交通,大到人类生产及自然环境变化,都受到 气温变化的重大影响。尤其是农业生产更有赖于气温的因素。影响气温的因素很 多,它是一种复杂的自然系统,人类的活动也在影响着气温。自世界工业革命后 的2 0 0 年间,随着人口的剧增,科学技术发展和生产规模的迅速扩大,人类活动 对气候的不利影响越来越大,比如近年来全球气温不断升高成为人们关注的焦点, 2 4 研究气温也就突显出了其实际的意义和价值。这里我们选取气温时间序列进行简 单讨论,作为深入研究的前提和基础。 首先,气温时间序列选取自北京的2 1 个气象站从1 9 9 7 年1 月1 日至2 0 0 4 年 1 2 月3 1 日,2 9 2 2 天的气象记录。 气温时间序列: i ; 峄 ll ;l d ; ; 糕珈 lij 骥毫 “ 随l 一 泌 _ 奠 一到隧j e :豫肛-娅 陌圈 1 瓢 一嚣一l m 扩| | l i一霄一 i i i 强ii 一 i 一一,e - - - 。1 。胙 l l 鬟强! 一 - _ _ ”h 曩i | r l 为 ; _ 一1 :+ + 一 l i - f 。i 。i 。i 。i 亨亨。亨。 。l 篷 唰 一- - -_ j 一1 j 一 一王j j :扛 1 i 】 型 臻【j j j 睢圭 wil 一一卜一l 1 + 十一 : !l !;:; 1 9 9 71 9 9 日1 9 9 9 2 0 0 0z 1 2 0 0 2 瑚3 2 0 0 4 y e a r 图3 3气温时间序列图,数据单位为( 1 ) 2 气温时间序列的重分形性 我们利用m f d f a 方法判断温度时间序列是否具有多重分形性。 图3 4 气温时间序列h ( q ) 与g 的关系图 上图给出了广义h u r s t 指数h ( q ) 与g 的关系。从图中可以看出,h ( g ) 依赖于q , 并且随着q 值的增大而减小,这表明温度时间序列具有多重分形性质。 3 重构相空间参数确定 下图给出原始气温时间序列的重构相空间参数的确定。时间延迟选取为l o , 嵌入维数选取为8 。 互信息法求时延 c a o ,y 法求嵌入维 图3 5 计算气温时间序列的延迟时间和嵌入维数 从图3 3 可以看到原始气温时间序列自身就有明显的周期性趋势,近似函数 l s i n ( x ) l 的图像,可以利用s i i l 周期函数拟合原始时间序列,抵消这种趋势,再来考 察新的时间序列的奇异值分解情况。 对原始气温时间序列拟合的趋势记为丁( f ) = 1 3 5 s i nf 2 万i 7 3 0 ) i 一5 ( 扣l ,2 ,刀) ,下图给出了拟合趋势与原始气温时间序列的对比图。 图3 6 图( a ) 为原始气温时间序列图,图( b ) 为拟合趋势r ( i ) 的图像。 给原始时间序列加趋势:一r ( i ) ,考察加周期趋势前后时间序列奇异值分解变 化情况。下图给出了奇异值分解后奇异值的分布图。 图3 7图( a ) 为原始气温时间序列的奇异值,图( b ) 为加周期趋势后的时间序列奇异 值分布。 可以看到,在奇异值分布上前后似乎没有明显变化,但注意到纵坐标值的不 同,原始时间序列的奇异值分布中,前两个奇异值远远大于其后的奇异值,第一 个奇异值又比第二个奇异值大将近5 倍,数值变化非常显著。而在图( b ) 中,不 存在如同图( a ) 中异常大的奇异值,最大的奇异值与最小的奇异值不过相差四倍, 而且从第二个奇异值开始,其数值的分布就很均等了。说明加周期趋势后的时间 序列奇异值分布变得均匀了。 回顾第一部分,可以得到虽然是不同的原始时间序列,一组是计算机模拟时 间序列,一组是实验得到的时间序列,但是经过加周期趋势处理后却得到了相似 的效果。说明加s i n 周期趋势后使时间序列的奇异值在数值上的变化更加均匀了。 4 经验模式分解和奇异值分解在时间序列中的综合应用 4 1 引言 大多数自然现象、生命科学、社会经济等系统的实测时间序列都是非线性、 非平稳信号。传统的研究方法,如傅里叶变换和小波变换都是假设系统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中师说课件
- 2025年春季教导处工作计划(附2至6月工作安排)
- 高中东南亚课件听
- 知识产权许可与转让常年法律顾问服务协议
- 城市绿化工程合同签订条件及植物养护责任规定
- 离异家庭财产分割及子女教育基金协议
- 离婚协议书撰写参考:共同财产分割与子女监护权协议
- 如何在初高中生中进行性别平等教育
- 巴鲁兄弟的幽默漫画规程
- 优雅走向成功的商务礼仪课程
- 室内电梯安装工程安全技术交底
- 从初高中物理教学衔接角度谈初中物理教学课件
- 小儿支气管肺炎课件
- 安全学原理第2版-ppt课件(完整版)
- DB32-T 3751-2020公共建筑能源审计标准-(高清现行)
- 销盘式摩擦磨损试验机设计
- 原创领袖的风采-易发久
- 2022年《上海市初中语文课程终结性评价指南》中规定的个文言实词
- 苏教版四年级上册科学全册课件
- 苹果电脑的发展史ppt课件
- 北京中考英语词汇表1600词汇+词组
评论
0/150
提交评论