(电路与系统专业论文)替代数据及其应用.pdf_第1页
(电路与系统专业论文)替代数据及其应用.pdf_第2页
(电路与系统专业论文)替代数据及其应用.pdf_第3页
(电路与系统专业论文)替代数据及其应用.pdf_第4页
(电路与系统专业论文)替代数据及其应用.pdf_第5页
已阅读5页,还剩120页未读 继续免费阅读

(电路与系统专业论文)替代数据及其应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

替代数据及其应用 华东师范大学学位论文原创性声明 郑重声明:本人呈交的学位论文替代数据及其应用,是在华东师范大学 攻读硒芷博士( 请勾选) 学位期间,在导师的指导下进行的研究工作及取得的 研究成果。除文中已经注明引用的内容外,本论文不包含其他个人已经发表或撰 写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明 确说明并表示谢意。 作者签名:日期:2 口1 1 年j 月三p 日 华东师范大学学位论文著作权使用声明 替代数据及其应用系本人在华东师范大学攻读学位期间在导师指导下完 成的题孝博士( 请勾选) 学位论文,本论文的研究成果归华东师范大学所有。 本人同意华东师范大学根据相关规定保留和使用此学位论文,并向主管部门和相 关机构如国家图书馆、中信所和“知网 送交学位论文的印刷版和电子版;允许 学位论文进入华东师范大学图书馆及数据库被查阅、借阅;同意学校将学位论文 加入全国博士、硕士学位论文共建单位数据库进行检索,将学位论文的标题和摘 要汇编出版,采用影印、缩印或者其它方式合理复制学位论文。 本学位论文属于( 请勾选) 审查核定的“内部”或“涉密”学位论文, 适用上述授权。 m 本人签名 z ot l 睦霹 年,月二9 日 , 乏; 一 i p。 r i 一 替代数据及其应用 眭烨硕士学位论文答辩委员会成员名单 姓名职称单位备注 顾国庆研究员华东师范大学主席 韩定定副教授华东师范大学 黄昶副教授华东师范大学 i v 替代数据及其应用 论文摘要 随机信号的非线性检验和平稳性检验在随机信号处理中是个很常见的预处 理过程,并在其中起着十分基础和重要的作用。本文介绍了替代数据法,一种使 用人造受限噪声作为统计学检验参考对象的方法。阐述了替代数据的构建以及使 用替代数据检验随机信号非线性和平稳性的方法。 在此基础上,本文在m a t l a b 环境下设计和实现了随机信号分析系统。该系 统可以对随机信号进行基本的统计学分析,按照指定方法构建替代数据,分析原 始数据和替代数据的非线性特征和时频域性质,对数据做非线性和平稳性检验。 对于非线性检验,该系统利用反面假设和对应替代数据的非线性特性,通过 比较原数据和替代数据的非线性特征来实现对随机信号非线性的检验。 对于平稳性检验,该系统利用替代数据对原数据的平稳化,通过在时频域中 分别计算原数据和替代数据的时频谱并相互比较来实现对随机信号平稳性的检 验。 该系统提供了友好的用户界面。实验表明,该系统可以方便地完成随机信号 各种基本统计量的分析以及非线性和平稳性检验,对于测试数据给出了较好的检 验结果。 关键词:替代数据,非线性检验,非线性特征,平稳性检验,时频分布 v 替代数据及其应用 a b s t r a c t f o rr a n d o ms i g n a lp r o c e s s i n g ,t h et e s to fn o n - l i n e a r i t ya sw e l la st h es t a t i o n a r i t y t e s ti so f t e na n i m p o r t a n ta n db a s i cp r e p r o c e s s i n gs t e p t h i sp a p e rr e v i s i t st h e s u r r o g a t em e t h o d ,w h i c hi sa m e t h o du s i n gs o m ec o n s t r a i n e dn o i s ea sar e f e r e n c ef o r s t a t i s t i c a lt e s t i n g i nd e t a i l ,t h i sp a p e ri n t r o d u c e ss e v e r a lm e t h o d sf o rc r e a t i n g s u r r o g a t e sa n dt h eu s eo fs u r r o g a t e si nt h et e s t so fn o n l i n e a r i t ya n ds t a t i o n a r i t y i na d d i t i o n ,t h i sp a p e re x p l a i n so u rd e s i g na n di m p l e m e n t a t i o no fas y s t e mf o r r a n d o ms i g n a la n a l y s i sb a s e do nm a t l a b t h i ss y s t e mg i v e sa ni n t e r f a c ef o rb a s i c s t a t i s t i c a lt e s t ,t h ec o n s t r u c t i o no fs u r r o g a t eu s i n ga s s i g n e dm e t h o da n dp r o v i d i n gt h e n o n l i n e a r i t yf e a t u r e sa n dt h ec h a r a c t e r i s t i c si nt i m e - f r e q u e n c yd o m a i no fb o t h o r i g i n a ld a t aa n ds u r r o g a t ed a t a i nt h et e s tf o rn o n - - l i n e a r i t y , t h en o n - l i n e a r i t yf e a t u r e so fo r i g i n a ld a t aa n ds u r r o g a t e d a t aa r ec o m p u t e db yt h es y s t e m t h e nt h ed i f f e r e n c eb e t w e e nt h o s ef e a t u r e sc a nb e u s e df o rn o n l i n e a r i t yt e s t i nt h et e s tf o rs t a t i o n a r i t y , t h eo r i g i n a ld a t aa r es t a t i o n a r i z e db yc r e a t i n gs u r r o g a t e d a t a t h e nt h ed i f f e r e n c e sb e t w e e nt h ec h a r a c t e r i s t i c si nt i m e - f r e q u e n c yd o m a i no f o r i g i n a ld a t aa n ds u r r o g a t ed a t ac a nb eu s e df o rs t a t i o n a r i t yt e s t t h i ss y s t e mg i v e saf r i e n d l yi n t e r f a c ea n di sc o n v e n i e n tt ou s e t h ee x p e r i m e n t i n d i c a t e st h i ss y s t e mc a np e r f o r mt h et e s to fn o n l i n e a r i t ya n dt h es t a t i o n a r i t yt e s t k e yw o r d :s u r r o g a t e ,n o n 1 i n e a r i t yt e s t , n o n 1 i n e a r i t yf e a t u r e ,s t a t i o n a r i t yt e s t , t i m e - f r e q u e n c yd i s t r i b u t i o n ( t f d ) v i 替代数据及其应用 目录 第一章绪论。l 1 1 研究背景1 1 2 论文主要工作一2 第二章替代数据法4 2 1 产生背景4 2 2 替代数据法4 2 2 1 一个替代数据法的例子。4 2 2 2 替代数据法5 2 3 替代数据法定义8 2 4 替代数据的构建一9 2 4 1 传统实现法构建替代数据9 2 4 2 受限实现法构建替代数据1 0 2 4 3f t 生成算法1 1 2 4 4a a f t 生成算法1 3 2 4 5i a a f t 生成算法。l6 2 4 6 遗传算法生成法2 0 2 5 统计检验方法2 5 第三章非线性检验2 7 3 1 非线性定义2 7 3 2 反面假设2 7 3 3 信号的非线性特征2 8 3 3 1 高阶统计特性2 9 3 3 2 相空间观测量3 l 3 4 用替代数据检验信号的非线性3 2 3 4 1 信号非线性特征比较。3 2 3 4 2 信号的非线性检验3 5 第四章平稳性检验4 0 4 1 平稳性定义4 0 4 2 平稳性判据4 l 4 3 替代数据的构建4 3 4 4 用替代数据检验信号的平稳性4 6 第五章主要算法的程序实现4 7 5 1d f t 的计算4 7 5 2 自相关函数的计算5 0 5 3 时间概率分布的计算5 l 5 4 时频分布的计算5l 5 5a a f t 的计算5 2 第六章程序集设计5 4 6 1 程序集设计思想和方法5 4 6 1 1 程序设计思想5 4 6 1 2 程序设计方法。5 5 6 2 基本信号分析函数5 5 v 7 4 构建替代数据模块7 5 7 4 1 功能描述。7 5 7 4 2 界面介绍。7 6 7 4 3 使用说明7 7 7 5 非线性分析模块7 8 7 5 1 功能描述7 8 7 5 2 界面介绍7 9 7 5 3 使用说明。7 9 7 6 平稳性分析模块8 1 7 6 1 功能描述8 1 7 6 2 界面介绍8 l 7 6 3 使用说明。8 2 7 7 非线性检验模块8 4 7 7 1 功能描述。8 4 7 7 2 界面介绍。8 5 7 7 3 使用说明。8 5 7 8 平稳性检验模块8 8 7 8 1 功能描述8 8 7 8 2 界面介绍。8 8 7 8 3 使用说明8 9 7 9 基本特征分析模块9 0 7 9 1 功能描述9 0 7 。9 2 界面介绍9 0 7 9 3 使用说明9 0 7 10 主控制模块。9 2 7 1 0 1 功能描述。9 2 l i i x 替代数据及其应用 1 1 研究背景 第一章绪论 用线性还是非线性方法来分析随机信号在信号处理领域是个基本问题【l 】【2 1 。 信号处理中的另一个基本问题是如何判断待处理的信号是否平稳【3 】【4 】。本学位论 文采用替代数据来研究这两个基本问题。论文有贡献意义之处是作者设计的基于 m a t i ,a b 的随机信号分析系统。 在传统的信号处理方法中,我们通常都会使用以高斯信号模型为基础的线性 信号分析方法。以传统的典型频谱分析方法( f o u r i e r 方法) 为例,它在平稳信 号处理中几乎处于不可替代的地位。 在很多现实情况下,信号的高斯分布假设是合理的,并且这种假设的合理性 可以通过中心极限定理来证明。另外,在高斯分布假设基础上设计的信号处理算 法满足线性特征,使得相关算法不仅易于进行理论分析,而且易于实现。而另一 方面,如果我们要使用非高斯假设,都会引入非线性效应,从而极大地增加了算 法设计分析的复杂性。 实际上,传统信号处理领域对于高斯分布假定的广泛采用,主要是因为两个 方面的原因,一方面是信号处理理论缺乏对非高斯信号的有效模型,二是计算机 性能还不足以满足复杂信号模型下计算量的需要。因此,我们通常将实际应用中 遇到的各种信号和噪声都近似成高斯分布来处理。 但是,随着相关领域研究的不断深入,我们注意到:尽管高斯模型能够很好 地描述许多信号和噪声,但在实际应用中任然存在大量的非高斯信号和噪声。例 如,太阳黑子序列、癫痫病人脑电图序列、股票价格序列等等都难以用高斯分布 来进行准确描述。这些信号的非高斯特性,直接引起基于高斯假设所设计的线性 信号处理算法的性能显著退化。 在这些情况下,使用非线性信号处理方法就显得尤为必要。近年来,非线性 动力学特别是混沌理论的发展为看似随机的复杂序列提供了新的解释和分析方 法。 但是随之而来的一个重要问题是,如何判断一个信号是线性还是非线性? 从 替代数据及其应用 混沌理论出发,研究人员设计了多种判断序列是否来自混沌动力系统的算法,如 最大l y a p u n o v 指数估计、关联维估计、非线性预测误差等【5 1 。但是,随着研究的 深入,人们发现对于来自实验中的含噪声、有限长的时间序列,这些方法的结果 并不十分可靠【6 】【7 】。 之后,t h e i l e r 等人提出了一种基于能够代表某种反面假设的人工构建的随 机序列的非线性检验方法,或称替代数据法,开创了非线性检验的新领域。 同样,在处理实验数据时,判断数据是平稳的还是非平稳的也是一个重要的 预处理过程。它会极大地影响后续的分析和建模。 但是尽管平稳性的理论定义( 一些统计特性与时间无关) 看起来很明确,实 际使用中对于平稳性的判定却有许多问题。例如观察尺度对信号平稳性判断就有 很大的影响,一个信号在小的观察尺度上可能是平稳的,在更大的观察尺度上可 能又表现出非平稳性【3 】。另外,在一个观察尺度上,信号起伏在多大程度上可以 被判为平稳或是非平稳也值得研究【3 】o 在这些问题上,业界并没有取得多大成果。在一些统计学文献中【8 】【9 】,平稳 性检验的问题被提出来加以讨论。有些文献涉及到受限的和参数的非平稳性检 验。另一些则需要借助对原始数据性质的特别假设 1 0 。1 2 域者使用不能被广泛应用 的参数模型【1 3 】。而如何检验更广泛的、大量的信号的平稳性的问题仍然没有得 到很好的研究。 最近文献【1 4 】【1 5 】中又提到了这一问题,并且提出了一种新的检验平稳性的框 架。这一框架混合了时频分析法f 1 6 】和著名的替代数据法【5 】【1 7 1 。这一方法的一个主 要特点是它使用了一些从数据导出的经验假设,而不是对于数据本身的特殊假 设。它的基本思想是引入“可控噪声”,即替代数据。并且由于替代数据的一些 特性,它可以作为平稳性的评判标准。 1 2 论文主要工作 本文的主要组成部分包括: ( 1 ) 阐述了替代数据、替代数据法的原理以及几种构建替代数据的方法; ( 2 ) 阐述了随机信号的非线性特征和检验原理以及用替代数据法检验随机信 号非线性的方法; 2 替代数据及其应用 ( 3 ) 阐述了随机信号的平稳性特征和检验原理以及用替代数据法检验随机信 号平稳性的方法; ( 4 ) 分析了以上各方法在实际程序中的实现方式; ( 5 ) 设计了可用于完成文章中所使用的分析方法的程序集,描述了程序集的 设计思想和各组成函数; ( 6 ) 设计了集成信号分析系统,描述了该系统人机交互界面的设计与使用方 法。 其中本学位论文的主要创新之处在于:结合实际的随机信号分析要求,在替 代数据法检验随机信号非线性和平稳性的基础上,设计并构建了可用于分析随机 信号各种统计特性、检验随机信号非线性和平稳性的程序集和对应的综合信号分 析系统。该系统基于m a t l a b 的g u i 平台,为用户提供了一个友好、便捷的信 号分析处理工具。 替代数据及其应用 2 1 产生背景 第二章替代数据法 通常我们使用非线性的方法来分析时间序列【2 1 妣1 】主要有两个不同的原因。 其一是由于信号本身的性质。例如对于一个信号,可能在对其使用了所有已 知的线性分析方法之后,信号中的一些结构仍然无法被分析出来。因此我们不得 不考虑使用非线性分析方法。 其二是由于一些我们可能已知的关于被观测现象的先验知识。例如我们可能 己知一个系统包含了非线性的组成部分。这样我们就自然认为不能用线性方法来 分析它了。这样的例子很常见,例如在大脑研究领域( 没有人希望大脑是线性的) , 有充足的证据显示小簇的神经元是非线性的。因而我们倾向于用非线性方法来分 析整个大脑。 但是后一个原因其实是很危险的。一个系统包含非线性元件并不代表我们从 这个系统得到的某个信号就一定是非线性的。另外,我们也不知道是不是有必要 用非线性方法来分析那些可以近似为线性信号的信号。毕竟,我们的分析方法不 应该表现出我们对系统线性或非线性的偏见。好的分析方法应该可以客观的反映 出信号中的各种结构。 因此,在一个以信号为基础的分析方法中,非线性分析方法的使用应该建立 在对信号非线性的判断的基础上。 2 2 替代数据法 2 2 1 一个替代数据法的例子 在非线性检验中,我们通常无法直接得到被检测信号的解析表达式进而判断 它的非线性,因此我们需要通过一定的方法来检验它的非线性。 我们从某个生物学测试中得到了图2 1 所示的观测信号吼。 4 这里我们同样无法直接得到被检测信号的解析表达式。 用肉眼就可以看出信号中的一些特殊结构。该信号未能通过高斯性检验,因 而我们可以暂时排除高斯线性随机过程作为它的产生源的可能性。 基于我们对于产生该信号的系统的性质的不同假设,我们可能得到不同的对 于图中“道钉”的由来的解释。例如,一大群神经元可能间歇性地同步运动以产生 冲击( 类似图中的道钉结构) 。事实上,某些人工神经网络就表现出了类似的性 质。 然而,最无聊( 或者说最简单) 的一个解释是,所有的“道钉”结构都来自于 测量系统的误差,而所有的线性相关性都来自于一个线性随机过程。 奥卡姆的剃刀告诉我们,在尝试任何更复杂的解释之前,我们首先要否决此 类相对简单的假设。而替代数据法就将尝试寻找最简单并且无法被否决的假设。 2 2 2 替代数据法 在替代数据法中,我们会人工构建随机序列来表示这样的反面假设,然后通 过尝试否决反面假设来证明原始信号的非线性。 在上例中,我们不妨采用这样的解释( 假设) :即这个数据产生自一个平稳 高斯线性随机过程( 自回归滑动平均过程a r m a ) ,然后通过了一个可逆、静态 但是可能非线性的观察函数: o n = d ( 吒) , 吒) :a g m a ( m ,n ) ( 2 1 ) 其中阶数必n ( a r m a 的系数) 以及函数o 都是未知的。即使我们没有对这些 参数精确建模,我们仍然可以知道这样的过程将会表现出特有的线性相关性( 体 替代数据及其应用 现了a r m a 结构) 和单一的时间概率分布( 体现了函数0 在原来的高斯分布上 的作用结果) 。 图2 2 显示了一组被设计好的替代数据霸。这组替代数据尽可能精确地复制 了原数据的这些性质,包括时间概率分布和自相关函数,但同时又是尽量随机的。 图2 3 和图2 4 对比了原数据和替代数据的时间概率分布和自相关函数。 通过适当的统计学的测试,我们现在可以寻找其他在原始数据里存在但替代 数据没有的结构。如果发现了这样的结构,那反面假设就被证伪了。 ,、 c o 、一 n 图2 2 替代数据 _ l 替代数据及其应用 c o l ,。、 o o c k 盘 ,、 o o t ( 1 a g )x1 0 4下( 1 a g )x1 0 4 ( a )( b ) 图2 4 自相关函数a c f ( a ) 序列d 。的a c f ( b ) 替代序列霸的a c f 实际情况是,对于图2 1 所示的时间序列来说,它并没有此类额外的结构。 因为它和图2 2 所示的替代数据都是由公式 吼= 口# ,= 0 9 x - l - i - r l( 2 2 ) 产生的。其中原始线性信号矗的波形如图2 5 所示。 仇) 是高斯独立增量,口是 一个常数,一般用来校正数据使它具有单位方差,这里简单地将其置l 。因此由 脉冲所体现的强非线性是由观测函数在原数据的波动基础上加强或者说扭曲的。 而原始数据的波动是由线性随机过程产生的。由此可见,最简单的假设竟然是真 实的。 n 图2 5 原始线性信号矗 从这个例子我们可以发现,有时候看似最简单,最不可能的假设往往体现了 信号的真实情况。这个例子也向我们展示了替代数据法的基本思想:对于所要检 验的原始信号的某个性质,首先提出反面假设,然后构建对应的替代数据。通过 替代数据及其应用 比较替代数据和原始数据的某些特征,来证明或者证伪反面假设。 2 3 替代数据法定义 对于较正式的统计学上的非线性检验,我们将会针对两种对象构造反面假 设:第一种对象是产生被观测信号的系统,第二种对象是被观测信号本身。 对于前者,反面假设自然是信号产生自高斯线性随机过程。然而在有些情况 下我们会采用后者。例如当我们很难适当地定义组可能的产生信号的系统时, 后者显然更合适。 我们将会通过比较数据的一个非线性参数的值和该值可能的分布来决定我 们是否要否决反面假设。然而实际上,只有在很少的情况下,我们可以得到这种 值的精确或者近似分布。在大多数情况下,我们必须借助额外的强力的假设才能 得到类似的结果。 。 因此,我们必须用蒙特卡洛重抽样法来估计这种值的分布。这一过程在非线 性信号处理相关的文献【5 6 2 2 1 中被称为替代数据法。 另外,在传统意义上的非线性检验中,我们倾向于使用决定论的观点来判断 一个信号的非线性特性:它必然是线性的或者非线性的,二者必居其一。但是实 际上,类似模糊数学的概念,一个好的非线性检验结果应当只是暗示该信号的线 性或者非线性,或者给出该信号在多大程度上是线性的或者非线性的。 具体来说,如果我们有原始数据 ) 以及根据某个反面假设( 例如数据产生 自线性高斯随机过程) 构建的一组k 个替代数据 ) ,k = 1 ,k 。在此基础上我 们根据某个非线性特性来估计原始数据和替代数据的非线性观测值f = f ( ) :对 于原始数据,我们有t o = f ( # ) ;对于替代数据,我们有= f ( ) 。然后,我们可 以根据t 的分布来近似得到观测值t 的分布。之后我们就可以设定一个判决门限 占来确定矗是否属于该分布。 如果f 0 不属于该分布,那么假设被否决。原始数据 # ) 被认为与它的线性替 代数据不同。因此 ) 被认为在判决门限s 水平上是非线性的。 替代数据及其应用 同样的,替代数据法也可以用在其他与随机信号性质检验有关的问题中,例 如随机信号的平稳性检验和随机性检验。我们只需要提出合适的反面假设,并构 建出对应的替代数据。然后通过比较替代数据和原始数据的一些统计特性,来尝 试否决反面假设,进而得到我们的检验结果。 2 4 替代数据的构建 构建替代数据有两类常用的生成算法【2 3 1 ,它们分别为传统实现法和受限实 现法。 2 4 1 传统实现法构建替代数据 当我们用传统的自举方法来构建替代数据时,我们需要从数据中提取完整的 模型方程,然后通过这些方程得到替代数据。 我们可以先考虑一个最简单的反面假设:原始数据是由独立同分布的随机变 量产生。当我们使用传统实现法时,我们可以用观测数据来预测一个概率分布, 然后从服从这个概率分布的时间序列里随机抽取小段来构成替代数据。文献【2 4 】 中介绍了一种具体的用此方法产生替代数据的例子。之后,如果我们在原始数据 和替代数据之间发现了明显的序列相关性的不同,那么我们就可以否定独立性的 反面假设。 进一步,当我们否决了独立性的反面假设后,原数据可以被认为是含有线性 相关性的。我们可能会对这些相关性的本质感兴趣。对此最简单的解释是相关性 产生自两点线性自相关。对应的反面假设可以描述为:观测数据是由某个包含高 斯增量的线性相关随机过程产生的。其中最常见的单变量线性过程可以表示为 m = q 晶叫+ 岛, ( 2 3 ) t = li = o 其中 巩) 是高斯无关随机增量。 统计学检验的复杂性在于,检验某个特别的线性过程( 对应a i 和6 l 的某组特 定取值) 是不够的。我们需要检验所有可能的线性过程( 对应口,和6 ,所有可能的 取值组合) 。这被称为复合反面假设。未知参数q 和勿有时也被称为“多余参数” 9 替代数据及其应用 ( n u i s a n c ep a r a m e t e r s ) 。在这种情况下,基本上我们有两种解决问题的切入点。 第一,我们可以尝试使多余参数之间统计独立。这种方法只在非常简单的情 形下才被证明有效。 第二,我们可以尝试找出哪一种线性模型( 多余参数的某个特定组合) 最适 合观测数据,然后试图否定这种反面假设即数据是由这种特定的线性模型产生 的。对应的替代数据则由该特定实现产生。文献【2 5 】给出了这种“特定实现法 ( t y p i c a lr e a l i s a t i o n sa p p r o a c h ) 的一个具体例子。这个方法最大的短处是我们不 能用这种方法找到产生观测数据的“真实”过程,我们找到的过程只是“真实”过程 的一个近似。如果我们忽略在确定正确的模型阶数m 和中可能遇到的那些问 题,那么观测数据确实很可能是该特定实现的某个特定输出。而该特定实现的其 他输出数据将会在观测数据上下浮动。这样会造成我们对于否定反面假设的偏 见。这一问题在文献【2 2 】中有更详细的讨论。 总而言之,传统实现法在计算置信区间方面很有效,当然这种结果需要建 立在模型方程可以成功得到的基础上。然而在实际情况中,我们可能很难选定模 型方程的类别和阶数,方程参数的估计也是个问题。如果反面假设涉及到未知方 程而不仅仅是几个参数时,这些问题就会很严重。我们可以在文献【2 6 】中找到一 个这样的在动态系统中使用传统实现方法构建替代数据的例子。 2 4 2 受限实现法构建替代数据 与传统实现法相对的,我们可以使用另一种称为受限实现法【2 刀的方法来构 建替代数据。在该方法中,我们通过把所需的结构强加于随机时间信号上来避免 挑选模型方程。 对于2 4 1 节里的第一个问题,受限实现法可以不用重新构造原始数据里的 小段,只需要随机交换它们,就可以得到重排的数据,即替代数据。对应的替代 数据被限制了,它和原始数据有完全一样的概率分布,只是小段的排列顺序不同。 对于第二个问题,考虑原始信号可测量的性质比分析产生它的潜在模型更有 用。因此,原始数据产生自高斯线性随机过程的反面假设也可以被描述成:我们 可以在观测数据里找到那些符合高斯线性随机过程的一阶、二阶统计特性( 均值、 方差、自相关函数等) 。这意味着我们可以构建一个随机但具有与观测数据相同 二阶统计特性的序列来作为与观测数据对应的随机数据。例如,信号的线性性质 1 0 总而言之,对于受限实现法,我们回避了选择模型方程时遇到的大量问题, 但是在随机序列上任意强加所需结构的困难限制了我们对反面假设的选择。不过 在实际使用中,受限实现法被证明更适合我们对反面假设的测试【2 4 1 。 2 4 3l j r 生成算法 最早的受限实现法是以傅立叶变换( f o u r i e rt r a n s f o r m ,f t ) 为基础的生成算 法。正如2 4 2 节所描述的那样,f t 算法首先取得原数据的傅立叶变换,然后保 持该变换的幅度不变,将其相位随机打乱,一般是取【0 ,2 万) 上独立均匀分布的随 机相位。之后再进行傅立叶反变换,就得到了替代数据。 我们的原始数据是以2 0 0 h z 的采样率对 z o ) = s i n ( 1 0 t 2 + ,) + 1 0 ,0 ,1 5 ( 2 6 ) 采样得到。图2 6 显示了用f t 算法生成的替代数据s ( f ) 与其原数据x ( t ) 的对比 图。图2 7 显示了它们傅立叶变换的幅度对比图。图2 8 显示了它们傅立叶变换的 相位对比图。图2 9 显示了它们的时间概率分布对比图。 替代数据及其应用 、。一 o a ) c 车, 、- 一 f o ,) 图2 1 5 傅立叶变换幅度示意图( a ) a b s ( x ) ( b ) a b s ( 墨) ,( k ) a b s ( s o ) ( a ) 飞 酊 、。一 旦 口 c ( b ) m 2 1 6 傅立叶变换相位示意图( a ) a n g l e ( x ) ( b ) a n g l e ( s i o ) : 、- _ , o t - 疗 tt ( a )( b ) 图2 1 7 时域波形( a ) 原信号x ( f ) ( b ) 替代信号s l o ( f ) 1 9 替代数据及其应用 xs 1 0 ( a )( b ) 图2 1 8 时间概率分布p d f 示意图( a ) 原信号j ( 幻的p d f ( b ) 替代信号s ( 幻的p d f 从图2 1 5 可以看出,头两次迭代后,傅立叶变换的幅度值就有了明显改善, 之后随着迭代次数的增加,替代数据的傅立叶变换幅度值越来越接近原数据傅立 叶变换的幅度值。实际上,s c h r e i b e r 证明了这一点:对于非线性自相关过程,替 代数据的功率谱将会逐渐趋近原数据傅立叶变换的功率谱【3 0 1 。当第( 2 ) 步里对傅 立叶变换幅度值的矫正足够小时,第( 3 ) 步里的重排将会完全抵消第( 2 ) 步的变化。 这时替代数据的功率谱将不再变化。 从图2 1 8 可以看出,i a a f t 保持了a a f t 的优点,替代数据与原数据有完全一样 的时间概率分布。 2 4 6 遗传算法生成法 ( 1 ) 遗传算法生成法的基本思想 前文讨论的f t 、a a f t 、i a a f t 算法都是基于傅立叶变换的算法。而r a l f e n g b e r t 在文献t 2 4 】中提出了另一种基于遗传算法的替代数据生成法。 让我们考虑这样的反面假设:观测到的数据 ) 是一个高斯线性随机过程通 过了一个静态的非线性测量函数。对应的替代数据应该具有如下特性: ( a ) 与原始数据有相同的非时变概率分布; ( b ) 与原始数据有相同的自协防差 c = 击篓( - - ) ( 一- ) ( 2 7 ) 基于遗传算法的替代数据生成法同样属于受限实现法。它以一定次数随机交 替代数据及其应用 换原始数据中两个数值的位置。这样可以保证产生的替代数据满足特性( a ) 。对 于特性( b ) ,我们引入一个评价标准,即替代数据的自协方差e 。( f ) 与原始数据 的自协方差( f ) 之间的差异。这个差异由以下公式定义 a ( m ,五) = lc o , , ( r ) - c 。, ( r ) ie x p ( - a r 2 ) ( 2 8 ) r = l 其中五表示权重,引入权重是基于这样的假设:对于更小的时间间隔f ,自协方 差之间的差异应该更小。当这个差异小于一定值时,我们近似认为替代数据的自 协方差和原始数据的自协方差是相等的。这样的替代数据就是符合要求的。而对 于交换方法的确定,r a l f e n g b e r t 等人就使用了遗传算法。 ( 2 ) 遗传算法 在遗传算法中,上文中定义的差异由适应性f 表示,它们之间的关系为 f ( m ,五) = 一( 所,彳)(29) 因此差异越小,对应的适应性越大。 假设我们用于遗传算法的群体为p = l ) 删删,包含m 个个体。每个个体 l 由它的遗传基因c 埘代表。遗传基因表示了一种生成替代数据所用的交换方法, 或者说是原始数据到替代数据的一种映射方法。初始群体里的每个个体的遗传基 因都是随机产生的。 接下来我们要定义进化,即由一代个体产生下一代个体的方法。这个方法包 含四种操作: ( a ) 选择:将一个群体的所有个体按照适应性大小由高到低排序。适应性高 的个体更容易被选择繁殖下一代。 ( b ) 繁殖:由两个被选出的个体交换他们一部分的遗传基因来产生下一代个 体。或者说,后代个体的染色体是由父辈个体的染色体的片断构成的。 ( c ) 变异:这个操作按照一定的变异概率随机改变个体染色体的某一位。 ( d ) 淘汰:经过前三个操作后,群体规模可能会增大,这时候就要将适应性 排在最后的若干个个体淘汰掉,以保证种群规模被限制在一定范围之内。 对于这四种操作来说,具体的实现方式可以有不同。另外对于染色体的含义 也可以有不同。这两点我们将在后文加以说明。 2 l 替代数据及其应用 每次生成新群体后,将这个群体中个体适应性的最大值作为这个群体的代 表。然后我们不断让群体进化,直到这个最大值符合一定的要求( 大于某个事先 设定的门限) 时停止。最后得到的群体里的适应性最大的个体就是我们要求的替 代数据。 ( 3 ) 用遗传算法构建替代数据 为了定义本文所用的遗传基因,我们要引入一个称为复杂度的概念。复杂度 代表了替代数据是在原始数据基础上经过多少次交换得到的。或者说,复杂度越 高,交换次数越多,反之交换次数越低。当确定了复杂度之后,就可以通过对原 始数据随机交换复杂度次得到替代数据。 然后我们来定义遗传基因,本文所用的遗传基因就是交换操作所组成的序 列。例如,如果我们有原始数据如表3 1 所示。某个个体的遗传基因如表3 2 所 示,其中每一列表示一次交换的两个数据的序号。则该个体所代表的替代数据就 如表3 3 所示。个体的染色体长度与实验所采用的复杂度是相等的。 表3 1 原始数据示意 本文所用的遗传算法的四种操作在前文描述基础上还要细化如f 。 ( a ) 选择:将一个群体的所有个体按照适应性大小由高到低排序。假设适应 性最高的个体的适应性为,适应性最低的个体的适应性为。然后我们定 义每个个体的相对适应性无为 f f 厶= 音哮 ( 2 1 0 ) “k 一 p7 1 面“ 如果k 等于,那么所有个体的相对适应性都定义为0 5 。之后我们定义一 替代数据及其应用 个繁殖门限。从群体中选出两个个体,如果他们的相对适应性的和大于繁殖门限, 就让他们繁殖一个后代,否则不能繁殖。这样的一次操作称为一次配对。当群体 里的所有个体都和剩下的所有其他个体有且仅有一次配对,则一次群体繁殖结 束。 ( b ) 繁殖:由两个被选出的个体交换他们一部分的遗传基因来产生下一代个 体。具体来说,将两个父辈个体的染色体在某个位置打断,将剩下的部分交换, 生成两个新染色体,然后从这两个新染色体中随机选择一个作为他们后代的染色 体。 ( c ) 变异:这个操作按照一定的变异概率随机改变个体染色体的某一位。具 体来说,我们定义了一个变异门限。对于每一个后代的每一个染色体位,会生成 一个随机数,如果这个随机数大于变异门限,则随机地改变这个染色体位,否则 不改变。 ( d ) 淘汰:经过前三个操作后,如果生成的下一代群体的规模太小( 本文定 义为小于上一带群体的规模) ,我们将会适当降低繁殖门限( 本文采用使新门限 为旧门限的9 0 ) ,然后重复前三步。直到新群体的规模大于等于旧群体的规模。 这时我们将新旧群体的所有个体放在一起,按照适应性从高到低排序,然后保留 前m 个个体作为这一轮进化的最终结果。 我们还是以2 4 3 节的原数据为例计算它的替代数据。原数据与替代数据的 时域波形如图2 1 7 所示。它们的傅立叶变换幅度值如图2 1 8 所示,相位值如图 2 1 9 所示,时间概率分布如图2 2 0 所示。种群最大适应性如图2 2 l 所示。 1 1 5 1 1 1 0 5 e1 0 9 5 9 8 5 一r r l f 必。泓厶啦| 。1 0 5 1 01 5 ( a ) :, 、- 一 疗 t ( b ) 图2 1 9 时域波形( a ) 原信号x ( f ) ( b ) 替代信号s ( f ) 替代数据及其应用 j 。、 、。一 疗 丘 佰 ,、 邑 西 c 母 j 、 、- 一 ( a ) 图2 2 0 傅立叶变换幅度示意图 ( a ) 图2 2 l 傅立叶变换相位示意图 x ,。、 c ,) 、_ 一 d 日 ( b ) ( a ) a b s ( x ) ( b ) a b s ( s ) ,、 ( ,) 、- , 功 c 眄 ( b ) ( a ) a n g l e ( x ) ( b ) a n g l e ( s ) , o 、- 一 q ( a ) ( b ) s 图2 2 2 时间概率分布p d f 示意图( a ) 原信号x ( f ) 的p d f ( b ) 替代信号s ( t ) 拘p d f 2 4 替代数据及其应用 g e n e r a t i o n s 图2 2 3 种群最大适应性示意图 从图2 2 3 可以看出,遗传算法的确可以起到优化交换的作用。图2 2 0 显示 的替代数据的傅立叶变换幅值和a a f t 替代数据类似,效果没有i a a f t 替代数 据的好。图2 2 2 显示了替代数据和原数据有完全一样的时间概率分布。这一点 和a a f t 以及i a a f t 替代数据是一样的。 遗传算法生成替代数据的一大缺点是遗传参数的选择对结果影响较大,但是 我们无法显式地得到它们具体是如何地影响结果的。同时和效果相近的a a f t 算法相比,遗传算法的时间和空间效率都要低得多。 2 5 统计检验方法 当我们从原始数据和替代数据里获得了某种形式的统计量( 这里是非线性 特征或平稳性特征) 后,就需要根据这些统计量的分布来决定判决门限,之后比 较判决门限和原始数据的统计量来肯定或者否定反面假设。 但是在实际应用中,这些统计量的分布常常是未知的。我们一般首先会想到 的是假设统计量服从正态分布,对原始数据和替代数据集使用高斯分布的参数检 验方法进行检验。但实际上替代数据的统计量并不一定满足正态分布,此时使用 参数检验方法就会有偏差。 这时就需要用至l j s c h r e i b e r 等人提出的将统计量排序( r a n k o r d e r ) 后再进行检 验的秩方法【2 3 1 。具体来说,假设原数据的统计量为瓦,替代数据的统计量为 z ) 篙( 这里假设有组替代数据) 。如果原始数据和替代数据的统计量服从同一 个分布,那么r o 是所有统计量 t o ,五,瓦) 里最小或者最大的概率就是 替代数据及其应用 2 ( n + 1 ) 。因此,在n 足够大的情况下,如果我们发现瓦比 z 盘的所有值都大 或者小,那么瓦就很可能和 z ) 墨。服从的是不同的分布。反面假设也因此被否定。 对于单边检验,这一方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论