(应用数学专业论文)用非平稳度量区分白噪声过程与鞅差分序列.pdf_第1页
(应用数学专业论文)用非平稳度量区分白噪声过程与鞅差分序列.pdf_第2页
(应用数学专业论文)用非平稳度量区分白噪声过程与鞅差分序列.pdf_第3页
(应用数学专业论文)用非平稳度量区分白噪声过程与鞅差分序列.pdf_第4页
(应用数学专业论文)用非平稳度量区分白噪声过程与鞅差分序列.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(应用数学专业论文)用非平稳度量区分白噪声过程与鞅差分序列.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性声明 本人声明,所呈交的论文是本人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特另l j j n 以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其它教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了谢意。 签名: 学位论文使用授权书 本人完全了解武汉理工大学有关保留、使用学位论文的规定,即:学校有 权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅 和借阅。本人授权武汉理工大学可以将本学位论文的全部内容编入有关数据库 进行检索,可以采用影印、缩印或其他复制手段保存或汇编本学位论文。同时 授权经武汉理工大学认可的国家有关机构或论文数据库使用或收录本学位论 文,并向社会公众提供信息服务。 ( 保密的论文在解密后应遵守此规定) 僦引鹕:型獬 日期:卅,) 。 武汉理工人学硕士学位论文 摘要 由于系统本身的复杂性以及我们的认识和观测手段的局限性,往往不易准 确地认识其微观结构。此时,可将系统视为一个数据生成过程,通过系统输出 的数据流来研究系统的演化规律。 本文基于遍历论、粗粒化方法和信息论的基本思想,以判断频率序列的稳 定性和提取数据流的稳定信息结构为切入点,研究了数据流非平稳性度量基本 问题。首先应用粗粒化的方法对数据流的相空间进划分,通过判断数据流在相 空间的初始划分的集合的频率序列的稳定性来提取数据流相空间的子信息结构, 把子信息结构的s h a n n o n 信息熵的上确界作为数据流的信息熵,在此基础上定 义了数据流的非平稳性度量,并给出了非平稳性度量的近似计算方法。在我们 看来,平稳性较好的数据流,有较小的非平稳度量值,基于此我们可以通过比 较不同数据流的非平稳度量值大小,来判断不同数据流的平稳性好坏。 在应用方面,作者选取了一些经典的白噪声过程和鞅差序列,其中包括平 稳过程和非平稳过程。通过计算白噪声过程和鞅差分序列的非平稳度量值大小, 在比较其非平稳度量大小的基础上,达到区分鞅差分序列和白噪声序列的效果。 经数值实验结果的表明,非平稳性度量能在一定程度上区分白噪声过程和鞅差 序n :s l l s 平稳性度量是衡量数据非平稳性程度的合理指标。 关键词:非平稳度量,白噪声过程,鞅差序列,熵 武汉理工大学硕士学位论文 a b s t r a c t a st h ec o m p l e x i t yo ft h es y s t e ma n do u rl i m i t a t i o n so fu n d e r s t a n d i n ga n d o b s e r v a t i o n a la p p r o a c h e s i td i f f i c u l tt ou n d e r s t a n d i n gt h e i rm i c r o s t r u c t u r ea c c u r a t e l y f o rt h i sp o i n t ,t h es y s t e mc a nb er e g a r d e da sad a t ag e n e r a t i o np r o c e s s w ec a ns t u d y t h ee v o l u t i o no ft h es y s t e mt h r o u g ht h eo u t p u td a t ao ft h es y s t e m i nt h i sp a p e r ,w es t u d i e ds o m ep r o b l e m sa b o u tt h en o n s t a t i o n a r i t yo fd a t af l o w o nt h eb a s i so ft h es t a b i l i t yo ff i e q u e n c ys e q u e n c ea n dt h ec o n c e p to fi n f o r m a t i o n s t r u c t u r e sb yu s i n gr e l a t e di d e a so fe r g o d i ct h e o r y , c o a r s eg r a i na n di n f o r m a t i o n t h e o r y f i r s t ,w ed i v i s e dt h ep h a s eo fd a t af l o wb y c o a r s eg r a i na n de x t r a c t e d i n f o r m a t i o ns t r u c t u r eb yj u d g et h es t a b i l i t yo ft h ef i e q u e n c ys e q u e n c eo fs u b s e ti nt h e p h a s es p a c eo fd a t af l o w s e c o n d ,w em a d et h es u p e r m u r no fs h a n n o ni n f o r m a t i o n e n t r o p ya se n t r o p yo fd a t af l o w a ne f f e c t i v ea p p r o x i m a t e l ya l g o r i t h mi sd e s i b n e df o r n o n s t a t i o n a r i t ym e a s u r e w et h i n kt h en o n s t a t i o n a r i t ym e a s u r ei ss m a l l e rf o ram o r e s t a t i o n a r yd a t af l o w b a s e do nt h i s ,w ec a nd e t e r m i n et h es t a t i o n a r yo fd i f f e r e n td a t a f l o w b yc a m p a r et h e i rn o n s t a t i o n a r i t ym e a s u r e i na p p l i c a t i o n ,w es e l e c t e dan u m b e ro fc l a s s i cw h i t en o i s ep r o c e s sa n d m a r t i n g a l ed i f f e r e n c es e q u e n c e s ,i n c l u d i n gs t a t i o n a r ya n d n o n s t a t i o n a r i t yp r o c e s s w e c a nd i f f e r e r l t i a t eb e t w e e nw h i t en o i s ep r o c e s sa n dm a r t i n g a l ed i f f e r e n c es e q u e n c e sb y c m c u l a t i n gt h e i rn o n s t a t i o n a r i t ym e a s u r e t h en u m e r i c a lr e s u l t ss h o w nt h a tt h e n o n s t a t i o n a r i t ym e a s u r ei ss o u n d ag o o di n d e xt oc o m p a r et h el e v e lo f n o n s t a t i o n a r i t y a m o n gd a t af l o w s k e y w o r d s :n o n s t a t i o n a r i t ym e a s u r e ,w h i t e n o i s e p r o c e s s ,m a r t i n g a l e d i f f e r e n c e s e q u e n c e s ,e n t r o p y i i 武汉理:1 = 大学硕士学位论文 目录 摘要i a b s l l a c t i i 第一章引言1 第二章预备知识5 2 1平稳过程与非平稳过程5 2 2 白噪声与鞅差序列7 2 3 熵的基本知识1 0 第三章常用检验方法。1 2 3 1b d s 检验方法1 2 3 2 游程检验13 3 3 b o x p i e r c e & l j u n g 混合q 检验1 4 3 4 频谱检验1 5 3 5 广义谱导数检验1 7 第四章数据流非平稳性度量2 0 4 1数据流非平稳性度量的意义2 0 4 2 非平稳性度量及其近似计算2 1 4 2 1稳定集合2 1 4 2 2 稳定集合的判断标准2 2 4 2 3 粗粒化与初始划分:2 5 4 2 4 非平稳性度量的近似计算方法一2 7 第五章白噪声和鞅差序列的区分j 3 1 5 1白噪声过程与鞅差过程的区别3 1 5 2 用非平稳度区分白噪声和鞅差序列3 l 第六章应用3 7 6 1非平稳性度量与模型选择3 7 6 2白噪声和鞅差序列区分在弱有效市场的应用4 0 第七章总结与展望。4 3 参考文献? :忑素烹0 羔:- 4 5一 附勇之? ? 4 8 致谢5 1 武汉理工大学硕十学位论文 第一章引言 有效市场假说是现代经济学和金融理论研究中的核心和热点内容之一。根 据月a e a 以9 删的定义:如果有关某项资产的所有信息能够迅速、完整和准确地 被理性的投资者获得并加以及时利用,并通过其市场行为最终反映在该资产的 价格上,则市场有效。市场有效性可以划分为以下三个层次: 1 ) 强式有效市场,是指最大程度的市场效率的概念,即有关某项资产的所 有信息都将在股票价格中充分展现出来,其中:包括内部信息和私人信息。 2 ) 半强式有效市场,是指所有公开可用的信息都被反映在股票价格中。 3 ) 弱式有效市场,资产当前价格已经充分反映了过去所有价格的信息。通 常研究的弱有效市场可表述为如下数学模型:当充分利用资产所有历史收益信 息集一对下一期收益所做的最佳预测与该资产的长期平均收益相一致,即: e ( 五i 一) = 五小( q = 五一五一。) 。 有效市场的分类源于误差项 薯 的不同假设。,即误差项是否服从于独立 , 同分布、或是鞅差序列还是白噪声序列。当误差项 e l 服从高斯分布时,独立同 分布序列、鞅差分序列和白噪声过程是等价的;对与非高斯过程,独立同分布 时间序列一定是鞅差分序列,鞅差分序列不一定为独立同分布时间序列,平稳 鞅差分序列一定是白噪声过程,但白噪声过程不一定是鞅差分序列。由此可知, 独立同分布、白噪声过程和鞅差分序列的区分,为判断市场行为类型以及了解 其具体的运动特征提供重要依据。 通常,白噪声过程是指一种功率频谱密度为常数的随机信号或随机过 程。换句话说,此信号在各个频率段上的功率是一样的,由于白光是由各 种频率( 颜色) 的单色光混合而成,因而此信号的这种具有平坦功率谱密 ! 啦性质被称作是“白色的”,此信号也冈此被称篚自噪声。 在统计分析中,由于从线性角度来说,不能用以前信息来对白噪声过程加 以预测,所以在经典线性回归模型中,往往假设回归方程中的误差项为高斯白 噪声过程。理论上来说,假如我们所建立的线性模型的残差序列为白噪声,则 武汉理工人学硕士学位论文 该模型在线性模型中是最优的。 常用的检验白噪声过程的检验方法主要有两类:一类是从时域出发,直接 利用样本的自相关函数( 或自协方差函数) 及其渐近分布构造出统计量,比如 b o x 用们e l j u n g ( 1 9 7 0 ) 的q 统计量4 3 ,方差比统计量5 3 等。其中, 方差比统计量尽管是利用序列累加项的方差来构造的,但其实质仍然是几个样 本自相关函数( 或自协方差函数) 的一个线性组合。另一类方法则是从频域的 角度出发来构造检验统计量,具体来说,由于白噪声过程的频率谱分布函数是 一个常数,因此,我们可以利用样本的功率谱分布函数来构造各种类型的拟合 优度统计量,比如:k o l o m o g o r o v - s i l l i m o 疏计量、c r o m e r y o n 胍s p 鳓计量等 等。这方面最早的结果是由g r e n a n d e r y 6 r o s e n b l a t t b l 针对独立同分布的谱分布 函数给出来的。o u d a u r c f l 9 9 1 年旧。中将其推广到了序列满足一定非齐性的情况, 并且针对标准化的谱分布函数给出了类似的结果。 鞅旧。也是一类特殊的随机过程。它起源于公平赌博,其数学描述为:在已 知过程在时刻芒之前的变化规律的条件下,过程在将来某一时刻t 的条件期望 值等于过程在时刻t 的值,即e ( 五k 一。) = 五一l 。虽然pl e v y 早在1 9 3 5 年就发表 了一些孕育着鞅论的工作,直到1 9 3 9 年,l e v y 才首次采用了鞅这个名称,但对 鞅系统地进行研究并使它成为随机过程的一个重要分支的,则应归功于 zl o o o b 。目前,鞅已成为研究随机过程的一个有力工具,近几十年,鞅理论 不仅在随机过程及其其他数学领域中占据重要地位,而且在实际问题如金融、 ,一, , 保险和医学嗡儿3 6 1 等领域也得到了广泛的应用。 例如,在经济学中,鞅过程与弱式有效市场是等价的,弱有效市场的检验 可以转化为误差项的鞅差分序列检验。由于鞅差序列无法从计量上得到很好的 统计分析形式,为此对鞅差序列的检验方法主要采用独立同分布检验和白噪声 检验这两种替代形式。 不少对鞅差序列的检验常用基于线性相关的统计方法,像前面提到 b o x p i e _ r t j u n g ( 1 9 7 0 ) 的混合q 统计量检验、方差比检验和频谱检验等 等,这些检验方法都是建立在样本自协方差函数或是谱密度函数的基础之上。 值得注意的是,用基于自相关函数或是谱密度函数的的统计方法来检验鞅差分 2 武汉理工大学硕士学位论文 序列在一定程度上是可行的,因为鞅差分序列也是线性不相关的。然而,基于 自相关函数或谱密度函数得检验方法仅仅能度量序列依赖的线性部分,它可能 会遗漏掉条件期望中的非线性部分,而这些非线性依赖将导致基于自相关函数 或谱密度函数检验的鞅差分检验无效。还值得一提的是,基于自相关系数检验 统计量及其极限分布都是在同方差假设的条件下推导出来的,任何条件异方差 的存在都将使该检验方法无效,它将导致了不合适的检验水平,得出错误的结 论。即,统计检验中常说的犯第一类错误的概率。 而基于独立同分布的检验方法有b d s 检验憎。、游程检验u w 等,这些方法也都 不适合用来检验鞅差序列。虽然独立同分布序列为鞅差序列,但鞅差序列并不 要求独立同分布。因此,对独立同分布的拒绝并不一定能拒绝鞅差序列,因为 鞅差分序列的序列依赖有可能是由方差或是高阶矩引起的,此检验方法容易犯 第二类错误。 洪永淼于j 删1 提出了广义谱导数检验方法,并在删“。年的论文中完 善了此方法,从而使得该方法比传统检验方法更适合高频金融数据的特点( 如: 允许存在任意形式的波动聚类的或是非线性结构) ,而且它比基于自相关的检验 更能有效地探测出对有效市场假说的各种偏离,即使基于自相关的检验的适用 范围被扩展到允许存在任意形式的条件异方差时也是如此。更重要的是,作为 一种频域分析方法,对比于一般的时域分析,其优势在于:可以通过核函数的 平方对高阶时滞赋予递减权重,这符合金融市场更多是受近期而非远期发生的 事件的影响的情形。 鉴于这些检验方法都未涉及白噪声过程和鞅差序列的区分,本文基于遍历 论、粗粒化方法和信息论的基本思想,以判断频率序列的稳定性和提取数据流 的稳定信息结构为切入点,研究了数据流非平稳性度量基本问题。首先应用粗 粒化的方法对数据流的相空间进划分,通过判断数据流在相空间的初始划分的 集合的频率序列的稳定性来提取数据流相空间的子信息结构,把子信息结构的 s h a n n o n 信息熵的上确界作为数据流的信息熵,在此基础上定义了数据流的非 平稳性度量,并给出了非平稳性度量的近似计算方法。 在应用方面,选取了_ 些典型的白噪声过程和鞅差序列,其中包括平稳过 程和非平稳过程,并期望通过比较白噪声过程和鞅差分序列的非平稳度量值的 大小,来区分鞅差分序列和白噪声序列。经数值实验结果的表明,非平稳性度 武汉理工大学硕士学位论文 量能在一定程度上区分一些典型的白噪声过程和鞅差序列,并有力说明非平稳 性度量是衡量数据非平稳性程度的合理指标。 本文组织如下:第二章简单介绍了与数据流非平稳度量有关的理论知识, 并给出白噪声过程和鞅差序列的定义;第三章给出了目前常见的检验白噪声过 程和鞅差序列的检验方法;第四章里详细阐述了数据流非平稳度量近似计算方 法;第五章通过用非平稳度量区分白噪声和鞅差序列的数值实验,来验证了第 四章提出的非平稳度量方法的有效性;第六章介绍非平稳性度量在模型选择中 的应用,以及白噪声过程与鞅差序列区分在统计、经济中的应用;第七章是对 全文的总结。 4 武汉理工大学硕十学位论文 第二章预备知识 本章主要介绍与非平稳性度量有关的预备知识理论。第2 ,节介绍了平稳性 过程和非平稳性过程的几种定义,以及它们之间的区别和联系。第2 肺在第2j 节的基础上给出了两种比较常见的平稳过程:白噪声与鞅差序列的定义。第2j 节介绍了s h a n n o r t ) 商的基本知识。 2 1 平稳过程与非平稳过程 数据流是指被观测到的依时间或是空间次序排列的数据序列,它可以抽象 成相空间上的一个无穷数列x = :,t l ,通常我们观察到的一组数据,可以 看成随机过程的一次实现。数据流非平稳问题是经典和非经典计量经济学的分 水岭,在经典计量经济学中,经常假设数据变量是平稳的,因此,不考虑数据 变量的非平稳性,然而,实际上大多数经济金融数据又非平稳的。本节主要介 绍随机过程平稳性的几种定义及它们之间的关系。 简单来说,平稳性是指系统不随时间指标变化而变化的一种统计性质。用 过程的联合分布函数可以定义严平稳,若用其矩可以定义过程在较弱意义下的 平稳。 定义2 1 ( 随机过程:! 矧:设实数丁是集合尺:( - - - o o ,o o ) 的子集,通常称丁为 指标集,如果对任意的t t ,都有一个随机变量z 与之对应,就称随机变量集 合 置) = 置:f t 为一个随机过程。当r 是全体整数或是非负整数时,称相应 的随机过程为随机序列,把随机序列的指标集合丁看成时间指标时,这个随机序 列就是时间序列。 定义2 2 ( 严平稳) 1 2 3 1 引:如果随机过程 z :,t ) 对任意正整数甩,k t , 随机向量( 五,五,以) 与( 五m 置“,以“) 有相同分布,即: 氏。以,以( 而,x :,矗) = f 。j :。,以( j c i ,x 2 9 0 9 毛) 武汉理工大学硕+ 学位论文 就称随机过程 工:f t ) 是严平稳随机过程。 定义2 2 的等价定义:如果随机过程 置:f t ) 对任意的七,t 2 ,t 。t , 随机向量( 五,五:,) 与( 气+ 。,x t 2 卅,+ 。) 有相同同分布,即: k 。,屯( 一,x 2 ,矗) = k 舯 “( x ix 2 ,毛) 。 严平稳要求随机过程的任意有限维联合分布不随时间的变化而变化,这个 条件比较苛刻,在实际应用中往往不易得到,为此我们有较弱意义下的平稳性 的定义。因为我们所考虑的数据流可以看作是随机过程的一次实现,所以接下 来的平稳性的定义都是针对随机过程而言。 定义2 3 ( 弱平稳) n 2 3 :如果随机过程 五 = 五:t e t ) 满足 ( 1 ) v t t ,珥 o ,且n js n j - n 6 武汉理工大学硕士学位论文 就称 置:,t l 为以阶平稳 严平稳与弱平稳的关系: 1 ) 严平稳推不出宽平稳,宽平稳推不出严平稳 2 ) 严平稳二阶矩存在可以推出宽平稳;反之一般不成立。 3 ) 当序列服从多元正态分布时,宽平稳可以推出严平稳:严平稳可以推出 宽平稳。这是因为服从多元正态分布的随机向量的联合分布函数是由均值和自 协方差函数完全决定。 平稳性是一个定性的性质,给定一个随机过程,它要么是平稳的,要么是 非平稳的。一般来说,我们把所有的不满足弱平稳性要求的过程都称为非平稳 过程。平稳性是经典的计量经济分析的基本要求之一,只有模型中的变量满足 平稳性要求时,经典的计量经济分析方法才是有效的,假如模型中含有非平稳 随机序列时,基于经典的计量经济分析方法的估计和检验统计量将失去通常的 性质,从而推断得出的结论可能是错误的。因此,在建立模型之前有必要考虑 数据流的平稳性。在很长时间里,学者们在分析经济变量时都假定所分析的数 据已满足平稳性的要求,但近几十年,不管是在理论分析上还是实际生活中, 非平稳过程的例子都远远多于平稳过程。这样的例子包括金融时间序列、水文 数据、大量宏观经济指标等。目前,对非平稳性的研究都集中在非平稳性检 验。但是实际中我们经常会遇见这样的问题,给定两给非平稳过程,到底哪个 会更加不平稳呢? 本文的主要工作之_ _ 就是给出这样一个数据流的非平稳性度 量方法,来比较不同数据流的非平稳性大小。 2 2 白噪声与鞅差序列 白噪声过程是指一种功率频谱密度为常数的随机信号或随机过程。换 句话说,此信号在各个频率段上的功率是一样的,由于白光是由各种频率 ( 颜色) 的单色光混合而成,因而此信号的这种具有平坦功率谱函数的性 质被称作是“白色的 ,此信号也因此被称作白噪声。 定义2 弓( 白噪声过程) 1 朝:如果 & ) 是一个平稳序列,如果对任意的五f 丁 有 7 武汉理工大学硕七学位论文 e 毛= ,c 。v ( 毛,b ) = o 2 , t = s 就称 b 是一个白噪声,记做w 门( ,盯2 ) 。 当 e t ) 是独立序列时,称 b ) 是独立白噪声; 当= 0 时,称 & ) 是零均值白噪声; 当= o ,盯2 = 1 时,称 e t ) 是标准白噪声: 对独立白噪声,当q 服从正态分布时, e t ) 是正态白噪声。 一舣采说,我们所说的臼噪声过程郡是均值为零的臼噪户过程,买际上, 对于均值不为的白噪声,我们可以作变换毛一时它转化为零均值,因此下文只 考虑零均值白噪声过程。可以看到白噪声是平稳 z - l 程的一种特殊形式,特殊的 是其自相关系数厂( ) = o ,0 ,这说明从线性角度来说,不能用以前信息来对 白噪声过程加以预测。 定义2 6 ( 谱密度函数) n 2 1 :假设 z ) 为弱平稳随机序列,若其自协方差 函数的傅里叶变换: 办( 仍) = 去荟y ( 咖一雕【- - 7 , 7 ,如一1 = 击丕厂( 小。s ( 俐 = 万i7 ( 。) + i i 善o o y ( ) c 。s ( 彩) 存在, 则称办( 缈) 为 ) 的谱密度函数,其中国为频率。 对于离散样本x = 置:f _ 1 ,2 ,n ,定义x 的离散傅里叶变换: 一= 二二= := l :一一一 一= = = := = :- _ 一 i , z ( 国) = n i zx , e 咖 i - i 8 武汉理工大学硕士学位论文 口j 得 。h n ( c o ) = 瓦1e i z ( 国) 1 2 = 万1e l 寻喜置e 枷1 2 = 荔i 丙备n 萎ne ( 墨鼍) p 一蛔 2 去,毛( 1 。舭m p 啦 2 去荟刖矿归( 岭o o ) 而称厂( 缈) = 厅( 国) 厂( o ) = 去i = - - 。p ( ) 2 咖= 去i = - - 。p ( 小。s ( 弘) 0 为标准化谱密度函数。 从定义2 万可以看出,白噪声过程的自协方差函数 7 ( _ ,) = e ( 五一) ( 五一,一) = o ,v j o ,从而可得白噪声过程的谱密度函数为 常数办( 彩) = 去7 ( o ) ,v 彩卜万,万】,这就是取名于白噪声的原因。 定义2 7 ( 鞅) 8 1 :首先假设随机变量五是定义在完备概率空间( q ,f ,尸) 上, e ,0 ) 是,上的一列仃子代数,并且满足ccc + ,刀0 ( 此时称之为仃子代 数流) 。随机过程 置,t o ) 称为 e ) 适应的,如果对任意的f 0 ,五是e 可测 的,即对任意的石r ,有 置x e ) ,此时称 置,五,t o p 设 f ,0 ) 是,上的上升的仃子代数列,若随机过程 置 称为 ) 适应的 g ( i x , i ) o 称为关于 f ,0 ) 的鞅。 若随机过程 置,0 是关于 f ,o ) 的鞅, 则称随机过程 u ,= z - x , 小f 0 ) 称为关于 c ,0 ) 的鞅差序列。 9 武汉理:亡火学硕十学位论文 等价定义:随机过程 坼 被称为关于信息集= 巾坼书) 的鞅差序列,如 果它满足e ( l ) = o 。 在经济学中,弱有效市场与鞅过程等价,假设股票价格指数变动服从鞅过 程,那说明投资者不可能通过股价的历史变动来预测未来股价的变动,此时的 市场为弱式有效。 2 3 熵的基本知识 熵( e n t r o p y ) 。指的是体系的混乱的程度,它在控制论、概率论、数论、 天体物理、生命科学等领域都有重要应用,在不同的学科中也有引申出的更为 具体的定义,是各领域十分重要的参量。熵由鲁道夫克劳修斯( r u d o l f c l a u s i u s ) 提出,并应用在热力学中。后来在,克劳德 ,艾尔伍德香农( c l a u d e 即g o o ds h a l i l o l l ) 第一次将熵的概念引入到信息论中来的。 如果随机变量代表一个信源,则熵就是它的平均不确定性度量,设j 是取 值于离散空间q 上的随机变量,其概率分布函数p ( x 1 = p ( x = x ) ,x q ,我们 用p ( x ) ,p ( y ) 分别表示随机变量彤j ,个概率密度函数。 定义2 8 ( 离散s h a n n o n 熵) 1 引:离散随机变量j 的熵定义为 h ( x ) = - z p ( x ) l o g p ( x ) j e q 其中: 对数函数以2 为底是,熵的单位为比特( b i t ) ; 对数函数以口为底是,熵的单位为哈特( h a r t l e y ) ; 对数函数以e 为底是,熵的单位为奈特( n a t ) 。 熵只是分布函数的函数,与x 的取值无关,用e 表示数学期望,e 。表示关 于分布p 的数学期望,即g ( x ) = g ( x ) p ( x ) z :二= = = 。= = :一一 工e n := := :l :一一一 则熵可以表示为随机变量1 0 9 两1的数学期望,即日(x)2易1。g两1p p i 爿j i zj 1 0 武汉理工大学硕士学位论文 定义2 9 ( 信息结构) :假设( x ,f ,p ) 为一个概率空间,a - - 4 :f n ) 是x 的一个划分,即: 1 ) 4 n 4 = 矽,v f j 2 ) u 4 = x 仃( 彳) 是由a 生成的仃代数,则称三元组合( x ,盯( 彳) ,只) 为概率空间 ( x ,p ) 上的一个信息结构,其中:只( 4 ) = p ( 4 f ) ,v a 仃( ) 。 由以上定义,我们可以定义信息结构( x ,盯( 彳) ,只) 的沏肋d ,桔息熵 h ( x ,仃( 彳) ,p a = - p , 4 ( a ,) l o g p a ( 4 ) 。 若在概率空间( q ,f ,p ) 上定义一个数据生成过程x = 五,邑,) ,则可以在 数据生成过程的相空间( o ,1 r ,盯( 【o ,l r ) ,p ) 上定义相应的信息结构。进一步,对 于数据生成过程产生的一个容量有限的数据流x = 薯:,t ) ,我们也可以定义 其相空间( 【o ,l r ,盯( 【o ,1 r ) ,p ) 上曾信息结构( x ,仃( 彳) ,只) ,其中只是划分盯( 彳) 上的频率的极限。 武汉理- 【大学硕士学位论文 第三章常用检验方法 本章主要介绍一些常用的检验白噪声过程与鞅差序列的方法,其中包括b d s 检验、游程检验、b o x 奄p i e r c e el j u n g 混合p 检验、频谱检验和广义谱导数 检验。 3 1b d s 检验方法 状态空间重构的方法是通过选择恰当的嵌入维数和延迟步长,来构造一个 相空间。重构的空间可以具有与实际的动力系统相同的几何性质和信息性质, 具有真实相空间的所有特征,这样我们可以模拟真实的系统以便于研究。设系 统的某状态变量随时间变化的有序输出序列为 薯:i = 1 ,2 ,n ( n 为样本大 小) 。 选择适当的嵌入维m 和滞后参数f ,建立起一个多维相空间,则多维相空间 的相点个数为n = n 一( 朋一1 ) f ,重构的m 维空间其对应的点集为: 只,f = 1 ,2 ,1 1 = n - ( m 1 ) f 通常我们取f = 1 ,则相空间的点集 只,i = 1 ,2 ,刀= n - ( m - 1 ) ) 为: 乃= 五,而,:,) 儿2 屯,黾,靠+ 似j ) 以= 矗,毛,h 计算m 维相关积分: 三( 删,占) 2 赤若日( 占一”乃o ) 其中s 是给定向量点点对的距离,iy l 一乃0 表示两个向量的咒和y 之间的范 数距离, 武汉理工人学硕士学位论文 日( s - i i 乃一乃1 1 ) = 三二氍二4 三三 蹴验的零假设为所检验的随机序列是独立同分布( f i d ) 。它的统计量为: 脚( 朋,占) :、f n c ( m _ , n 瓦, 6 ) - 丁c m 一( 1 , n , z ) 似引 若样本序列为i i d ,则z 弑渐进收敛于正态分布,即: l i m b d s ( m ,n ,占) n ( o ,1 ) j _ 相关积分表示在向量序列中点对的距离不超过s 的点对在所有点对中的比率,所 以它是一种空间相关性的量度。 当n 充分大时,且z 式为f i d 序列时,有ic ( m ,n ,s ) 寸c ”( 1 ,n ,s ) ,方差 0 , 2 m ,占) = 4 lk ”+ 2 k ”c + ( 历一1 ) 2 c 抽一m 2 k c 2 伽卅) | 以 其中z 赋中的c 、k 通常由下式估计: 柏= 南喜芸h ( 酬o ) 乏( s ) = 万硒摘善n 萎n 荟n 日( s i i x i - - x y o ) 日( 占一i i _ 一稚1 1 ) b d s 检验9 增皂够探测其它一些统计检验所忽视的非线性相关有很强的功效, 而基于独立性检验的相关系数检验只能检测出线性相关。b r o c k 等( 1 9 9 3 ) 检 查t b d s 统计量的有限样本分布发现:当样本有5 0 0 或者跏以上个观测值, 嵌入维数m 从2 取到1 5 时,占为现厌1 0 、1 5 和20 倍数据标准差,且 3 2 游程检验 一= = := 一= :一 一一二= = = = :o 二一一 在保持随机序列原有顺序的条件下,将观察值分为两个相互排斥的类。即 将样本序列 葺:f = 1 ,2 ,n ) 的每一个数减去样本均值x ( 或是减去样本的中位 武汉理t 大学硕士学位论文 数) ,用符号一表示x l x l u l ( o a t 00 肠知馏伽y 1 耐肋y 统计量砜= s u p i u ( ,) i 专;u p l u ( t ) i u s ,s lo g s i 肋如盯统计量砜= s u pi ( f ) 一( s ) i 专s u pl u ( t ) - u ( s ) i o :j j s lo j j s i 一一一= 二;二= = :一 一一一= = l = :- 值得一提的是,在自协方差绝对收敛的条件下,谱密度函数可以经自协方 差函数作傅里叶变换得到,自协方差函数也可以有谱密度函数经逆傅里叶变换 得到,因此,在一定程度上自相关检验和频谱检验是等价的。 1 6 武汉理工大学硕十学位论文 3 5 广义谱导数检验 洪永淼1 9 9 9 提出广义谱导数检验1 0 3 方法,以适用于时间序列的线性和非线 性结构,利用广义谱导数的检验能解决一些可能是零自相关,却表现强的非线 性依赖关系的非线性的时间序列过程。该检验方法的先进性在于通过广义谱函 数的各阶导数可检验随机游走过程、白噪声过程、鞅差序列、线性a r c h 、非线 性a r c h 、条件对称性( c o n d i t i o n a ls y m m e t r y ) ,条件异偏态( c o n d i t y o n a l h e r t e r o k u r t o s i s ) 等一系列的问题。该检验方法比较适合高频金融数据的特点。 毛e 2 0 0 2 1 1 1 年,洪永淼将该方法进一步的完善,由于检验统计量的极限分布与待 估参数没有直接关系,该方法可以用来检验时间序列过程的鞅假设。其基本思 想是: 假设随机序列 五 为弱平稳随机过程,其边际特征函数缈( “) = e ( p 。蝇) , 五和置一_ ,的联合特征函数纺( “,v ) = e ( p 毗+ 峭刊) , 其中i 2 = - i ,“,( - - - 0 0 ,o o ) j = o ,1 ,控, 广义谱的基本思想为:首先将原始数据进行指数变换 x t 一芦t 然后考虑变换后序列的 p 。嘶 的频谱夕( 缈,“,v ) = 寺乃( “,v 弦一狮,c oe - - 万,万】 ,i + - - t 0 其中国为频率,o j ( u , v ) 是变换后序列的白相关系数 q ( “,v ) = c o v ( p 峨,p ) = e ( p 喊“哟制) 一e ( p ,屿) + e ( p 峭刊) = o ,1 ,2 , 所以有q ( “,v ) = 纺( “,v ) 一缈( “) 妒( v ) ,当且仅当墨和置一,独立时,q ( “,) = o 。 广义谱函数( 缈,u ,v ) 能捕获到置和一,之间的任何依赖关系。在 v a r ( x , ) = 盯2 哆条髀一_ 有 ( 缈) = 一吉 广义谱密度函数。 ,所以称门荔存,v ) 为 ”d - ( o ,o ) 武汉理工大学硕士学位论文 将广义谱密度函数厂( 彩,“,v ) 对“,求导,阶数用( m ,) 来表,( m ,) 不同取值 可以刻画序列相关的不同方面: 广川门c o ,州) = 万1 吖缸,v ) p 啪,缈h ,万】 ,i 吼叫,= 掣 可以证明, 取( 朋,z ) 为( o ,0 ) 可检验独立同分布性; 取( 朋,) 为( 1 ,1 ) 可检验白噪声; 取( 朋,) 为( 1 ,o ) 可检验鞅假设,即市场弱势有效。 构造统计量: 。 “c m ,z ,= 若t - i 七2 u ,p ,c r 一歹,j 1 二:。,v ,1 2 d 彤c “,d c v ,一6 7 。芸七2 c ,p , 刍? n 丢t - 2 七4 c ,p , ; 其中: ( o , m d ) t l ( 肘,) f ( 1 3 ,州) = 石1 ( 1 一l :i r ) k ( :p ) c r , ( “,v ) e - t j o j 国h ,万1 ,i = l - t 巍州,= 鲁 “l ,m “( ”) 崩) d r r 一( c o ju , - u ) d 彬v ) 。 = i ( ( ”) i 盯,( u 一 ,) 易? n = j 1 。了刀c “,“,1 2d 彤c “,d 彤c 甜,j 1 毒7 c v ,v ,1 2 d 彬c v ,d c v , 彬( ) ,( ) 为权重函数,七( ) 为核函数或滞后窗口,u o ( m ,) 渐进服挑 ( o ,1 ) 。 该检验方法比传统检验方法适合高频金融数据的特点,可以用来检验时间 序列的非线性结构,而且它比基于自相关的检验和频谱检验方法更能有效地探 测出对有效市场假说的各种偏离。更重要的是,作为一种频域分析方法,对比 1 8 武汉理工大学硕士学位论文 于一般的时域分析,其优势在于:可以通过核函数的平方对高阶时滞赋予递减 权重,这符合金融市场更多是受近期而非远期发生的事件的影响的情形。 1 9 武汉理j r 大学硕十学位论文 第四章数据流非平稳性度量 4 1 数据流非平稳性度量的意义 一个随机过程被称为平稳过程,如果刻画它的统计性质不随时间变化而变 化,否则就称为非平稳随机过程。对于平稳过程,借助于自相关函数和功率谱 密度函数,线性时间序列分析的理论知识得到了很好发展,在许多领域也有着 非常广泛的应用。上世纪八十年代以来,非线性平稳随机过程理论也得到了很大 的发展r “。由于平稳过程只是实际过程的近似,非常多的应用领域都直接涉及到 非平稳随机过程,如:医疗、机械工程、地震学、语音识别、经济和金融等。非 平稳过程的理论研究成为亟需发展的领域。与平稳随机过程不同,非平稳过程 的理论还远没有发展成熟,仅在某些非常特殊的假定下才得到了一些结果。 例如,在计量经济分析中,对非平稳性的研究基本上都限制在单位根检验 这一领域,一方面,单位根检验并不能用于任意的非平稳随机过程的非平稳性 的比较,另一个缺陷就是,假设检验只能以一定的概率拒绝或不拒绝( 单位根) 的原假设。但对于两个通过假设检验已经确定为单位根或平稳的数据流却无法 直接比较其非平稳程度: 传统的分析非平稳过程的方法是试图把非平稳过程转化成平稳过程来处理。 即:假定所面临的非平稳过程是由某些随时间变化的趋势或是随机趋势的叠加 而成,对这类过程的分析就转化为如何从该过程的数据输出中找出趋势项,并 尽可能提取趋势项。目前,已经发展了许多趋势项提取的方法,如:处理周期波 动、各种形式的增长、衰减趋势的提取、差分方法和小波方法等等。如果所考 虑的非平稳过程的趋势项结构单一,上述方法能够得到很好的结果,有非常广 泛的应用。但如果过程的非平稳性来源或是耦合方式非常复杂,这类方法将不 再有效。值的注意的是,由于不同的学者对同一非平稳过程的趋势的理解不同, 将导致所提取的趋势项不同,在一定程度上容易弓1 起争论。 本章我们将借助遍历论、粗粒化方法和信息论的思想,以频率序列的稳定 一一二;= = = = = := := = 一 一一= :二_ = :- 性和信息结构问切入点,研究了数据流非平稳性度量问题um 纠。首先应用 粗粒化的方法对数据流的相空间进行划分,通过判断数据流在相空间的初始划 2 0 武汉理t 大学硕十学位论文 分的集合的频率序列的稳定性来提取数据流相空间的稳定信息结构,把稳定信 息结构的鳓删d ,信息熵的上确界作为数据流的非平稳性度量。在保持其他条件 相同的i j 提下,拥有较精细的平稳信息结构的数据流的非平稳程度较低。在此 基础上,我们给出了数据流的非平稳性度量的有效的算法刮。 一旦有了数据流非平稳性度量的数学定义和近似计算方法,就可以通过考 察模型残差序列的非平稳性度量,如果残差序列的非平稳程度足够小,我们 就可以认为该模型提取了该数据流的趋势项,而且残差序列可以当作随机扰动 来处理。只有在对非平稳性进行明确、定量的刻画以后,才可以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论