




已阅读5页,还剩60页未读, 继续免费阅读
(计算机系统结构专业论文)基于范例推理的时序预测层次模型及其在期货预测中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 奉文从期货市场的实际情况出发,针对当前时间序列方法在期货预测及应用中存在 的问题,采用范例推理技术弥补其在实际应用中的不足,从宏观上提出一个多层次范例 推理的时间序列分析框架,并结合基于原子模式的模板匹配算法和多项式拟合算法对期 货市场进行预测。论文的主要工作如下: 1 从宏观方面,以相似模型的统一描述为基础,提出一个多层次抽象范例重用框 架,它适用于时序的描述和预测。在时间序列的背景下,描述了多层次范例推 理方法,并且讨论了在时序预测中些c b r 循环常见的问题。 2 ,在解决了宏观的架构问题以后,本文以1 ,2 阶模式为基础推导出基于n 阶原子 模式的构造,提出了,l 阶模板匹配算法,解决了范例检索、匹配和类比转换问 题。通过理论分析和实验验证,基于模板匹配的算法与时间序列预测领域的同 类方法和传统方法相比较在精度上和性能上都有较大优势。 3 本文还提出一种基于多项式拟合时间序列的方法,通过对时间序列的多项式拟 合的函数特征化,将时间序列的数据映射到多项式的系数特征空间,然后根据 系数的特征空间采用类似欧氏距离的方法来比较时间序列的相似性,从而进行 时间序列的预测。 4 最后,将本文的时间序列层次模型应用到期货的实际预测中,实现了基于该模 型的简化期货预测系统。通过该系统提供的数据充分说明了本文一系列解决方 案的有效性。 实验验证了该模型比其它几种经典方法预测精度高,稳定性好,而且对给定长度的 变化敏感度低,具有较高的实际应用价值。 【关键词】范例推理;范例表示;时间序列预测;多项式拟合 垒堕塑里 a b s t r a c t c o n s i d e r i n gt h ef a c to ff u t u r e sm a r k e t ,t h e r ea r ee n o r m o u sd i f f i c u l t i e so nt i m es e r i e s e x t r a p o l a t i o n f o rf u t u r e sm a r k e t t r a d i t i o n a l a p p r o a c h e s ,m o s t o fw h i c ha r eb a s e do n m a t h e m a t i c a lm o d e l s ,h a v es e v e r a ld i s a d v a n t a g e s ,s u c ha s t i m e c o n s u m i n g ,e i t h e rr o u g ho r r i g i dm o d e l ,i n a b i l i t yt of u l l yr e f l e c tt h em a r k e ta c t i v i t i e s , n o n r e a s o n a b l ea n di m p l i c i t e x p l a n a t i o n o n s i m i l a r i t ym e a s u r e m e n t ,e t c a i m i n g a tc u r r e n t p r o b l e m s ,c a s e b a s e d r e a s o n i n g ( c b r ) i sc h o s e na st h ef r a m e w o r k t h i sp a p e rp r e s e n t sah i e r a r c h i c a lc a s eb a s e a r c h i t e c t u r ef r o mam a c r o p e r s p e c t i v e ,a sw e l la sat e m p l a t e - b a s e dm a t c h i n ga l g o r i t h ma n da p o l y n o m i a l f i t t i n ga l g o r i t h mi ne x t r a p o l a t i n gt h et i m es e r i e s 1 f r o mam a c r op e r s p e c t i v e ,b a s e do nau n i f i e dd e s c r i p t i o no fs i m i l a r i t ym o d e l s ,w e p r o p o s e sag e n e r a lh i e r a r c h i c a lf r a m e w o r k f o rm u s i n gc a s e sa ts e v e r a ll e v e l so f a b s t r a c t i o n , p a r t i c u l a r l yd e s i g n e df o rd e s c r i b i n ga n de x t r a p o l a t i n gt h et i m es e r i e s w es h o wh o w t h ei d e a o fh i e r a r c h i c a lc a s e - b a s e dr e a s o n i n gc a nb ei n v o l v e di nt h et o p i co ft i m es e r i e s s i m i l a r i t y a s s e s s m e n t ,s e v e r a lk e yi s s u e si nc b r c i r c l ea r ed i s c u s s e dw i t h i nt h ec o n t e x to ft i m es e r i e s p r e d i c t i o n 2 u n d e rs u c ha r c h i t e c t u r e ,a2 “一o r d e rp a t t e md e f m i t i o ni s g i v e n ,t h e nw e d e d u c et h e c o n s t r u c t i o no fm o r d e r e da t o mp a t t e m ,w i t hw h i c ha t e m p l a t eb a s e dm a t c h i n gc i b m ) a l g o r i t h m i s p r o p o s e d t or e s o l v e p r o b l e m s i nc a s e s e a r c h i n g ,m a t c h i n g ,a d a p t i n g t h e e x p e r i m e n t a l r e s u l ts h o w st h a to u rt b ma l g o r i t h m o u t r ) e f f o r m s t r a d i t i o n a la n ds i m i l a r a p p r o a c h e s w i t h h i 【g ha c c u r a c ya n ds t a b i l i t y 3 i n a d d i t i o n ,ap o l y n o m i a l - f i t t i n ga l g o r i t h m i s e x p a t i a t e d ,a n di m p l e m e n t e d i n t o e x t r a p o l a t i o no f f u t u r e sm a r k e t w i t hf u n c t i o n a lc h a r a c t e r i z a t i o no f p o l y n o m i a l f i t t i n g o nt i m e s e r i e s ,t h ea l g o r i t h mm a p st h ev a l u e so ft i m es e r i e so n t ot h ee i g e n v e c t o rs p a c eo fp o l y n o m i a l c o e f f i c i e n t s ,b a s e d o nw h i c hw em e a s u r et h e s i m i l a r i t y o ft h et i m es e r i e s u s i n g e u c l i d e a n - a l i k ed i s t a n c e ,t h u se x t r a p o l a t i n gt h et i m es e r i e s 4 a tl a s t ,t h em o d e li s i m p l e m e n t e d ,t od e m o n s t r a t eaf u t u r e sa n a l y s i sa n dd e c i s i o n s y s t e m t h er e s u l ta c h i e v e sf i n er e s u l ta n d p r o v e st h a to u r m o d e li sm o r e p r e c i s ea n d m o r es t a b l e t h a nt r a d i t i o n a lm o d e l s ,t h u sp r o v i n gi t se f f e c t i v e n e s s k e y w o r d c a s e b a s e dr e a s o n i n g ;c a s er e p r e s e n t a t i o n ;t u n e s e r i e se x t r a p o l a t i o n p o l y n o m i a l - f i t t i n ga l g o r i t h m 华南理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 、 作者签名:办h 耐 日期:知衅厂月仅日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印什和电子版,允许论文 被查阅和借阅。本人授权华南理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存 和汇编本学位论文。 保密口,在一年解密后适用本授权书。 本学位论文属于 小保密瓯 ( 请在以上相应方框内打“4 ”) 作者签名:踢爹奴吖嫱 日期:知中年z , h ,a 日 剔磴辄彩么 日期:即f 引肌 第1 章绪论 1 1 引言 第1 章绪论 在当今的金融市场中,风险转移与很多金融合约都息息相关,其中又以在期货、期 权这种衍生品的风险管理中最为常见。期货市场在中国成立至今有十个年头,但在西方 它已有近百年发展历史。随着中国商品经济发展,为更好地实现与世界经济接轨,中困 的期货行业在经历了起步阶段、发展阶段、调整阶段后,现面临一个巨大的发展机遇与 挑战,期货行业被列为我国十五的发展规划之一。 在期货交易中,投资者不需太多的资金就可完成一宗大买卖。准确的期货价格走势 预测可使投资者在瞬间成为巨富,反之也能让其一贫如洗,因此期货投资者最关心的是 如何预测期货价格走势,以决定其最佳的买卖策略。预测的目的是发现规律,再用其对 期货价格走势进行预测。目前人们主要用回归等统计手段建立模型来预测期货市场。然 而,由于影响期货价格的因素较多,包括商品供求状况、经济波动周期、金融货币因素、 政治政策闵素、大户的操纵和投机心理等,且各种因素相互交织、相互影响,其预测的 效果并不理想。虽然目前还没有精确预测期货价格走势的万能公式,但从现有的历史数 据中,我们可以找出一些可较准确预测其走势的基本规律,而这些隐藏在历史数据中的 规律,可以表现为一种函数关系。 与股票、债券相比,期货的市场行为具有更大的投机性,所以一些常规的预测方法 往往失效,本文采用数据挖掘方法( 时间序列分析手段) 对期货价格走势进行预测。由 于时间序列分析手段可有效地通过对海量期货交易行情数据的挖掘,发现期货数据中随 时间变化的一些隐含的规律,帮助预测期货市场的价格走向,从而可以做出正确、及时 的决策,因此时间序列分析手段具有较高的实际应用价值。 1 - 2 研究的背景 经过多年来国内外众多学者的努力,目前存在很多经典模型理论和当代传统的时间 序列模型理论。与经典模型理论的提出者相比,当代的学者着力研究时问序列的结构问 题,例如d f t 方法将时序变换为n 维空间点,然后在n 维欧几里德空间进行欧式距离 的比较,巧妙地解决了时间序列的索引、挖掘、搜索、预测等问题;一些对时问序列的 变换包括a f f i n e t r a n s f o r m a t i o n ,l a n d m a r k ,形状匹配法等为时间序列的分析提供了很 好的工具。但仔细研究可以发现,当代的时间序列模型理论依然存在一些问题: ( 1 )传统的时间序列分析和预测技术多数是基于数学模型的,主要通过研究其数理 统计特性得到其运动特质,然后进行外推。这种方式在理论上较完搀严密,但期货市场 中往往伴随大量的投机行为,又存在众多因素的影响,如政策、天气等等,且其变化难 华南理工人学硕士学位论文 以量化,i 到此以数学公式表达的模型很难应付如此复杂多变的市场,需要引入一些智能 处理方式弥补其不足。 ( 2 ) 一些智能的方法,如神经网络,对时问序列的处理与普通的序列不作区分,忽 视了时问序列内部富含的信息。 ( 3 ) l a n d m a r k 方法可以很好地保留时间序列的峰值和谷值,对保留时间序列峰值和 谷值当时的信息是有利的,但对短期的小幅高频振荡处理不足,使用其m d p p 平滑往往 很容易把这些短期小幅高频振荡平滑掉,事实上这样的短期小幅高频振荡包涵的信息, 往往反映了证券市场的消息的往复过程。 1 3 研究的内容 证券经理人在操作证券投资的实战中,很少采用数学统计方法预测证券未来价格走 向,而是通过自身多年的经验判断支股票的涨、跌及其变化幅度。因此针对1 2 中的 问题( 1 ) ,本文引入( 人工智能技术的) 基于范例的推理方法解决其不足。基于范例的 推理方法是基于历史的知识,经过类比转换来匹配当前的问题,然后得到当前问题的解 决办法。也就是说,本文将利用该价格以往的走势特征来预测该价格未来的走势。 时问序列是可以分解为长期趋势,周期变动,季节波动和随机项等等。这些项往往 是交错的,例如当年大趋势下降,但当月有可能是上升。如果简单地按照曲线相似搜索 案例库,很难反映真实的情况,从而导致错误的结果。因此本文要考虑基于一些基本的 时问序列统计特性来研究问题,在这个问题中,正确的处理方法是分而治之,在案例库 中寻找相似的年趋势,和月趋势等等。这就是“分层处理时序”想法的由来。这样, 就把以前采用直接预测的方法( 最多进行差分) 改变为分别对不同含义的时序采用不同 的方法预测然后组合,使得得到更加精细的结果。在消除长期趋势方面,可以采用第2 章中2 6 1 介绍的方法。 还可以这样认为,“范例的相似,首先是粗糙层面上的相似,然后才是精细层面上 的相似。”引入时序领域,可以这样理解:“两个时间序列的相似,首先是比较大的时 间粒度上的相似,其次才是比较小的时间粒度上的相似”。本文在时序的相似性索引、 搜索、匹配的宏观架构方面,在时序预测中引入h c b r ( h i e r a r c h i c a lc a s e - b a s e d r e a s o n i n g ) 架构 1 6 】f 1 8 1 1 1 9 1 ,h c b r 方法的好处有: ( 1 ) 有助于解决范例库组织的无含义性带来搜索的盲目性,层次模型更能符合人们对 相似的逐步认知过程; ( 2 ) 抽象范例的使用可以减少范例的复杂性; ( 3 ) 高级别的抽象范例可以当作一种原型来使用; ( 4 ) 范例抽象可以用于定义相似性的语意; ( 5 ) 范例抽象可以大大增加了重用的伸缩性; 2 第1 章绪论 ( 6 ) 范例抽象与雕琢,本来就可以视为一种解的类比匹配方法。 通过上面讨论,本文的工作可以分成下面几步: 第一步工作。尝试建立时间序列的h c b r 架构,提出通用的c b r f o r t i m es e r i e s p r e d i c t i o n 的框架,这个框架必须是能容纳不同的相似模型,比如:a r m a 模型,d f t , d w t ,欧式距离,l o n g e s t c o m m o n s u b s e q u e n c e ,动态时问变形( d y n a m i c t i m e w a r p i n g ) , l a n d m a r k 方法等等( 第2 章) 。 第二步工作。考虑在上述相似算法的基础上提出自己的相似算法,并用实验验证其 有效性。 以往的相似模型,例如d p t ,要求两个序列变换成相同的模型,然后进行变形,再 比较相似性,优点在于相似性判断的模型化,但缺点就是消耗系统资源比较厉害。本文 争取跳过模型化这一步,通过数据点的值的变换和比较,进行快速的匹配,在效率方面 可以与欧式距离接近。因此本文目的是:寻找相似模型必须能满足h c b r 的层次结构; 能为多样性的序列提供模板,比如w ,m ,抖动等,并保留峰值和谷值,保留大致的 形状特征;能够恰当地得到类比转换的算子,以便利于后期的预测。 本文在第3 章提出了基于- 阶原子模式匹配的算法,此模型的方法与英国学者 b r a n k op e c a r 的a p r e 方法类似,避开数学模型化,以满足人们的直觉为出发点,关一心 时间序列的升降起伏,峰值和谷值,并能动态地处理相似模式,较为宽容但合理地进行 时序模式的匹配。 1 4 研究的目标和创新 本文的日标是要给出基于案例推理的时序预测的层次模型、具体构架和相关的理论 及算法;同时要实现二阶原子模式的匹配算法;实现多项式拟合的匹配算法;实现基于 案例推理的层次模型的期货预测实验系统;实现多项式拟合的时序预测应用实验系统。 本文的创新在于在时间序列领域引入了层次性范例推理框架相似首先满足粗 糙层面上的相似,然后才是精细层面上的相似;从低阶原子模式到高阶原子模式的构造, 使得不同的序列的相似性有了相对更合理的标准,为考察时间序列的外形特征提供了基 石出。 1 5 论文结构 本文的结构如f : 1 第一章绪论概括介绍本文研究的内容,背景和意义。 2 第二章介绍关于范例推理和时问序列的概述。讲述了范例推理的基本内容和一 般过程,同时给出了计算范例相似的过程,一般算法和度量。还介绍了时间序 列的相关知识,同时介绍了目前世界上的实践序列预测模型的状况。 3 华南理t 大学硕士学位论文 3 第三章是本文的重点,介绍了基于案例推理的时序预测的层次模型。在这个模 型中给出了相似模型的概念和范例表示,以及基于模板的时问序列的相似匹配 算法。 4 第四章主要讲述该时间序列的层次模型在期货中应用。介绍了基于该模型的两 套实验系统,一套是使用原子模式的匹配算法,一套是基于多项式拟合的匹配 算法。 5 第五章是结论,总结了论文的工作,不足和进行了展望。 1 6 小结 本章中,介绍了本论文的选题背景和时问序列领域的一些最新动态和本文的工作的 丰要内容。 4 第2 章基于范例推理和时间序列预测问题概述 第2 章基于范例推理和时间序列预测问题概述 人工智能发展至今,取得了许多实用性的成就。但在专家系统发展的3 0 多年时间 罩,知识系统的基本结构变化很小。一方面,从知识系统本身的技术发展看,专家系统 面临许多诸如知识抽取的瓶颈、实现困难,不能处理和管理大量的信息和难维护等问题: 另一方面,知识系统研究人员一直以来忽视了一个在没有模型的情况下,如何建立知识 系统的基本问题。近几年来,面对传统人工智能知识获取的局限,基于数据挖掘和分析 的计算智能成为一个新的发展方向【”。同时,基于相似性的推理越来越受到重视,故此 提出范例推理( c a s e b a s e dr e a s o n i n g ,本文以下称c b r ,又称为基于范例推理) 。由 于它可以克服专家系统当前所面临的难题,具有简化知识获取、提高问题的求解效率、 改善求解质量、进行知识积累等优点,被认为是人类认知心理学理论和提供人类解决问 题的一种认知模型,提供了与人类解决问题甚为近似且易突破知识系统脆弱性的一种方 法。范例推理实际上是通过接受以往范例的知识或信息用于新范例问题求解过程。c b r 是由日标范例的提示获取记忆中的源范例来指导目标范例求解的一种策略。c b r 是个 典型的循环过程,包括相似范例抽取、利用相似范例进行问题求解,修正问题的求解和 新范例保存四个阶段。这一过程与人类在解决问题时的思维过程极为相似,可以认为 c b r 提供了一种模拟人类推理方式的方法,利于抽取和存储专家知识。 另外,c b r 与规则推理( 砌j r ) 有效结合,町以互相弥补不足,可满足不同知识源 的需要,提商推理的准确性,并可提高设计推理的效率。 从认知心理学角度看,c b r 是人类认知的一种合理性模型,同时又是一种建立智能 知识系统的方澍3 1 。采用范例推理方法进行决策问题求解,提供了一种决策问题分析新 思路。在复杂环境中,一些现象是相似的或者表现出相似关系,相似性技术恰恰是用于 分析存在自然和社会科学中隐含信息的种技术,用来进行探求和解决真实世界的复杂 模式,并且它能够以整体的观点来分析环境问题,而不同于以往用数理模型的抽象模拟。 通过理解主题之间的相似性可以比孤立地研究更好地了解该主题。因此有人认为环境的 建模可以不用经过抽象而依靠自身的相似性来建模【2 】,而c b r 技术则提供了实现这种 相似性建模的可能性。对此,1 9 9 4 年b r a n t i n g 和h a s t i n g s 就利用c b r 解决环境问题, 开发了c a r m a 系统来解决牧场的虫灾问题。1 9 9 3 年,j o n e s 和r o y d h o u s e 应用c b r 研究气象卫星图像,进行天气模式的预报;1 9 9 4 年g o e l 等利用c b r 技术和分层的空 间模型进行实验1 9 9 4 年,k e l l e r 利用c b r 作为一种知识获取手段辅助制图综合i ”。 5 华南理工大学硕十学位论文 确认的方案 日 i 重用 + 厂 被提议的 ij 解硗方案 l _ j 图2 1 范例推理( c b r ) 循环”4 2 “”。 2 1 范例推理基本内容 c b r 中,知识表示是以范例为基础,范例的获取比规则获取要容易,大大简化知识 扶取。对过去的求解结果进行复用,而不是再次从头推导,可以提高对新问题的求解效 率。过去求解成功或失败的经历可以指导当前求解时该怎样走向成功或者避开失败,这 样可以提高求解的质量。但是,范例复用是基于问题描述的,因此不确定性将会导致得 到的结果在推理后期是没有用的,而阻碍了推理程序的执行。如果执行的结果是未知的 或者不确定的,那么选择和执行一个计划将会得到不可预计的结果。【z 】 图2 - 2c b r 的源范例与目标范例的类比映射”4 2 “4 4 6 第2 章基于范例推理和时间序列预测问题概述 2 2 范例学习的一般过程 在基于范例的学习过程中,最初是由于目标范例的某些特殊性质使我们能够联想到 曾经记忆的源范例。但它是粗糙的并不一定正确,我们必须证实其可类比性。在这个阶 段做了一定类比映射的工作,这个过程结束后,获得的源范例集已经按与目标范例的可 类比程度进行了优先级排序。接下来则进行类比映射,从各选范例集中选择最优的一个 源范例,建立它与目标范例之间的一一对应关系。再利用一一对应关系转换源范例的完 整的( 或部分的) 解决方案,从而得到目标范例完整的( 或部分的) 解决方案。若目标 范例得到部分解答,则把解答结果加到目标范例的初始描述中,从头开始整个类比过程; 若所获得的目标范例的求解方案未能给目标范例以正确解答,则需解释失败原因并修补 所获得的方案。整个类比过程是递增地进行的。 输入 图2 3 范例推理的一般过程 从图中可以看出,范例的一般过程关心下列问题: 范例的表示 基于范例推理方法的效率和范例表示紧密相关。范例表示涉及这样几个问题:选择 什么信息存放在范例罩;如何选择合适的范例内容描述结构;范例库如何组织和索引。 对于那些数量达到成千上万而且十分复杂的范例,组织和索引问题尤其重要。 7 华南理工大学硕士学位论文 分析模型的选择 分析模型用于分析目标范例,从中识别和抽取检索源范例库的信息。 范例的检索问题 利用检索信息从源范例库中检索并选择潜在可用的源范例。基于范例推理方法和人 类解决问题的方式很相近。碰到一个新问题时,首先是从记忆或范例库中回忆出与当前 问题相关的最佳范例。后面的所有工作能否发挥应有的作用,很大程度上依赖于这一阶 段得到的范例质量的高低,它分为三个子过程: 特征辨识是对新问题进行特征提取,可以是从对问题的描述中直接获得的特征:也 可以使对问题经过分析理解后导出的特征;还可以是根据上下文或知识模型的需要从用 户n jl 通过交瓦方式获取的特征。 初步匹配是指从范例库中找到一组与当前问题相关的候选范例。这事通过使用上述 特征作为范例库的索引来完成检索的。由于一般不存在完全的精确匹配,因此要对范例 之间的特征关系进行相似度的估计。它可以是基于上述特征的与领域知识关系不大的表 面估计,也可以通过对问题进行深入分析后的深层估计。 最佳范例是指初步匹配过程中获得的一组候选范例中选取一个或几个与当前问题 最相关的范例。这一步与领域知识关系密切。做法是由领域知识模型对候选范例进行解 释或生成某些期望的结果,然后对这些解释或结果进行有效性测试或评估,最后依据某 种度量标准对候选范例进行排序,得分最高的就成为最佳范例。具有最强或最合理解释 的范例可选定为最佳范例。 一般讲,范例匹配不是精确的,只能是部分匹配或近似匹配。因此,它要求有一个 相似度的评价标准。该标准定义得好,会使得检索出的范例十分有用,否则将会严熏影 响后面的过程。 类比映射 寻找目标范例同源范例之间的对应关系。 类比转换 转换源范例中同目标范例相关的信息,以便应用于目标范例的求解过程中。其中, 涉及到源范例求解方案的修改。 把检索到的源范例的解答复用于新问题或新范例中。它们分别是源范例与目标范例 问有何不同之处;源范例中的哪些部分可以用于目标范例。对于简单的分类问题,仅需 要把源范例分类结果直接用于目标范例。它无需考虑它们之间的差别,因为实际上范例 检索已经完成了这个工作。而对于问题求解之类的问题,则需要根据它们之间的不同对 复用的解进行调整。 从复用的信息内容来看,主要有两种类型:结果的复用和方法的复用。对于前者来 讲,当源范例的解答结果需要调整时,它依据一些转换操作知识,把源范例的种种可能 解转换为目标范例巾相应的解。方法的复用则关心源范例中的问题时如何求解的,而不 8 第2 章基于范例推理和时间序列预测问题概述 是其解答结果。源范例带有求解方法的信息,如操作算子的使用,子目标的考虑,成功 或失败搜索路径等,复用时需把这些方法重新例化。 解释过程的选择 对把转换过的源范例的求解方案应用到目标范例时所出现的失败做出解释,给出失 败的因果分析报告。有时,对成功也同样做出解释。基于解释的索引( b a r l e t1 9 8 8 ) 也 是一种重要方法。 范例修补 有些类似于类比转换,区别在于修补过程的输入是解和一个失败报告,而且也许还 包含一个解释,然后修改这个解以排除失败的因素。 进行结果评估,可以依据它在实际环境中运行后的反馈,也可以通过想教师询问完 成。等待反馈可能要花一段时间,比如病人治疗的结果好坏。谓词,可以考虑通过模拟 时问环境来实现。 修正错误一般设计错误探测和寻找原因。寻找原因是为了都错误进行解释分析,以 找m 原因对症下药,即修改造成错误的原因使其不再发生。当然,修改既可以使用领域 知识模型进行自修补,也可以由用户输入完成。 类比验证 验证目标范例和源范例进行类比的有效性 范例保存 新问题得到了解决,则形成了一个可能用于将来情形与之相似的问题。这时有必要 把它加入到范例库中。这是学习也是知识获取。此过程涉及选取哪些信息保留,以及如 何把新范例有机集成到范例库中。修改和精化源范例库,其中包括泛化和抽象等过程。 2 3 相似性关系 f 4 标范例弓源范例之间的相似性有语义相似、结构相似、目标相似和个体相似等等。 2 3 1 语义相似性 两范例之间是可以类比的,首先必须满足语义上具有相似性关系。相似性关系是类 比问题求解的基础。两实体的类比可以区分为正类比、反类比、不确定类比。两个实体 可类比的条件之一是:模型的本质性质与因果关系不构成反类比的一部分。在类比求解 巾目标范例的本质特征和源范例的本质特征必须具有相似性a 2 3 2 结构相似性 女f f 果在两个结构之间存在某种对应关系,且这种对应关系能够保持结构一致性,则 9 华南理工大学硕士学位论文 认为两结构也是同构的。结构一致性要求:一一对应的关系必须保证他们涉及的个体或 低阶关系也足一一对应的,且这种对应不应打破原来个体间的对应关系。w e i t z e n f e l d 早 就注意到同构对于类比推理有效性的重要意义。h o l y o a k 和t h a g a r d 等也注意到结构之 间的相似性和同构对于类比检索的不容忽视的作用。 结构对丁 类比检索的意义是重大的。表面上并不相似的范例由于在结构上具有相似 性,从而使得类比成为可能。子结构间的同构和相似性可以使我们只需见树木而不顾及 森林。在我们类比检索模型中,同构和结构相似性占有非常重要的地位,结构相似性可 以保证初步检索到町类比的源范例。根据同构条件,可以优先考虑那些与目标问题具有 l 刊构和局部同构关系的源范例或者部分源范例。 2 3 3 目标特征相似性 问题求解的最终目的是要实现问题本身所提出的目标。人们求解问题时,都是向着 这个目标而竭尽全力。h o l y o a k 对g e n m e r 的“结构映射理论”提出的批评之一便是: 它忽略了问题的目标特征( h o l y y o a1 9 8 5 ) ,很清楚,在相似的一组源范例中,那些对实 现目标范例的目标具有潜存的重要作用的源范例,较之那些不具有目标相关性的源范 例,更应该得到优先考虑。 2 3 4 个体相似性 在本文的模型中强调的另一重要约束是个体的类别信息。从不严格的意义上讲,如 果两个个体之间具有一些相似的属性,则它们是属于同一类别的。在概念聚类( s t e p p 1 9 8 6 ;马1 9 9 0 ) 中,本文使用概念( 或客体) 间的相关性来对概念( 或客体) 集进行 分类。相关性足指概念的属性之间相似度的平均值。有时,一个范例中的某些( 或某个) 个体町能对于问题的解决具有主导作用。在这种情况下,这些个体应该作为问题的显著 的检索信息来初步地检索源范例。p 】 2 4 相似性计算 目标范例与源范例之问的相似性有三种计算方法,即欧式距离、曼哈顿距离和无限 模距离,时间序列的距离也是这样定义的,本课题中,本文还提出了一种新的基于最大 拟合代价的距离。 欧式距离 d o2 荟( ”朋) 2 ) 1 2 1 0 ( 2 1 ) 一茎! 至量王至型塑翌塑堕塑堡型翌型塑墨堑垄 其中,n 是属性总数,a i h 是第i 个范例的第h 个属性的值,w h 是第h 个属性的权值。 此处每个属性值已规范化,即均值为0 ,标准偏差为1 。 曼哈顿距离 c o s t 和s a l z b e r g 提出用曼哈顿度量法。该方法用两点之间的连线长度作为两点之间 的距离。 d 口;w 。k 一 无限模距离 m a n g a s a r i a n 提出了另一种度量方法,成为无限模距离。 2 5 时间序歹u 基础 2 5 1 简介 d - m a 】【m 。1 一a j n ( 2 - 2 ) ( 2 - 3 ) 时间序列分析是统计数学的一个分支,它是动态数据提供定量预测的重要理论和方 法。时间序列分析理论可分为频域分析和时域分析两大类。前者涉及平稳序列及其相关 函数的谱理论和傅立叶变换的有关知谈,而后者则借助于前者的若干理论研究结果,更 多地通过对序列在时间域上的各种平均值地分析和研究,揭示动态数据所遵从的统计规 律性。 经济系统是一个随时问演变的复杂动态系统。经济变量通常表现为按时间顺序排 列,彼此之间呈现出相互影响、相互制约而又与它们历史状况密切关联、错综复杂的关 系。以统计方法测定发生于经济生活中的具体数量规律性,除熟知的计量经济学模型外, 现在也越来越多地使用时间序列分析方法和时间序列模型。不过它们之间有着一些重要 的区别:计量经济学必须依据一定的经济理论建立经济模型,其建模的目的是为了检验 经济理论,寻求经济规律进而为经济决策提供依据,而时间序列分析方法较多地则不去 区分引起经济现象演变发展的种种原因,而只是将经济变量的现在值看作它的过去值和 随机十扰的函数,并在一定的数学模型的假定之下,利用变量自身的历史资料,寻求观 测数据演变所遵从的动态规律性,以预测其未来。建立时间序列模型的目的主要是为了 预测。由于时间序列分析方法是处理动态数据的一种探索性方法,它不需要以任何经济 理论为根据,因此通常不将它归结在计量经济学范畴之内,但值得注意的是,对经济变 量动态特性和周期特性的研究,经济变量之间因果关系的测定和检验,联立方程建模等 许多方面新的理论发展,已经将时间序列分析方法和标准的计量经济学方法密切地联系 1 1 华南理工大学硕十学位论文 起来,成为计量经济学的一个重要组成部分了。 时间序列模型是一种基于序列的历史记录进行建模的方法,它也包括少数几个序列 联立模型或传递函数模型的方法,即用一个序列和它的过去值、现在值和其他少数相关 序列进行建模的方法。 2 5 2 时间序列的概念 如于时间序列分析所研究的对象是一串按时间顺序观测或记录下来的数据y ,y , y 3 y 。,同时,又因为存在众多的因素以不同方式和程度影响着观测变量的取值, 冈此,对每个固定的t ,y t 是一个随机变量。在概率论中,一族( 无限多个) 随机变量 的集合 y c ,t e t 为随机过程( s t o c h a s t i cp r o c e s s ) ,t 称为参数集,随机过程简记为y t , 当t 取值为f 1 ,2 ,3 ) 或 ,2 ,1 ,0 ,1 ,2 , 时,称y t 为时间序列。 刻划时间序列y t 的统计规律性,一般来说,对t 的任一有限子集f y 】,y 2 ,y 。, 属于t ,可以知道相应的随机变量( y 1 1 ,y t 2 ,y 1 ,y t 。) 的分布函数: r 。 ( y l , y 2 , - - y 。) 2 p 影, y ,e 2 y 2 ,一。 y 。 ( 2 。4 ) 从而,可以获知随机变量( y t l ,y 1 2 ,y 1 ,y 。) 的一些数量特征,如均值向量 ( e y t i ,e 1 ,e y l ,e y l 。) 和它的协方差矩阵: c o v ( y , 。,y c l ) c o v ( y , ,k ) c o v ( y , 。,v ) c o v ( y , :,k ) c o v ( y , :,e :) c o v ( y 。:,e 。) c o v ( y , 。,) c o v ( y , ,r :) c o y ( y , ,y f 。) ( 2 5 ) 其中cov(y,,r);q一必)暇一聪)】是随机变量k和e之问的协方差。, 当 乃,乃,瓦 取遍t 的一切有限子集时,分布函数的全体称为y t 的有限维分 布族。从统计规律上,可以把随机过程y ,和它的有限维分布族等同起来。可知要完整 地掌握一个随机过程的统计规律是十分困难的事情。在时间序列分析中,由于分布函数 簇的复杂性,人们更加注意使用时间序列的各种数值特征量的描述。比如即将引入的均 值函数,协方差函数,以及谱分布函数等,所谓的时间序列的统计分析,主要是对这些 特征量的统计分析。在大多数实际问题中本文只需要掌握y t 的某些数量特征,即可描 述它的主要特征,满足应用的需要,均值函数 r a t = e y ft1)(2-6) 当t 取遍t 时,就可得到t 上的函数,即为h 上的均值函数; 自协方差函数 第2 章基于范例推理和时间序列预测问题概述 c o v ( y t ,y s ) = e ( y t - e y t ) ( y s - e y s ) t ,s t( 2 - 7 ) 定义为时间序列昂在刁i 同的时刻t ,s 相应的随机变量的随机变量e ,k 之间的变 异和相关关系,记为y 。 自相关函数( 也称作规范化的自协方差函数) 它刻划了时间序列h 在不同时刻t 切程度,自相关系数取值在一1 与1 之问 的自相关度越高。 n ,= 1 等三f ,s 7 - ( 2 8 ) q y ”q ys , s 相应的随机变量k ,e 之间的线性相关的密 即- 1 9 r ,矗1 ,b ,。l 与1 越接近,说明时间序列 在本文后面的实验中,将利用自相关函数( a u t o c o r r e l a t i o n f u n c t i o n ,a c f ) 和偏 自相关函数( p a r t i a l a u t o c o r r e l a t i o nf u n c t i o n ,p a c f ) 进行a r m a 预测阶数的判定, 以及通过对预测值与实际值残差的a c f ,p a c f 图谱的随机性来确认残差为白噪声。另 外,互相关函数( c r o s sc o r r e l a t i o nf u n c t i o n ) 也可以应用在两个序列的相似性判定卜。 平稳随机过程是随机过程的一种特殊的形式,其统计规律性不会随着时间的推移而 发生变化。如果b 的任意有限维分布具有如下的性质: f t ”们( y 1 ,y 2 ,y n ) = f t n _ m ,t n + n ( y 1 ,y 2 ,y n ) ( 2 9 ) 则称随机过程蜥是严平稳的,但在一般应用上,由于时间序列的分布函数较为复 杂,并难于得到,因此一般只考虑随机过程在一阶,二阶的矩函数,因此上述的分布函 数的不随时间改变转换称随机过程在一阶、二阶的矩函数的说法,那么此时的随机过程 称之为宽平稳过程,它有两个性质: ( 1 ) 对任意的f t ,均有e 的均值= m ,m 为常数; ( 2 ) 对任意的t ,s t ,其自协方差r 。= y t - s ,即仅仅与沁有关。 在本文后续的章节的讨论中,时间序列都是假定已经经过转换的平稳的时问序列。 另外一方面,由于对经济的时间序列来说,在某一时刻的观察值仅仅有一个,因此 对于 :述的均值函数毋和自协方差函数r 。等时间序列的数量特征是无法求出来的。 在这里,有必要提及一下遍历性的定义。遍历性是指对任意的函数g ,g ( y 。) 的总体 平均等于时域的平均。公式如下: 。l i m t - - 甘警g ( y t + 沪 ) ( 2 - l o ) 从公式上可看出,式子的右端是g ( y t ) 在各个时间上的平均,即时域平均,而右 式是依g ( y 。) 的分布所求的平均,即为总体平均。这样,当n 足够大时,将有: 一兰重鍪三盔兰堡主兰壁垒奎 样本均值 萝2 万1 善n 一,有坼m 一歹 样本协方差 c s 。专著n - s 哆。一而一两 ( 。一,2 ) 则,喁,e + 。= y s “g ,样本相关系数p = i c s ,它是总体自相关函数的近似。 2 6 传统分析方法 2 6 1 移动平均法( m o v i n g a v e r a g e ) 移动平均法( m o v i n g a v e r a g e ) 是1 8 8 4 年英国波因廷教授在皇家统计学会杂志 提出来的序列分析方法,1 9 2 4 年英国统计学家鲍莱肯定了这一方法,4 0 年代,丁尼尔 进一步发展了移动平均法。 设时间序列为x 1 ,x 2 ,移动平均法可以表示为: 一 1 = 万1 。黔t ( 2 - 13 ) 式中,置最新观察值;靴,欲预测的下一期的值。经整理,移动平均计算公式 还可以简化为: = 等+ 互( 2 - i 4 ) 移动平均法主要用来预测长期趋势,可以用 2 与产+ 互 ,或者通过对序列进行移动平均,得到较平 滑的序列,使得可能采用些低阶的模型,如多项式等等进行拟合,然后再根据这些低 阶模型去预测。 同时,依据柏森斯教授的残余法,利用移动平均法得到的序列去减原序列,可以达 到消除长期趋势获得平稳的时间序列,这一点在本文的实验过程中利用a c f 和p a c f 图进行检验,得到了证实,其效果与差分基本相同。本文在第3 章中介绍的时序范例层 次型框架中的前期实验中应用到了这个结果,时序范例库的每一抽象层都是通过上一层 1 4 第2 章基于范例推理和时间序列预测问题概述 序列减去该层移动平均并得到的,当然差分也可以满足需要。 长期趋势的预测,除了移动平均,德国的高斯提出了最小二乘法,本来是用于观察 运动误差的角度创用这一方法,后来被用于计算时间序列的长期趋势值,在现代最j , - - 乘法应用非常广泛。1 8 2 0 年英国保险学家冈柏茨在略论估计寿命的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度浙江省二级注册建筑师之法律法规经济与施工通关题库(附带答案)
- 节前施工现场安全培训
- 低压线路运维培训
- 中考物理核心考点考前冲刺 惯性的理解与应用(含解析)
- 造瘘空肠管护理
- 康复医学护理专业介绍
- 幼儿园小班生活穿鞋子教案
- 幼儿园小班教案《找朋友》5篇
- 电商java必问面试题及答案
- 听力迟钝测试题及答案
- RFJ05-2009-DQ人民防空工程电气大样图集
- Unit 2 Neither Pine nor Apple in Pineapple-高中英语外研版(2019)必修第一册
- 高危作业培训试卷及答案
- 有机基板课件
- 曹杨二中自招数学试卷(答案)
- 肝内胆管结石()
- 项目工程EHS管理
- 产品合格证模板-合格证模板样本
- 免疫学(全套课件)
- 热力工程竣工资料模板(含换热站)全
- 桥梁养护与加固教案
评论
0/150
提交评论