(计算机应用技术专业论文)商空间粒度计算理论在时间序列预测中的应用.pdf_第1页
(计算机应用技术专业论文)商空间粒度计算理论在时间序列预测中的应用.pdf_第2页
(计算机应用技术专业论文)商空间粒度计算理论在时间序列预测中的应用.pdf_第3页
(计算机应用技术专业论文)商空间粒度计算理论在时间序列预测中的应用.pdf_第4页
(计算机应用技术专业论文)商空间粒度计算理论在时间序列预测中的应用.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(计算机应用技术专业论文)商空间粒度计算理论在时间序列预测中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

安教大学2 0 0 7 届硕士学位论文 摘要 预测对决策具有重大指导意义。时间序列预测是一种根据历史数据构 造时间序列模型来预测未来的一种方法。是多学科交叉的研究领域。现实 世界多是非线性、不确定、开放性的复杂系统,传统的统计学方法或者静 态模型下的时间序列预测很难满足要求。在时间序列预测的众多模型中 神经网络因为其良好的自学习与自适应能力而比一般模型更容易从复杂 模式中抽象出有用的信息。但传统的神经网络方法存在收敛速度慢、网络 结构不易确定等弱点。因此有必要在时间序列预测中引入新的方法和思 想。 本文针对复杂时间序列,在商空间拓扑结构下变换序列的构成方式, 从不同层次、不同角度分析时间序列,把定性思维和定量分析有机的结合 和统一起来。能够改变信息的不完备性、降低问题复杂性;在此模型基础 上,引入构造性学习方法,是一个很有价值的课题。 本文的主要研究内容和创新点为: 1 、分析了时闻序列中粒度的选取。通过分层与合成技术选取大小不 同的粒度,更全面获取信息,降低问题复杂度,提高效率。 2 、在商拓扑结构下,进一步讨论时间序列的构成和预测。 从时间间隔的角度看,不同大小粒度本质上就是时间同隔的不同。不 同层次的粒度选取对应着不同的时间间隔序列分析。在商空间模型下,综 合利用多个相关序列提供的信息对其中一个序列进行预测,从不同层次的 信息粒度综合利用多个相关序列提供的信息对其中一个序列进行预测。如 冬小麦产量预测中序列4 中混合粒度就是采用变化的时间间隔选取的。实 验结果也显示了这种混合粒度的方法更有效。 从数据是否重叠的角度去看,在商拓扑结构下还可以采用数据重叠交叉的方 式构建序列,因为时间序列的信息常常具有非线性、不完备性等特征。在商拓扑 结构下,数据重叠的序列构成方式,将具有一定相关性的多个时间序列作为一个 整体进行研究,即进行多变量时间序列分析,这将有利于更好地了解各时间序列 安徽大学2 0 0 7 届硕士学位论文 的特性,最大限度的改变了信息不完备程度,挖掘出序列的内在信息。大气质量 预测实验中4 日数据重叠的序列2 和9 日数据重叠的序列3 也显示了其预测效果 比直接的、数据不重叠的序列构成方式要好。 3 、将构造性学习方法覆盖算法引入时间序列预测中,具有结构简单、 构造性好、可读性强、预测速度快、准确性高的特点。冬小麦产量预测的 实验结果很好的说明了基于覆盖算法的时间序列方法的实用、灵活、稳定、 精确。核覆盖算法融合了$ v m 中的核函数法与构造性学习的覆盖算法中 的优点。煤价预测实验结果也显示了基于核覆盖算法的时间序列预测具有 计算量小、精度高等优点。 本文将商空间理论应用于时间序列研究还仅仅是一个初步的尝试和 探讨,相信随着计算智能研究的深入,将会有更多的更有效的方法应用到 时间序列分析和预测中来,为推动经济和社会的发展做出贡献。 关键词:时间序列、粒度、商拓扑、覆盖算法、核函数 安徽大学2 0 0 7 届硕士学位论文a b a r 扯t a b s t ra c t f o r e c a s t i n gi sag u i d a n c et od e c i s i o n - m a k i n gt i m es e r i e sf o r e c a s t i n gi s am e t h o do ff o r e c a s t i n gt h ef u t u r eb a s e du p o nh i s t o r i c a ld a t aa n di t s r e s e a r c h i n gs c o p ei n v o l v e sm u l t i p l es u b j e c t s b u tt h et i m es e r i e sf o r e c a s t i n g b a s e do nt h et r a d i t i o n a ls t a t i s t i c sm e t h o d sc a l l t s a t i s f yt h ed e m a n d so f n o n l i n e a ra n du n c e r t a i nm u l t i v a r i a b l es y s t e mi nc o m p l e xr e a l i t yu s u a l l y i n t h ep r o c e s so ft i m es e r i e sf o r e c a s t i n g ,a r t i f i c i a ln e u r a ln e t w o r k sc a l lr e f i n e v a l u a b l ei n f o r m a t i o nf r o mc o m p l e xp a t t e r n se a s i l yf o ri t s s e l f - l e a r n i n ga n d s e l f - a d a p t i v ea b i l i t y t r a d i t i o n a ln e u r a ln e t w o r kc a l ln o t s a t i s f y t h e r e q u i r e m e n tb e c a u s eo fi t sl o ws p e e do fp r o c e s s i n g ,t h ed i f f i c u l t yi nd e f i n i n g t h es t r u c t u r ea n de s t i m a t i n gt h ep a r a m e t e r s s oi ti s v e r yn e c e s s a r yt o i n t r o d u c en e wi d e a sa n dm e t h o d si n t ot i m es e r i e sf o r e c a s t i n g i nt h i sd i s s e r t a t i o n ,d i f f e r e n tt i m es e r i e sh a v eb e e nd i s c u s s e d0 1 1t h eb a s i s o fq u o t i e n tt o p o l o g y b yt h i sm e a n s ,c o m p l i c a t e dp r o b l e mc a nb cs o l v e db y a n a l y z i n g t h ec o m p l e xt i m es e r i e sw i t hd i f f e r e n tg r a i n s i z e a l s o ,i ti s v a l u a b l et oi n t r o d u c et h ec o n s t r u c t i v el e a r n i n gm e t h o d st ot h i sm o d e l t h ea u t h o r sw o r ki sc o n c e n t r a t e do nt h ef o l l o w i n ga r e a s : 1 g r a n u l a r i t ys e l e c t i n gf r o mt i m es e r i e sh a sb e e nd i s c u s s e d d i f f e r e n t g r a n u l a r i t yc a nb co b t a i n e db yg r a n u l a t i n ga n ds y n t h e s i z i n gu n d e rt h et h e o r i e s o fg r a n u l a r i t ym o d e las u i t a b l eg r a n u l a r i t yc a nb cs e l e c t e da c c o r d i n gt ot h e n a t u r eo ft h ep r o b l e mt op r o v i d ec o r r e s p o n d i n gk n o w l e d g eb yt h i sa p p r o a c h , ah i g h e rs u c c e s sr a t i oa n dal o w e rc o m p u t a t i o n a lc o s tc a nb eo b t a i n e d 2 f u r t h e rd i s c u s s i o na b o u tc o n s t i t u t i n ga n df o r e c a s t i n go ft i m es e r i e s h a v eb e e ng i v e no nt h eb a s i so fq u o t i e n tt o p o l o g y i nc o n s i d e r a t i o no f t i m ei n t e r v a l ,d i f f e r e n t s i z eg r a n u l e s s e l e c t i n g c o r e s p o n d sw i t hd i f f e r e n tt i m ei n t e r v a la n a l y z i n gi nt i m es e r i e s i nq u o t i e n t s p a c em o d e l ,r e l a t i v es e r i e sa r ec o m b i n e ds y n t h e t i c a l l yf o rt h ep r o b l e mo f m 安徽大学2 0 0 7 届硕士学位论文 a b s t r a a t i m e - s e r i e sf o r e c a s t i n gs i n c ei tt a k ef u l l a d v a n t a g eo fg r a n u l a ri n f o r m a t i o n f r o md i f f e r e n tl a y e r sb a s e do nr e l a t i v i t yo fi n f o r m a t i o n i nc o n s i d e r a t i o no fd a t ao v e r l a p p i n g ,t i m es e r i e sc a l lb ec o n s t i t u t e db y o v e r l a p p i n gs i n c et h ei n f o r m a t i o ni ni th a st h ec h a r a c t e r i s t i co fn o n l i n e a r i v y a n di m p e r f e c t i o ni no r d e rt or e d u c et h ei m p a c to ft h ei n c o m p l e t ei n f o r m a t i o n a n do b t a i nm o r ea c c u r a t ei n f o r m a t i o na n dr u l e s ,t h et i m es e r i e sh a v eb e e n o v e r l a p p e do nt h eb a s i so fq u o t i e n tt o p o l o g yb yr e s e a r c h i n gt h e s et i m e - s e r i e s w h i c ha r ei n t e r d e p e n d e n c ya sa ni n t e g r a t i o nn a m e l ym u l t i v a r i a b l et i m e s e r i e s a n a l y s i s ,t h ep r o p e r t i e so ft h e s et i m e - s e r i e sw i l lb er e a l i z e db e t t e rt h e e x p e r i m e n tr e s u l t so ff o u r - d a y o v e r l a p p e ds e r i e s2a n dn i n e d a y - o v e r l a p p e d s e r i e s3i na t m o s p h e r eq u a l i t yf o r e c a s t i n gb o t hs h o wt h a ti ti sar e a s o n a b l ea n d e f f e c t i v em e t h o d 3 、i ti sm o r ep r e c i s ea n dr e a d a b l ew i t hi t ss i m p l ea n dc l e a rn e t w o r k s t r u c t u r ea n dh i g ht e s t i n gs p e e db yi n t r o d u c i n gt h ec o n s t r u c t i v ec o v e r i n g a l g o r i t h mi n t ot i m es e r i e sf o r e c a s t i n g t h ee x p e r i m e n t a l r e s u l t si n y i e l d f o r e c a s t i n g o fw i n t e rw h e a ts h o w st h a tt h em e t h o db a s e do nc o v e r i n g a l g o r i t h mi sm o r ep r a c t i c a l ,f l e x i b l ea n ds t e a d y k e r n e lc o v e r i n ga l g o r i t h mn o t o n l yo v e r c o m e sl i m i t a t i o no ft r a d i t i o n a la p p r o a c ht op r e d i c t i o nb u ta l s o o v e r c o m e st h ew e a k n e s so fb o t hs v ma n dc o n s t r u c t i v em a c h i n el e a r n i n g m e t h o dw i t hc h a r a c t e r i s t i co fl o wc o m p u t i n ga n d h i g ha c c u r a c y ,t h e e x p e r i m e n t a l r e s u l t sa l s op r o v ei ti sm o r ee f f e c t i v ei nc o a l p r i c es e r i e s f o r e c a s t i n g i t so n l yap r i m a r yd i s c u s s i o na n da t t e m p tt oa p p l yq u o t i e n ts p a c et h e o r y t ot h er e s e a r c ho ft i m es e r i e s f o r e c a s t i n g w i t ht h ed e e p l yr e s e a r c h i n c o m p u t a t i o n a li n t e l l i g e n c ef i e l d ,m o r em e t h o d sw i l lb ea p p l i e dt ot i m i n gs e r i e s a n a l y s ea n dp r e d i c t i o n i tc a r lm a k ec o n t r i b u t i o nt ot h ed e v e l o p m e n to ft h e e c o n o m ya n dt h es o c i e t y k e y w o r d s t i m es e r i e s ;g r a n u l a r i v y ;q u o t i e n tt o p o l o g y ;c o v e r i n g a l g o r i t h m ;k e r n e lf u n c t i o n i v 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得安徽大学或其他教育机 构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任何贡献 均已在论文中作了明确的说明并表示谢意 学位论文作者签名 肌1 1 、望 签字日期:2 0 0 7 年4 月2 2 日 学位论文版权使用授权书 本掌位论文作者羌全了解安徽大学有关保留。使用学位论文的规定,有 权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借 阅本人授权安徽大学可以将学位论文的全部或都分内容缓入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:肛1 3 、关 签字日期:2 0 0 7 年4 月2 2 日 学位论文作者毕业去向: 工作单位: 通讯地琏: 导师签名: u 1 , 签字日期:2 0 0 7 年4 月23 日 电话: 邮编: 第一章概述 第一章概述 1 1 课题的研究背景和意义 “凡事预则立,不预则废”“人无远虑,必有近忧”,这些名言都表明 了预测的重要性。决策是人的一项最基本的思维和实践活动,人们总是要 对一些行动方案的可行性和优劣作出一个判断。无论是个人生活、还是国 家建设发展,都要进行决策,而任何成功的决策都离不开科学的判断和预 测。预测对最终决策方案的正确与否、优劣与否都起着重要的作用。 预测是通过对事件本身及其所处的环境作深入分析和研究,去寻找事 件的发展和变化的内部规律,利用内部规律定性或是定量的分析问题,然 后科学预测事件的未来发展。现实世界是很复杂的,预测也是随着人的认 识之深化以及预测方法的不断改进,从而提高预测准确度。 1 2 预测学概述 预测就是人们根据过去和现在的数据资科对未来作出各种假设、猜 溯、设想,推断和探索人们所关心的事物今后可能的发展趋势,以指导未 来的行动简单的说,预测就是根据过去和现在估计未来,根据己知推测 未知。 预测的内容称为预测对象,例如:气温、价格和作物产量等都是预测 对象。预测的原理中主要一点可以说是寻找预测规律。预测原理如图l 所 示。【1 l 图1 预测原理图 f i g u r e1 c h a r to ff o r e c a s t i n gp r i n c i p i u m 商空间粒度计算理论在时间卑列预蔫中的应用 现在预测学已经发展成为一门综合性很强的学科,在现代社会生活中 发挥了越来越大的作用。1 9 3 7 年美国自然资源委员会提出技术趋向国家 政策的报告,揭开了现代预测应用的全新一页。1 9 4 5 年美国利用投入产 出方法对钢铁需求给出定量描述被后来的发展所证实。这引起人们的极大 震动,更使得人们对预测科学刮目相看。1 9 6 4 年贝朗特朱线纳尔预测 艺术一书出版,开创了严格预测的研究。1 2 】 之后,预测的理论和方法被不断丰富。随着计算机技术的不断发展 预测程序得到不断的改进和更新,预测精度不断提高,许多人工办法很难 实现的方法也得到推广和应用。 l - 3 时间序列预测及其研究现状 1 3 1 时间序列 时间序列包括的范围很广,在国民经济及企业范围内的人口、工农业 总产值、国民收入、基建投资、生产量、销售量、成本、利润等均可编制 时间序列。它的时间单位可以是时、日、周、旬、月、季、年等。 从数学意义上讲,如果我们对某一过程中的某一个变量或一组变量 x ( t ) 进行观察测量,在一系列时刻h ,t 2 ,t i ( t 为自变量,且 t 2 1 0 1 2 积温4 6 0 0 - - - 5 3 0 0 :太阳年辐射总量1 0 5 1 3 0 千卡厘米2 ;无霜期2 0 0 - - - 2 5 0 天;年降水量7 7 0 1 7 0 0 毫米,南多北少。从气候角度看,全省气候条件优越, 农业气候资源丰富,光、温水同步,适宜各种粮食作物和经济作物的种植和生长。 但由于处于中纬度地带,天气形势多变,且地形地势多样,冷暖气团活动频繁, 常有暴雨、大风、冰雹等灾害性天气出现。经常造成不同程度的干旱和洪涝灾害, 给国民经济和人民生活带来一定影响。 安徽省是农业大省,因此数据资料的选取也是以安徽省主要农作物冬小麦在 生长过程中的历史数据为重点,分析作物产量与天气条件关系,尤其是不同发育 阶段对光、温、水分及其它环境气象要素的要求,据此进行作物产量预测研究。 本课题数据均来源于安徽省气象所。 3 3 2 数据说明 根据冬小麦的生长时期和生长特点,气象数据选取该年1 0 月份至下 一年的6 月份,共9 个月的数据。在农业生产中,影响生长的因素很多影 响产量的气象因素很多,这里我们根据气象学原理选取最主要的因素,也 是气候特征描述的主要因子,即日照、温度、降水量。原始序列按照天的 时间顺序排成一个序列,数据是按天记录是按照天来的,即一天内的记录, 其中温度选的是一天内的平均气温。日照和降水量是一天中的总量。然后 按照天的时间排成一个序列。冬小麦的产量是从安徽省各个气象站采集回 来的小麦单产值,按年排列。 2 0 第三章时间序列中粒度的选择与分析 3 3 3 产量序列中商空间模型分析 从气候角度看,气候条件的变化始终是不会朝着一个方向发展白勺,无 论生产力水平怎样提高,也避免不了受气候波动的各种影响农业始终是 要受到气候条件的制约。 3 a l 所以主要选取气象因子中最主要的光照、温度、 降水量作为产量序列的特征属性。产量序列的决策属性产量值,本文中以 类别来标志,具体分类在后面进行说明。 产量序列的商空间模型中,论域x 由气象信息数据按照时间序列构成 的集合。论域的属性f 主要是描述上面提到的气象因子的属性。如( x ) 描 述平均气温,丘( x ) 描述降水量,f a x ) 描述光照,f a x ) 描述类别。这样 f = ( ,) 。结构t 是表示这些产量序列中各个属性元素之间内在 关系,当论域和属性函数确定之后,结构t 也就随之确定了。 3 3 4 产量时间序列中粒度划分与选择 人类菩于根据不同的研究目的,选择合适的粒度和它的划分办法。这 种能力来自人们的实践经验,来自在实践中不断地总结与学习。因此,划 分构成不同粒度世界的方法,可依据结果y 对x = f - i ( y ) 进行分类,也可 以直接对x 进行分类。划分方法主要有属性划分法、投影划分法、结构划 分法、约束划分法、拓扑划分法。i ”j 产量序列分析主要是提取产量序列变化特征通常根据不同的目的。 从不同的层次上和不同的角度上去挖掘出时间序列中的信息。通常不同的 特征的提取有不同的要求,分析时侧重点不同,提取方法也不一样。有些 时候需要细致深入的分析,有些时候需要概括性的分析。例如对四季的分 类,就是根据季节的特点来进行划分的,是相对来说比较概括性的划分。 商空间理论从租细不同的粒度进行全面综合的分析,需要概括总体分 析时,选粗粒度,当概括分析不能解决问题需要进行精确细致分析时,选 细粒度。在实际应用中,如果被选的粒度是有效地,则认为这种等价划分 是合理的。反之再重新进行粒度的划分,直到选取到合适的粒度为止。 2 商空问粒度计算理论在时同序列预测中的应用 针对产量序列特点,对降水量、日照、温度这些主要气候因子进行分 析,按照商空间理论中所讲的对论域x 进行颗粒化三种方法中的对属性f 取不同的粒度方法进行颗粒化,通过属性的粒度对论域进行划分。 按照时间属性进行划分,分别用日、周、旬、月四种不同的时间属性 函数对论域划分,可得出四种不同的商空间,记为( 【x , f l ,i t ) 、 ( 【x 】:, f 】:,盯】:) 、( 【x l ,【f 】3 ,i t ,) 、( 【x l ,【f h ,i t 】。) 。新的商空间空间里各个 成分构成了新的关系,而且不同的商空间之闻也有着一定的关系。 当然,还可以按照其他的方法进行划分。下面介绍基于商空间理论分 层与合成技术的时间序列的粒度选择与构成。 3 4 基于分层与合成技术的时间序列粒度分析 分析时间序列信息时,传统的方法单一、片面。没有考虑到粒度粗细 的变化。商空间粒度计算理论主要采用粒度的分层、合成、推理技术来实 现不同粒度空间转换,粒度空间转换不仅包括粒度由细到粗的变化,而且 可实现粒度由粗到细的转换。如在产量序列中,综合利用分层和合成对时 间序列来进行粒度的选取,多侧面、多角度的考察气象信息特征,从总体 和局部更好的把握问题,降低计算复杂度。 下面应用商空间粒度计算理论分析产量序列,探讨时间序列中的粒度 选取。这也是解决其他复杂问题的重要方法。 3 4 1 基于粒度分层技术的时间序列分析方法 产量序列从时间上去看,可咀先从一年的粗粒度开始考察,例如考察 这一年里重大灾害情况,如旱灾、涝灾等。然后再细化到到一个季度,或 者月、旬、周、天等。层层深入,更加具体。层次结构如图3 所示。 第三章时间序列中粒度的选择与分析 图3 粒度的层次结构图 f i g u r e3 c h a r to f h i e r a r c h i c a ls t r u c t u r eo f g r a n u l a r i t y 对应到商空间理论。就是先要采用分层方法对序列进行粗分割,然后 再向更高层次分析,即粒度由细到粗,再细化。例如产量序列中气象信息 进行粗分割后,可以得到某个时间段内气候重要特征,如这个阶段是多雨 水还是多光照,是偏早还是偏涝,总体的气温是偏高还是偏低这样获得 一个概况后,再进行深入的研究。利用商空间理论的保假原理,可以知道 在一个比较粗的粒度上进行求解时如果没有解,则在更细的粒度下肯定没 有解。如产量序列的周粒度、旬粒度上无解,则在天粒度上一定无解,这 时就必须进一步分析月粒度、甚至年粒度等,通过不同层次的粒度分析, 找到适合的解。利用保假原理,可以在时间序列分析中能够选择一个最佳 的粒度。更好的解决问题。这种分层方法能更全面把握问题降低复杂度。 3 4 2 基于粒度合成技术的时间序列分析方法 合成技术可以引入到时间序列分析中来,如产量序列中,可以将天控 度、旬粒度、周粒度等比较细的粒度通过合成技术变成月粒度等比较粗的 粒度由商空间的保真原理可以推断,在细粒度如天粒度、旬粒度、周粒 度上有解。在其合成的粒度月粒度上也一定有解,这也就保证了商空间方 法对时间序列分析的可行性。保真原理就是对这种“综合”的抽象和概括。 2 3 商空间粒度计算理论在时间序列预测中的应用 这也充分说明了在商空间粒度模型中引入结构的重要性。合成技术对不同 层次、不同侧面的信息特征进行合成,充分挖掘隐藏在时间序列中的本质 特征信息,降低了求解复杂性,更符合人类的思维习惯。 设x l 。x 2 的规模分别为n ,m ,则x 3 的规模最多可达n m ,原先要在 x 3 上进行求解,如果化成在x l ,x 2 上分别进行求解,这样就将规模( n m ) 化成规模( n + m ) 。即将复杂性从“相乘”降为“相加”,这也是商空间方 法可以降低计算量的另一原因。 3 4 3 综合利用分层与合成技术的时间序列分析方法 在冬小麦产量序列分析中综合利用了分层与合成技术,该方法主要过程为: l 、在产量序列信息不同层次下提取特征,形成不同层次的粒度空间。 2 、再对同一层次下的每个粒度空间进行划分。然后同层次的分割结果进行 合成,形成新的粒度空间。 3 、再结合具体情况将不同层次的中间粒度进行合成,形成所需要的粒度空 间。 商空间粒度合成包括论域的合成、属性函数的合成和拓扑结构的合成三个环 节,针对冬小麦产量序列来说,论域中各个要素间结构与属性函数都是密切相关 的,论域和属性函数合成后,新的论域间的结构、属性关系就唯一地被确定,因 此,这里我们仅讨论了论域和属性函数的合成运算。 综合利用分层与合成技术实现对时间序列信息的分析,充分体现了商空间粒 度计算理论的思想方法。采用分层递阶技术的主要目的是降低计算复杂性,使原 来难以处理的复杂问题化简。合成主要是对事物简化、概括、抽象的反过程,即 对事物不断深入、全面及系统化的了解过程。这两个方面很好的结合起来就能够 更好的把握问题。 商空间理论是源于人工智能的一种很有价值的解决问题思维方法也 是一个全新的领域目前关于该理论在实际应用中的研究很少,有待更多 学者的进一步关注。【3 9 】 第三章时问序列中粒度的选择与分析 3 5 本章小结 本章介绍了商空间理论的基本内容和原理,结合冬小麦产量序列,运用商 空间粒度计算理论分层和合成技术分析了时间序列中粒度的选取,通过不同粒度 变换,全面考察和分析问题,简化复杂问题。 下一章将在商空间理论下,对冬小麦产量的时间序列分析基础上,引入构 造性覆盖算法,应用于冬小麦产量预测中。 商空间粒度计算理论在时间序列预测中的应用 第四章基于覆盖算法的时间序列预测 第二章、第三章介绍了本文的理论基础及模型,探讨了时间序歹0 中的 粒度选择与分析,这一章主要介绍基于覆盖算法的时间序列预测具体应 用。 本章首先应用构造性学习的交叉覆盖算法对安徽省冬小麦的产量序 列进行了预测。接着将改进的核覆盖算法应用于煤价时间序列的预铡中。 分析了实验结果。最后是本章小结。 4 1 基于覆盖算法的作物产量序列预测 4 1 1 产量序列预处理 产量序列由特征属性和决策属性两个部分构成,具体的数据说明请参 阅第二章的介绍。先对序列进行预处理。 4 1 1 1 产量特征属性序列预处理 产量特征属性中的各个元素的基本度量单位不统一,先要对产量特征 属性序列归一化,归一化主要目的是归纳统一样本的统计分布性。归一化 的方法很多,本文中采用最大最小值法对数据序列归一化。 最大最小值法处理方法:x ,= ( ) ( i x 。) “x 。一x 。) 其中为x ;网络的标准化输入数据,x j 为原始观测数据,x 。、x 一分 别为各样本数据中的最大和最小值。 4 1 1 2 产量决策属性序列预处理 冬小麦单产值均是呈上升趋势的,主要原因是:气象所给出的单产数 据是实测数据,这些实测数据除了气象因素的影响,还有生产力增长等其 第四章基于覆盖算法的时间序列预测 它因素的影响,这给气象产量考察带来一定难度。需要对实际产量数据进 行预处理。 考虑到除了天气原因外,最主要的影响因素就是生产力科学技术提高 带来的。在分析时,对产量序列决策属性的产量实际值先用灰色理论的 g m ( i ,1 ) 模型方法处理,将实际产量( y ) 分解为趋势产量项( x ) 和由气 象条件变化引起的气象产量项( y - ) :即 y = y + x( 公式4 - 1 ) 按照时间顺序将产量序列作为g m ( i ,1 ) 模型的初始输入序列,通过g m ( 1 ,1 ) 模型运算后到的值作为趋势产量值。 4 1 2 产量特征属性序列分析 根据冬小麦生长情况,气象数据选取该年1 0 月份至下一年的6 月份, 共9 个月的数据。在农业生产中,影响生长的因素很多,这里我们根据气 象学原理选取最主要的因素,也是气候特征描述的主要因子,即日照、温 度、降水量。原始数据记录是按照天收集的,即记录的是一天内的变化情 况,日照和降水量记录的是一天内的总量、温度记录的是一天内的平均气 温。 为了能恰当地反映时序性质的影响,每一个训练样本中的输入数据x 都是一个由若干个顺序采样的多变量数据x ( t ) ,x i ( t 一1 ) ,x i ( t j ) 按一定的关系及预测目标组成的子集,其中时间t 的单位是时段,x ( t ) 是 该时段内的一组相关变量,在产量序列预测中的日照、温度、降水量三个 相关量。这样下一个输入数据子集x i 1 将是x i 1 ( t ) ,x i i ( t - i ) ,x i i ( t j ) 等。所有x ,( t ) 集合为: x k t ) = x l l ,x 1 2 ,x i3 ) x 2 ( t ) = x 2 l ,x 2 2 ,x 2 3 ) x 。( t ) = ( x n l ,x n 2 ,x 们) 商空问粒度计算理论在时间序列预测中的应用 对于每一个向量有一个决策属性,对应着其预测值。即对作物产量的 决策属性j + l 时刻的情况进行预测。这种序列构成,具有一定相关性的多 个时间序列作为一个整体进行研究,即进行多变量时间序列分析,这将有 利于更好地了解各时间序列的特性。下面我们来介绍产量决策属性序列。 4 1 3 产量决策属性序列分析 由于构造性学习是有导师的学习。还要给出样本类别信息。根据前面 的方法对实际产量预处理后,得到趋势产量。比较趋势产量和实际产量的 值,若实际产量的值大于趋势产量的值,则类别值记为1 ,否则记为2 。 作为一种尝试,这里简单的分为两类,也可以给出更多更细的分类。 这样预处理后,时间序列就是由气象信息和产量类别信息共同来描 述,其中气象信息主要是选取该地区的光照、降水量、温度三个属性,作 为其特征属性,产量类别属性作为决策属性。 4 2 实验 4 2 1 实验样本介绍 实验样本选取1 9 7 1 年至2 0 0 0 年的共3 0 年的数据,气象所给出的原 数据是按天的,考虑到按天的时间过于精确,进行了按旬的平均处理,即 把样本的某个属性数据1 0 天的取平均后,整成该样本的一个属性。所有 的属性数据按年整理成一个记录,这样每个记录向量的维数为:9 3 3 = 8 1 。这样就能够得到3 0 个样本记录,其中特征属性8 1 个,决策属性1 个。 其中前2 9 年作为学习样本,最后一年作为测试样本,测试2 0 0 0 年的值。 然后看看测试样本的覆盖归哪一类,并且给出最近的覆盖及其相似的样 本,然后对照该样本中的趋势产量值与实际产量值的差,与所测试样本的 趋势产量值相比较后,即可得到需要测试样本的产量预测值。 第四章基于覆盖算法的时间序列预涮 4 2 2 实验图 实验图如图4 所示: 图4 基于覆盖算法的产量序列预测实验图 f i g u r e4 c h a r to f y i e l ds e r i e sf o r e c a s t i n ge x p e r i m e n tb a s e do n 4 2 3 实验结果 实验结果如表1 所示: c o v e r i n ga l g o r i t h m 商空间粒度计算理论在时间序列预蔫中的应用 表1 基于覆盖算法的产量序列预测实验结果 t a b l e1 e x p e r i m e n t a lr e s u l t so f y i e l ds e r i e sf o r e c a s t i n gb a s e do i l c o v e r i n ga l g o r i t h m 地区实际产量g m 预测值本文预测值误差( ) 安庆 2 4 3 818 2 02 4 6 611 4 绩溪 1 4 2 42 3 0 31 4 9 348 5 蚌埠2 7 3 93 3 3 52 6 8 818 6 图5 不同方法的产量序列预测实验结果对照图 f i g u r e5 t h ec o m p a r a t i v ec h a r to f e x p e r i m e n t a lr e s u l t sb a s e do n d i f f e r e n tm e t h o dsi ny i e l ds e r i e sf o r e c a s t i n g 实验中灰色理论g m ( 1 ,1 ) 模型的预测值是根据1 9 7 1 1 9 9 8 年的值,预 测出1 9 9 9 年的产量,再用1 9 7 2 1 9 9 9 年的值,用g m ( 1 ,1 ) 模型预测2 0 0 0 年的值。 4 2 4 实验结果分析 1 、g m ( 1 ,1 ) 模型对产量时间序列数据进行处理,继承了灰色方法的优 点,最大程度排除了气候因素之外的影响。神经网络模型有着良好的数据 3 0 第四章基于覆盖算法的时间序列预测 认知能力,具有极强的非线性逼近能力,对数据有更好的适应性,预测精 度明显优于灰色方法。 2 、神经网络下的时间序列预测,能有效提取各指标间关系,弱化了对数据 准确度的要求,对时间序列的内在规律作出分析和预测。利用时间序列分析可以 避免主观性偏差,两者相结合提高了模型的预测精度。构造性神经网络模型还具 有比其他传统神经网络模型有更好的推广价值和应用前景。因为随着社会经济的 发展,信息的丰富,各种数据会越来越多,保存的资料的年份会更久,海量数据 将会成为各种数据发展的一个趋势,而构造性神经网络特别适合于海量数据的处 理,这也是其他的神经网络模型所无法相比的。 3 、本实验仅仅是对构造性神经网络模型在农作物产量预测中的一种尝试 作为对模型的一种检验,还仅仅是实验数据结果,如何进行大面积的实际推广应 用还有待于进一步研究。 4 3 基于核覆盖算法的煤价序列预测 核覆盖算法实在覆盖算法的基础上引入了核函数的方法。该算法引入 了全局求优的规划思想,从而使得覆盖邻域更少、局部更优:在核空间中 采用覆盖方法,不仅可以使得识别的方法简单,而且可解释更强。【4 0 】 本节首先介绍了核函数和核覆盖算法,然后给出了方法核覆盖算法在 火电厂燃料管理系统煤炭价格时间序列的预测中的应用。 4 3 1 核函数法分析 支持向量机方法是现在统计学习理论中比较热门的一种方法,也是统 计学习理论最成功地实现。统计学习理论指出,只要满足一种m e r c e r 条件, 那么它就可以作为内积函数。通过它可以实现十分复杂的线性分类。核函 数法的基本思想是:通过非线性变换将输入空间变换到一个高维的空间, 然后在这个新空间中求取最优线性分类面,其所求得的分类函数形式上类 似于一个神经网络,其输出是若干中间层节点对应于输入样本的与一个支 持向量的内积。核函数法可以看成是一种特殊的覆盖算法。【4 1 】常用的核函 数有多项式核函数、高斯核函数等。 3 l 商空间粒度计算理论在时间序列预测中的应用 4 3 2 基于煤炭价格序列预测的核覆盖算法 核覆盖算法就是将先将时间序列数据映射到一个核空间,然后在核空 间中利用一般的覆盖算法进行求解。其具体的算法如下: 给定p 个学习样本,设集合为k = f x l y i ) ( f 矿) ,( 妒,y p ) ) ,其中k 是n 维欧 式空间的点集,设输入的样本的定义域为n 维空间的有界集合d ,k 依其样本所 属的类别可分为s 个子集,k = ( 1 ( 。,k 2 ,c ) 。可以构造出三层神经网络,通过这 个网络,使得属于k 10 = 1 , 2 ,s ) 的样本点的输出均为矿= ( o ,1 0 ,o ) ,其中, 的第i 个分量为1 ,其余分量为0 。i 帅】 4 4 实验 4 4 1 煤价序列介绍 煤价与电厂企业息息相关,缥价预测的准确程度直接影响到火电厂企 业的效益。1 4 2 】但是由于煤的价格受到市场需求、经济政策、银行利率等 诸多因素的影响,给煤价的准确预测带来了很多困难。 4 3 1 市场瞬息万变 煤价也受政治、经济、市场等诸多因素影响。在煤炭价格诸多属性数据中, 煤的实际价格是最令人关注的问题,因此在煤价预测中,采用了实际单价 属性作为其分类标准,并将其类别值作为样本的决策属性。选取了矿方发 热量、厂方发热量、实际发热量、厂方单价、矿方单价、实际单价、涂损 对煤价影响大的七个属性作为样本的属性。这每个样本共有8 个属性。 本实验中,我们从安徽省某电厂l9 9 9 年至2 0 0 5 年的大量报表中提取 和整理出有效的煤炭实际交易数据,按照时间的先后顺序构成数据序列, 作为实验的样本数据,并且将其分为两个部分,分别为学习样本和测试样 本。样本数据的详细情况如表2 所示。 第四章基于覆盖算挂的时间序列预测 表2 煤价序列数据说明 t a b l e2 d a t ae x p l a i n i n go fc o a lp r i c es e r i e s 属性8 个 类别4 类 样本数2 1 7 1 个 第一类9 7 个 第二类7 7 8 个 第三类 1 0 5 6 个 第四类2 4 0 个 4 4 2 煤价序列的训练和预测 设有样本集x ( t ) ( t = l ,2 ,n ) ,若进行一步预测时,选取m 个输入,1 个输出,可以组成训练组x ( n m + 1 ) ,x ( n 1 ) ,x ( n ) :。网络训练好后, 如要预测x ( n + 1 ) 的值,只需把实际值x ( n - m + 1 ) ,x ( o - 1 ) x ( n ) 输入 网络,其输出就是下一时刻的预测值文( n + 1 ) 。 4 4 3 实验结果1 实验结果如表3 所示。 表3 基于覆盖和核覆盖算法的煤价序列预测结果 t a b l e3 e x p e r i m e n t a lr e s u l t so f c o a lp r i c es e r i e sb a s e do ng e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论