(计算机应用技术专业论文)基于商空间粒度计算的信息预测研究.pdf_第1页
(计算机应用技术专业论文)基于商空间粒度计算的信息预测研究.pdf_第2页
(计算机应用技术专业论文)基于商空间粒度计算的信息预测研究.pdf_第3页
(计算机应用技术专业论文)基于商空间粒度计算的信息预测研究.pdf_第4页
(计算机应用技术专业论文)基于商空间粒度计算的信息预测研究.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

(计算机应用技术专业论文)基于商空间粒度计算的信息预测研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中北大学学位论文 基于商空间粒度计算的信息预测研究 摘要 在实际生产过程中,复杂不确定性系统内部关系复杂、外部影响因素多、数据量大 较难建立简单函数方程来预测系统的未来发展趋势,制约了人们获取有用信息,采取有 效行动的能动性。 本文应用粒度计算方法将复杂系统划分为一系列简化的小系统,以小系统为粒度构 成复杂系统的商空间,在分析不同粒度大小的基础上,推导出商空间理论下小系统粒度 拓扑演进关系,初步建立了从细粒度空间到粗粒度空间的粒度信息发展模型。模型重构 了复杂不确定系统的逻辑结构,突出了信息预测中信息载体和信息拓扑两方面的信息。 具体工作为: ( 1 ) 应用粒度计算方法聚合了系统发展的主要影响信息,降低了相关信息在原始 数据中的离散度,分析了复杂不确定系统的信息构成; ( 2 ) 建立了复杂不确定系统信息粒的层次拓扑结构,分析了信息在商空间粒度计 算后系统信息的演变、增长规律并建立了系统信息的增长模型; ( 3 ) 建立了商空间粒度计算理论的信息预测方程,并将预测方程应用到粮食产量 和天气灾变预测中,验证了方法的实用性。 关键j 闻:商空间理论,信息粒,信息拓扑,粒度计算,信息预测 中北大学学位论文 t h ei n f o r m a t i o nf o r e c a s tr e s e a r c hb a s e d o nt h eq u o t i e n tg r a n u l a rc o m p u t i n g w a n gx i n g y e h a nx i e 一一l a a b s t r a c t i nt h ea c t u a lp r o d u c t i o np r o c e s s ,t h ec o m p l e xu n c e r t a i n t ys y s t e mc o n t a i n sc o m p l i c i t i n s i d er e l a t i o n s h i p ,m a n yo u t s i d ea f f e c t i n gf a c t o r sa n dm a s s i v eo r i g i n a l l yd a t a s oi ti s d i f f i c u l tt oe s t a b l i s hs i m p l ee q u a t i o nt o p r e d i c tt h ef u t u r et r e n do fd e v e l o p m e n t ,w h i c h r e s t r i c t e dt h ep e o p l e sa c c e s st og e tu s e f u li n f o r m a t i o na n dt a k ee f f e c t i v ea c t i o n i nt h i sp a p e r ,t h ec o m p l e xu n c e r t a i n t ys y s t e mi sd i v i d e di n t oas e r i e so fs m a l ls y s t e m s , t h e r es m a l ls y s t e m sa sg r a n u l a rc o n s i s to ft h eq u o t i e n ts p a c e ,a n dt h e nt h ep a p e rd e d u c t sa g r a n u l a rt o p o l o g i c a l e v o l u t i o n b ya n a l y z i n g d i f f e r e n tl e v e l g r a n u l a r ,w h i c hi n i t i a l l y e s t a b l i s h e da ni n f o r m a t i o nd e v e l o p m e n tm o d e lf r o mf i n e g r a n u l a rs p a c et oc o a r s e g r a n u l a r s p a c e t h em o d e lr e b u i l d st h et o p o l o g yi n s t r u c t i o no ft h ec o m p l e xu n c e r t a i n l ys y s t e ma n d h i g h l i g h tt h ei n f o r m a t i o no fi n f o r m a t i o nc a r r i e ra n di n f o r m a t i o nt o p o l o g y t h e p a p e r sm a i nw o r k si n c l u d e : ( 1 ) t h ea p p l i c a t i o n o ft h e g r a n u l a rc o m p u t i n gp o l y m e r i z e s t h em a i na f f e c t i n g i n f o r m a t i o no fs y s t e md e v e l o p m e n ta n dr e d u c e st h ed i s p e r s i o no fr e l a t e di n f o r m a t i o n i nr a wd a t a ,t h e nt h ep a p e ra n a l y z et h ei n f o r m a t i o nc o n s t i t u t eo fc o m p l e xu n c e r t a i n t y s y s t e m ( 2 ) i te s t a b l i s h e dt h ei n f o r m a t i o ng r a n u l a r l e v e l t o p o l o g y i n s t r u c t i o no fc o m p l e x u n c e r t a i n t ys y s t e m ,a n a l y z e st h ei n f o r m a t i o ne v o l u t i o na n dg r o w t ha f t e rg r a n u l a r c o m p u t i n g ,a n dt h e nt h ep a p e re s t a b l i s h e st h eg r o w t hm o d e lo fs y s t e mi n f o r m a t i o n ( 3 ) t h ep a p e re s t a b l i s h e s a ni n f o r m a t i o nf o r e c a s t i n ge q u a t i o ni nq u o t i e n tg r a n u l a rt h e o r y t h e nt h ee q u a t i o ni su s e dt of o r e c a s tt h eg r a i no u t p u ta n dd i s a s t r o u s ,w h i c hv e r i f yt h e u s a b i l i t yo ft h em e t h o d k e y w o r d s :q u o t i e n ts p a c e ,i n f o r m a t i o ng r a n u l a r ,i n f o r m a t i o nt o p o l o g y ,g r a n u l a r 中北大学学位论文 c o m p u t i n g ,i n f o r m a t i o nf o r e c a s t 原创性声明 本人郑重声明:所呈交的学位论文,是本人在指导教师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含 其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡 献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人 承担。 论文作者签名:王= 一名耻 日期:幽l57 拿 关于学位论文使用权的说明 本人完全了解中北大学有关保管、使用学位论文的规定,其中包括: 学校有权保管、并向有关部门送交学位论文的原件与复印件;学校可 以采用影印、缩印或其它复制手段复制并保存学位论文:学校可允许学 位论文被查阅或借阅;学校可以学术交流为目的,复制赠送和交换学位 论文;学校可以公布学位论文的全部或部分内容( 保密学位论文在解密 后遵守此规定) 。 签名:尘牛日期 导师签名:j 掣l e t l l l l : 渺8rs 26 中北大学学位论文 1 系统预测的基本知识 1 1 1 系统预测的概念 1 绪论 预测是对将要发生的事物或现象或目前不明确的未来情况进行预先的估计和推测。 预测要有定的科学依据,其建立在对事物历史与现状的调查上,建立在对有关主要因 素分析的基础上。 系统预测就是根据系统发展变化的实际数据和历史资料,运用科学的理论、方法和 各种经验、判断、知识去推测、估计、分析事物在未来一定时期内的可能变化情况,其 实质是充分分析、理解待测系统及其有关主要因素的演变,以便找出系统发展变化的固 有规律,根据过去、现在估计未来,根据已知预测未知,从而推断该系统的未来发展状 况川。 1 1 2 预测方法的分类 由于预测的对象、时间、范围、性质等不同,预测方法可以形成不同的分类,根据 方法本身的性质特点可将预测方法分为三类脚。 ( 1 ) 定性预测方法 根据人们对系统过去和现在的经验、判断和直觉进行预测,其中以人的逻辑判断为 主,仅要求提供系统发展的方向、状态、形势等定性结果。 该方法适用于缺乏历史统计数据的系统对象,利用诸如市场调查、专家打分、主观 评价等做出预测。 ( 2 ) 时间序列分析 根据系统对象随时间变化的历史资料,只考虑系统变量随时间的变化规律,对系统 未来的表现时间进行定量预测。辛要包括移动平均法、指数平滑法、趋势外推法等。该 方法适于利用简单统计数撕预测研究对象随时| 日j 变化的趋势,例如企业的总产值,南品 1 中北大学学位论文 的销售额、城市的用电量、地区的降雨量等。 ( 3 ) 因果关系预测 系统变量之间存在某种前因后果关系,找出影响某种结果的几个因素,建立因与果 之间的数学模型,根据因素变量的变化预测结果变量的变化,既预测系统发展的方向又 确定具体的数值变化规律。一般因果关系模型中的因变量与自变量在时间上是同步的。 其方法主要包括时间序列分析、线性回归分析、概率统计方法、计量经济学方法、 系统动力学仿真、神经网络技术等。 1 1 3 预测方法的要素及作用 预测方法的主要要素有: ( 1 ) 预测对象所处学科领域的理论。 ( 2 ) 预测方法的理论。 ( 3 ) 预测对象的历史和现状资料与数据。 ( 4 ) 采用的计算方法或分析判断方法。 ( 5 ) 预测方法和预测结果的评价与检验。 预测的作用有:第一,帮助我们认识和控制未来的不确定性,使我们对未来的情况 更可能多地了解;第二,使计划的预期目标同不断变化的周围环境与经济条件保持一致: 第三,事先了解计划实施后可能产生的结果。对于一个个体( 可以是国家、单位、个人 等) 来说,无论是制定计划,还是做出决策,都必须对未来的状况做出推测,并以这种 推测作为计划和决策的依据。例如我们可以根据天气预报的情况来决定穿衣、晾晒以及 是否进行户外工作等,这时准确的天气预报是很重要的,所以正确的决策主要是来源于 准确的预报。因此,预测在我们现实生活中具有重要的作用。 预测的应用领域很广,通常我们感兴趣的预测主要是经济预测。经济预测是根据现 有的各种相关信息对某一经济活动( 常见的有股票交易,货物买卖等各种交易) 将来的 发展趋势进行预测。由于经济又可以分为宏观经济和微观经济,所以预测也就有宏观经 济预测和微观经济预测之分。宏观经济预测通常是指一个大的方面的预测,例如我国的 国 屯经济增长情况预侧,某个地区的经济发展状7 兄颅测。在本文我们主要讨论微观经济 的颅测情况。 2 中北大学学位论文 1 1 4 预测的准确度问题 由于预测是对未来的一种估计,不能百分之百的准确,总会存在一定的偏差。影响 预测准确度的因素很多,主要有: ( 1 ) 客观实际情况在不断迅速地变化,而人们的认识总是滞后的。这是长期预测困 难的主要原因。 ( 2 ) 客观事物发展有渐变,也有突变。在突变的情况下是难以预测的,社会发展如 此,技术进步也是如此。 ( 3 ) 预测研究还是一项年轻的事业,还不成熟。 ( 4 ) 限制预测实现的因素也很多。 。 总之,客观事物的发展是瞬息万变的,而人的认识总是不完全的,因而从根本上讲, 完全准确的预测是不现实的。要提高预测的准确度,应从以下几方面入手: ( 1 ) 从预测的资料来源看。资料、数据、情报一定要可靠,必须经过核实。资料是 否完全、正确,直接影响到预测结果的精度。在预测工作中,应投入相当大的力量去进 行资料的搜集和鉴别,并应逐步积累,建立起常用的数据库。 ( 2 ) 从预测的方式看。要善于利用各方面的预测成果和报告。预测需要集体去做, 要发挥集体的力量。预测的结果要由集体来评定,要吸取不同的意见。 ( 3 ) 从预测的方法看。应注意研究预测的方法,改进预测技术。针对不同的问题, 选用不同的预测方法,这对保证预测精度是十分重要的。做技术预测应懂技术,做经济 预测应懂经济,这样才能做到理论明确、方法可靠、精度提高。 总之,提高预测的准确度并不是使预测百分之百的准确。由于计划是面向未来的, 而未来又是不肯定的,所以预测的准确度是相对而言的。在提高预测准确度的基础上, 同时要考虑预测的精度问题。预测的精度是相对的,要根据预测内容和要求而定。 1 2 信息与预测 1 2 1 信息的重要作用 信息和物质、能量并、z ,同为自然与社会的肇本组成要素。本体论。r k 质的信息可以 3 中北大学学位论文 定义为“事物运动的状态和( 状态改变的) 方式 或“物质与能量在时空中分布的不均匀 性( 的量度) 乜1 ,这是一种普遍适用的信息定义。从人的认识角度出发,可以把信息看 作“认识主体所感知和( 或) 所表述的事物运动的状态和方式。 嘲在这一定义的基础上再 引入新的约束条件,可以得到更为具体,适用范围更为狭窄的定义。具体应用中,根据 信息的作用可以归结为两点:一是帮助人感知和认识事物,二是可以用于支配自然与社 会,进行信息分析与预测的作用及在此范围之内。 信息既是人类认识世界的途径和手段,也是人类改造并且影响自身环境的工具。在 现代社会中,信息的作用越来越重要,正在取代材料和能源成为社会发展中最为重要的 资源。在发达国家,经济增长的主要动因不再是物质材料、能源和资本的投入,科学技 术知识、先进管理经验、市场信息等方面的信息投入和信息利用已经成为经济增长的主 要动力。社会生产力的提高主要是依靠信息的投入而实现。信息不仅在现代社会的物质 生产中发挥了重要作用,而且在满足人们的精神需求方面扮演了主要角色。信息价值的 生产正在成为社会活动和经济发展过程中的中心环节。 1 2 2 信息分析与预测 可以把信息分析与预测看作是一个信息输入与输出的过程。预测要建立在大量信息 资料的基础上,要求全面收集研究对象的各种信息,通过深入分析认识预测系统的组成、 结构、状态、历史与现状、环境条件、运动变化规律等,然后建立有关模型,进行实际 的预测研究,其中包括通过模拟方法,摸清改变系统的结构、组成或环境条件,被分析 系统发生变化的方向与可能性。可以说,没有信息的收集、整理与分析就无法进行预测。 从预测工作的过程看,要经过确定课题、选择研究方法、制定工作计划、调查与信 息收集、材料整理与分析、建立模型和进行预测、对预测结果进行检验等,其中的每一 步骤几乎都要在信息分析的基础上彳能进行【5 1 。从信息研究目的来看,研究工作总是针 对实际问题对具体事物进行的,需要对事物的未来发展进行推测,以利于提出控制事物 未来变化的措施,相应进行准备,而信息分析与预测是这一信息研究工作中密切相联的 两个方面。 4 中北大学学位论文 1 3 本文研究内容 从上面信息与预测的辨证关系上可以的出以下结论:信息分析是预测的基础,预测 是信息预测的目的。信息分析与预测结果之间的有机和唯一联系是两者之间的一种组织 结构模型。而模型的建立过程是与信息分析分不开的,是由信息分析方法决定的, 不同的信息分析方法将建立不同的模型,有多少种信息分析方法就可建立多少种模型, 它们都将指向同一个目标得到预测的信息。 本文既遵循这一规律,在引进新的信息分析方法的基础上,建立信息预测的模型, 预测所需的信息。 文章以人工智能商空间理论和粒度概念为基本理论依据和分析工具,以商空间理论 分析信息的内在规律,以粒度计算方法整理,分析,划分基本信息单元,同时借鉴了灰 色理论的方法构建了商空间粒度计算理论基础上的信息增加模型用来预测信息。 1 4 本文的组织结构 第一章介绍了预测的发展状况及与信息的关系和本文所要研究的内容; 第二章主要介绍了本文所依据的商空间理论的知识及此理论所惯常使用的方法论; 第三章阐述了信息预测的相关知识以及现在普遍存在的多变量时间预测问题和灰 色预测方法; 第四章主要论述信息粒化的概念及粒化基础上信息的拓扑关系,最后建立了信息粒 化拓扑关系基础上的信息增长概念: 第五章全面介绍了商空间粒度计算信息预测模型的建立过程; 第六章建立的模型在灾变预测领域的简单应用; 第七章总结了本文的研究并展望了本课题今后所要做的工作。 5 中北大学学位论文 2 1 商空间理论研究的问题 2 商空间理论 人们在思考问题时,具有从全局分析问题的能力,可先从总体进行观察,然后再逐 步深入地研究各个部分的情况,即从不同粒度、层次上分析问题的能力( 称为演绎能力) , 又具有从底层的事物( 数据) 中归纳规律的能力( 称为归纳能力) ,先从各个方面对同一问 题进行不同侧面的了解,然后对它们进行综合:或是上面两种方法的组合,即时而从各 侧面对事物进行了解,然后进行综合观察,时而综合观察后,对不甚了解的部分再进行 观察。总之,根据需要从不同侧面、不同角度反复对事物进行了解、分析、综合、推理。 最后得出事物本质的性质和结论。人工智能研究者对人类这种能力进行了深入地研究, 并建立了各种形式化的模型乜1 。商空间理论就是对上述问题研究的理论成果。 2 2 商空间理论简介 2 2 1 商空间法 张钹院士和张铃教授在研究问题求解时,独立地提出了商空间理论幽。商空间法可 用一个三元组( x ,厂,z ) 描述一个问题。x 表示问题的论域,( ) 表示论域的属性,可用 函数厂:x 一y 表示,z 是论域的结构,指论域z 中各元素的相互关系。分析或求解问题 ( x ,丁) 是指对论域x 及其相关的结构、属性进行分析、研究。对论域x ,在其上给定 一个等价关系尺,对应于尺的商集【x 】,然后将【x 】当作新的论域,对它进行分析、研 究。故商集是将等价类看作新元素而构成的新空间,自然得到一个较粗粒度的世界【x 】。 我们将不同粒度的世晃与数学上的商集概念统。一起来,或者说以商集作为不同粒度 世界的论域的数学模型,这就是粒度世界的商空i 日j 模型。设属性函数 厂:x y ,p :x 一【x 】是自然投影,f 丁j : “l p 1 ( “) s r , u x ,定义 厂 :【x 呻y 这样我 6 中北大学学位论文 们就得到一个新的问题( x , 厂 ,【丁 ) ,称( p , 门,p ) 是问题僻,丁) 对应于等价关系 r 的商空间,其中r 对应于一定的粒度。 2 2 2 不同粒度世界的推理模型 在商空间模型下,可建立不同粒度世界对应的推理模型,并有如下的性质: 命题2 1 ( 保假原理) p ( x ,z ) 呻( x ,【r ) 是自然投影,则p 是连续的。若彳c x 是 连通集,则p ( 彳) 是【x 中的连通集。这表明,若一个问题在原论域x 中有解( 是连通的) , 在适当的粗粒度论域【x 】上也有解。反之,若一命题在粗粒度空间中是假的,则该命题 在比它细的商空间中一定也无解。因为粗粒度的空间规模小,故计算量也少,这样我们 就可以以很少的计算量得出所要的结果。 设( 墨,六,五) 和( x 2 ,五,互) 是僻,丁) 的两个商空间,定义互,乏的合成瓦为: 定义2 1 五,瓦的合成是x 上所有拓扑构成的半序格中五与互的最小上界乙。 具体构成如下:令b 一 w l w = 咋n “j ,咋五,“,互) ,然后以b 为拓扑基,构成的拓扑 就是毛。 命题2 2 ( 保真原理) 设问题在半序商空间( 墨,六,瓦) 及( x :,厶,互) 均有解,则在其 合成的商空间( 墨,厂3 ,五) 也有解。 所谓“保真原理”是指若命题在两个较粗粒度的商空间中是真的,则( 在一定条件 下) 在其合成的商空间中对应的问题也是真的。 这两个原理在商空间模型的推理中起到很重要的作用,如若我们要对一个问题进行 求解,当问题十分复杂时,常先进行初步分析,即取一个较粗粒度商空间,将问题化成 在该空间上的对应的问题,然后进行求解,若得出该问题在粗粒度空间中是无解,则由 “保假原理”,立即得原问题是无解的。因为料l 粒度的空例规模小,故计算量也少,这 样我们就可以以很少的计算量得甘;所要的结果,达到“事半功倍”的目的。 同样利用“保真原理”也可达奎l j 降低求解的复杂性目的,设在两个较粗空间x jx , 7 中北大学学位论文 上进行求解,得出对应的问题有解。利用“保真原理 可得,在其合成的空间置上问 题也有解。设置,x :的规模分别为s 、是。因为一般情况下,x 3 的规模最大可达到ss :。 于是将原来要求解规模为s 是空间中的问题,化成求解规模分别为s 、s :的两个空间 中的问题。即将复杂性从“相乘 降为“相加 。 2 2 3 商空间粒度的构建 粒度计算的主要问题是两方面,一是如何构建信息粒度,二是如何利用粒度去计算。 前者处理粒度的形成、粗细、表示和语义解释,而后者处理怎样利用粒度去求解问题。 利用商空间理论求解问题时,可从不同粒度来考察问题,问题的不同粒度表示对应于不 同的等价关系尺。也就是不同的粒度,只不过是对论域进行不同的划分而已。因此,划 分就是构成不同粒度世界的方法。 商空间理论提出了四种主要的构建方法:属性法、投影法、结构法、约束分层法。 ( 1 ) 属性划分法。即将属性相同或相似的元素归为一类。 ( 2 ) 投影划分法。若元素x 的属性函数是多维的,如有n 个属性函数分量 五,厂2 ,若暂不考虑其中f 个属性 ,厂2 ,正,将石坩正,正训属性相同的元素 归为一类。 ( 3 ) 结构划分法。把结构上或功能上关系密切的元素分为一类。 ( 4 ) 约束划分法。设有n 个约束条件c l ,c :,c 3 ,那么可按c i 进行划分。 分类有相交的情况:当x 中的同一元素x 同时属于x 中不同的类别时,即分类的交 界处不十分分明时,可引入模糊逻辑的概念,对分类相交问题进行讨论。 2 2 4 分层递阶 人们在解决复杂问题时,通常不是一次性的考虑问题的全部细节,而是先把问题分 解或剪接,忽略其中细节,然后从较抽象的层次丌始,一层层地深入到其中的细节,这 种由粗到细,从全局到局部地解决问题的方法,通称为分层递阶方法。 人们在处理复杂问题时也使用类似的策略。般来讲f 两种情况。其一是有时只需 8 中北大学学位论文 要知道问题的某些较为概括性的性质,因此不必对整个问题进行深入细致和全面的考 察,而是一定层次上对该问题进行分析,得出所需要的一些概括性的性质即可,这时候 用到了分层。其二是,问题本身非常复杂,直接进行研究将十分困难,或工作量太大而 无法进行。于是采取从上到下分层的解决办法,先在较高的层次上对问题进行初步分析, 从中提供出一些有用的信息,然后在这些初步结论的指导下,再进入下一个更低的层次 作分析,又可得出一些有用信息,用这个信息再知道下一层次的分层和分析,逐步地达 到目的。 人们这样做的目的,似乎也在于提高效率,用计算机科学的术语来讲,分层递阶的 目的在于降低计算量的复杂性。 常用的分层方法有两种n 。第一种叫分枝法,把一个问题分为子问题,子问题又分 为更小的子问题:第二种称为嵌套法,即把一个问题按不同的细节程度加以分层。实际 上,分层递阶的分枝结构即对应于不同的分类,对应于不同粒度的世界。而嵌套式的分 层结构,也可以用不同粒度的世界加以描述。在嵌套结构的上层,许多细节是未知的, 可以把未知部分分为一类。到低层时,若干未知变成已知,再重新对它分类,总之,也 可用不同粒度的世界来描述。 2 2 5 合成 许多科学对分层递阶都很感兴趣,人工智能也不例外。我们己经分析过,采用分层 递阶技术的主要目的是降低计算复杂性,使原来难以处理的复杂问题化简。为了把握分 层递阶的方法,关键在于解决由低层次空间构造高层次空间的问题,即研究商空间与原 空间的关系副。 可是人类的认识活动正与上述相反。人们对事物的认识,则是从浅到深,由表及里, 从局部到全局。人们总是先在不同层次、不同角度上对事物进行观察和了解,然后把这 些零星、片面的了解综合汇总为较系统、全面的了解。这个过程正好是上述的对事物简 化、概括、抽象的反过程,即对事物不断深入、全面及系统化的了解过程,这也是人类 智能的重要纠l 成部分。 这个过利即已知符干高层次的状态和性质,如何推算出原对象的低层次的状念和性 质来。这个过程统称为合成过程,也可称为综合过t f 翟。这种从侧、 ,j 邡的观察以综合全 9 中北大学学位论文 体的过程,是人类思维活动的普遍现象。在我们的模型中,均可把它们化为:已知若干 商空间,如何综合出其原来空间的问题,即合成问题。其重点在于确定原空间与商空间 的关系。 2 2 5 核覆盖算法 核覆盖算法就是将先将数据映射到一个核空间,然后在核空间中利用一般的覆盖算 法进行求解。它是在覆盖算法与s n 司算法的基础上给出基于融合的覆盖技术和相应的 算法。该算法比较好地解决了核函数法和构造性方法中的不足之处。 ( 1 ) 核函数 在原空间x ( 一般设为欧氏空间) ,任给一球面c :k 一4 i = 厂,经g a u s s 核变换 f :x z , ( f ( 石) ,f ( ) ,) ) k ( 圳) = e x p ( 一r l z y 1 2 ) 由( ,( z ) ,f ( y ) ) = k ( 石,y ) - e x p ( 一y 厂2 ) 知c 的像在核空间z 中是一球心在f ( 4 ) 的 球面。 ( 2 ) 覆盖的融合 定义2 6 设在x ( 距离空间) 上一组球面 q ,c 2 ,c ,是用覆盖算法求到的划分边 界,即是一组覆盖( 如超球面,下面简称为球面) ,记c 的中心为五,半径为 ( i - 1 ,2 ,刀) ,取核函数k ( x ,y ) = c x p ( 一y 卜一y 1 2 ) , 特征空间z 上的“曲面s 有 唧( 一叫x 1 - - x p ( 一yx 2 - - x 1 2 纠+ 唧( 一叫x n - - x 附) 州 则称s 是c l ,c :,e 的融合。引。 当点落在c 上时,若略上此点到e x p ( 一yi x l - x 1 2 i ;) ( f ) 各项的影响,则 中北大学学位论文 厂( z ) e x p ( 一,) ,既近似地看,落在c 上的点基本上也落在s 上,故s 可以看成是 c 1 ,c :,c 的融合。 ( 3 ) 核覆盖算法 设x 是二分类问题的训练样本,c 1 ,c 2 ,c ( 覆盖正类) ,c 彬c ,e ( 覆盖 负类) 是在样本空间中构造的覆盖领域系,a l , 口:,a ,口m ,a 。,d 。,d :,d ,d 州,叱是 相应的领域中心和阈值,对覆盖领域进行融合,将属于同类的覆盖领域融合成特征空间 的一个球面,且使分类错误最小,也就是在特征空间中寻找每类领域的最优包络线,使 相近的同类领域融合在一起n 6 1 。为此我们作融合判决函数: 巾) t 塞一( 一y i 戈一q + ,弘x p h x - a , 1 2 c ,) 记正类领域c 对应的输出为咒- 1 ,负类领域c f 对应的输出为乃一一1 ,并记 k a i , x ) 唧( 一y i a i - - x 于是式可以写为,( z ) = 薹口;y f ( 乜,x ) 式中的口f 可以用求支持向量的方式求解。由于要在特征空间中把覆盖领域分开, 为消除领域的大小对超平面的影响,我们将领域首先进行归一化,即取式中的q 为各 自领域半径的平方,即领域的阈值砰。 用该算法对样本进行分类时,对每一个样本,计算厂( x ) 的值,若( x ) 0 ,则x 属 于正类,若( x ) 毛,0 毛 l 0 x 2 1 0 , 0 中,“g r a n u l a t i o n 这个词被提及。但是和“g r a n u l e 不同的是,这种“粒是模 糊的,粒与粒之间可能有重叠的部分。所以“i n f o r m a t i o ng r a n u l a t i o n 是研究如何将信 息分成模糊的带有不清晰边缘的“块”,并讨论定义在其上的操作等问题,这种分割实 际上是一种覆盖1 。 y y y a o 认为,粒的大小、粒上的操作、粒之| 日j 的关系是粒计算理论发展中最重要 的部分乜。对研究对象进行适当分割,在问题求解中使用粒子,是粒计算的基本思想妇引。 粒计算是一个很宽泛的概念,它“覆盖了所有有关粒度的理论、方法、技术和工具的研 究。柑略地讲,一方面它是模糊信息柁理论、; f 1 糙集理论、商空间理论、间计算等的 2 1 中北大学学位论文 超集,另一方面是粒度数学的子集。具体地讲,凡是在分析问题中,应用了分组、分类和 聚类手段的一切理论与方法均属于粒度计算研究范畴一汹1 。 综上所述,粒计算是研究信息如何分类,被分成的块是两两分离的划分还是两两可 能有交的模糊分割;研究分成的粒度大小,不同粒度层之间的关系,粒度分解和合并等, 简言之,它是对于基于不同粒度层次和粒度细节的一般问题求解理论的研究。 4 2 信息拓扑关系 在一个抽象集合上定义拓扑的方法是多种多样的,自从1 9 1 4 年h a u s d o r f f 用邻域关系 定义拓扑以来,现在人们已经知道,用开集族、闭集族、闭包运算、收敛等方法均可定 义拓扑乜钔。下面我们从目前比较通用的由开集族建立拓扑的方法来定义拓扑空间,这种 方法始于a 1 e x 柚d r 0 屿h o p f 冽。 定义:设x 为非空集合,fc2 工为x 的一个子集族,若,满足 ( 1 ) x ,o e f ; ( 2 ) 当f 。cf 时,u ue f ; - 叩 ( 3 ) 当阢,u e e f 时,n u , e f , 1 = 1 称,为x 上的一个拓扑结构或拓扑,集合z 与它的一个拓扑f 组成的偶( x ,f ) 称 为拓扑空间或空间,x 中的元素称为点,f 中的元素称为( x ,f ) 的开集,在不致引起 混淆的情况下,也记( x ,f ) 为z 。 由定义可见,所谓给空间( 既集合) z 一个拓扑,就是规定其中某些子集为开集, 使之满足条件( 1 ) ( 3 ) ,因此可以想象,在一个集合x 上,可以给出的拓扑结构, 一般来说不是唯一的,而拓扑空间无非是比集合更为精细的一种结构。 从拓扑结构的定义可以看出拓扑的建立与子集合的构造是同时进行的,只是这里的 子集合不定是x 的划分,大多数情况下拓扑构造的子集合是x 的一个覆盖。拓扑与 覆羔足一对共生体,由拓扑天系得到集合划分,由集合划分u 以得到拓扑关系,子集合 2 2 中北大学学位论文 又可以认为是信息粒,所以信息粒与拓扑关系天然统一。信息粒是带有拓扑关系的信息 【2 7 】 商空间理论描述系统x 的方式与粗糙集、模糊集不同的一点就是引进了系统固有的 拓扑结构,( x ,f ,丁) 在系统z 上划分粒度。 定义1 :设x ,y 是两个集合,x y 是x 与】,的积集,r ;xx y 。设x e x ,y e y 有 ( x ,y ) e r ,则称x 与y 有关系尺,记为x r y ,称尺为x y 上的一个关系。 定义2 :若x x ,令 x ;yx r y ,称【x 为x 的等价类。 定义3 :令 x = 卜批x ) ,称 司是关于尺的商集。 故商集是将等价类【习看成新元素而构成的新空间,是原空间粗粒度的论域。商空间 理论,将不同粒度的世界与数学上的商集概念统一起来,或者说以商集作为不同粒度世 界的数学模型啪。 商空间理论应用信息粒概念在一定层次上描述了系统的整个构造。信息单位由构成 x 的x 转换成【司,这样可以最大限度的除去冗余信息又可以突出系统的主要矛盾。冈 作为信息粒,信息粒内部相似,信息粒之间保持较大的区别。信息论认为相异性是信息 的本质,人类认识世界、研究事物的本质时都是从相异性着手的,粒度之间的区别对系 统的描述至关重要。 4 3 粒度上信息的增长 为了在粒度层次上预测系统,我们对上面提到的两类信息粒c 一粒和,一粒做了发展 和综合,使得信息粒有利于信息的携带和拓扑关系的建立啪1 。 商空间理论中的信息粒集合可以看作是系统x 的一个覆盖,【x 】为系统x 的信息粒 覆盖集合口,由【x 】诱导出的x 上的关系为r ,商空间理论下关系r 的具体形式为:自 反关系、对称关系和传递关系或它们的组合。论文是对商空间粒度计算的应用,所以对 关系r 有限制,一般来说关系r 为等价关系,这一关系有助于下一步信息粒上信息的拓 2 3 中北大学学位论文 展。 等价关系r 构成系统x 上的划分,对由r 诱导出的信息粒,信息粒中各个元素关系 密切。信息粒可以认为是在相应【x 】层次上的信息核。这里的核与机器学习中的核概念 相近,是信息聚类的结果。传统的商空间信息粒都是c 一粒,下面我们应用商空间粒度 合成方法对c 一粒做扩充使得c 一粒具有一些厂一粒的特性。 对于系统x 上的不同等价关系墨和恐。r ,r 在不同层划分粒度构造了信息粒,如 果r ,恐之间有偏序关系,即r d : d 。应用d ( x ,y ) - 4 对x 进行一次聚类得到划分( 【x 。,【厂 。,【7 。) ,【x 1 是我们关心的信息粒,为了构造信息 粒上的嵌套关系,在这里以 x l 中的粒度集为划分对象取d ( x ,y ) 一d :,对 x l 中的各个 粒度结合应用f l u s t e r 算法得到各个粒度集上的划分n 羽,合并这些划分构成 ( 【x :,【门:,p :) ,反复重复上面算法直到d ( x ,y ) - d ,。 下面对上面的算法总结如下; s t e p l :取d ( 茗,y ) f d 。应用只u s t e f 算法得到( 【x l ,【厂 1 ,p 1 ) s t e p 2 :f o ri 一2 :朋 取d ( z ,y ) d i 对( x 1 _ 1 , 1 1 _ 1 【r 1 。) 上的商集应用f l u s t e r 算法 s t e p 3 :由上面粗粒度到细粒度的嵌套关系构建拓扑树s ,从叶子节点到根节点是一 嵌套序列。 5 5 商空间预测方程 5 5 1 信息树 若( 彳,f ,z ) 为原问题空间,应用商空间粒度划分方法得到划分( x ,【厂 , 丁 ) ,粒度 的合成是粒度转换的主要方式,对( 【x ,i s ,p ) 应用合成理论进行合成,反复执行以上 过程,直到返回原问题x 。由此得到x 的分层结构,分层结构的每一层表示x 的一个 划分,设( x l , 厂l ,【丁1 ) 为第i 层的商集,r 为( x j , 厂l , r 1 ) 上的等价关系, ( x l + l , 门m ,【丁1 + 。) 为第f + 1 层的商集,冠+ 。为f x 。,i t 。, 丁 1 ) 上的等价关系,行且使得 r r 。在上面x 的商空间粒度构造合成过程中实际 :也构造了棵树s ,树s 的第i 中北大学学位论文 层节点为商集( 【x ;, 厂 ;, r ;) 的元素,他们构成了系统x 的一个树型内在关系拓扑结 构,s 是系统信息,如图5 1 所示。 5 5 2 在信息树s 上建立预测方程 图5 1 信息树s 商空间粒度信息的白化与商空间数列拓扑关系的建立是同时进行的。对商集 陋1 d - “x 。】。,k 】o ,”k 。】。) 的元素集合求均值得到元素集合的白化信息集合为数集x 。,【x 】o 中的元素为树s 的叶子节点。用凰中的元素代替相应的叶子节点,上层的节点为下层 节点的和,其中根节点的值为k 元素的和,从第f 个叶子节点回溯到根节点,构成一数 列厶,有k 个叶子节点可构造k 个数列,数列t 数据由小到达排列。 在此建立灰色方程: 分析结构树s 以及数列,数列厶的增长步长为2 ,4 ,8 ,1 6 。设中的数据为 ( 。( o ) ,毫。( 1 ) ,l 。( 2 ) 毫。( m ) ) ,则( 毫( o ) ,0 ( 1 ) ,毫( 2 ) 毫( 研) ) 为t 中的数据f 次累加 3 1 中北大学学位论文 的数歹l j 。在此把数据厶当做一次累力,建立灰色方程,设:石d x ;冯掣彳| 导= d x 毛( j ) d l 2 ( j 一2 ) 灰色方程为:拙+ 一;6 由兽+ d 。( 1 ) 而, 1 一j 、7 等+ 砒2 , 写成矩阵:y 一西口其中y 一 ( 1 ) 2 1 t ( 2 ) 2 0 t ( 七) 2 2 器+ 叫阶6 。 ,m = 一。( 2 ) 1 一。( 3 ) 1 ;1 一毫。( 七) 1 用最小二乘法求解口向量:o - 口,6 】r 一( 中r m ) m r y ,0 :。 i b 设一的估计值为以可得误差序列:ei y m 钆其中刍2 ( 主) 由此得到灰色方程;查墨盟+ 二掣 ) 占的离散形式解 d f 叠0 ( 七) :“( 七) 一鱼) e x p ( 七一1 ) + 鱼( 七;o ,1 ,2 朋) , aa 工 + 1 ) - - x i + 1 ) 一船 ) t0 , 1 , 2 ,m 一1 ) 得到预测序列为 二:0 1 一 叠0 1 ( 1 ) ,二:o ( 2 ) ,二! o ( ,珂) 】。 树结构s 。有七个叶子节点,因此可以建立七个从色方程,得到七个预测j 产列 毫。( f = l ,2 七) 。预测值只能仃一个,对上述七个预删值的合成是必要的,、f 均值或权 3 2 中北大学学位论文 重均值法都是有效的方法。 平均值 ;一【妻三,。,妻二! o ) c 2 ,妻羹叭伽,乒】 权| 匡匀值二;i 耋k - 。) c 1 ,t i 1 r 1 i ( , 。) , a - i 。m 1 ,_ 1 - i 叠。) c 刀t ,】 5 5 3 构建信息树s 的信息增长树& 信息树s 由信息粒和信息粒之间的包含关系构成,信息粒就整个系统来说是系统某 一层次的确定信息,但是与我们要达到信息预测目标来说,信息粒仍然显得太大,尤其 对于数值方程来说。由系统划分得到的信息粒是集合,这个信息粒与灰色理论中灰信息 的概念相似,信息粒与信息粒之间关系明确,信息粒内部不明确m 1 。也就是说信息粒是 外延明确,内涵不明确的对象。 信息粒作为预测的信息载体,在预测之前要做一些预处理。与灰色预测要对灰数据 白化相对,信息粒也要经过白化处理才能应用于预测方程,信息粒白化可以应用灰数白 化方法得到。但是由于本文的信息预测偏重于信息变化的方面,我们建立的模型也是对 变化的信息做出预测,让预测模型建立在变化信息的基础上更能反映系统的动态性“鄹。 因此对原来的信息树s 要做出调整。 若原来的信息树s 为,层,第z 层为叶子节点,由信息树构造过程可知,一1 层是由比 z 层粗的信息粒构成的,层是f 一1 层的信息核,一1 层信息是z 层信息的外延。这里以z 一1 层信息粒与所包含的z 层叶子信息粒做差运算,所求的差集合代替叶子节点。然后用,一2 层信息粒与,一1 层信息粒做差运算,结果代替f 一1 层节点,反复进行上面的运算直到根 节

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论