已阅读5页,还剩48页未读, 继续免费阅读
(信号与信息处理专业论文)基于粗糙集理论的石化信息处理系统的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨理工大学工学硕士学位论文 基于粗糙集理论的石化信息处理 系统的研究与实现 摘要 随着我国国民经济和汽车、化工等相关产业的迅猛发展,自用车保有量 的持续增加,石化资源消耗快速增长,需求与日俱增。石化资源的流通供 应,即“进一销一存 环节成为石化企业关注的问题。如何处理石化信息, 根据需求进行准确决策对企业至关重要。以往是用传统方法来统计加油站的 需求再逐级上报,企业根据生产和库存来进行调拨,决策执行慢,容易出现 市场需要某一油品而库存不够,不需要的油品又在库内大量积压的现象。可 见,面对激烈的市场竞争,更加先进的石化信息处理技术与方法的研究对石 化企业意义重大。针对多数石化企业还使用以往的c s 结构的石化信息处理 系统,采用传统的统计方法处理信息,依靠以往经验来获得企业决策的情 况,本论文采用当前处理海量信息的有效工具,粗糙集理论来处理石化信 息,得到科学决策,并构建了基于b s 结构的石化信息处理系统。 本论文首先介绍了粗糙集理论及其优势,提出了基于区分矩阵的属性约 简在石化信息处理上的约简流程,使用粗糙集理论处理石化信息,通过算例 的属性约简得到石化信息的决策规则,提供科学决策参考,无需像以往按传 统经验来进行决策。其次本论文介绍了b i s 结构的工作原理以及b s 结构 与c s 结构相比较的诸多优点,给出了基于b i s 结构的石化信息处理系统 的层次结构,根据石化企业的运营体系及业务要求,构建了基于b s 结构的 具有决策参考功能的石化信息处理系统。本论文将网络技术、数据库技术和 动态网页技术应用到石化信息处理系统中,介绍了整个系统的结构、功能, 完成了系统软件部分的各个模块的设计。最后本论文针对所完成的工作做出 了总结。 关键词粗糙集;属性约简;区分矩阵;石化信息;浏览器服务器 哈尔滨理t 大学工学硕上学位论文 s t u d ya n di m p l e m e n t a t i o no fp e t r o c h e m i c a l i n f o r m a t i o np r o c e s s i n gs y s t e m b a s e do hr o u g hs e t a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fn a t i o n a le c o n o m y , a u t o m o b i l ea n dc h e m i c a l i n d u s t r i e s ,a n dw i t ht h es u s t a i n e di n c r e a s eo fp r i v a t ec a r s ,t h ec o n s u m p t i o no f p e t r o c h e m i c a lr e s o u r c e ss h o w sar a p i dg r o w i n gt r e n d ,a n di t sn e e di si n c r e a s i n g d a yb yd a y t h ec i r c u l a t i o n so fp e t r o c h e m i c a lr e s o u r c e s ,n a m e l ys t o c k i n g ,s a l e a n dst o r a g e ,h a v eb e c o m eap r o b l e mw i t hw h i c hp e t r o c h e m i c a le m p r i s e sa r e c o n c e r n e d h o wt oh a n d l et h ep e t r o c h e m i c a li n f o r m a t i o na n dm a k ed e c i s i o n s e x a c t l yi si m p o r t a n tf o rt h ee m p r i s e s u s u a l l y ,t h et r a d i t i o n a ls t a t i s t i c si su s e df o r c a l c u l a t i n gt h ed e m a n d so fg a ss t a t i o n s ,t h e n ,t h er e p o r t sa r ep a s s e dt oh i g h e r d e p a r t m e n t ss t e pb ys t e p a c c o r d i n gt op r o d u c t i o na n di n v e n t o r y ,e m p r i s e sm a k e r e f i n e do i l st r a n s f e r s d e c i s i o n m a k i n g sa r ee x e c u t e ds l o w l y s ot h a t ,w h e no n e k i n do fr e f i n e do i li sn e e d e di nm a r k e t ,i t si n v e n t o r yi sn o te n o u g h b u tu n n e e d e d r e f i n e do i lo v e r s t o c ki nt h es t o c k r o o m t h o s ep h e n o m e n aa r ee a s i l ya p p e a r e d s o , i nf a c eo ft h ef i e r c em a r k e tc o m p e t i t i o n ,t h em o r ea d v a n c e ds t u d i e so f t e c h n o l o g y a n dm e t h o d si np e t r o c h e m i c a li n f o r m a t i o np r o c e s s i n ga r es i g n i f i c a n tf o rt h e s e e n t e r p r i s e s i nt h ep a s t ,m o s te n t e r p r i s e su s e dt h ee a r l i e rc l i e n t s e r v e r - b a s e d p e t r o c h e m i c a l i n f o r m a t i o n s y s t e m ,a d o p t e d t r a d i t i o n a ls t a t i s t i c st oh a n d l e i n f o r m a t i o n ,a n dm a d ed e c i s i o n sb yv i r t u eo fe x p e r i e n c e s i nv i e wo ft h o s e s i t u a t i o n s ,t h i sp a p e ra d o p t sr o u g hs e t t oh a n d l ep e t r o c h e m i c a li n f o r m a t i o n , o b t a i n st h es c i e n t i f i cd e c i s i o n a n dap e t r o c h e m i c a li n f o r m a t i o np r o c e s s i n g s y s t e mb a s e do nb r o w s e r s e r v e ri sb u i l tu pi nt h i sp a p e r a tf i r s t ,i nt h i sp a p e r ,r o u g hs e ta n di t sa d v a n t a g ea r ei n t r o d u c e d ,a n dt h e a t t r i b u t er e d u c t i o nf l o wo fp e t r o c h e m i c a li n f o r m a t i o nb a s e do nd i s c e r n i b i l i t y m a t r i xi sg i v e no u t r o u g hs e ti su s e dt oh a n d l ep e t r o c h e m i c a li n f o r m a t i o n ,t h e n - 哈尔滨理工大学工学硕k - 学位论文 d e c i s i o nr u l e so fp e t r o c h e m i c a li n f o r m a t i o n i so b t a i n e d t h r o u g h a t t r i b u t e r e d u c i n g a n ds c i e n t i f i cr e f e r e n c e so fd e c i s i o ni sp r o v i d e d t h e r e f o r e ,d e c i s i o n - m a k i n gd e p e n d e do np r e v i o u se x p e r i e n c e s i sn o tn e e d e d s e c o n d l y ,w o r k i n g p r i n c i p l e o fb r o w s e r s e r v e ra n dt h ea d v a n t a g e so fb r o w s e r s e r v e ra g a i n s t c l i e n t s e r v e ra r ei n t r o d u c e d ,a n dt h es y s t e ml a y e r so fp e t r o c h e m i c a li n f o r m a t i o n s y s t e mb a s e do nb r o w s e r s e r v e ra r eb r o u g h tf o r w a r d a c c o r d i n gt oe m p r i s e s o p e r a t i n g a n db u s i n e s sr e q u e s t s ,t h ep e t r o c h e m i c a l i n f o r m a t i o np r o c e s s i n g s y s t e mw i t ht h ea b i l i t yo fd e c i s i o n - m a k i n g i sb u i l tu p ,w h i c hi sb a s e do n b r o w s e r s e r v e r i nt h i sp a p e r , n e t w o r kt e c h n o l o g y , d a t a b a s et e c h n o l o g ya n d d y n a m i cp a g et e c h n o l o g ya r ea p p l i e di nt h i ss y s t e m a n dt h ea r c h i t e c t u r e sa n d f u n c t i o n so ft h ew h o l es y s t e ma r ei n t r o d u c e d e v e r ym o d u l e so ft h es o f t w a r ea r e d e s i g n e di nd e t a i l f i n a l l y , c o n c l u s i o n sa b o u tt h ep 印e ra r eg i v e n k e y w o r d sr o u g hs e t ,a t t r i b u t er e d u c t i o n ,d i s c e r n i b i l i t ym a t r i x ,p e t r o c h e m i c a l i n f o r m a t i o n ,b r o w s e r s e r v e r i i i 第1 章绪论 随着国民经济和汽车、运输、化工等相关产业的迅猛发展,我国成为世 界上继美国之后的第二大石油消费国,石化能源消费量呈现快速增长的势 头,石化能源需求与日俱增。随之而来的石化资源的流通问题就成了石化企 业关心的问题,尤其是石化资源的“进一销一存( 购进一销售一库存) ”环节 直接影响着石化公司的市场供给能力、抗风险能力、经济效益等,是石化企 业的生存之本。面对日益激烈的市场竞争,石化信息的处理对石化企业的经 营及长远发展至关重要。 1 1 课题研究的背景及意义 石油资源是一种关系国计民生的战略性物资和特殊商品,是工业制造、 运输、国防以及居民生活等各方面都离不开的基础动力能源。石油和化学工 业企业,是我国国民经济的支柱产业。石油和化工企业的发展将有力地支撑 和推动我国经济的发展,其经营发展与经济效益是关系到我国国民经济增长 的重要因素之一。 我国加入世界贸易组织( w o r l dt r a d eo r g a n i z a t i o n ) 之后,按照w t o 规则 的要求,我国已于2 0 0 4 年1 2 月开始相继开放石油( 主要指成品油) 零售市场 和批发市场【l i 。国际石油巨头抢滩中国市场的态势非常明显,国内石化市场 竞争更加激烈。石化企业想要在激烈的竞争中获得经济利润,占有一席之 地,石化信息的处理能力及决策能力显得尤为重要。因而,除中石油、中石 化和中海油大型国企之外的中小型石化企业更是注重石化资源的“进一销一 存”问题。石化资源购进太多将占用企业大量的流动资金;购进太少又无法 抵抗市场的竞争风险。销售量太小,将影响企业的生产经营;销售量太大, 将增大企业经营风险;库存量太低,将会对企业生产运行造成威胁:库存量 太高,又会影响企业资金的使用效率。石化企业必需正确并及时地处理石化 信息,了解石化市场供求关系,把握市场价格波动规律,正确分析市场走 势,做出科学经营决策。以往经营决策都是靠经验,而面对激烈的市场竞 争,这些经营决策必须有大量而又准确的科学数据作后盾,必须有正确的分 析方法和技术作保证,这样,才能保证石化企业的正常的生产经营,才能保 证中小型石化企业不被国内外巨头企业排挤,不被市场淘汰。 哈尔滨理t 大学工学硕士学位论文 2 0 世纪6 0 年代以后,我国石化企业的石化信息处理在具体操作上还处 于“拍脑袋 和手工化的传统方式,尤其在优化石化资源的“进一销一存 环节、准确掌握市场需求并做出敏捷的决策调整、高质高效地提供客户服务 以赢得市场等方面的信息化水平还相当落后。8 0 年代,我国加快石化企业 信息化进程,多数企业开始使用软件来处理石化信息,具体方法还是传统的 数理统计方法,只是由原先的人工统计变成了电脑软件统计,工作效率有所 提高,可是处理信息的基本方法没有改变。进入2 1 世纪,除了资金雄厚的 大型国有石化企业采用国外的价格昂贵的专业管理软件外,中小型企业还是 更多地使用数理统计方法。随着石化信息量的快速增加,市场竞争的日益激 烈,“进一销一存 决策及时应对要求的提高,数理统计方法已不能满足当 前需要,显露出很多弊端。 数理统计学是研究随机现象统计规律性的一门学科。它是通过大量表示 随机现象的数量特征的数据的搜集、整理、分析和推断,从而发现随机现象 的统计规律。因为石化信息存在大量的随机现象,所以,作为从定量方面研 究信息的统计学,主要是从大量的总体信息( 或数据) 中随机抽取一部分信息 ( 或数据) ,通过对抽取的部分信息( 或数据) 的研究得到关于总体的规律,由 于抽取的样本的随机性和差异性,因而从样本中得到的信息与总体的信息之 间必然存在着误差,不能准确反映总体信息情况。并且统计学在石化信息的 处理上主要用的方法单一,即计算平均数或加权平均数等。 所以从某种程度来说,用数理统计方法,即从部分信息推断出总体信 息,具有某种不确定性、不精确性。而粗糙集理论无需任何关于数据的先验 信息和附加信息,对问题的不确定性、不精确性描述和处理比较客观,能分 析挖掘隐藏在数据中的事实。使用粗糙集理论来处理石化的海量信息对石化 企业来说具有重要的实际意义。 石化资源的“进一销一存 一方面对于中小型石化企业而言是最重要的 利润来源之一。另一方面,对于国民经济稳步发展、国家石化资源的可持续 发展以及国家能源安全而言事关重大1 2 1 。因此,面对日益激烈的竞争,更加 先进的石化信息处理技术与方法对中小型石化企业来说至关重要。 1 2 国内外发展概况及研究现状 本论文是选用粗糙集理论来研究石化信息的处理问题,并建立基于b s 结构的石化信息处理系统。所以,分别介绍粗糙集理论和石化信息处理系统 哈尔滨理工大学t 学硕上学位论文 的发展概况及研究现状。 1 2 1 粗糙集理论的发展概况及研究现状 粗糙集理论( r o u g hs e t ,r s ) 作为一种处理不精确、不确定与不完全数据 信息的新的数学理论,最初是由波兰数学家z p a w l a k 于1 9 8 2 年提出的。它 通过不可分辨关系对论域进行划分,用上、下近似集合对给定概念进行逼 近,从而得出粗糙的概念表示形式,将不确定或不精确的知识用已知的知识 来近似刻画。粗糙集理论不仅为信息科学和认知科学提供了新的科学逻辑和 研究方法,而且为智能信息处理和数据挖掘提供了有效的技术。 由于最初关于粗糙集理论的研究大部分是用波兰语发表的,因此当时没 有引起国际计算机学界和数学界的重视,研究地域也仅局限在东欧一些国 家,直到2 0 世纪8 0 年代末才逐渐引起各国学者的注意。1 9 9 2 年,第一届 关于粗糙集理论国际学术会议在波兰k i e k r z 召开1 4 。1 9 9 5 年,a c m c o m m u n i c a t i o n 将其列为新浮现的计算机科学的研究课题。1 9 9 9 年,在日本 东京召开的第七届粗糙集、模糊集、数据挖掘和粒度一软计算国际会议,推 动了亚洲地区对粗糙集理论与应用的研究。2 0 0 1 年5 月第一届中国粗糙集 理论与软计算学术研讨会在重庆举行【5 1 。2 0 0 4 年l o 月,第四届中国r o u g h 集与软计算学术研讨会在浙江舟山举行。2 0 0 6 年,粗糙集知识技术国际会 议在重庆召开。这些国际学术会议在我国的举办标志着我国对粗糙集理论研 究与应用已经达到国际同行的先进水平,并且形成了一支较强的研究队伍。 目前,粗糙集理论已成为人工智能和智能信息处理领域中一个较新的学 术研究和技术应用热点,在机器学习、专家系统、知识发现、数据挖掘、决 策分析、医疗诊断、过程控制、模式识别与人工智能等许多领域中得到了广 泛的应用1 6 1 。 国外粗糙集领域的研究主要集中在约简的优化算法、粗糙集理论和模糊 理论、粗糙集理论同神经网络理论等其他人工智能技术的结合、粗糙逻辑等 课题上,波兰、加拿大、日本和美国关于粗糙集的理论研究与应用处于世界 前列。基于粗糙集理论的原型系统主要有,波兰华沙大学和挪威科技大学联 合开发的基于粗糙集的决策分析系统r o s e t t a 及其增强版r e s e t 7 1 。加拿大 r e g i n a 大学研制开发的基于变精度粗糙集模型,主要用于市场分析的知识 发现系统k d d r t s l 。美国k a n s a s 大学开发的用于环境保护、气候研究【9 1 和 医疗诊断的实例学习系统l e r e 等【1 0 1 。这些系统实现了粗糙集模型的基本功 哈尔滨理工大学工学硕上学位论文 能,在不同的领域取得了较好的应用效果,在满足实际问题需要的同时也对 粗糙集理论基础有了进一步的扩展。 与国外相比,我国在粗糙集领域的研究起步较晚,但是发展速度很快, 国内对粗糙集理论基础理论及应用的研究始于9 0 年代中期。曾黄麟、王国 胤、刘清、张文修和史开泉等先后出版了关于粗糙集理论的专著【l 。目前中 科院计算所、中科院自动化所、清华大学、西安交通大学、浙江大学、同济 大学等十余所研究机构和高校已经加入到这个领域,对粗糙集理论有较为深 入的研究,并取得了一定的成果。例如,癌症病灶的医学诊断【1 2 】、故障诊 断【l3 1 、财务预警和车牌识别等1 1 4 】。这些工作表明我国粗糙集理论研究的队 伍正在不断壮大,已经得到国际同行的重视和认可。 1 2 2 石化信息处理系统的发展概况及现状 信息技术的飞速发展和i n t e m e t 技术的普及,为石化信息的存储、传播 和处理提供了广泛的基础,促使了石化生产经营方式的变革,同时也积累了 大量的数据。面对与日俱增的海量信息,人们迫切需要相应的技术,迅速、 准确、有效地处理海量数据信息,以满足石化企业决策的需要。 国外的石化企业在战略决策的信息化方面开发和应用起步较早,已绝大 多数采用了先进的b s ( 浏览器月艮务器) 体系结构,或者两者的混合结构。和 国内相比,技术相对成熟许多,现在许多的大型信息系统开发商,s u n , o r a c l e ,b o r l a n d ,m i c r o s o f t 等都有相当成熟的商业化产品。国外的石化企 业已经普遍应用了e r p ( 企业资源计划) 、s c m ( 供应链管理) 和电子商务平台 等先进的信息技术,领先的s a p 解决方案等。 我国作为当今经济稳定快速发展的国家之一,把信息技术的研究和发展 作为科学技术发展的重点,提出“以信息化带动产业化的战略目标【3 l 。在 国内,资金雄厚的大型国企采用三层b s 体系结构来构建石化信息处理平 台,大部分的中小型石化企业采用传统的二层c s ( 客户机服务器) 体系结 构,一部分小型石化企业还停留在人工操作,人工报表,人工统计的石化信 息处理水平上。 传统的石化信息处理系统一般建立在c s 体系结构之上【 】。c s 体系结 构即c l i e n t s e r v e r ( 客户机服务器) 体系结构,出现于2 0 世纪8 0 年代,属于 胖客户结构,一般分为两层:第一层是客户机系统,结合了用户界面与业务 逻辑;第二层是服务器层。客户端通过客户应用程序直接访问服务器,优点 哈尔滨理1 二人学工学硕上学位论文 是效率较高,对服务器要求较低。 但是,随着石化企业的不断发展,运营方式的不断变化,规模的不断扩 大,应用程序的复杂度越来越高,网络系统的高度集成化以及对分布和跨平 台操作要求的提高,c s 体系结构显露出很多弊端。 1 - 移植性差c s 结构缺乏作为企业级应用平台的一些特性,难以扩 展到互联网环境中去,不同平台上开发出来的软件,很难交互使用,客户端 软件和服务器端软件只能工作在特定的硬件平台和操作系统环境下。 2 升级维护代价高客户端需要安装专用的客户端软件。由于多数 c s 结构的多数任务在客户端应用程序完成,因此对于一个已经建立起来并 运行的c s 应用系统而言,应用程序的任何微小变动,都需要维护人员对每 个客户端进行修改,维护复杂,升级麻烦。 3 信息共享性差两层c s 结构是单一服务器且以局域网为中心的, 很难扩展至大型企业广域网或i n t e r n e t ,无法做到通过浏览器上网就可以进 行信息处理,无法满足客户及企业之间信息交互、共享的需求。 b s 体系结构即b r o w s e r s e r v e r ( 浏览器服务器) 体系结构,是随着 i n t e m e t 的快速发展和w e b 技术的日益成熟,于2 0 世纪9 0 年代发展起来 的,是对c s 体系结构的一种改进的结构【1 6 1 。在这种结构下,石化信息处 理系统的用户界面是通过w w w 浏览器来实现,极少部分事务逻辑在前端 ( b r o w s e r ) 实现,但是主要事务逻辑在服务器端( s e r v e r ) 实现。这样,就大大 地简化了客户端的电脑载荷,减轻了系统维护与升级的成本和工作量,并且 降低了用户的总体成本【1 7 l 。目前b s 体系结构已成为分布式计算处理的网 络系统的主流,属于瘦客户结构。它一般分为三层:第一层为客户端的浏览 器层,第二层为中间服务器层,第三层为后端服务器层。它较好地解决了 c s 体系结构的不足,实现了分布式的、动态的、跨平台的、交互式的、易 于集成和扩展的操作。 b s 结构与c s 结构相比,具有以下优点: 1 b s 结构对用户的硬件要求比较低,用户端只需较低的配置就可以获 得不错的性能。而c s 结构对客户端机器的要求比较高。 2 b s 客户端只需安装通用的浏览器不需安装专用的客户端软件。c s 结构的开发和维护成本较高。对不同客户端要开发不同的程序,编程工作量 较大。 3 b s 结构提供了一致的用户界面。c s 结构根据客户端软件的不同呈 现不同的界面。 哈尔滨理工大学t 学硕上学位论文 4 b s 结构的数据实时性强,特别适用于网上信息发布,使得传统的信 息系统得功能易扩展。 5 b s 结构灵活性强。b s 结构三个模块相对独立,一个模块发生变动 时不会影响其他模块,使系统升级非常容易。c s 结构中一个模块的改动会 影响到另一个模块,所以升级困难。 因此,随着石化企业经营规模的不断扩大,数据库复杂度的不断提高, 信息实时处理要求的不断提高,传统的c s 结构不能满足当前石化信息处理 系统的要求,基于b s 结构的石化信息处理系统开发模式的研究,已成为我 国石化企业经济发展的当务之急【l 。】,b s 结构也将很多石化应用系统的网络 体系结构的研究带入一个新阶段【”l 。 1 3 本课题的主要研究内容 1 简要地回顾当前石化信息处理技术的发展与现状,分析石化信息处 理技术存在的问题,即传统数理统计方法在石化信息处理上存在的弊端,进 行了粗糙集理论处理石化信息的尝试。 2 研究粗糙集理论的在石化信息处理中的应用。研究粗糙集的各种算 法,如基本算法、启发式算法、遗传算法、扩展算法等,尤其深入研究经典 的基于区分矩阵的属性约简算法及其在石化信息处理中的应用。 3 对石化信息处理系统采用的b s ( 浏览器服务器) 体系结构的演变与 发展作了系统的研究,对b s 结构的优点进行分析,对b s 结构的信息处 理系统的设计与开发模式进行了分析。 4 研究了应用三层b s 体系结构开发石化信息系统的思路和方法。应 用b s 三层体系结构,构建了石化信息处理系统的模型,开发了具有决策功 能的石化信息处理系统。 哈尔滨理工人学t 学硕十学位论文 第2 章粗糙集理论基础 粗糙集理论( r o u g hs e t ,r s ) 作为一种处理不精确、不确定与不完全数据 信息的新的数学理论,最初是由波兰数学家z p a w l a k 于1 9 8 2 年提出的。它 通过不可分辨关系对论域进行划分,用上、下近似集合对给定概念进行逼 近,从而得出粗糙的概念表示形式,将不确定或不精确的知识用已知的知识 来近似刻画1 2 0 。粗糙集理论不仅为信息科学和认知科学提供了新的科学逻 辑和研究方法,而且为智能信息处理和数据挖掘提供了有效的技术,它能有 效地解决下列问题:发现属性之间的依赖关系、计算属性重要度、冗余属性 和数据的约简、求属性及属性值的核、获取决策规则等。下面介绍粗糙集理 论的基础知识【2 1 1 。 2 1 知识与知识库 “知识”这个概念在不同的范畴内有多种不同的含义【2 2 1 。在粗糙集理 论中,“知识 被认为是一种分类能力【2 3 1 。人们的行为是基于分辨现实的或 抽象的对象的能力,如在远古时代,人们为了生存必须能分辨出什么可以食 用,什么不可以食用;医生给病人诊断,必须辨别出患者得的是哪一种病。 这些根据事物的特征差别将其分i - j 另j j 类的能力均可以看作是某种“知识 。 设u 囝是我们感兴趣的对象组成的有限集合,称为论域。任何子集 x s u ,称为中的一个概念或范畴。为规范化起见,我们认为空集也是 一个概念。u 中的任何概念族称为关于u 的抽象知识,简称知识。u 上的 一族划分称为关于u 的一个知识库,它构成了一个特定论域u 的分类。 设r 是u 上的一个等价关系,u r 表示尺的所有等价类构成的集合, 【x 】。表示包含元素x u 的尺等价类。一个知识库就是一个关系系统 k = ( u ,r ) ,其中u 为非空有限集,称为论域,r 是【,上的一个等价关系。 若p r 且p a ,则n p ( p 中所有等价关系的交集) 也是一个等价关 系,称为p 上的不可区分( i n d i s e e m i b i l i t y ) 关系,记为i n d ( p ) ,且有 i x n d ( 2 拶x k ( 2 1 ) 式中,u i n d ( p ) ( 即等价关系i n d ( p ) 的所有等价类) 表示与等价关系族p 相关的知识,称为k 中关于u 的p 基本知识( p 基本集) 。为简单起见,我们 哈尔滨理工大学1 = 学硕十学位论文 用u p 代替u i n d ( p ) ,i n d ( p ) 的等价类称为知识p 的基本概念或基本范畴。 事实上,p 基本范畴是拥有知识p 的论域的基本特性,即知识的基本模块。 对于两个知识库之间的关系,有以下结论:k = ( u ,p ) 和k = ( u ,q ) 为两 个知识库,若i n d ( p ) = i n d ( q ) ,即u p = u q ,则称足和k 是等价的,记作 k k 。;当i n d ( p ) c i n d ( q ) 时,称知识p ( 知识库均比知识q ( 知识库k ) 更精 细,或者说q 比p 更粗糙;当p 比q 更精细时,也称p 为q 的特化,q 为 p 的推广。 2 2 不精确范畴与粗糙集近似 令x u ,尺为u 上的一个等价关系。当x 能表达成某些r 基本范畴 的并时,称x 是冗可定义的;否则称x 为r 不可定义的。r 可定义集也称 作r 精确集,而尺不可定义集也称为r 非精确集或r 粗糙集。 对于粗糙集可以近似地定义,我们使用两个精确集,即粗糙集的上近似 ( u p p e ra p p r o x i m a t i o n ) 和下近似( 1 0 w e ra p p r o x i m a t i o n ) 来描述。给定知识库 k = ( u ,r ) ,对于每个子集z u 和一个等价关系r i n d ( g ) ,定义两个子 集: _ e x = u y u l y x 解= u r u rl 】,n x a ) ( 2 - 2 ) ( 2 - 3 ) 分别称型和戤为x 的尺下近似集和尺上近似集。集合b n r ( x ) = 面一丛 称为x 的r 边界域;p o s r ( x ) = _ r x 称为z 的尺正域;n e g r ( x ) = u 一取称 为x 的r 负域。显然有: r x = p o s r ( x ) u b n r ( x ) ( 2 4 ) r x 或p o s 。( x ) 是由那些根据知识r 判断肯定属于x 的u 中元素组成的 集合;戤是那些根据知识r 判断可能属于x 的u 中元素组成的集合; b n 舟( x ) 是那些根据知识尺既不能判断肯定属于x 又不能判断肯定属于描的 u 中元素组成的集合;n e g 。( x ) 是那些根据知识r 判断肯定不属于x 的u 中元素组成的集合。 上近似,下近似和边界域的关系如图2 1 所示。 哈尔滨理工大学工学硕士学位论文 集合x 的边界 l x 的下近似 匿至圈x 的边界域 图2 1 粗糙近似示意图 f i g 2 - lb a s i cd i a g r a mo fr o u g ha p p r o x i m a t i o n 集合的不精确性是由于边界域的存在而引起的,集合的边界域越大,其 精确性越低。为了更准确地表达这一点,我们引入了精度概念。由等价关系 尺定义的集合x 的近似精度为: 引耻蹦 ( 2 - 5 ) 式中x a ,i x i 表示集合x 的基数。 精度口r ( x ) 用来反映我们对集合x 的知识的完全程度。显然,对每一 个r 和x u 有o ( x ) l 。当( x ) = 1 时,x 的r 边界域为空集,我 们说集合x 为尺可定义的;当口詹( x ) l 时,集合x 是非空r 边界域,我 们说集合z 为r 不可定义的。 当然,也可以用其它量度来定义集合x 的不精确程度,比如,用x 的 足粗糙度风( x ) 来定义: 风( x ) 2 1 一( x ) ( 2 - 6 ) x 的r 粗糙度与精度恰恰相反,它表示的是集合x 的知识的不完全程度。 除了用数值( 近似程度的精度) 来表示粗糙集的特征外,也可以根据上、 下近似的定义来表达粗糙集的另一个有用的特征,即拓扑特征。 下面定义四种不同的重要粗糙集: 哈尔滨理1 = 大学工学硕士学位论文 1 如果丛g 且面u ,则称x 为r 粗糙可定义: 2 如果_ r x = 彩且厨u ,则称x 为r 内不可定义; 3 如果丛囝且厨= u ,则称x 为足外不可定义; 4 如果_ r x = 0 且戤= u ,则称x 为r 全不可定义。 这个划分的直观意义如下:如果集合x 为r 粗糙可定义,则我们可以确定 u 中某些元素属于x 或描;如果x 为r 内不可定义,意味着我们可以确定 u 中某些元素是否属于硝,但不能确定u 中任一元素是否属于魁如果x 为尺外不可定义,我们可以确定u 中某些元素是否属于z 但不能确定u 中任一元素是否属于如果z 为尺全不可定义,则我们不能确定u 中任 一元素是否属于x 或也, 粗糙集的数字特征表示了集合边界域的大小,但没有说明边界域的结 构;而粗糙集的拓扑特征没有给出边界域大小的信息,它提供的是边界域的 结构。因此在粗糙集的实际应用中,我们需要将边界域的两种信息结合起 来,既要考虑精度因素,又要考虑到集合的拓扑结构。 粗糙集理论还对集合类关于近似空间的分类问题定义了上近似和下近 似。令产 局,弼, 是【,的一个分类或划分,这个分类独立于知识 天。子集z ( f = 1 ,2 ,刀) 是划分f 的类。f 的r 下近似和上近似分别定义 为:星f = 脱,脱,战) 和弦= 戤,戤,甄 。 有两个量度来描述近似分类的不精确性,第一个量度为根据知识r ,f 的近似分类精度: e i _ r x , 1 ( f ) = 等一 ( 2 - 7 ) 戤i i f f i l 第二个量度为根据知识r ,f 的近似分类质量: i 脱l 。 ( f ) = 昔 ,( 2 - 8 ) i ul 近似分类的精度描述的是当使用知识r 分类对象时,可能的决策中正 确决策的百分比;分类的质量表示的是应用知识r 能确切地划入,类的对 象的百分比。 将粗糙集的概念与普通集合论相比较,可以看出粗糙集的基本性质,如 元素的成员关系、集合的等价和包含等,都与不可区分关系所表示论域的知 哈尔滨理工人学工学硕士学位论文 识有关。因此,一个元素是否属于某一个集合,不是该元素的客观性质,而 取决于我们对它的了解程度;同样,集合的相等和包含也没有绝对的意义, 而取决于我们对所研究问题中集合的了解程度。 2 3 知识约简与知识的依赖性 粗糙集理论的两个最基本问题是:知识约简和知识的依赖性。知识约简 是考察近似空间中每个等价关系是否都是必要的,能不能在保持原有的分类 能力下尽可能地删去冗余的知识。而能否从给定的知识中导出另一知识,就 是所谓的知识依赖性问题。依赖性决定知识是否可以进行约简,根据依赖性 所定义的知识的重要性往往是知识约简的重要启发式信息【2 4 1 。 知识约简是粗糙集理论的核心内容之一。给定的一个知识库,是否可以 用较少的知识表达同样的概念。也就是说,删除了知识库中的一些知识是否 又使它能够与原来的知识库具有相同的表达能力。这就是知识的简化, 约 简【2 5 j 。 约简与核是知识约简的两个基本概念。 令r 为一族等价关系,r r ,如果i n d ( r ) = i n d ( r 尺 ) 则称月为r 中 不必要的:否则称r 为r 中必要的。如果每一个r r 都为r 中必要的,则 称r 为独立的;否则称r 为依赖的或非独立的。 设q p 。如果q 是独立的,且i n d ( q ) = i n d ( p ) ,则称q 为p 的一个约 简。显然,p 可以有多个约简。p 中所有必要关系组成的集合称为p 的核, 记作c o r e ( p ) 。 核与约简有如下关系: c o r e ( p ) = n r e d ( p )( 2 9 ) 式中,r e d ( p ) 表示p 的所有约简。可以看出,核这个概念的用处有两个 方面:首先它可以作为所有约简的计算基础,因为核包含在所有的约简之 中,并且计算可以直接进行;其次可解释为在知识约简时它是不能消去的知 识特征集合。 在应用中,一个分类相对于另一个分类的关系十分重要。令p 和q 为 u 中的等价关系,q 的尸正域记为p o s 尸( 9 ) ,即 p o s j p ( q ) = u 蹦 ( 2 一l o ) 哈尔滨理工大学t 学硕l 学位论文 式中,q 的尸正域是u 中所有根据划分u p 的信息可以准确地分类到 关系q 的等价类中去的对象集合。 令p 和q 为等价关系族,r p ,如果 p o s m d o , ) ( i n d ( q ) ) = p o s i 咄p 剐( i n d ( q ) ) ( 2 11 ) 则称r 为p 中q 不必要的;否则尺为p 中q 必要的。为简单起见,也用 p o s p ( q ) 代替p o s i i i d ( p ) ( i n d ( q ) ) 。如果p 中的每个尺都为q 必要的,则称p 为 q 独立的。 设s p ,s 为p 的q 约简当且仅当s 是p 的q 独立子族且 p o s 。( q ) = p o s ,( q ) 。p 的q 约简简称为相对约简,p 中所有q 必要的原始关 系构成的集合称为p 的q 核,简称为相对核,记为c o r e q ( p ) 。 相对核与相对约简的关系如下: c o m q ( p ) = n r e d q ( p ) ( 2 - 1 2 ) 式中r e d q ( p ) 是所有p 的q 约简构成的集合。 知识的依赖性可形式化地定义如下:令k = ( u ,r ) 是一个知识库,p , q p 。 1 知识q 依赖于知识p ( 记作pjq ) 当且仅当i n d ( p ) ci n d ( q ) ; 2 知识p 与知识q 等价( 记作p 暑q ) 当且仅当pjq 且qjp ; 3 知识p 与知识q 独立( 记作p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年秋季新教材统编版九年级上册道德与法治全册知识点背诵提纲精简版
- 广东省东莞市中学堂镇六校2026届中考物理模拟预测试卷含解析
- 成本实操-游乐场的成本核算案例
- 山东省滕州市达标名校2026届中考物理仿真试卷含解析
- 前置胎盘产后恢复护理查房
- 梁、板技术交底
- 中压碰口作业动土施工方案
- 常州市天宁区2025届数学三下期末质量检测模拟试题含解析
- 梧州社区工作者考试真题库(2025版)
- 护理风险防范的法律法规解读
- 中暑教育课件
- 和客户谈恋爱-销售流程与技巧课件
- 乡愁朗诵课件
- 大学学院资产管理与招标采购应知应会手册
- DB34T 4324-2022 水泥土搅拌桩地基加固施工技术规程
- 编外事业单位考试题目
- 《高速公路日常养护巡查检查作业规程》
- (正式版)JBT 11880.12-2024 柴油机 选择性催化还原(SCR)系统 第12部分:尿素品质液位传感器
- 植物微生物组的系统生物学探究
- PPK初始过程能力研究报告表
- 超长无缝混凝土结构技术规程
评论
0/150
提交评论