




已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 粗糙集理论是处理不完备信息的一种方法,它是建立在这样一种假设l ,1 下 即:对论域中的每个对象总是有一些信息是相互联系的,并且对象仅由能够较容 易获得的有效信息来描述。因此对于具有相同信息的不同对象可以将其看作在已 知的信息中是不可区分f i l l 3 “1 的,所以有效信息可以用等价关系来表述,称之为 不可区分关系,其中每个等价类由不可区分的对象组成。 汪培庄教授于8 0 年代初提出因素空间1 2 6 1 t 2 ”,1 9 8 2 年他正式发表了有关因素 空间的论文。现代控制论中的状态空间,模式识别中的特征空间和参数空间,现 代物理中的相空间等都是因素空间的特殊情形。 粗糙集理论和因素空间在各个方面有着广泛的应用,由于粗糙集理论将等价 关系对空间的划分与知识等同,即将知识理解为对数据的划分,任何u 的子集称 为u 中的一个概念或范畴。粗糙集的研究对象叫j 【1 8 1 是由一个多值属性( 特征、 症状、特性等) 集合描述的一个对象( 观察、病历等) 集合,对于每个对象及其 属性都有一个值作为其描述符号,对象、属性和描述符是表达决策问题的3 个基 本要素。这种表达形式也可以看成为一个二维表格,表格的行与对象相对应,列 对应于对象的属性;各行包含了表示相应对象信息的描述符,还有关于各个对象 的类别成员的信息。于是形成了粗糙集理论的知识库叫儿l8 1 ,而因素空间理论的 因素空间与知识库之间具有定的关系,我们在本文中讨论t - - 者之间的关系。 另外,由于知识的不完备,我们在进行知识获取邮1 之前需要对数据进行预 处理,包括原始数据的采样、收集和整理。但是,我们获得的原始数据不一定适 合直接用于知识获取,通常还要进行预处理加工,对于原始数据资料中遗漏的信 息,需要补充。对遗漏信息进行补充的方法有多种,本文提出了一种基于决策的 数据补全方法,并举例说明其有效性。 关键词:粗糙集理论:因素;状态空间;因素空间:描述架;知识表达系统;容 差关系:决策内容差类;决策外容差类;决策表系统 a b s t r a c t r o u g hs e tt h e o r yi s a na t t e m p tt ot a c k l i n gt h ep r o b l e mo fi m p e r f e c t k n o w l e d g e i nr o u g hs e tt h e o r y ,w ea s s u m e t h a tw i t he v e r yo b j e c ts o m e i n f o r m a t i o ni sa s s o c i a t e da n do b j e c t s c a n b e “s e e n ”t h r o u g h t h e a c c e s s i b l ei n f o r m a t i o no n l y h e n c e ,o b j e c tw i t ht h es a m ei n f o r m a t i o nc a n n o tb ed i s c e r n e da n d a p p e a r a st h es a m e t h i sr e s u l t si n ,t h a t i n d i s c e r n i b l eo b j e c t so ft h eu n i v e r s ef o r mc l u s t e r so fi n d i s t i n g u i s h a b l e o b j e c t t h ec o n c e p to ff a c t o rs p a c e p r o p o s e db yw a n g p eiz h u a n g i n1 9 8 2 h e d e l i v e r e dt h e s i sa b o u tf a c t o rs p a c ef o r m a l l y n o w ,t h e r ea r em a n ya s p e c t t h a ti so n eo ff a c t o rs p a c e ,s u c ha s ,t h es t a t es p a c eo fm o d e r nc o n t r o l t h e o r y ,f e a t u r es p a c ea n dp a r a m e t e rs p a c ei nm o d e li d e n t i f y r o u g h s e t t h e o r y a n df a c t o r s p a c e a r ea l l a p p l i e dw o r l d l y t h e p a r t i t i o nd e t e r m i n e db ye q u i v a l e n c er e l a t i o ni st h es a m ea sk n o w l e d g ei n r o u g hs e tt h e o r y ,t h a ti s ,k n o w l e d g ei sr e g a r d e da sap a r t i t i o no fd a t a a n ys e to fa l li n d i s c e r n i b l eo b j e c t si sc a l l e da ne l e m e n t a r yc o n c e p t s t h er e s e a r c ho b j e c t si sd e s c r i b e db yam u l t i a t t r i b u t es e t w i t he v e r y o b j e c t ,t h e r eh a sav a l u ed e s c r i b i n gt h ea t t r i b u t e o b j e c t ,a t t r i b u t ea n d a t t r i b u t e v a l u ea r et h r e ee l e m e n tt ot h ep r o b l e mo fd e c i s i o n d a t aa r e o f t e np r e s e n t e da si n f o r m a t i o nt a b l e s ,c o l u m no fw h i c ha r el a b e l l e db y a t t r i b u t e s ,r o w sb yo b j e c t sa n de n t r i e so ft h et a b l ea r ea t t r i b u t e v a l u e s s ot h et a b l ei st h ed a t a b a s eo fr o u g hs e t t h e o r y h o w e v e r ,t h e r eh a v e r e l a t i o nb e t w e e nf a c t o rs p a c ea n dd a t a b a s e i nt h ea r t i c l e ,w ea r g u e dt h e r e l a t i o n s o m e t i m e s ,t h ep o o rd a t a b a s ei sv e r yc o m m o nw h e ny o uu s et h e m s ot h e d e m a n d i n gd a t a b a s em u s tb ee f f e e t i v ec o l l e c t i o n t tm u s tb ed o n et h a t c o l l e c t i n ga n da r r a n g e m e n tb e f o r e a c q u i r i n gk n o w l e d g e h o w e v e r ,t h e a c q u i r e d d a t a m a y n o tf i tt o a c q u i r ek n o w l e d g ed i r e c t l y i ft h e i n f o r m a t i o ni sd e f a u l t ,w em u s tf i l l i t n o wt h e r ea r em a n ym e t h o d st o f i l ld e f a u l t i nt h i sa r t i c l e t o l e r a n c er e l a t i o ni sa p p l l e dt of i l d e f a u l ti nd e c i s i o nt a b l e p r a c t i c ep r o v et h ee f f i c i e n c yo ft h em e t h o d k e yw o r d s :r o u g hs e tt h e o r y :f a c t o r ;t h es t a t es p a c e :d e s c r i p t i o nf i a m e s : k n o w l e d g er e p r e s e n t a t i o ns y s t e m :t o l e r a n c er e l a t i o n ;t o l e r a n c er e l a t i o n i nd e c i s i o n ;t o l e r a n c er e l a t i o no u td e c i s i o n : 前言 粗糙集理论是2 0 世纪8 0 年代初由波兰数学家z p a w l a k 1 首先提出的处理 不确定性知识的数学理论,经过2 0 多年的研究和发展,已经在理论和实际应用 中取得了长足进展,比如在知识发现、数据挖掘、模式识别、决策分析、机器学 习等方面和领域】【1 9 i ”o ”】。目前,粗糙集理论已成为信息科学最为活跃的研究 领域之一。同时,该理论还在医学、化学、材料学、地理学、管理科学和金融等 其他学科得到了成功的应用。在实际中有时影响f u z z y 集的因素较多f ”1 ,这类 f u z z y 集的隶属度函数是多元函数,在应用的过程中确定这样的多元函数比确定 单因素的f u z z y 集的隶属度要困难。方案对总目标的优良度可以看作是“好方案” 集合( 一个高维f u z z y 集) 的隶属度,而方案对某单目标的优良度可看作是“某 方面看的好方案”集合( 一个f u z z y 集) 的隶属度。要考虑这个合成问题,首先 得研究因素 2 6 1 2 8 1 之间的层次结构。针对这种因素间的层次结构,汪培庄教授和 李洪兴教授较系统地研究了因素空间,建立了相应的理论。 粗糙集的研究对象f 1 8 1 是由一个多值属性( 特征、症状、特性等) 集合描 述的一个对象( 观察、病历等) 集合,对于每个对象及其属性都有一个值作为其 描述符号,对象、属性和描述符是表达决策问题的3 个基本要素。这种表达形式 也可以看成为一个二维表格,即其形式与信息表的数据表格知识表达系统是一致 的,也就是说,粗糙集是在知识表达系统的基础上进行的讨论。由于因素空间中 对象在因素的影响下对应着相应的状态,我们亦可以将其看作是一个二维表。鉴 于以上两种理论对象及其因素( 属性) 的表示方式的类似,很自然的我们想到二 者之间有何联系及区别。并且由于在进行知识获取呻1 之前,我们要对原始数据 进行预处理,由于采集到的原始数据不一定是完备呻1 的,因此我们首先要通过 一定的途径来对信息表中的遗漏数据进行补全。 本文对粗糙集的知识表达系统以及因素空间作了比较,并提出了一种基于决 策的数据补全方法。本文的写作得到了导师刘文奇教授的悉心指导和帮助,特此 谨致衷心的感谢! 鉴于作者现有的水平和能力,加之自身知识的局限性,本文不 妥与不完善之处在所难免,敬请各位老师不吝斧正! 昆明理工大学学位论文原创性声明 y - 6 6 9 = 7 7 7 本人郑重声明:所呈交的学位论文,是本人在导师的指导下进行 研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含 任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做 出重要贡献的个人和集体,均已在论文中作了明确的说明并表示了谢 意。本声明的法律结果由本人承担。 学位论文作者签名:零终 日期:p j 年 月七日 关于论文使用授权的说明 本人完全了解昆明理工大学有关保留、使用学位论文的规定,即: 学校有权保留、送交论文的复印件,允许论文被查阅,学校可以公布 论文的全部或部分内容,可以采用影印或其他复制手段保存论文。 ( 保密论文在解密后应遵守) tl j 尸,一 导师签名: :一! 论文作者签名 v 日 期:! ! 生二旦二! 旦 昆明理工大学硕士研究生学位论文 第一章绪论 1 1 粗糙集理论概述 1 1 1 粗糙集理论的研究概况 r o u g h 集理论1 是由波兰华沙理工大学p a w l a k 教授于2 0 世纪8 0 年代初 提出的一个分析数据的数学理论i l l 6 l ,是一种研究不完整、不确定知识和数据的 表达、学习、归纳的理论方法,并且在人工智能和认知科学,特别是在智能信息 处理 1s l 2 0 1 方面,如知识的表达与推理、数据分析、机器学习和知识发现等领域 得到了广泛的应用。引起了世界各国学者的广泛关注,掀起了粗糙集理论研究和 应用的热潮。许多国际性的学术会议、专题讨论和众多的知名学者纷纷将粗糙集 引入自己的研究项目和计划,涌现了大量高质量、高水平的学术论文和研究成果, 使粗糙集理论取得了进一步的发展和丰富。 粗糙集理论是建立在分类机制的基础上的【3 】 ”,它将分类理解为特定空 间u 上的等价关系,而这些等价关系构成了u 上的划分。粗糙集理论将等价关 系对空间的划分与知识等同,即将知识理解为对数据的划分,任何u 的子集称为 u 中的一个概念或范畴 1 1 1 1 6 1 。粗糙集的研究对象邮】【1 8 l 是由一个多值属性( 特征、 症状、特性等) 集合描述的一个对象( 观察、病历等) 集合,对于每个对象及其 属性都有一个值作为其描述符号,对象、属性和描述符是表达决策问题的3 个基 本要素。这种表达形式也可以看成为一个二维表格 1 5 1 ”】【1 8 l ,表格的行与对象相 对应,列对应于对象的属性;各行包含了表示相应对象信息的描述符,还有关于 各个对象的类别成员的信息。通常,关于对象的可得到的信息不一定足以划分其 成员类别,即是这种不精确性导致了对象的不可分辨性。经典粗糙集理论i “l 从 人的认知n 6 们0 1 特性出发,把知识看作是对论域的一种划分能力,认为知识是有 粒度的,因此引入代数学中的等价关系利用上、下近似这两个基本概念来讨论知 昆明理工大学硕士研究生学位论文 识。粗糙集理论的主要思想呻1 是利用已知的数据库,将不精确或不确定的知识 用已知的数据库中的知识来近似亥姣。 粗糙集理论与其它处理不精确、不确定问题理论的最显著的区别畔1 是它无需 提供所需处理的数据集合之外的任何先验信息,无需对知识或数据的局部给予主 观评价,所以它对问题的不确定性的描述或处理比较客观。但是,一方面,运用 粗糙集理论处理决策表时,要求决策表中的值用离散数据表达。如果某些属性的 值域为连续值,则在处理前必须进行离散化处理,而且,即使对于离散数据,有 时也需要通过将离散值进行合并( 抽象) 得到更高更抽象层次的离散值:另一方 面,粗糙集理论以不可分辨关系为基础,把论域划分为等价类,形成粗糙集的上 近似和下近似。在实际应用中,建立粗糙集的知识库。往往把知识划分的过细, 导致问题的复杂化。因此,粗糙集理论需要与其它具有处理不精确或不确定问题 的理论( 如概率论、模糊数学和证据理论等) 进行相互补充。 粗糙集理论的研究已经经历了1 0 多年的时间,无论是在系统理论、计算机 模型的建立和应用系统的研制开发上,都已取得了很多成果,也建立了一套较为 完善的粗糙集理论体系。 目前,对粗糙集的研究主要集中在1 1 9 】【2 0 l 】:粗糙集模型的推广;问题的不确 定性研究;与其它处理不确定性、模糊性问题的数学理论的关系和互补:纯肄的 数学理论方面的研究;粗糙集的数学性质研究:粗糙集的有效算法研究和人工智 能其它方向关系的研究等等。 1 1 2 粗糙集模型的推广 广义粗糙集是对标准粗糙集模型的变形和推广 2 0 l 。推广的角度不同,所得 到的广义模型也不同。从目前已有的广义粗糙集模型来看,模型的推广主要是从 逼近算子的构造方向上,包括有两类( 1 ) 从模型的代数结构入手,将定义标准 粗糙集的等价关系推广为相应的二元关系,得到各种形式的代数粗糙集模型;( 2 ) 将粗糙集理论推广到实数域中,研究诸如粗糙集、粗微分、粗积分等一般数学问 题的租糙函数模型。在粗糙隶属函数的推广方面,主要包括( 1 ) 将概率论的观 点和统计信息引入到p a w l a k 模型中的概率粗糙集模型( 2 ) 以及最近出现的将粗 糙包含概念引入到近似推理中的粗糙m e r e o l o g y 等。 昆明理t 大学硕士研究生学位论文 1 1 3 不确定- 性问题的理论研究 粗糙集理论中知识的不确定性,既有客观原因,又有主观原因呻1 。对于知识, 造成其不确定的客观因素,除了随机性和模糊性外,还有知识之间的冲突( 不一 致) 、经验知识形成的局限、知识获取的不完全等。人的经验知识往往是通过以 下几种推理方式形成的:归纳推理、拓广推理、类比推理、统计推理、逆向推理、 似然推理等。人们通过这些方法获得的经验知识是具有不确定性的。而且,人类 对于客观世界的认识是不完全的,而是不断发展和改进的,这就决定了我们在处 理很多问题的时候所具有的知识不是完全的。 在建立系统、构造知识库的时候,也可能产生不确定性m 1 。首先,两个事件 之间的因果关系不是简单的、容易指定的。任何事件都和很多复杂因素有关,并 不是孤立的,我们在建立系统模型的时候,需要严格地限定模型,抓住主要因素, 而忽略一些次要因素,这样得到的系统和知识库自然具有不确定性。其次,一些 经验知识,特别是直觉知识,我们难于表达精确。再次,知识表达语言也会引入 不确定性,特别是用自然语言表达知识的时候,更是难于避免由于自然语言本身 的含糊性所带来的不确定性。另外,机器中存储、使用的知识总是有限的,这也 会导致不确定性。对于通过机器学习所获得的知识,也会由于学习样例的不足、 学习算法的不完备、学习过程处理所带来的不确定等等原因,产生不确定性。 1 1 4 与其它处理不确定性方法的理论的研究 在粗糙集理论与其它处理不确定性或模糊性方法之间关系的研究中,目前, 主要讨论它与模糊集理论、d e m p s t e r - - s h a f e r ( d s ) 证据理论、概率论和信息 论等的渗透和互补【1 9 】。 1 1 5 算法研究 粗糙集理论中的有效算法研究是粗糙集在人工智能方向上研究的一个主要 方向a 目前,粗糙集理论中的有效算法 1 9 1 2 0 1 研究主要集中在导出规则的增量式 算法、约简的启发式算法、粗糙集基本运算的并行算法以及与粗糙集有关的神经 网络遗传算法等。 1 1 6 粗糙集在智能信息处理中的应用 智能信息处理”1 1 是现代信息技术的一个典型特征。它主要用于解决因 昆明理工大学硕士研究生学位论文 信息量不全而导致的系统病态问题,用数学模型难以描述的非线性和不确定性问 题,以及计算复杂性和实时性问题。粗糙集理论模仿人的认知特性,将信息处理 转变成一种逐层次逼近的知识获取行为,以其数据处理的有效性和实用性,而成 为智能信息处理技术的新理论和新方法,并在众多领域取得了成功的应用。 1 机器学习 美国k a n s a s 大学j w g r z u m a l a - - b u s s e 等在8 0 年代末开发的l e r s 系统 就是一个“基于粗糙集的示例学习系统” 2 0 1 。该系统在美国国家航空航天局 ( n a s a ) 约翰逊( j o h n s o n ) 空间中心被作为开发专家系统的工具使用了多年, 并且在不断改进。l e r s 在医疗领域曾用于比较取暖设备对手术后病人康复的效 果和预测孕妇的早产危险,还曾用于全球气候变化的研究,均取得了很好的效果。 2 知识挖掘 加拿大r e g i a n 大学研制的k d d r 系统是用于从数据中发现知识 ( k n o w l e d g ed i s c o v e r y i nd a t a b a s e ,k d d ) 的,又称为数据挖掘,是当前人工智 能与数据库技术交叉学科的研究热点之。k d d r 利用可变精度粗糙集模型, 实现了关于知识发现的决策矩阵方法,并用于医学数据的分析及电信工业的市场 研究。 3 决策分析 波“- - p o z n a n 科技大学开发的r o u g h d a s 和r o u g h c l a s s 系统是r o u g h 集方法 用于决策分析的软件实现。基于粗糙集的决策支持系统可以在分析以往大量经验 数据的基础上归纳出决策规则,用于辅助决策。j s t e f a n o w s k i 总结了基于粗糙 集方法获取的决策规则集的三种类型:最小集( m i n i m a ls e t s ) 、穷尽集( e x h a u s t i v e s e t s ) 和满意集( s a t i s f a c t o r ys e t s ) ,详细讨论了其不同的算法,并通过大量的机 器学习数据对各算法的性能进行了测试和比较。 4 粗糙控制 粗糙控制是根据租糙集理论从观测数据中获取控制策略的种智能控制方 法。w z i a r k o 用粗糙集方法实施城市铁路通道控制,将铁路沿线固定站点的交 通控制看作一个决策属性表,通过租糙集从现有数据中获取行驶方案的决策规 则 此外,租糙集理论在材料科学、机器诊断、信号和图象处理、地震预报、冲 4 昆明理工大学硕士研究生学位论文 突分析等领域都有成功的应用。 1 1 7 其它数学理论的联系 对粗糙集理论研究的不断深入,与其它数学分支的联系也更加紧密。例如, 从算子的观点看粗糙集理论,与之关系较紧密的有拓扑空间、数理逻辑、模态逻 辑、格与布尔代数、算子代数等;从构造性和集合的观点看,它与概率论、模糊 数学、信息论和证据理论、图论等联系较为密切。粗糙集理论的研究不但需要以 这些理论为基础,同时也相应地带动这些理论的发展。例如,从算子的角度来看, 粗糙集代数系统( 2 u , ,u ,n ,a p r ,币j ) 是普通布尔代数系统( 2 “,u ,n ) 加上两 个一元集合算子q 和面i 的推广。由于逻辑是计算机推理的基础,基于粗糙集 的逻辑研究也是粗糙集理论研究的比较活跃的一个方向m 1 。例如,粗糙集代数 系统( 2 “,u ,n ,a p r ,劳) 中的五个集合算子恰好对应模态逻辑的五个算子。因 此,基于粗糙集的模态逻辑的研究显得特别活跃,各种模型的粗糙集代数系统恰 好对应于各种模态逻辑系统,二者的结合有重要的应用,基于这种联系,粗糙集 理论能丰富模态逻辑理论,反之亦然。 从粗糙集的p a w l a k 代数系统的建立过程中,人们渐渐地应用粗糙集的方法 和背景,为纯粹的数学理论的研究,= p g j t 新思路。仞j 如,粗糙子群、半群中的粗 理想、粗糙逻辑和模糊逻辑等。我们认为,随着粗糙结构与代数结构、拓扑结构、 序结构的不断整合,必将涌现出新的富有生机的数学分支。 1 2 因素空间理论概述 因素空间m 2 6 儿2 8 1 是汪培庄教授于8 0 年代初提出的。早在这之前,为了论述 概率规律是体现着种广义的因果律,他便萌发了因素空间的思想。1 9 8 2 年他 正式发表了有关因素空间的论文。现代控制论中的状态空间,模式识别中的特征 空间和参数空间,现代物理中的相空间等都是因素空间的特殊情形。因素空间不 是一个固定不变的状态空间m “2 6 2 “,而是一族状态空间,它可以看作是一个维 数可变的状态空间。变维是因素空间的核心思想之一。 昆明理工大学硕士研究生学位论文 1 3 本文知识结构简介 文章共分为两个大部分,第一部分是对因素空间和粗糙集理论的知识系统进 行比较。首先介绍了因素空间的提出以及因素的刻画方式和因素的状态空间及描 述架的概念:接着简单对粗糙集理论的定义以及其知识表达系统的表示方式作了 介绍。第二部分由于我们要对数据进行处理之前要对原始数据进行预处理,对于 原始数据资料中遗漏的信息需要补充,于是我们提出了一种补全数据的方法。 6 昆明理工大学硕士研究生学位论文 第二章因素空间及知识表达系统的关系 因素空间2 儿2 6 1 【2 8 1 是汪培庄教授于8 0 年代初提出的,是为了论述概率规律是 体现着一种广义的因果律。李洪兴教授在因素空间的范畴下提出了概念的描述 架。这与p a w l a k 提出的粗糙集理论既有相同也有区别。下面分别介绍一下因素 空间的公理化定义与描述架以及粗糙集理论。 2 1 因素空间的定义与描述架 2 1 1 因素 “因素” 1 2 1 州2 8 为因素空间理论的一个元词是不加以定义的,从概念的角度讲, 可以从四个方面加以理解。 ( 1 ) 归因性:它有两层含义。其一是由果索因的思维方式中因素所处的地位, 即作为引起某结果的事物。其二是因素作为事物在某方面的状态和特征的 集中抽象,它总揽了这方面的全部可能状态或特征,可理解一类状态或一 组特征的表示。 ( 2 ) 解析性:概念的形成是通过对比来寻求不同事物之间的差别来实现的。共 性就是因素,差别则体现为状态的不同。因此,因素可视为认识客观对象 的视角。因此,因素具有分解的功能,是解析性认识方法。 ( 3 ) 描述性:任何事物都是诸多因素的交叉,这种交叉意味着可以建立一种广 义的坐标系,任何事物可以视为广义坐标系中的一个点,而广义坐标系的 每一条轴都表示了某个因素的状态集合( 即状态空间) 。因此,因素又可 视为广义坐标系的维名称。 ( 4 ) 层次性:由于某一事物可以是某些原因结果同时又是另结果的原因之 一,所以因素是分层的。 2 1 2 因素的状态空间 一个事物并非与任何因素都有关。所谓事物“与因素,相关,是指从厂谈论 “,总有一个状态f ( u 1 与之对应。 昆明理工大学硕士研究生学位论文 若u 与v 分别表示一些对象集和一些因素集,且对任意“u ,一切与“有 关的因素都在v 中,则称( u ,v ) 为一个左配对2 6 1 1 2 ”。 给定一个左配对( u ,v ) ,定义二元关系r 如:r ( u ,力= 1 营“与厂有关。 记d ( 厂) = “i “u ,r ( u ,f ) = 1 ) ,则厂可视为一个映射 厂:d ( f ) j x ( ,) ,u 卜f ( u ) 其中( ,) = 厂( “) i u d ( 厂) ) ,称z ( 门为, 的状态空间,x ( f ) 的元素为,的状态。 根据状态空间的不同,因素大致分为四种类型【1 7 】【2 6 1 1 ”i : ( 1 ) 变量型因素:此类因素的状态空间为一维或多维欧氏空间的某个子集, 它们通常为连续或离散的变量。 ( 2 ) 符号型因素:其状态空间由某些特定的记号组成,这些记号可以是名称, 也可以是其他代号。 ( 3 ) 开关型因素:其状态空间只有两个元素,可以记为 y e s ,n o ) 或( 0 ,1 或其他某对意义相反的词。 ( 4 ) 程度型因素:其状态空间一般为 0 ,1 ,但状态取值没有现成的测量可 用,但有一定的程度可言。 2 1 3 因素之间的关系和运算 用占表示空状态,它满足: x ,p ) = x ) ,( x ,0 ) = ( 口,x ) = x( 1 ) 即日与其他元素组成集合或序偶均无效。 定义2 1 3 1 ”7 2 6 “2 ”若x ( o ) = 刚,则称符号o 为零因素,即其状态空间只有一 个状态,且该状态还是个空状态。 约定:对任何一个左配对( u ,v 】,均有0 v 。 由于因素,可看作映射,:d ( ) 斗x ( 厂) ,可将厂的定义域d ( 厂) 扩展为整个论 域u : 厂- u 钳( 门朋舢ue d ( f 附) ) 定义2 1 3 2 1 7 2 6 1 1 2 8 设f 和g 为因素,若d = d ( g ) ,z ( 力= x ( g ) 且 ( v “) d ( ,) ,( “) = g ( “) 则称厂和g 相等,记为:厂= g 。 8 昆明理工犬学硕士研究生学位论文 定义2 1 3 3 【1 7 】【2 6 】【”i 设厂和g 为因素,若存在集合y 中且y o 使得 x ( ,) = x ( g ) x y ,则称g 为厂的真子因素,记为g 厂。若g f 或g = ,则称g 为,的子因素记为g 兰厂。 子因素的实际含义是厂的状态一旦确定则g 的状态随之而定。 定义2 1 3 4 1 设h ,厂,g 为因素,若h 为厂和g 的最大公共子因素,即满足: ( 1 ) h 蔓f 且h g ( 2 ) 对任意因素e ,若e 厂且e g j e 茎h 则称h 为,和g 的交因素( 或合取因素) ,简称交,记为h = 厂a g 。 定义2 1 3 5 1 设 ,f ,g 为因素,若矗为以,和g 为子因素的最小者,即满 足: ( 1 ) h ,且h g ( 2 ) 对任意因素e ,若e 厂r e g j 8 h 则称矗为,和g 的并因素( 或析取因素) ,简称并,记为h = f v g 。 ,和g 的交和并均可以推广到因素族) w 的无限交。台:和无限并品, 定义2 1 3 6 n 7 1 u ) w 为因素族,若对任意的j ,t 丁均有正 z = 0 a s ,则 称因素族u ) 。是两两独立的。亦简称m ) 。是独立的。 显然,相互独立因素的子因素也相互独立;零因素和任何因素都独立。 定义2 1 3 7 m 1 设厅,厂,g n n 素,且满足:( f , , g ) v h = ,且 g = 0 则称 h 为厂减g 的差因素,记为h = ,一g 。 定义2 1 3 8 设f 为因素集,若1 f ,且对任意的f f 有,s 1 则称l 为f 的全因素;1 一,为关于1 的余因素,记为,。 定义2 1 3 9 1 若因素厂除了零因素以外,没有真子因素,则称厂为原子因素。 设f 为因素集,则称疗= 厂f l 厂为原子因素) 为f 的原子因素集。 9 昆明理工大学硕士研究生学位论文 2 1 4 因素空间的定义 定义2 ,1 4 1 【2 6 】1 2 8 1 设( u ,v 】为左配对,f v ,称集合族 x ( ,) ) ,。f 为u 上 的一个固素空间,如果满足: ( f 1 ) ( f ,v ,x ,。,0 ,1 ) 为完全的布尔代数: ( f 2 ) x ( o ) = 田; ( f 3 ) 对任何t f ,且对任意的j r ,g t ,f g 时f a g = 0 ,则 x ( v t ) = 兀x ( ,) r e r 此时称f 为因素集,f f 为因素,x ( f ) 为,的状态空间,l 为全因素,x ( 1 ) 为 全空间,0 为零因素,口为零状态。 现代控制论中的状态空间、模式识别中的特征空间和参数空间,现代物理学中的 相空间等都是因素空间的特殊情形。因素空间不是一个固定的状态空间,而是一 族维数可变的状态空间,“变维”是因素空间的核心思想之。 若 z ( ,) ,。,为一因素空间,, f f :l 玟f ,g f ,则,v g = ( ,一g ) v ( , g ) v ( g 一厂) 旦厂一g ,厂a g ,g f 两两独立,从而 x ( f v g ) = x ( f g ) x ( f g ) x ( g - f ) 2 1 5 概念的描述架 概念即j f 2 6 2 8 是最基本的思维形式,是知识形成的基本要素。概念的描述有 三种方式: ( 1 ) 内涵方式:指明一个概念所具有的本质属性; ( 2 ) 外延方式:指明符合概念的所有对象所形成的范畴: ( 3 ) 概念结构:从概念与概念之间的相互关系中说明一个概念。 假定要讨论一组概念善= ( 口,厉,) ,它们的论域为u 。取因素族矿,使u 与v 组成一个左配对( u ,v 】;再取因素集f c v ,使得f 对u 是充足的,即满足 条件: 对v “l ,“2 u 存在,f 使得f ( u 1 ) f ( u 2 ) 则称( u ,掌,f 】或 ( u ,手, x ( ,) ,;, 为掌的一个描述架。 1 0 昆明理工大学硕士研究生学位论文 对于给定的描述架( u ,掌,f ,全因素1 必为单射。 在既定的描述架( u ,掌,f 】中,任取一个概念口掌,它在u 中外延是u 上的一个f u z z y 集a c f ( u ) ,实际上4 是一个映射:a :u 一【0 ,1 】,“f - - ) 爿( “) 称a ( u ) 为u 对概念口或a 的隶属度。特别地,若a ( u ) = 0 , 1 ) ,则称爿为普通集, 口为清晰概念( 或精确概念) 。对于孝每个状态空间x ( f ) ( f f ) 都叫做表现 论域,x ( 1 ) 叫做完全表现论域。 2 2 粗糙集理论 经典集代数是基于二值逻辑【1 1 1 ,这就缺乏对不完备和不精确信息处理的能力。 当论域中的每个对象所需要的信息都是完备的,我们可以将经典集代数理论看作 是做决策的一种有效的工具。在粗糙集理论中,对象仅通过有效信息来描述。因 此,粗糙集理论为基于有效信息的决策提供了支持工具,然而有效信息可能是不 完备、不精确的。集合的粗糙性是由于有效信息的不完各和不精确而产生的。哲 学家、逻辑学家以及数学家们一直致力于不完备信息的处理问题,近些年来计 算机科学家们也密切关注着不完备信息的处理问题,尤其关注在人工智能领域中 不完备信息的处理。处理不完备信息的方法也是有多种的,无疑,z a d e h 提出的 模糊集理论是最为成功的。由p a w l a k 提出的粗糙集理论也是处理不完备信息的 一种方法,它是经典集理论的扩展,其主要运用在有效信息为不确定、不完备的 情况下。粗糙集是建立在这样一种假设下即:对论域中的每个对象总是有一些信 息是相互联系的,并且对象仅由能够较容易获得的有效信息来描述。因此对于具 有相同信息的不同对象可以将其看作在已知的信息中是不可区分的,所以有效信 息可以用等价关系来表述,称之为不可区分关系,其中每个等价类由不可区分的 对象组成。空集。和每个等价类被称为基本集。称几个基本集的并为可定义集。 对于论域中的任意子集并不一定能够使用已知的信息将其表示出来,但是总可以 用一个精确集对来表示,即是可以表示为上近似和下近似的集对。下近似即是由 根据已知知识判断肯定属于此集合的元素组成,上近似即是由根据已知知识判断 可能属于此集合的元素组成。 昆明理工大学硕士研究生学位论文 设u 中是我们感兴趣的对象组成的有限集合,称为论域。任何子集x u 称为u 中的一个概念或范畴。我们认为空集也是一个概念。矿中的任何概念族 称为关于u 的抽象知识,简称为知识。设f = x ,x :五 为u 上的个划 分,其中,x ,量u ,x ,妒,对于任意的f 门亨置n x ,= x ,= u u 上 的一族划分称为关于u 的一个知识库 t 6 1 。 设r 是u 上的一个等价关系,u r 表示r 的所有等价类( 或者u 上的分类) 构成的集合,【z k 表示包含元素x u 的r 的等价类。一个知识库就是一个关系 _ + 系统k = ( u ,r ) ,其中u 为非空有限集,称为论域,r 是u 上的一族等价关系。 斗斗 + 若p 互r ,且p 庐,则n p ( p 中所有等价关系的交集) 也是一个等价关系 称为p 上的不可区分关系5 记为棚( 即且有咧南。3 m 一。这样 _ 一 u i i n d ( p ) 表示与等价关系族p 相关的知识,称为丘中关于u 的p 基本知识【l 】1 1 6 】 呻 ( p 基本集) 。i n d ( p ) 的一个等价类称为知识p 的基本概念或基本范畴。特别地 _ 如果q r 则称q 为k 中关于u 的q 初等知识,q 的一个等价类为知识r 的q 初 - 等概念或q 初等范畴。事实上p 基本范畴是拥有知识p 的论域的基本特性。即它 们是知识的基本模块。k = ( u ,r ) ,为一个知识库,i n d ( k ) 定义为芷中所有等价 - _ 关系的族,记作i n d ( k ) = i n d ( p ) f 痧p 三r ) 2 3 因素空间的公理化定义与描述架和粗糙集理论的联系与区别 粗糙集理论是在知识库的基础上对论域中的元素( 集合) 根据已知知识对其 进行近似刻画,前面我们已经知道论域u 上的一族划分就是一个关于u 的知识 库,盖是v 上的一族等价关系,则构成了一个关系系统世:( u ,盖) 。通常数据是 以数据表的形式给出的,称为属性值表,信息表或数据库。一个数据库就是 一个表,行是讨论的对象,列是属性,行列交叉处即是对象在对应属性的属性值, 1 2 垦堕堡王查兰堡主堕壅圭堂垡堡兰 一 可以用知识表达系统来表示,它在智能数据处理中占十分重要的地位。 形式上,四元组s = ( u ,a ,v ,正) 是一个知识表达系统叫】【1 ”,其中,u 为对 象的非窑有限集合,也即论域;a 为属性的非空有限集合;v = u 圪,圪是属 口e a 性a 的值域;f :u a 砷y 是一个信息函数,它为每个对象的属性赋予一个信 息值,即v a a ,x u ,正( x ,a ) 圪 知识表达系统也称为信息系统,通常也用s = ( u ,a ) 来表示。知识表达系统的数 据以关系表的形式表示。关系表的行对应要研究的对象,列对应对象的属性,对 象的信息是通过指定对象的个属性值来表达。显然,一个属性对应一个等价关系, 一个表可以看作是定义的一族等价关系,即知识库。 在因素空间中,因素可以从四个方面刻画:归因性、解析性、描述性、层次 性。由于属性可看作是一类状态或一组特征的公共标志,并且讨论的对象集中任 一对象均可看作是属性值之间的一个特定组合,因此知识表达系统中的属性,我 们可视其为因素a 那么z 三( ,4 一v 为每个属性值赋予一个信息值,即表明 x u 对v a a ,x 与a 有关。正( x ,口) 就是对于论域中的对象x 在属性( 因素) d 下的值。其全体为,那么圪即为4 的状态空间。由于信息系统中各个属性作 用的范围是相同的我们可以认为其定义域是相同的。 知识p 依赖于知识q ,当且仅当i 棚( p ) 呈i n d ( 、q ) ,记作p j q 。 知识p 与知识q 等价,当且仅当p j q 且q p ,记作p = q 。 知识p 与知识q 独立,当且仅当p ;q 且q j p 均不成立。 命题2 3 1 因素厂与g 相等,则由厂、g 形成的知识等价。 证明:由于因素,与g 相等即是d ( 厂) = d ( g ) ,x ( ,) = x ( g ) 且对v “d ( 厂) 均 有,( “) = g ( u ) 那么,与g 形成的等价类相同,即u f = u g 所以,作为知识 f zg a 但是,知识等价其形成的因素不一定相等。例如下表,在此数据库中有六个 昆明理工大学硕七研究生学位论文 存储的货物对象并且由四个属性表征。 e 一销售人员的能力;q 一货物的质量:l 一放置的便利位置:p 一赢利还是 赔本。 表1 货物的知识表达系统 s t o r ee q lp 1 h i g h g o o dn op r o f i t 2m e dg o o dn 0l o s s 3m e dg o o dn 0l o s s 4n o a v g n ob a l a n c e 5m e d a v g y e sl o s s 6 h i 曲a v g y e sp r o f i t 由表1 口j 以知遭 u e = l ,6 , 2 ,3 ,5 , 4 ) ;u p = “l ,6 ,( 2 , 3 ,5 , 4 显见p = f 然而对于对象 1 来说e ( i ) p ( 1 ) ,所以对于因素e 与p 不相等。 在知识表达系统中,对于属性集合;爿以及亘彳,若;蚤那么将其看 作因素时就有集合蚕= ;u ( 圣一) ,所以有x ( 亘) :x ( ) z ( 玉) 即是蚕 对- j :因素的合取及析取运算,我们又有:在知识表达系统中,对于属性集合 ;a 以及西爿,若吾:;n 西,那么将其看作因素时哥即是因素j 与西的合 取因素,且吾是因素与圣的最大公共子因素。若蕾:u 圣,那么将其看作因 素时西即是因素与丕的析取因素,且吾是因素;与蚕的最小的析取因素。 在知识表达系统中,对于属性集合4 以及蚕a ,;g e + n q + :矿,那么将 其看作因素时,;与蚕即是相互独立的因素。 设( u ,v 为左配对,f 三v ,称集合族 z ( 力) 。为u 上的一个因素空间, 如果满足: ( f 1 ) ( f ,v , ,。,0 ,1 ) 为完全的布尔代数; ( f 2 ) x ( o ) = 0 ; ( f 3 ) 对任何t g f ,且对任意的f ,g t ,f g 时f a g = 0 ,则 1 4 昆明理工丈学硕士研究生学位论文 x ( v t ) = n x ( ,) r r 此时称,为因素集,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度水沟护坡工程劳务合作合同样本
- 呼吸器安全考试题及答案
- 2025劳动合同标准格式
- 2025年健康管理师三级考试题库(含答案)
- 2025村居后备干部参考考试题及参考答案
- 中级婴师考试题库及答案
- 课件中的交互效果设置
- 课件中添加表格
- 培训安全员要求考试试题及答案
- 宝玉石鉴定课件
- 设计总监升职述职报告
- JJF 2203-2025水质毒性分析仪校准规范
- 施工安全教育内容
- 电信人工智能学习考试题(附答案)
- 肝门部胆管癌诊断和治疗指南(2025版)解读课件
- 急诊危重症患者转运专家共识解读课件
- 《发芽小麦粉气流分级产品及其面筋蛋白品质的研究》
- 2025年危险化学品经营单位主要负责人安全生产全国考试题库(含答案)
- 青岛版五四制科学五年级上册科学学生活动手册参考答案
- 社区街道网格员安全培训
- 村卫生室医疗废物管理制度
评论
0/150
提交评论