粗糙集的知识表示_第1页
粗糙集的知识表示_第2页
粗糙集的知识表示_第3页
粗糙集的知识表示_第4页
粗糙集的知识表示_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

粗糙集的知识知识表示信息论的度量主要任务是:度量颗粒性只是属性特征的重要性和属性特征之间的相依性程度。主要内容:信息论的度量:信息熵,条件熵和互信息引入粗糙集理论,揭示知识粗糙性和信息之间的关系。1粗糙集中的知识表示知识表示是人工智能和智能信息处理的首要问题。基于粗糙集理论的知识表示的着眼点:知识时一种对事物的分类能力。知识表达系统可看成关系数据库,关系表的行对应要研究的对象,关系表的列对应对象的属性,对象信息通过指定各对象的各属性值来表达。1・1定义:知识系统称四元组KRS=(U,A,V,F)是一个知识表达系统,其中,U:对象的非空有限集合,称为论域;A:属性的非空集合V:全体属性的值域,V二V,V表示属性aeA的值域;aaF:表示uxAtV的一个映射,称为信息函数。信息系统常简记为:(U,A)。知识表达系统主要有两种类型:一类是信息系统(信息表)即不含决策属性的知识表达系统;另一类是决策系统(决策表),即含有决策属性的知识表达系统。在Pawlak模型中,关系数据库的一个属性对应一个等价关系。一个关系数据表可以看作论域U和U上的一簇等价关系的二兀序偶,即一个知识库或者近似空间。知识约简可转化为属性约简和属性值的约简。信息系统和决策表的举例:ft5,2医院描迷流舉的佶息基统论城U茶件.属性HeadacheTemperatureyesyesnormalyesyeshighyesyesvery-highnoyesnormalnonohighnoyesvery-highAS.3医院谧新流晶的决策轰论域U条件厲性瞧策属性F]uHeadacheTeiiiperaltircyesyesnormalnoyesyeshighyesyesyesvery^highyesnoyesnormal!nononohighnonoyesvery-highyes2知识约简原理在知识表达系统中,知识约简考察的是信息系统或决策表中给出的所有知识是否都必要。一般而言,知识表达系统中含有冗余的知识和信息。约简任务之一就是保持原始信息系统或者决策表的分类能力不

变的前提下,删除知识表达系统中冗余知识。对信息系统而言,这一

过程为知识约简;对决策表而言,这一过程为知识的相对约简。决策表中所有条件属性对于决策而言并非同等重要,甚至有些属性是不必要的,也就是冗余的。通常,在信息系统和决策表中存在两种类型的冗余:1)属性从整体的角度而言存在冗余;2)从整体上讲某个属性是必要的,但某些对象在该属性上的取值可能存在冗余,即属性值的冗余。2.1知识表达系统系统的知识约简1信息系统中知识约简的一般步骤1) 删除表中重复对象2) 删除冗余的条件属性3) 删除每个对象的冗余属性值4) 求出其约简。2决策表中知识约简的一般步骤5) 根据其约简,求出决策规则。论域U条件属性决獗鼎性HuHeadacheTemptratureye&normalnoyeshighyesyesvery-highyesnonormaLnonohighnonovery-highytrs義5.召决樂表轧占经属性值妁筍馬縛到的决策表论域[丿条件属性策属性FluHeadache"remperaiure老ilaotmalno辟yeshighyesFm*veryhighyesnurmallnunohighnovery-high沪*5.7 5.5加对象后怡战的不相客决療寰论域u条件属性换策属性FluHeadacheTemperatureyesnorma]noFzyeshighyesfjyesvery^highyesnortormaJno110highnonovery-highyesnohighyeanovery-highno1.2不相容决策表的知识约简对于不相容决策表,粗糙集理论的处理方法是对每一个决策概念,计算其上、下近似。从其下近似导出的规则是肯定成立的,称为确定性规则;从上近似导出的规则可能是成立的,称为可能性规则。前者用于逻辑推理,后者有实例支持。1.3代数表示粗糙集理论的重要作用之一:提供了一种有效的从数据中获取规则的方法和工具。知识约简种,核与约简是其中最重要的概念。在Pawlak模型中,这些概念是通过代数表达式定义的,也称为代数表示。例如:不可分辨关系,属性的必要性和相对必要性,属性的独立性和相对独立性,正域和相对正域,核与相对核,约简与相对约简,核与约简的关系等都是代数形式描述的。1.4知识粗糙性的信息表示粗糙集理论将知识定义为关于论域的划分模式,从而使知识有了颗粒性,称其为信息粒度或知识粒度,简称粒度。知识粗糙性是相对于两种知识粒度的比较。在粗糙集理论中,知识粗糙性是通过代数数学中的等价关系和集合包含关系来定义的。本节讨论:知识粗糙性和信息之间的关系。首先,建立知识与信息熵及互信息之间的联系;其次论证信息熵及互信息都是随着知识粗糙性的增加而单调下降,通过反例证明它们之间的逆关系一般不成立;最后讨论逆关系成立的条件。1.4.1知识粗糙性知识粗糙性通过数学中的等价关系和集合包含关系定义。定义设K=(U,P)和K,=(U,Q)是两个知识库,如果下式成立:U;IND(P)匸U:IND(Q则称知识P比知识Q较细,或者Q比P较粗,记作pq。

1.4.2知识的信息熵与互信息为探讨知识粗糙性与信息之间的关系,首先需要建立知识与信息之间的联系,定义知识的信息熵与互信息。在粗糙集理论中,知识被理解为关于论域的各种划分模块。粗糙集意义下的知识可以被视为随机变量。1•知识的概率分布设U为论域,P和Q分别为论域U上的两个等价关系簇。将P和Q看作是定义在U的子集组成的代数上的两个随机变量,其概率分布可通过如下方法确定:设P和Q在论域U上导出的划分分别为X和Y,其中X二U/IND(P)={x,X,…,X}1 2 nY二U/IND(Q)二&,Y,...,Y}1 2 m贝I」:(1)P和Q在论域U的子集组成的&-代数上定义的概率分布为:Ix;pLIx;pLX1P(X)1X2P(X)2X...X—3 nP(X)...P(X)3 n」YiP(Y) P(Y) P(Y)...P(Y)1 2 3 m」P(X)=card(X)P(Y)=card(Yj)i card(U) j card(U)(2)P和Q的联合概率分布为:(S)严与Q的联合概率分布定宾为x.nr

x.nr其中,积事件的概率计算公式为card(U)符号c^rd(E)其中,积事件的概率计算公式为card(U)符号c^rd(E)a示集合E的基数,2知识的信息熵和互信息定义知识P的信息熵H(P) 给定知识P和它的概率分布,则称H(P=)-YP(X)loP(X)为知识P的信息熵,简记为H(P)。i ii=1定义知识Q相对于知识P的条件熵H(QIP)给定知识P和Q以及它们各自的概率分布和条件分布,则称H(QIP)=-Hp(X)1Ep(YIX)logP(YIX)为知识Q相对于知识Pi ji jii=1 j=1的条件熵,简记为H(QIP).定义

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论