(应用数学专业论文)基于afs模糊逻辑的模糊关联分类研究.pdf_第1页
(应用数学专业论文)基于afs模糊逻辑的模糊关联分类研究.pdf_第2页
(应用数学专业论文)基于afs模糊逻辑的模糊关联分类研究.pdf_第3页
(应用数学专业论文)基于afs模糊逻辑的模糊关联分类研究.pdf_第4页
(应用数学专业论文)基于afs模糊逻辑的模糊关联分类研究.pdf_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 a f s 理论( a x i o m a t i cf u z z ys e t s ) ,即公理模糊集理论是一种新的模糊数学分析 方法,是刘晓东教授于1 9 9 5 年提出的。a f s 理论针对一直广泛争论的模糊集理论 的最基本问题:模糊概念的隶属函数的科学、严密、统一的确立方法和正确表示 人类思维逻辑的模糊逻辑运算,进行了深入的研究和探讨。a f s 理论给出了依据 原始数据和相关信息确定隶属函数的算法。a f s 模糊逻辑比现有的模糊逻辑更接 近于人类思维逻辑,应用它可直接在原始数据和相关信息上建立更准确地描述现 实世界智能系统的模型。这种可被自然语言描述的模型更易于人类理解,为进一 步研究人类智能、建立复杂智能系统模型并对其分析和控制提供更加有效的研究 方法。目前,a f s 理论被进一步研究并已经被应用到模糊聚类分析、模糊决策树, 信用分析、模式识别和故障诊断等领域。 本文是将a f s 模糊逻辑分类算法与模糊关联规则结合,对基于a f s 模糊逻辑 的分类器做进一步研究。文中使用了a f s 模糊逻辑分类器的思想和模糊关联分类 器设计的方法,将模糊关联规则应用于a f s 模糊逻辑的分类器设计之中,还对模 糊关联规则在分类中常用的支持度度量进行了修改,使其更具合理性。通过在五 个u c i ( u n i v e r s i t yo fc a l i f o m i a , i r v i n e ) 数据集上应用m a t l a b 程序进行实验,验证 了分类器的性能,并给出了确定参数的一个简单方法。最后,将得到的实际数据 的分类准确率与已经提出的一些分类器的分类结果进行比较,实验结果说明该算 法具有很好的分类效果。 关键词:a f s 代数;a f s 模糊逻辑;关联规则;模糊关联分类 英文摘要 a b s t r a c t a f st h e o r y ( a x i o m a t i cf u z z ys e t s ) i san e wm e t h o dt os t u d yf u z z ys e tw h i c hw a s p r o p o s e db yp r o f e s s o rl i ux i a o d o n gi n19 9 5 a f st h e o r yh a v es t u d i e da n dd i s c u s s e d t h ee s s e n t i a lp r o b l e m so f f u z z yt h e o r y :h o wt of i n dt h es t r i c ta n dc o n s i s t e n ta l g o r i t h m s o fd e t e r m i n i n gm e m b e r s h i pf u n c t i o n sf o rf u z z yc o n c e p t sa n dt h e f u z z yl o g i c a l o p e r a t i o n sa c c u r a t e l yr e p r e s e n t i n gh u m a nt h i n k i n gl o g i c i nt h ef r a m e w o r ko fa f s t h e o r y , a f sp r e s e n tan e wa l g o r i t h mo fd e t e r m i n i n gm e m b e r s h i pf u n c t i o n sf o rf u z z y c o n c e p t sa c c o r d i n gt oo r i g i n a ld a t ea n di n f o r m a t i o na n dp r o p o s ea f sf u z z yl o g i c i n f a c t , a f sf u z z yl o g i ci sm o r ea p p r o p r i a t et or e p r e s e n th u m a nt h i n k i n gl o g i ca n dt h e m o d e l so fi n t e l l i g e n ts y s t e m si nr e a lw o r l da p p l i c a t i o n sb a s e do no r i g i n a ld a t aa n d i n f o r m a t i o n , w h i c ha r ec o m p r e h e n s i b l ea n dh a v ed e f i n i t i v es e m a n t i cm e a n i n g s t h e s e a p p r o a c h e sh a v ep o t e n t i a la p p l i c a t i o n s i nt h es t u d yo fr e c o g n i t i o na n dl a r g e - s c a l e c o m p l i c a t ei n t e l l i g e n ts y s t e m s r e c e n t l y ,a f st h e o r yh a sb e e nd e v e l o p e df u r t h e ra n d a p p l i e dt of u z z yc l u s t e r i n ga n a l y s i s ,f u z z yd e c i s i o nt r e e s ,c r e d hr a t i n ga n a l y s i s ,p a t t e r n r e c o g n i t i o na n dh i t c hd i a g n o s e s ,e t c i nt h i sp a p e r , w ec o m b i n et h ea f sf u z z yl o g i cc l a s s i f i c a t i o na l g o r i t h ma n df u z z y a s s o c i a t i o nr u l et os t u d yf u r t h e rt h ec l a s s i f i e r sb a s e do na f sf u z z y , l o g i c e m p l o y i n gt h e i d e ao ft h ea f sf u z z yl o g i cc l a s s i f i c a t i o na l g o r i t h ma n dt h em e t h o d so fd e s i g n i n gt h e f u z z ya s s o c i a t i o nc l a s s i f i e r , w ea p p l yt h ef u z z ya s s o c i a t i o nr u l e st od e s i g nan e w c l a s s i f i e rb a s e do na f sf u z z yl o g i c i na d d i t i o n ,am o d i f i c a t i o no fs u p p o r tc o m m o n l y u s e di na s s o c i a t i o nc l a s s i f i e ri sm a d em o r er e a s o n a b l e w i t hm a t l a b ,w ei m p l e m e n t t h ea l g o r i t h ma n de x p e r i m e n t so n5u c i ( u n i v e r s i t yo fc a l i f o r n i a , i r v i n e ) d a t as e t st o v a l i d a t et h ep e r f o r m a n c eo ft h ea l g o r i t h m f i n a l l y ,w ec o m p a r et h ea c c u r a c yo ft h ed a t a s e t so b t a i n e df r o mt h ec l a s s i f i e rp r o p o s e dw i t ht h er e s u l t sp r e s e n ti nl i t e r a t u r e s t h e r e s u l t ss h o wt h a tt h ep r o p o s e dc l a s s i f i e ri sp r a c t i c a la n du s e f u l k e yw o r d s :a f sa l g e b r a :a f ss t r u c t u r e ;a s s o c i a t i o nr u l e s ;f u z z ya s s o c i a t i o n c l a s s i f i c a t i o n 大连海事大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果, 撰写成硕士学位论文竺基王缱曼搓翅逻塑的槿塑差毯筮耋婴究= = 。除论文中已 经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中以 明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体已经公开发 表或未公开发表的成果。本声明的法律责任由本人承担。 学位论文作者签名: 虹查 学位论文版权使用授权书 本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学 位论文的规定,即:大连海事大学有权保留并向国家有关部门或机构送交学位论 文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本 学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫 描等复制手段保存和汇编学位论文。同意将本学位论文收录到中国优秀博硕士 学位论文全文数据库( 中国学术期刊( 光盘版) 电子杂志社) 、中国学位论 文全文数据库( 中国科学技术信息研究所) 等数据库中,并以电子出版物形式 出版发行和提供信息服务。保密的论文在解密后遵守此规定。 本学位论文属于:保密口在年解密后适用本授权书。 不保密旷( 请在以上方框内打“4 ,) 论文作者签名:楣于k 导师签名: 日期:沙产 基于a f s 模糊逻辑的模糊关联分类研究 引言 数据挖掘的目的是帮助分析人员寻找数据之间的关联,发现被忽略的要素,而这 些信息对于预测趋势和决策行为是十分有用的。通过数据挖掘,有价值的知识、规则 或高层次的信息就能从数据库的相关数据集合中抽取出来,并从不同角度显示,从而 使大型数据库作为一个丰富可靠的资源为知识归纳服务。分类在数据挖掘中是一项非 常重要的任务。其方法是找出描述并区分数据类或概念的模型( 或函数) ,以便能够使 用模型预测类标记未知的对象类,应用机器学习的方法其目的是学会一个分类函数或 分类模型( 也常常称作分类器) ,该模型能把数据库中的数据项映射到给定类别中的某 一个。一个分类器的效率一般是由准确率和可解释性两个方面来衡量,现在很多方法 能有很高的准确率,但是却比较复杂并且结果缺乏可解释性。分类中的关联规则挖掘 方法( m i n i n ga s s o c i a t i o nr u l e s ) 在上述两个方面有很好的效果,很多研究表明这种方法 一般都能得到很高的分类准确率、运算速度快并且最后得到结果具有很好的语义解 释。 关联规则挖掘就是从大量的数据中挖掘出有价值的描述数据项之间相互联系的 有关知识,具体地说就是在数据库的知识发现中描述一个事务中物品之间同时出现规 律的知识模式,通过找出所有频繁项集来产生强关联规则。随着收集和存储在数据库 中的数据规模的增加,人们对从这些数据中挖掘相应的关联规则的兴趣也更大了。关 联规则应用极其广泛,例如可以用于客户购买模式、财政预测、医疗诊断、市场规划、 分类设计等十分广泛的领域。 用模糊集描述数据间的关联,扩充了可以表现的关系类型,方便了规则的语义解释, 而且避免区分属性域时的不正常边界。为了描述模糊信息,美国控制论专家扎德( l a z a a e h ) 在1 9 6 5 年提出了模糊集理论。此后模糊集与系统被人们广泛地研究和应用起来。 a f s ( a x i o m a t i cf u z z ys e t ) 模糊逻辑系统是模糊集理论的一种新的研究方法,由刘晓东教 授于1 9 9 5 年提出。针对一直广泛争论的模糊集理论的基本问题:模糊概念的隶属函数 的确立方法和模糊逻辑运算,a f s 模糊逻辑理论提出了一套客观、严密、统一的理论和 方法。它仅利用样本数据间的序关系,将原始数据通过构造a f s 结构( 必f ,和a f s 引言 代数( 凰e l i 代数) 及其上的一个逆序对合运算建立模糊逻辑系统。很多工程实际问题都 可以应用a f s 理论来解决,其中一个重应用就是数据挖掘。本文就是利用a f s 模糊逻 辑,使用模糊的方法研究关联分类算法,并在数个数据集上验证该算法的性能。 。 本文在第一章介绍了文章主要用到的模糊数学的基础知识,包括模糊集合及其运 算、模糊关系、模糊逻辑和模糊语言。第二章介绍了知识发现的过程以及关联规则的概 念,并对在模糊关联分类中普遍使用的支持度度量做了改进。第三章则对a f s 理论做了 比较简要的介绍,主要涉及模糊逻辑、a f s 结构以及基于a f s 的隶属度计算方法。第四 和第五章则对算法进行了详细的描述,给出了在五个数据集上的实验结果,并且给出了 每个数据集上的参数选择。最后对本文的工作进行了总结,并提出了存在的一些问题, 为以后的进一步研究指明了方向。 2 基于a f s 模糊逻辑的模糊关联分类研究 第1 章模糊数学基础 现代电子计算机已经可以解决了很多复杂的数学问题,但是在判断推理方面还是不 如人脑,这是为什么昵? 美国加利福尼亚大学扎德( l a z a d e h ,1 9 1 2 一) 教授仔细地研 究了这个问题,他发现德国人c a n t o r 创立的古典集合论中的集合概念必须进行推广,这 样才有利于用数学模型来描述某些现象的模糊性。1 9 6 5 年,z a d e h 教授发表了模糊集 合论论文,提出用“隶属函数”这个概念来描述现象差异的中间过渡,从而突破了古 典集合论中属于或不属于的绝对关系。z a d e h 教授这一开创性的工作,标志着数学的一 个新的分支模糊数学的诞生。 模糊数学理论虽然经历了近三十年的发展,但是相对于其他数学学科,它还是一门 新的数学理论、一种新的数学工具。早在7 0 年代初,模糊集合的概念逐渐为更多的学 者所关注。有关模糊集的论文数量迅速增加,质量不断提高,涉及的范围十分广泛。模 糊理论与经典理论相比,更接近于人类思维和自然语言系统,因此更适合于模仿人类的 思维推理。 与计算机相比,人脑具有处理模糊信息的能力,善于判断和处理模糊现象。但计算 机对模糊现象识别能力较差,为了提高计算机识别模糊现象的能力,就需要把人们常用 的模糊语言设计成机器能接受的指令和程序,以便机器能像人脑那样简洁灵活的做出相 应的判断,从而提高自动识别和控制模糊现象的效率。这样,就需要寻找一种描述和加 工模糊信息的数学工具,这就推动数学家深入研究模糊数学。所以,模糊数学的产生是 有其科学技术与数学发展的必然性。模糊数学在理论上还处于不断发展和完善中,它的 应用也日益广泛。它在聚类分析、图像识别、自动控制、故障诊断、系统评价、机器人、 人工智能等多方面取得了应用。 本章主要对本文所涉及到的模糊数学基础知识进行简要的介绍,主要包括模糊集合 及其运算、模糊关系、模糊逻辑和模糊语言1 ,2 ,4 】。 3 第1 章模糊数学基础 1 1 模糊集合及其运算 在康托创立的经典集合论中,一事物要么属于某集合,要么不属于某集合,二者必 居其一,没有模棱两可的情况。这就表明,经典集合所表达概念的内涵和外延都必须是 明确的。 我t f l9 5 n 道,一个概念所包含的那些区别于其他概念的全体本质属性称为概念的内 涵,而符合某概念的对象的全体就是概念的外延。比如:“人”这个概念的外延就是世 界上所有人的全体,而内涵就是区别于其他动物的那些本质属性的全体。 在人们的思维中,有许多没有明确外延的概念,即模糊概念。表现在语言上有许多 模糊概念的词,如以人的年龄为论域,那么“年轻 、“中年、“老年 ,都没有明 确的外延,或者以人的身高为论域,那么“高个子 、“中等身材 、“矮个子”也没 有明确的外延,所以诸如此类的概念都是模糊概念。 模糊概念不能用经典集合加以描述,这是因为不能绝对地区别“属于 或“不属于 , 就是说论域上的元素符合概念的程度不是绝对的0 和1 ,而是介于0 和1 之间的一个实 数。 1 1 1 模糊子集的定义及其表示 这里给出z a d e h 在1 9 6 5 年对模糊子集的定义: 定义1 1 设给定论域阢u n o ,1 1 闭区间的任一映射: :u _ o ,1 】 甜一脚( 砂 都确定u 的一个模糊子集彳,脚称为模糊子集的隶属函数,脚( 功称为u 对于么的隶属 度。在不混淆的情况下,模糊子集也称为模糊集合。 上述定义表明,论域u 上的模糊子集a 由隶属函数( “) 来表征,( “) 取值范围为 闭区间 o ,1 1 ,蝴( 甜) 的大小反映了u 对于模糊子集的从属程度。脚( 甜) 的值接近于1 ,表示 u 从属于么的程度很高;( “) 的值接近于0 ,表示u 从属么的程度很低。可见,模糊子 集完全由隶属函数来描述。 当( “) 的值域等于 0 ,l 时,脚( “) 蜕化成一个经典子集的特征函数,模糊子集彳便 蜕化成一个经典子集。由此不难看出,经典集合时模糊集合的特殊形态,模糊集合是经 4 基于a f s 模糊逻辑的模糊关联分类研究 典集合概念的推广。 1 1 2 模糊子集的运算 ( 1 ) 模糊子集的包含和相等关系 设彳、召为论域【厂上的两个模糊子集,对于u 中的每一个元素u ,都有( “) 从力, 则称么包含b ,记作彳2 男。 如果彳2 召,且b d _ a ,则说么与召相等,记作a = b 。由于模糊集合的特征是它的 隶属函数,所以两个模糊子集相等也可用隶属函数定义。若对所有元素“,都有u a ( u ) = 呦( “) ,则a = b 。 ( 2 ) 模糊子集的并、交、补 设彳、曰是论域u 上的两个模糊子集,规定么堋、a t 、b 、4 。的隶属函数分别为沾、 脚加、脚c ,并且对于u 的每一个元素j 都有 v 文材) = 儿4 ( “) v 以砂 脚从妨= 脚( 国 似力 “文甜) = 1 - “a ( u ) 上述三式分别为彳与召的并集、交集和彳的补集。式中“v ”表示取大运算,“八 表 示取小运算,称其为z a d e h 算子。因此两个模糊子集的并、交可写成 ( 功v 似功= m a x i l l a ( u ) ,瓜功】 ( 功八似妨= m i n “a u ) ,文功】 模糊子集彳、曰并集的隶属函数取脚( 功及以功中的最大值,而彳、刀交集的隶属函 数取脚( “) 及从功中的最小值,模糊集合的并、交运算可以推广到任意多个模糊集合。 ( 3 ) 模糊子集的运算的基本性质 幂等律:么u 么= 彳;a 厂、a = a 交换律:么ub = bu 彳;a 邶= bn 么 结合律:au 功uc = 彳up uc ) ;a 厂、功厂、c = 彳厂、厂、c ) - 分配律:似u 功r 、c = 口r 、c ) u r 、c ) ;“r 、功uc = 似uon uc ) 吸收律:研u 功na = 彳;似n 功u 彳= a 同一律:auu = u ;anu = 彳;彳ug = 彳;ana = f 2 j 5 第1 章模糊数学基础 复原律:“丁= a 对偶律:u b ) 。= 彳c n 矿;口r 、功c = 彳c u 矿 上述性质模糊集合与经典集合是相同的,但须指出,模糊集合不在满足互补律,其 原因是模糊子集彳没有明确的边界,彳c 也无明确的边界。正是这一点,使模糊集合比经 典集合更能客观地反映实际情况,因为实际问题中,存在着许多模棱两可的情形。 1 2 模糊关系 1 2 1 模糊关系的定义 模糊关系是普通关系的推广,在模糊集合论中,模糊关系占有重要地位。普通关系 是描述元素之间是否有关联,而模糊关系则是描述元素之间关联程度的多少。 设五】,是两个非空集合,则直积x 】,= ,力ix 五y n 中的一个模糊子集r 称为从x 到】,的一个模糊关系,记作弘与y o 模糊关系r 由隶属函数:x 卜【o ,1 1 完全刻画。序偶阮力的隶属度为化力,它表明了伍,力具有关系足的程度。 1 2 2 模糊关系的运算 ( 1 ) 模糊关系的运算 设r 、s 是x y 上的模糊关系,则定义以下模糊关系的并、交、包含、相等、补 等运算: 并:rus 营v 【 ,力,0 ,力】,v ( x ,力弘】, 交:r 厂、s 营a ,力,l a s ( x ,力】,v ( x ,力从】, 包含:尺s o r ( x ,力冬o s ( x ,力,v 力承】, 相等:r = s 营o ,力= p s ,力,v 瓴力x 】, 补:彤营州甜) = 1 - t r ( x ,力,v ( x ,力x 】厂 转置:r r ,力= p r r ( x ,力,v ( x ,y ) 彳lr r 称为r 的逆关系,又称倒置 关系。 恒等关系:若给定x 上的模糊关系,满足 ,p j c 毛j ,= l :i j 6 基于a f s 模糊逻辑的模糊关联分类研究 则称,为x 上的恒等关系。 零关系:若给定x 】,上的模糊关系q 满足q 营p q ,力= 0 ,v ( x ,力x l 则称q 为x 】,的零关系。 全称关系:若给定x 】厂上的模糊关系e 满足e 营p 舷,力= l ,v o ,力x l 则称e 为x 】,上的全称关系。 ( 2 ) 模糊关系的运算性质 根据上述定义,容易得到下述性质: 俾c ) c = r ,这里,属性“富有经验”和“高收入都由模糊属性来模拟。 1 4 基于a f s 模糊逻辑的模糊关联分类研究 我们注意到这种通过模糊属性来模拟的类型必须要谨慎。事实上,它假定给所有属 性分配一个单一的范围( 单位区间) ,定义在数字属性域上的隶属函数通过模糊性质定 义了这些域的一个改变尺度。虽然这对潜在的数字定义域d o m ( a o ( 例如,高度和其相 关的性质“高 或者收入和其相关的性质“高) 是合理的,但是对复杂定义域的属性 或潜在维数不清楚的属性则不明显了。例如,在单位区间度量性质“富有经验 可能很 棘手如果它不仅依赖管理者的工作时间,还依赖另外一些方面,比如,公司的大小,工 程的数目和类型等等。 注意到几个( 一维) 模糊属性彳,能够通过丁一范数。组合到一个多维的属性彳: 谢 么( 功= 固a i ( x ) a ic a 这是扩充到模糊情形的一个直接的方法。互范数是函数致o ) :【0 ,1 】【0 ,1 】一【0 ,1 】,将 合取推广到部分真值,正范数满足【1 5 】 ( t 1 ) 边界条件,t ( 0 ,0 ) = 虱o ,1 ) = 及l ,0 ) = 0 , ( t 2 ) 恒等条件,t ( x ,1 ) = x , ( t 3 ) 交换性,t ( x ,力= 地功, ( t 4 ) 单调性,t ( x ,力砸,们如果x z 和y w , ( t 5 ) 结合律,t ( x ,珊,力) = t ( t ( x ,力,力。 两个经常用到的弘范数是最小值:t ( x ,力= m i n ( y , 功和乘积:t ( x ,力= 砂 对于模糊集x 和y ,以力和p 脚分别表示记录f 隶属于x 和】,的隶属度,那么, 一个最一般的推广了的模糊关联规则的支持度和信任度就可以表示为: d s u p p = 铲 f o t ( i t x o ) ,p 】,( r ) ) d c o n f :鱼曼 ! :竺羔:! 一 f d p x ( f ) 很多学者对关联规则支持度和信任度测度也做了大量的研究,指出了这两个测度的弊 端,并对它们进行了推广【1 4 ,1 5 , 1 6 1 。 1 5 第2 章k d d 与关联规则 2 3 3 模糊关联分类 在基于规则的分类系统中,输入的预测属性和输出的类变量用i f t h e n 规则表示。 对于关联规则,规则的后件不是事先能够确定的,而分类生成的规则其规则后件就是当 前数据所属的类标号,于是就有了将分类规则与关联规则挖掘相结合的方法c b a , 并提出了关联分类规则1 9 1 。在此之后,人们对关联分类做了大量的研究,很多研究表明 关联分类在一般情况下都能有更好的结果,它主要有一下几个方面的优点:第一,具有 独立于训练集大小的较快的训练机制;第二,能很容易的处理高维的数据集;第三,紧 凑的规则集使得分类更快;第四,分类模型很容易被人类理解,具有很好的可解释性【3 5 】。 随后人们对基于关联规则的分类算法做了大量研究,并提出了很多改进了的算法,如 c m a r 2 0 1 、c p a r 2 1 】等等。 同样,由于分明集合在解决实际问题时的固有弊端,人们将分明集上的关联分类规 则使用模糊的方法进行了延伸,从而出现了运用模糊集合的方法设计关联分类器,关联 分类规则就被称之为模糊关联分类规则,规则的前件是特征空间的模糊集,而结论是集 合 1 ,2 ,c 中的一个分明( 非模糊) 的类标号。 令c = c l ,c 2 ,c c 是类标号的有限集合,特别地,在关联分类中,只有单一类标 号的那些规则是我们需要考虑的。如前一节所述,可以从给定的训练样本中定义模糊关 联规则a c c 的支持度和信任度。因为c 是只有值 0 ,1 ) 分明集:如果p 属于类g , 如) = 1 ,否则以功= 0 ,于是模糊关联规则a c jc 的支持度可以按如下的方式计算: d s u p p ( a c c c ) = 坠半 f ct ( g a 。( r ) ,p e ( r ”。f 盛c 。t ( i a a 。( ,) ,p c 。( r ) ) 2 两一十阿一 f c ,p 彳。( ,) 2 矿 = 哗半斜 1 6 基于a f s 模糊逻辑的模糊关联分类研究 令 s u p p ( a e 删= 产 , 令jc c ) = 丝掣 ( 1 0 ) 它只由第c 类中记录决定,而和其它类中的记录无关。与肪切相比,它避免了各 类中记录数的不平衡,这种不平衡是指数据集中某些类只有很少样本而另外的类有很多 的样本,这时容易忽略那些具有较少样本的类挖掘出来的感兴趣的规则,下面以一个例 子来说明这种情况。 例2 1 假设有一数据集d ,样本总数为1 5 0 ,分成c l 和c 2 两类,样本数分别为3 0 和1 2 0 。现在有两个模糊集a 和b ,类c l 中的样本属于a 和b 的隶属度分别为0 6 和 o 1 5 ,而类c 2 中的样本属于a 和b 的隶属度分别为o 1 和0 6 ,利用( 9 ) 和( 1 0 ) 式, 可以分别求得 d s u p p ( a := c - ) = 警- 0 1 2 d s u p p ( b = = ,c 1 ) = 等= o 0 3 d s u p p ( a :c 2 ) = 訾_ o 0 8 d s u p p ( b c 2 ) = 百0 6 x 1 2 0 = o 4 8 和 一 s u p p ( 彳j c 1 ) = 1 0 6 x 矿3 0 = o 6 s u p p ( b :,c 1 ) = 骂产_ o 1 5 s u p p ( a = ,c 2 ) = 警_ 0 1 s u p p ( b c 2 ) = 百0 6 x 1 2 0 = o 6 对于d s u p p ,如果取阈值为o 1 ,那么规则ajc 1 和b c 2 就能够被发掘,但是如 果阈值为0 2 ,那么就只有bjc 2 ,对c l 有用的规则ajc l 就被忽略了。而如果使用 勋口矽就能够比较明显的避鱼此类问题。在本文,我们将采用这个改进了的s u p p 作为支 1 7 第2 章k d d 与关联规则 持度准则,并且按如下的方法计算信任度: c d 矿( 以jc c ) = d c o n f ( a cjc c ) f dt ( i x a 。( r ) ,l x c 。( ,) ) z t d p 彳( f ) z , t c 。r ( p 彳。o ) ,p c 。( f ) ) f 硭c 。t ( p a 。o ) ,p c 。( ,) ) f dp 4 ( f ) f dl x a 。( t ) f c 。p 4 。( f ) e ,d p 彳( ,) 在下面的分类器设计中,该支持度是用来过滤每一类中影响很小的规则,而信任度 是则用来度量每类中模糊关联规则的强度。 1 8 基于a f s 模糊逻辑的模糊关联分类研究 第3 章a f s 代数和a f s 结构 自1 9 6 5 年l a z a d c h 提出模耪集理论以来,国内外许多学者在隶属函数和模糊逻 辑方面做了大量的研究工作,模糊概念的描述、模糊逻辑控制器、模糊聚类分析、近似 推理和其他人工智能等模糊集理论的应用领域都是建立在隶属函数和模糊逻辑基础上 的。然而,目前所采用的确定隶属函数的方法,主要都是靠人的经验和直觉,含有大量 的人为因素。目前的模糊逻辑系统中的逻辑运算分别是用磁、卜模及否定算子定 义的,它们有无穷多种。逻辑运算算子的具体选取也含有一定的人为因素,由此导致了 隶属函数和模糊逻辑系统的建立缺少客观性、严密性和统一性,使得许多重要的数学工 具不能发挥其应有的作用,严重地阻碍和限制了模糊集与系统理论的发展和应用。 刘晓东教授于文献 2 2 。3 4 】中提出的a f s 理论,将人对概念的分解及合成的部分机理 数学抽象化,较好地揭示了人靠经验和直觉描述复杂的模糊概念以及确定相应模糊概念 的隶属函数的内在机理,不是用i 模、雠和否定算子,而是由原始数据用a f s 代 数的运算和其上的一个逆序对合运算来建立模糊逻辑系统,同时已初步用拓扑分子格刻 划人类概念之间的抽象关系,从而使得应用代数、拓扑、组合数学等严密的经典数学方 法来研究模糊集理论成为可能,也使得隶属函数和模糊逻辑系统的建立更具客观性、严 密性和统一性。 a f s 理论将模糊集的思想数学公理化,是一个更接近于实际的数学工具。a f s 理论 给出了三个新的数学对象:a f s 代数、a f s 结构和认知域。a f s 代数是一种分子格,包 含日代数、* e i 代数、日一代数和日斤代数,它是概念的表示、结构、合成、分解的数 学刻划,是建立a f s 理论的数学基础。a f s 结构是论域x 上的复杂关系的数学抽象, 它和a f s 代数结合可以给出论域x 上的模糊集的隶属函数的表示以及a f s 模糊逻辑系 统的构造,a f s 结构与计算机的数据库在结构上很相似,非常便于计算机操作。而认知 域则将三一模糊集转化为z a d e h 一模糊集,即隶属度取值在【o ,l 】中的模糊集。这种卜 模糊集到z a d e h _ 模糊集的转化,将使得模糊概念的a f s 描述更直观,更易于操作。 1 9 第3 章a f s 代数和a f s 结构 下面简要的介绍文中用到的a f s ( a x i o m a t i cf u z z ys e t ) 模糊逻辑的表示和性质, 更详细的介绍可以参看文献 2 2 , 2 3 , 2 6 , 3 1 , 3 2 l 。本质上来讲,a f s 框架研究的是如何将数据库 中的信息转化为隶属函数及其模糊逻辑运算。 3 1a f s 模糊逻辑 下面我们以一个例子来讲解a f s 模糊逻辑的机制。 例3 1 :设= x l ,x 2 ,x l o 是由1 0 个人构成的集合,属性集m = m l ,m 2 ,m l o , 其中m 1 = 老,聊2 = 身高高,m 3 = 体重重,m 4 = 工资高,m 5 = 财富多,m 6 = 男性,m 7 = 女性,m 8 = 头发颜色黑,m 9 = 头发颜色白,m l o = 头发颜色黄。关于论域x 和属性 集旭有下面的表格和关于头发颜色的序关系。例如,头发颜色白一列的数字表示如下 的序关系( ) :x 7 x 1 0 x 4 = x 8 x 2 = x 9 = x 5 x 6 = 秘= x i 表3 1 属性描述 t a b l e3 1d e s c r i p t i o n so f f e a t u r e s 外貌财富性别头发颜色 年龄身高体重薪水财产男女 里 白黄 x l 2 01 99 01o106 14 x 2 1 31 23 2o0o1 4 31 x 3 5 01 76 71 4 03 4o1614 x 4 8 01 87 32 08 010342 x 5 3 41 45 41 52lo522 x 6 3 71 68 08 02 80l614 x 7 4 51 77 82 6 89 01o164 x 8 7 01 6 57 03 04 510342 x 9 6 01 8 28 32 59 801431 x i o 31 12 1oo01253 从右边到左边的表示头发颜色黑的程度越来越强。在上式中,x , x y ( 例如x 7 x l o ) , 表示勘头发的颜色接近于黑得程度要比x j 强。劫= x j ( 例如x a x s ) 表示而头发的颜色看 基于a f s 模糊逻辑的模糊关联分类研究 起来和坼一样黑。在x 上的概念可能会和一个或多个属性有关。例如,模糊概念“高 属性“高度 有关,模糊概念“白发的老年妇女”和三个属性( 年龄,头发颜色黑,女 性) 。设m = m l ,m 2 ,m l o 是在x 上的分明或模糊属性,每一个m m 是一个单独的 属性,m 中的元素被看作是简单概念。对于每一个概念集合么互m 兀聊“m 表示么的 概念做“口材逻辑运算生成的一个新概念。例如,a = m l ,m 6 c 坛r i m a m 寻m l m 6 表 示一个新的模糊概念“年龄老的男人 ,与这个概念相关的属性是“年龄 和“性别”。 ,以l 刮f m ) 是l - l m “,m 表示的由所有a ,i e i 作“o r 逻辑运算生成的一个新概念。 例如,丫= m l m 6 + m l m 3 + m 2 的意思是“年龄老的男人 或“体重重的年龄老的人” 或“个子高的人 。 m 是一些模糊概念和分明概念的集合,每一个旭又兀掰e a i 聊) ,a f mf ,都有一 个明确的含义,如我们上面所讨论的。m 3 m s + m l m 4 + m l m 6 m 7 + m l m 4 m s 和m 3 m s + 所l 弛+ m l m 6 m 7 是等价的即同一个模糊概念。对于任意x ,x 属于模糊概念m l m 4 m $ 的程度总是 比属于模糊概念m l m 4 的程度小。因此,m l 聊棚8 对于左边的概念来说是冗余的。下面考 虑以下两个概念仪:m l m 4 + m 2 m 5 m 6 ,u :m s m 6 + m s m s ,模糊概念“ao rd 和“仪a n d d 可以如下描述: “0 lo ru :m l m 4 + m 2 m 5 m 6 + m 5 m 6 + m 5 m s 等价于 m l m 4 + m s m 6 + m s m s “0 【a n du :m l m 4 m 5 m 6 + m 2 m s m 6 + m l m 4 m s m s + m 2 m s m 6 m $ 等价于m l m 4 m s m 6 + m 2 m s m 6 + m l m 4 m s m s 为了研究模糊概念及其逻辑运算的内在本质,引入下面的符号e m * 和a f s 代数。 设m 为一个集合,一般m 是一些模糊概念或分明概念构成的一个集合。 e 财= 埏又兀埘鲥,垅) 陋,鱼f 厶,为任意一非空指标集 定义3 1 :设m 是一个非空集合。e m * 上的二元关系按如下定义,对于f 以l 彳,聊) , 骂j ( 兀晰嘶聊) 脚, f 又l - m e a f 聊) 】r 【与e 又兀坍b jm ) 营 ( 1 ) w f d ,j 既q 力使得彳f2 岛 ( 2 ) v b j 6 , 力,了彳“后d 使得b j _ d a k 。 记商集e m * m 为e 九在本文中,埏4 严写局总表示迮4 f 和b 局等价,因此它们 的语义是相同的。在例3 1 中, 2 1 第3 章a f s 代数和a f s 结构 亏= m 3 m $ + 历l 晌+ 脚l 脚6 脚7 + m l m 4 m 8 , 2m 3 m $ + m l m 4 + m l m 6 m 7 e m 通过定义3 1 ,得到亏= 。f e 又兀埘a ,m ) e m 称为一个模糊概念,模糊概念的长度 r 舡l “,m ) l l 按如下定义: 州 1 n i i ,又兀肼a fm ) l l = a ff 厶a k 岱么f ,对于任意k 厶后f )( 3 1 ) 例如,号= m 3 m 8 + 历l 刀q + m j m 6 m 7 + m l m 4 m 8 点a 办贝0 i i 亏i i = 3 。 定理3 1 :设m 是一个非空集合,如果如下定义肼上的运算八,v , 完全分配格( 分子格) :任意,i ( 1 - l 彳,加) ,写e 又兀研毋聊) e m , 善vz出i-岛iilmea,聊h ( 酬 f 历i v 。聊i = i 兀所i i l , j j m e b j k e iu t 、m k ) 善哑m 八否哑聊 = ,毛( 。驭m 贝i j ( e m , a ,v ) 是 ( 3 2 ) ( 3 3 ) 其中k 八j ,( ,uj 是指标集j ,的不交并) ,当k ,时,c k = 么| ,当k 山q = b k 。删;a ,v ) 称为m 上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论