基于云模型定性规则推理的分类方法_第1页
基于云模型定性规则推理的分类方法_第2页
基于云模型定性规则推理的分类方法_第3页
基于云模型定性规则推理的分类方法_第4页
基于云模型定性规则推理的分类方法_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于云模型定性规那么推理的分类方法论文导读::根据粗糙集原理和模糊集理论,提出了一种基于云模型定性规那么推理的分类方法,它利用云的相关理论获得多条件单规那么中包含隶属度的决策表,结合模糊模式识别技术进行样本分类。针对一些数据对象分别隶属于不同类别的情况,定性概念来代替模糊集中的定量数据并建立二元关系,能对连续型数据进行更为简单合理的软;分类,从而使基于定性概念的算法模型符合人类思维方式。论文关键词:云模型,规那么推理,分类算法,定性概念0 引言在模糊理论【1】中,模糊聚类分析方法就是通过建立模糊相似矩阵或模糊等价矩阵,利用直接聚类法、最大树法、编网法等方法结合阈值对论域中的样本进行分类。然而模

2、糊相似矩阵和模糊等价矩阵都是通过相似系数法、距离法和其它方法如数量积法、夹角余弦法、海明距离、欧氏距离、切比雪夫距离等方法建立在二元关系的根底之上,并且通过等价关系的传递性质进行动态聚类。因此,建立二元关系是进行分类或聚类的重要过程。不同论域中定量数据可以通过模糊聚类方法中的一般步骤建立起二元关系,即两个样本之间的相似关系或相关程度。那么,定性概念是符合人类思维方式的一种数据结果表达方法,建立定性概念之间的二元关系是否也能对相应论域中的样本进行分类呢?由于云是定量数据与定性概念之间相互转化的智能模型,它主要应于数据挖掘、预测【6】和决策等领域,实现算法过程的定性概念描述和推理分析。通常情况下,

3、定量数据的推理过程是通过模糊控制理论来实现,起到定量数据的模糊化推理,可以到达较好的结果。同样,不确定性人工智能云理论的诞生,为定性推理奠定理论根底。本文主要根据模糊粗糙集理论,提出一种基于云理论定性推理的分类算法。与传统方法相比,该方法通过利用云模型的相关机制对隶属于不同概念的样本实现软;分类,而且其分类的输出结果符合人的思维模式。1 云模型为了更为方便地说明分类算法过程分类算法,我们对李德毅院士提出的云模型的相关定义作一些简单的介绍,并给出一些相关定义。定义1设是一个用精确数据值表示的定量论域,是上的定性概念,假设定量值,且是定性概念的一次随机实现,对的隶属度确定度为是具有稳定倾向的随机数

4、,那么在论域上的分布称为云,每个称为一个云滴。云是用语言值表示的某个概念与其定量表示之间的不确定性转换模型,用以反映自然语言中概念的不确定性。概念的整体特性用云的数字特征来反映,数字特征用三个参数来描述,分别为期望,熵和超熵论文参考文献格式。期望表示最能够代表定性概念的点,熵表示定性概念的不确定性度量,反映了模糊性与随机性的关联性,超熵是熵的不确定性度量。定义2由统计学原理可知,假设满足:,其中,且对定性概念确实定度满足,那么称在论域上的分布称为正态云。定量数据和定性数据的转换可以通过正向正态云发生器和逆向正态云发生器来实现,如图1所示。图1云发生器示意图在不确定性人工智能研究过程中,如图2所

5、示,软与;可以看成是一个定性概念,处理双条件单规那么发生器时,用二维正态云表示,其中两个维的论域分别对应着确定度和的取值范围,即和。通过软与;操作转换后的云滴的统计分布的期望是1,1,那么在论域中的这一点上,它确实定度,相当于逻辑上的与;操作,而其它位置确实定度都小于1,反映了与;的不确定性,这就是软与;的特性。图2双条件单规那么发生器定义3 对于多条件单规那么If 、,Then ,前件规那么被激活概念的隶属度分别为、,通过软与;运算SA(Soft And)的结果为;那么称是分别在概念、下的相关程度,记。除了上述重要定义外,本文还利用了一些其它相关的云理论及定义,如云变换分类算法,云的普适性说

6、明,云概念提升等,限于篇幅,我们就不再逐一说明,具体知识请参考文【2】。2分析过程及算法描述2.1分析过程在多条件单规那么发生器中,规那么前件的多个条件和规那么后件的单个规那么可以用形如表1的决策表所描述,其中任意。表1中表示仅描述了规那么集中一条规那么的数据分布信息,这条规那么为If 、,Then 。表1多条件单规那么决策表 样本ID 条件属性 决策属性 1 2 n 决策表中所有样本满足同一规那么推理,即If 、,Then ,按规那么推理可知,应该把这些样本都归为同一类,即归为概念集合中。然而根据粗糙集相关原理可知,在属性决策表中,假设所有样本的条件属性值和它对应决策属性值都各不相同,那么说

7、明这些样本之间存在一定的差异,应该对它实现进一步的分类,从而让更相似的数据样本归为同一类。事实上,如果所有样本的条件属性值激活每个条件概念属性的隶属度都为1,那么可以推出所有样本决策属性值对应于概念的隶属程度也为1,即对于表1中任意一个样本,假设、,一定可以推出。根据逆向云发生器原理可知,假设隶属度为1,那么说明为概念云模型的期望值,因此,所有样本就成了同一个样本的复写。但在工程实践中,决策表是不可以是同一数据的复写,其条件属性与决策属性都不相同,因此,对于可以推出同一规那么且具有相同的激活概念的样本,由于条件隶属度的不同,导致每个样本隶属于同一规那么决策属性的程度存在差异,即隶属于同一决策概

8、念的样本之间可能存在较大的差异,故需对它们实现进一步的分类。从粗糙集的角度出发分类算法,如果断策属性为连续型数据,那么要对数据样本进行分类,首先将连续型数据转化为离散型数据。假设利用边界划分或人工划分等方法对连续型数据进行离散化,但通常会导致临界数据的划分不合理性,即对数据实现了硬划分。然而,利用云模型中的云变换,对连续型数据进行软划分,不仅对数据进行了有效的离散化,而且充分考虑到数据客观分布的特性。、能够推出,说明之间存在一定的相互关系,这样才能共同作用推出规那么,这种关系就是软与;关系,其相关程度的值为软与;操作的结果。极端地说,如果激活其相应概念的隶属度都为1,那么可以推出,此时值为决策

9、概念的期望值,它最能代表决策概念的特征,说明具有超强关系或稳定关系。因此,的相互关系是通过对同一决策属性的共同作用来反映它们之间的关系,展示这种关系的过程就是软与;操作。相应地,为了方便进一步讨论基于云规那么推理的分类思想,需要把表1的决策表变成以隶属度为数据值的决策表,如表2所示。表2多条件单规那么中隶属度的决策表 样本ID 条件属性 决策属性 概念 概念 概念 概念 1 2 n 通过上述分析,表2所有的样本不能简单地把其归为概念类。那么,这些样本到底可以归为哪些类?哪些样本能够比拟适宜地被概念所描述呢?根据知识的不确定性,概念与概念之间的关系存在着一定的模糊区域,因此,在模式识别或概念识别

10、过程中,对特定概念所描述的区域或称管辖范围可以允许存在一定的弹性,使得这个概念随着条件的变化更能够表达其描述的力度。把这种能够增强概念描述力度的弹性对象称为弹性系数,其值是根据决策表2中所有决策属性值的分布情况来决定的。通常情况下,弹性系数取值为,其中、分别为概念云模型左右相邻的云模型、与之相交的隶属度值,如图3所示。图3 概念及相邻概念的云模型图3中,两个红点u1与u2的纵坐标的值就对应于、的值,此时弹性系数的值就为论文参考文献格式。2.2 算法描述有了上述的分析理论做准备分类算法,那么基于云规那么推理的分类模型的核心思想如下:(1)对于决策表2,假设第个样本在规那么前件的隶属度通过软与;后

11、得到的相关程度为,假设,那么把该样本归入概念类中;(2)假设,那么利用条件云发生器计算出云模型在激活强度为的值两个值,即;再利用条件云发生器计算分别在云模型确实定度,即,;(3)假设,那么把该样本归入概念类中,否那么,把样本归入概念类中;(4)反复执行步骤(1)(3),直到为止。步骤(2)是分类思想的主要运算局部,其过程及对应值分布如图4所示。图4 各概念被激活的隶属度分布图3 实例分析通过对某一网站上Web日志上大量数据的采集,对大量不同客户的数据进行分析处理,即考虑客户在网站上的停留时间,访问次数和访问信息量等条件因素,来调查客户对该网站信息的满意程度,最终得到客户的有效分类。图4实际上是

12、该实验过程的结果,通过本文方法,假设将最终的决策属性分为三个定性概念,即不满意、较满意和满意三个不同的概念,其对应的云模型分别为:LCB29,9.5,0.113,CB50,8.4,0.097,RCB85,10,0.082。某一客户对网站的访问信息为因素集停留时间、访问次问、访问信息量和满意值,通过计算得到这些条件因素的相关程度。又因为决策属性的三个定性概念之间的弹性系数为,且,通过算法可知,该用户被归入了概念LCB中。在此过程中可以最多得到个规那么,为每个条件因素的概念个数,例如:表示决策表中客户的满意程度的三个概念。最终任意一多条件单规那么R都可以描述为形如:停留时间长、访问次数较大和访问信

13、息量一般分类算法,那么客户的满意度为较满意;的规那么。与定量数据相比,它更符合人类的思维模式。实事上,在模糊模式识别当中,最大隶属原那么和择近原那么是样本归属分类的主要依据,同样,基于云规那么推理的分类模型的出发点也是利用最大确定度的原那么来对样本进行恰当的分类,这也就证明了该模型的可行性。4 总结本文提出了一种基于云模型的定性规那么推理分类方法,事先通过云变换对每个数值型属性进行离散化,生成一系列用云表示的根本概念集。将这些根本概念提升到适宜的概念层次上,采用极大判定法对每个数值型属性进行软划分,并求得相应被激活各属性概念确实定度,就可以得到基于隶属度的决策表。该方法摆脱了以往依赖于定量数据

14、的分类,实现了数据的软操作,通过定性推理过程,对数据对象进行定性概念的推理,进而实现了符合人类思维活动的分类过程。需要说明的是,多条件单规那么是多条件多规那么的一个子集,可以通过扩展,把多条件单规那么拓展到多条件多规那么中,实现基于多条件多规那么的定性推理分类。参考文献【1】谢季坚.模糊数学方法及其应用. 武汉: 华中科技出版社, 2003,7.【2】李德毅.隶属云和隶属云发生器. 计算机研究与开展, 1995, 32(6):15-20.【3】李德毅.不确定性人工智能. 北京: 国防工业出版社, 2005.7【5】Li Deyi, Di Kai chang, Li Deren, et al. Miningassociation rules with linguistic cloud models. Journal of Software. 2000, 11(20):143-158.【7】柳炳祥,李海林,杨丽彬.云决策方法. 控制与决策, 2021, 24(6):957:960.李海林,柳炳祥,杨丽彬.一种基于云理论的考核成绩评价模型. 计算机时代, 2007, 10: 4-5.Li Deyi, Han J,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论