《计算机智能导论》课件-第3章_第1页
《计算机智能导论》课件-第3章_第2页
《计算机智能导论》课件-第3章_第3页
《计算机智能导论》课件-第3章_第4页
《计算机智能导论》课件-第3章_第5页
已阅读5页,还剩255页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章模糊逻辑3.1模糊理论基础3.2隶属度函数3.3模糊关系及运算3.4模糊推理3.5模糊控制系统3.6模糊聚类分析3.7模糊综合评判模型3.8模糊理论在图像处理中的应用

3.1模糊理论基础

模糊是相对于精确而言的。对于多因素的复杂状况,模糊往往显示出更大的精确。过分精确还可能导致过于刻板和缺乏灵活性。比如我们去见一个陌生的朋友,只需知道对方的几个主要特征,而不需要对他的高低胖瘦精确到几尺几寸;又如在作演讲时,只需按提纲讲要点、临场发挥即可。

模糊逻辑是一种使用隶属度代替布尔真值的逻辑,是模糊理论的重要内容,在人工智能领域具有重要意义。一提到数学,人们自然会想到它是精确的。精确数学是以精确集合

论为基础的。根据集合论的要求,一个对象对应于一个集合,要么属于,要么不属于,二者必居其一,且仅居其一,这也就是我们熟知的布尔逻辑。在布尔逻辑中,一个可以分辨真假的句子称为命题。也就是说,一个命题非真即假,非假即真,两者必居其一。

模糊逻辑的理论基础是模糊集合。模糊集合论的提出虽然较晚,但目前在各个领域的应用却十分广泛。模糊逻辑经常应用于聚类分析、模式识别和综合评判等方面。实践证

明,在图像识别、天气预报、地质地震、交通运输、医疗诊断、信息控制、人工智能等诸多领域,模糊逻辑也已初见成效。从该学科的发展趋势来看,它具有极其强大的生命力和渗透力。

3.1.1概率与模糊

Bayesian(贝叶斯)学派认为,概率是一种主观的先验知识,不是一种频率和客观测量值。以赌博为例,赌徒总认为他所认定的事件概率大。

Lindley认为概率是对不确定性唯一有效并充分的描述,所有其他方法都是不充分的(直接指向模糊理论)。

相似之处如下:

(1)都可以用来刻画不确定性。

(2)都通过单位间隔[0,1]中的数来表述不确定性,即映射的值域是相同的,均为[0,1]。

(3-)都兼有集合和命题的结合律、交换律、分配律。

区别如下:

(1)经典集合论中,A∩AC=⌀,P(A∩AC)=P(⌀)=0代表概率上不可能的事件;模糊集合建立在A∩AC≠⌀的基础上。

(2)经典集合A中某个元素x的概率在x发生之后,就会变为0或1;模糊集合A中某个元素x的隶属度不会发生变化。

(3-)概率是事件是否发生的不确定性;模糊是事件发生的程度。

例3.1.1概率与模糊。

(1)有20%的可能会下雨(概率,客观);

(2)正在下小雨(模糊,主观)。

例3.1.2概率与模糊。

(1)下一个图像将会出现一个椭圆或者一个圆,各自出现的机会均为50%(概率,客观),如图3-1(a)所示。

(2)下一个图像将会出现一个不精确的椭圆(模糊,主观),如图3-1(b)所示。图3-1概率与模糊的区别

3.1.2模糊集合的定义

1.集合及其特征函数

1)集合

在讨论集合前,先介绍以下几个相关概念。

论域:一般而言,我们将被讨论的全体对象称为论域,常用大写字母U、E、X等表示。

元素:论域中的每个对象称为元素,常用小写字母u、e、x等表示。

集合:论域中具有性质P的元素组成的总体称为集合,常用大写字母A、B等表示。

2)集合的运算

集合的常用运算包括:交(∩)、并(∪)、补。

定义3.1.1集合的交、并、补运算:设A,B∈p(X),A与B的交、并、补运算定义可分别表示为

定义3.1.2集合的差、对称差运算:设A,B∈p(X),A与B的差、对称差运算定义可分别表示为

3-)特征函数

对于论域E上的集合A和元素x,若有以下关系:

则称μA

为集合A的特征函数。

注意:特征函数表达了元素x对集合A的隶属程度。可以用集合来表达各种概念的精确数学定义和各种事物的性质。

2.模糊集合

1)概念的模糊性

许多概念集合具有模糊性,例如:

成绩:好、差;

身高:高、矮;

年龄:年轻、年老;

头发:秃、不秃。

2)模糊集合的定义

论域X上的模糊集合A由隶属度函数μA

(x)来表征,其中μA

(x)在实轴的闭区间[0,1]上取值,μA

(x)的值反映了X中的元素x对于A的隶属程度。

模糊集合完全由隶属函数所刻画。μA

(x)的值越接近于1,表示x隶属于A的程度越高;μA

(x)的值越接近于0,表示x隶属于A的程度越低;当μA

(x)的值域为{0,1}二值时,就演化为普通集合的特征函数μA

(x),A也演化为普通的集合。

3.1.3-模糊集合和经典集合

在介绍模糊集合与经典集合的区别和联系前,我们先给出映射和函数的定义。

定义设两个集合X、Y,如果有对应关系f存在,即对于任一个x∈X,有唯一的y∈Y与之相对应,则f称为X到Y的映射,记作:

其中,y称为x在f下的像,x称为y在f下的原像。

当集合X、Y都是实数集的子集时,这种映射称为函数。

模糊集合和经典集合的区别如图3-2所示。图3-2经典集合和模糊集合的区别

例3.1.3-通过判别不同温度属于什么天气来解释经典集合和模糊集合的区别。

图3-3显示了温度与天气的对应关系,此处共列出了4种天气,分别是Cold、Cool、Warm、Hot。图(a)对于任一种温度,只有一种天气与之对应,即对于一个温度要么属于某个天气,要么不属于该天气,属于经典集合;图(b)对于一个温度,其隶属的天气有重叠部分,即一个温度,它可能同时属于两种天气,只是隶属程度不同,属于模糊集合。

图3-3-不同温度对应的天气

例3.1.4通过经典集合和模糊集合的集合图示及隶属度函数图来区分经典集合和模糊集合。

图3-4通过经典集合和模糊集合的集合图示及对应的隶属度函数图显示了经典集合和模糊集合的区别。图3-4经典集合和模糊集合的集合图示及隶属度函数

例3.1.5分别计算图3-5在经典集合和模糊集合下的隶属度函数,并绘制隶属度函数图。其中经典集合为A={长度大于3cm的线段},模糊集合为A={长线段}。图3-5不同位置对应的线段长度

解由题可知,经典集合为A={长度大于3cm的线段},即A={4,5,6},其隶属度函数为

隶属度函数图如图3-6(a)所示。

模糊集合为A={长线段}。

根据线段越短属于长线段的隶属度越小,可将隶属度函数设为

隶属度函数图如图3-6(b)所示。

图3-6隶属度函数

3.1.4模糊集合的表示方法

1.列举法

列举法只适用于有限集合。当论域U是离散域时,一般可以用扎德(Zadeh)表示法、序偶表示法和向量法表示法表示。这三种表示方法均属于列举法。

(2)用扎德表示法时,隶属度函数等于0的项可以省略;用向量表示法时,隶属度函数等于0的项不可以省略。

2.描述法

对于无限集,也可使用描述法来表示集合,即

其中,P(x)表示x满足性质P。

3.隶属度函数法

论域E上的模糊集合A是由隶属度函数确定的,所以可以用隶属度函数来表示模糊集合A。模糊集合可表示为

注意:隶属度函数用精确的数学方法描述了概念的模糊性。

3.1.5模糊集合的几何图示

将论域X的所有模糊子集的集合———模糊幂集合F(2X)看成一个超立方体In=[0,1]n,将一个模糊集合看成是立方体内的一个点。非模糊集对应立方体的顶点。中点离各顶点等距,具有最大模糊。以模糊集合A的集合图示为例进行说明,如图3-7所示。

图3-7模糊集合A的几何图示图3-8模糊集合A、AC、A∩AC及A∪AC的几何图示

图3-8中各个集合的坐标值分别为

1.模糊集合的大小

模糊集合的大小通常用基数来表示,即

模糊集合A的大小的几何图示如图3-9所示。图3-9模糊集合A的大小的几何图示

2.模糊集之间的距离

模糊集之间的距离公式如下:

l2距离就是欧几里德距离。最简单的距离就是模糊汉明距离l1,它是坐标差值的绝对值之和。利用模糊汉明距离,基数M可以写成l1距离的形式:

3.模糊集的模糊程度———模糊熵

A的模糊熵E(A),对应单位超立方体In中的0~1,其中4个顶点的熵为0,即不模糊;中点的熵为1,即最大熵。从顶点到中点,熵逐渐增大。A分别与最近顶点和最远顶点连线,如图3-10所示。

图3-10模糊集合A与最近顶点和最远顶点距离的几何图示

3.1.6模糊集合的运算

1.模糊集合的基本运算

模糊集合之间还可以像经典集合一样进行集合之间的其他运算。

图3-11两个高斯隶属度函数及其绝对差

例3.1.8一个房地产商想将销售给客户的商品房进行分类。衡量房子舒适度的一个标准是其卧室的数量。设X={1,2,3,4,5,6}是房子卧室数集,模糊集“对三口之家的舒适

型房子”可以描述为

模糊集“对三口之家的大面积型房子”可以描述为

试写出“大或者舒适的房子”、“又大又舒适的房子”和“不大的房子”的集合表示形式。

2)基本定律

2.一些常用的算子

3.2隶属度函数

3.2.1隶属度函数的基本概念1.隶属度函数的定义论域U上的一个模糊集A由隶属函数μA(x)唯一确定,表示x隶属于集合A的程度,故认为二者是等同的,即

2.常见的隶属度函数

常见的一维隶属度函数的示意图如图3-12所示。图3-12常见的一维隶属度函数

钟形隶属度函数中,改变c和a可改变隶属度函数的中心和宽度,改变b可改变交叉点处的斜度。图3-13显示了参数调整对钟形隶属度函数的影响。

图3-13-参数调整对钟形隶属度函数的影响

还有一种常用的一维隶属度函数———Sigmoid隶属度函数,此类函数常用于人工神经网络。其表示形式如下:

通过分析图3-14(a)、(b)的参数,可以得知参数a控制函数的左开和右开,适合用来描述“非常大”或“非常小”。下面将对左开、右开和闭模糊集合进行定义。

图3-14Sigmoid隶属度函数及其计算

2)二维隶属度函数

(1)通过一维扩展(CylindricalExtension)产生的二维隶属度函数如下:

以高斯隶属度函数为例,绘制它的一维函数图,并通过一维扩展绘制其二维隶属度函数图,分别如图3-15(a)、(b)所示。

图3-15高斯隶属度函数

(2)通过极小极大运算产生二维隶属度函数。以钟形二维隶属度函数和高斯二维隶属度函数的产生方式为例,图3-16(a)、(b)的产生方式依次为图3-16钟形二维隶属度函数

图3-17(a)、(b)的产生方式依次为

图3-17高斯二维隶属度函数

3.2.2隶属度函数遵守的基本原则

隶属度函数实质上反映的是事物的渐变性,隶属度函数遵守如下基本原则:

(1)表示隶属度函数的模糊集合必须是凸模糊集合。

①在一定范围内或者一定条件下,模糊概念的隶属度具有一定的稳定性;

②从最大的隶属度函数点出发向两边延伸时,其隶属度函数的值必须是单调递减的,而不允许有波浪性。

总之,隶属度函数呈单峰馒头形(凸模糊集合一般用三角形和梯形作为隶属度函数曲线),凸模糊和非凸模糊集合的示意图如图3-18所示。

图3-18凸模糊与非凸模糊示意图

(2)变量所取隶属度函数通常是对称和平衡的。

模糊变量的标称值一般取3~9个为宜,通常取奇数(平衡):在“零”、“适中”或者“合适”集合两边的语言值通常取对称值(如速度适中,一边取“速度高”,另一边取“速度低”,

满足对称性)。

(3)隶属度函数要符合人们的语义顺序,避免不恰当的重叠。

在相同的论域上使用的具有语义顺序关系的若干标称的模糊集合,应合理排列。图3-19显示的交叉越界的隶属度函数就不符合人们的语义顺序,是不恰当的。图3-19交叉越界的隶属度函数

(4)论域中的每个点应至少属于一个隶属度函数的区域,同时它一般应属于至多不超过两个隶属度函数的区域。

(5)对于同一输入,没有两个隶属度函数会同时具有最大隶属度。最大隶属度代表集合的最明显特征。

(6)当两个隶属度函数重叠时,重叠部分对于两个隶属度函数的最大隶属度不应有交叉。

3.2.3-隶属度函数的设计

1.设计方法

隶属度函数是模糊控制的应用基础,那么如何确定隶属函数呢?主要有以下四种方法:

1)模糊统计法

模糊统计法的基本思想是对论域U上的一个确定元素x是否属于论域上的一个可变的清晰集的判断。

模糊统计法计算方法如下:

可见,n越大,隶属频率就越稳定,但是计算量也越大。

2)例证法

例证法是由已知的有限个隶属函数的值,来估计论域U上的模糊子集A的隶属度函数。

3)专家经验法

专家经验法是根据专家的实际经验给出模糊信息的处理算式或者相应的权系数值隶属度函数的一种方法。

4)二元对比排序法

二元对比排序法是通过多个事物之间两两对比来确定某种特征下的顺序,由此来确定这些事物对该特征的隶属度函数的大体形状。

2.隶属度函数图形

模糊控制中的隶属度函数图形大概有以下三大类:

1)Z函数

Z函数是指左大右小的偏小型下降函数,如图3-20所示。图3-20Z函数

2)S函数

S函数是指左小右大的偏大型上升函数,如图3-21所示。图3-21S函数

3)Ⅱ函数

Ⅱ函数是指对称型凸函数,如图3-22所示。

例3.2.1X={0,1,2,3,4,5,6}为家庭可以拥有孩子的数目,模糊集合A=“家庭拥有最明智孩子的个数”,试设计A集合的隶属度函数。

解A={(0,0.1),(1,0.3),(2,0.7),(3,1),(4,0.7),(5,0.3),(6,0.1)}。

家庭拥有最明智孩子数量的隶属度函数图形如图3-23所示。横坐标表示孩子的数量,纵坐标表示对最明智孩子数量的隶属度。以(1,0.3)为例,表明孩子数量为1的家庭属于拥有最明智孩子数量家庭的隶属度为0.3。

图3-22Ⅱ函数

图3-23-家庭拥有最明智孩子数量的隶属度函数图

例3.2.2令X=R+表示人类可能年龄集合,模糊集合B=“60岁左右”,试设计B集合的隶属度函数。

属于60岁左右年龄的隶属度函数图形如图3-24所示。

图3-24属于60岁左右年龄的隶属度函数图形

3.2.4模糊集合的特性

模糊集合的特性包括支持、核、高度、正则化、α水平截集等。下面将介绍它们的定义,并在图3-25中对这些特性进行直观的体现。

图3-25模糊集合的特性

3.2.5模糊性的度量

隶属度函数值的确定,在实际中常常带有主观性。对于同一论域上的模糊集合,不同的人使用不同的判断标准,所得出的各元素的隶属度也不尽相同。这涉及模糊性的度量问题。目前使用较多的模糊性度量方法有“距离”和“贴近度”两种。

2)模糊性的“贴近度”度量

3.3-模糊关系及运算

3.3.1模糊关系1.集合的笛卡尔乘积设X={x},Y={y}为两个集合,则它们的笛卡尔乘积集可表示为其中,(x,y)是X、Y元素间的有序对。

2.关系定义及其表示

1)关系的定义

设X={x},Y={y}为两个集合,R为笛卡尔乘积X×Y的一个子集,则称其为X×Y中的一个关系。

注意:关系R代表对笛卡尔乘积集合中元素的一种选择约束。

2)关系的表示

(1)集合表示法:

(2)描述表示法:

(3)图形表示法。

(4)矩阵表示法。

例3.3.1设U={张三,李四,王五},V={数学,英语,政治},张三选了数学和英语,李四选了英语和政治,王五选了数学和政治。请用关系R来表示三者的选课情况。

解张三、李四和王五的选课情况可用关系R表示为

例3.3.2在医学上关于身高和体重的常用公式为:标准体重B(公斤)=身高A(厘米)-100,这给出了身高A与体重B的普通关系,若A={140,150,160,170,180},B={40,50,60,70,80},试以表格形式列出身高和体重的关系。

解身高与体重的普通关系如表3-2所示。

3.模糊关系

(1)如果关系R是X×Y的一个模糊子集,则称R为X×Y的一个模糊关系,其隶属度函数为μR(x,y)。

注意:隶属度函数μR(x,y)表示x、y具有关系R的程度。

(2)若一个矩阵元素取值在[0,1]区间内,则称该矩阵为模糊矩阵。同普通矩阵一样,模糊单位阵记为I;模糊零矩阵记为0。

例3.3.3-若例3.15中身高和体重的模糊关系可表示为

则给出身高和体重的模糊关系,并写出模糊关系的矩阵表示。

解身高和体重的模糊关系如表3-3所示。

4.模糊矩阵的关系及其运算

由于模糊关系也是模糊集合,所以模糊集合的相等、包含、并、交、补等概念对模糊关系同样具有意义。

设R1和R2是X×Y中的模糊关系,如果对∀(x,y)∈X×Y,模糊关系的基本运算的隶属度函数表示如下:

3.3.2模糊关系的运算

1.极大极小复合运算

设R1和R2分别是定义在X×Y和Y×Z上的两个模糊关系,R1和R2

的极大极小复合运算可得到一个模糊关系(集合),可表示为

2.极大乘积复合运算

设R1和R2

分别是定义在X×Y和Y×Z上的两个模糊关系,R1和R2

的极大乘积复合运算可得到一个模糊关系(集合),可表示为

图3-26MR3-(3,b)图形

例3.3.6假设有两个模糊关系,其合成如下:

试计算模糊关系P与模糊关系Q的合成。

3.4模糊推理3.4.1模糊逻辑的特点及运算模糊逻辑具有以下几个特点:①它是界于传统人工智能的符号推理和传统控制理论的数值计算之间的方法;②它不依赖于模型,用语言来表示变量,用规则进行模糊推理,处理事物;③它承认真值(True)与假值(False)的中间过渡性,认为事物在形态和类属方面亦此亦彼,模棱两可,相邻中介之间是相互交叉和渗透的。

设p、q为两个变元,模糊逻辑的基本运算定义如下:

3.4.2模糊语言变量

人类的思维和语言之间有着十分紧密的联系。思维通过语言来表达,是语言的内容;没有思维就没有语言,语言是思维的一种重要表达方式。人类思维中有着许多反映事物模糊性的概念,人类语言中相应地也有大量表达这些概念的模糊词语。

语言变量可用一个包含五个元素的集合(x,T(x),X,G,M)来表征,其中x为语言变量名;T(x)为语言变量x的语言值或语言术语集合;X为语言变量x的论域;G为产生T(x)中术语的句法规则,用于产生语言变量值;M是赋予每个语言值A以含义M(A)的语法规则,即隶属度函数。

例3.4.1T(年龄)={年轻,不年轻,不很年轻,…,

T(年龄)中的每一个术语(取值)可表征为论域X=[0,100]上的模糊集合,通常我们用“年龄=年轻”来表示给语言变量“年龄”赋以语言值“年轻”;相反,将年龄作为一个数值

变量,使用表达式“年龄=20”来赋予数值变量“年龄”以数值20。

1.句法规则

为了接近自然语言的描述习惯,更方便地将自然语言形式化、定量化,语言算子的概念被引入:将日常语言中一些用来表述程度的词语,如“微”、“很”、“非常”、“大概”等分别放在某词语或词组前,用来调整、修饰原来的词义,从而得到一个新词来表示可能性、近似性和程度。语言算子有:语气算子、模糊化算子、判定化算子。

(1)语气算子:可以修饰原词的肯定程度,在自然语言中把“很”、“极”、“非常”等放在一个词语前面,便调整了原词的肯定程度。

(2)模糊化算子:“大约”、“大概”、“几乎”等词语也是一种算子,称为模糊算子。这种算子放在一个词语前面,即可把词语的概念模糊化。

(3)判定化算子:作用是将模糊转化为比较粗糙的判断,例如“偏向”、“倾向于”、“多半是”等。

2.语法规则

为了更加准确地描述语言变量的隶属度函数,制定了语法规则。通过否定词(不)或程度词(非常、或多或少)修饰几个基本术语(年轻、年老、中年),从而产生新的语言变量,其

隶属度函数的计算可采用以下两个算子:压缩扩张算子和对比增强算子。

1)压缩扩张算子

当新语言变量是由程度词修饰几个基本术语产生时,其隶属度函数的计算采用压缩扩张算子,即

其中,当k>1时,对语言变量起压缩作用,表示“很”;当k<1时,对语言变量起扩张作用,表示“有点”。图3-27所示的是“年龄”语言变量的隶属度函数经过压缩扩张算子调整后的分布情况。

图3-27压缩扩张算子调整后的分布情况

2)对比增强算子

有时,压缩扩张算子产生的隶属度函数不足以描述新语言变量的程度,因此引入对比增强算子

其作用效果表现为,当语言的隶属度值大于0.5时,增大它;小于0.5时,减少它。

3)为复合语言变量建立隶属度函数

在日常生活中,除简单地表示程度、近似及不确定的语言变量外还存在一些更为复杂的概念,如“年轻但不是太年轻”等。这种由简单语言变量复合而成的语言变量称为复合语言变量。接下来将举例介绍如何为复合语言变量建立隶属度函数。

如图3-28所示,初始语言变量的值有“年轻”和“年老”两种。

图3-28复合语言变量的隶属函数

(1)或多或少有些年老:(年老)0.5;

(2)不年轻也不年老:(-年轻)交(-年老);

(3)年轻但不是太年轻:(年轻)交(-年轻)2;

(4)特别年老:年轻8。

3.4.3-模糊推理

传统的命题逻辑中,命题的“真”和“假”必须具有意义。逻辑推理就是给定一个命题,组合成另一个命题的过程。模糊推理可以认为是一种不确定的推理,是将输入的模糊集通过模糊逻辑方法对应到特定输出模糊集的计算过程。模糊规则就是在进行模糊推理时所依据的规则,通常可以用自然语言表述。

1.模糊规则

模糊规则是对自然或人工语言中的词语和句子定量建模的有效工具。通过将模糊规则理解为恰当的模糊关系,可以研究不同的方案。模糊规则也称模糊隐含、模糊条件句,一般形式为:“ifx是A,theny是B”,其中A和B分别是论域X和Y上的模糊集合定义的语言值。

例3.4.2如果压力高,则容量小;如果路滑,则驾车危险;如果西红柿是红的,则它熟了;如果速度快,则略微刹车等。

在使用模糊规则对系统进行分析和建模之前,必须将“ifx是A,theny是B”的意义形式化。实际上,这个规则描述的是变量x和y之间的关系,即模糊规则可以定义为乘积空间X×Y上的二元模糊关系R。其定义有多种,常见的两种是最小运算和积运算。

2.模糊推理

模糊推理也称近似推理,是从模糊规则“if-then”规则和已知事实中得出结论的推理过程。其推理过程如下:

1)单一前提单一规则

具有单一前提的模糊“ifthen”规则通常写为“如果x是A,则y是B”,GMP(广义假言推理)相应的问题如下:图3-29单一前提单一规则举例

2)多前提单一规则

具有两个前提的模糊“ifthen”规则通常写为“如果x是A,y是B,则z是C”,GMP(广义假言推理)相应的问题如下:图3-30多前提单一规则举例

3)多前提多规则

具有多个前提的模糊“ifthen”规则通常写为“如果x是A1,y是B1,则z是C1;如果x是A2,y是B2,则z是C2”,GMP(广义假言推理)相应问题如下:图3-31多前提多规则举例

图3-32多规则复合

3.模糊推理步骤

模糊推理的步骤如下:

(1)计算匹配度;

(2)计算激励度(某个规则激励程度);

(3)对规则的后件施加激励强度,生成有效的后件的隶属度函数并将其表示在一个模糊隐含句中;

(4)综合所有的有效后件,求得总输出隶属度函数。

3.4.4模糊化和去模糊化

模糊推理系统是建立在模糊集合理论、模糊“ifthen”规则和模糊推理等概念基础之上的先进的计算框架。模糊推理系统包括三部分:规则库、数据库(所有隶属度函数)、推理机制。

如图3-33所示,在解决实际问题时,模糊推理系统包括以下几个处理过程:将精确值输入通过模糊器转化为模糊值,再使用规则库和模糊机制对其进行处理,最后将结果转化为精确值输出。在实际应用中,精确值和模糊推理系统中的模糊值之间的相互转化过程十分关键。值得注意的是,模糊推理过程中的模糊化和去模糊化步骤将涉及隶属度函数,因此数据库包含在模糊器和去模糊器中。

图3-33-模糊推理系统

1.模糊化

2.去模糊化

通过模糊推理得到的结果是一个模糊集合或隶属度函数,但在实际应用中,特别是在模糊逻辑控制中,必须输出一个确定的值才能实现对确定对象的控制。在推理得到的模糊集

合中选取一个最能代表该模糊集合的单值的过程就称作解模糊判决,也称去模糊化。

去模糊化的方法主要有重心法、面积等分法、极大平均法、极大极小法、极大最大法等,如图3-34所示。

图3-34去模糊化示意图

1)重心法

所谓重心法(CenterOfGravity,COG),就是取模糊隶属度函数曲线与横坐标轴围成面积的重心作为代表点。理论上,我们应计算输出范围内一系列连续点的重心,即

去模糊化采用不同的方法所得到的结果也是不同的。理论上用重心法比较合理,但是计算比较复杂,故对实时性要求高的系统不宜采用这种方法。最简单的方法是最大隶属度

方法,该方法将所有模糊集合或隶属度函数中隶属度最大的值作为输出,缺点是不能兼顾其他隶属度较小值的影响,结果不具有代表性,所以常用于简单的系统。

3.5模糊控制系统

模糊控制系统的一般结构主要由模糊控制器、输入/输出接口电路、广义对象以及传感器系统(或检测装置)四个部分组成。相较于传统的控制系统,模糊控制系统只是用模糊控制器替换了传统控制器。

3.5.1模糊控制

控制理论在实际应用中最关键的一步就是要对控制对象建立起合适的数学模型。数学模型的精确程度对系统输出特性的影响很大,同时也是实现控制过程中最困难的一个环节。随着科学技术的发展,各个领域对控制系统的精度、稳定性、响应速度等各项指标的要求越来越高,所研究的系统也越来越复杂,致使控制对象的数学模型也日趋复杂。而实际系统中由于存在非线性、时变性、不确定性和不完整性等因素,一般无法得到精确的数学模型。另外,在系统模型的建立过程中,必须建立和遵循一些比较苛刻的假设,而这些假设在应用中往往与实际不相吻合;还有一些受控对象根本就无法建立起传统的数学模型。

模糊控制的突出特点在于:

(1)控制系统的设计不要求知道被控对象的精确数学模型,只需要提供现场操作人员的经验知识及操作数据;

(2)控制系统的鲁棒性强,适应于解决常规控制难以解决的非线性、时变及滞后系统;

(3)以语言变量代替常规的数学变量,易于构造形成专家的“知识”;

(4)控制推理采用“不精确推”(ApproximateReasoning),推理过程模仿人的思维过程,由于介入了人类的经验,因而能够处理复杂甚至“病态”系统。

3.5.2模糊控制器

模糊控制器是模糊控制系统中的核心部分,也是模糊控制系统设计过程中的主要任务。模糊控制方法主要有两种,一种是模糊语言控制,另一种是模糊最优控制。要实现语言

变量控制的模糊控制器,就必须解决以下三个基本问题:

(1)先通过传感器把要监测的物理量变成电量,再通过模数转换器转换成模糊集合的隶属度函数。这一步就称为精确量的模糊化或模糊量化,其目的是把传感器的输入转换成知识库可以理解和操作的变量格式。

(2)根据有经验的操作者或专家的经验制定模糊控制规则,并进行模糊逻辑推理,以得到一个模糊输出集合(即一个新的模糊隶属函数)。这一步称为模糊控制规则的形成和推理,其目的是用模糊输入值去适配控制规则,为每一个控制规则确定其适配的程度,并且通过加权计算将控制规则合并后输出。

(3)根据模糊逻辑推理得到的输出模糊隶属度函数,采用不同的方法找出一个具有代表性的精确值作为控制量。这一步称为模糊输出量的解模糊判决,其目的是把分布范围概括合并成单点的输出值,再由执行器实现控制。

1.工作原理

模糊控制器的工作原理如下:

(1)将输入语言变量中的实数值依据一定的策略模糊化后作为对应的输入模糊集合;

(2)将输入模糊集合送入模糊推理机;

(3)触发模糊规则库中相应的模糊规则,将输入模糊集合转换为输出模糊集合;

(4)通过解模糊接口将输出模糊集合转换为清晰值输出信号。

2.结构

模糊控制器基本结构如图3-35所示。图3-35模糊控制器基本结构

1)模糊接口(Fuzzification)

这部分的作用是将输入的精确量转化成模糊量。其中输入量包括外界的参考输入、系统的输出或状态等。模糊化的具体过程如下:

(1)对输入量进行处理以变成模糊控制器要求的输入量。

(2)将上述已经处理过的输入量进行尺度变换,使其变换到各自的论域范围。

(3)将已经变换到论域范围的输入量进行模糊处理,使原先精确的输入量变成模糊量,并用相应的模糊集合来表示。

2)知识库

知识库包含了具体应用领域中的知识和要求的控制目标,它通常由数据库和规则库两部分组成。

(1)数据库主要包括各语言变量的隶属度函数、尺度变换因子以及模糊空间的分级数等。

(2)规则库包括了用模糊语言变量表示的一系列控制规则,反映了控制专家的经验和知识。

3)模糊推理机

模糊推理机是模糊控制器的核心,它具有模拟人的基于模糊概念的推理能力。该模糊推理过程是基于模糊逻辑中的蕴含关系及推理规则来进行的。

4)清晰化(解模糊接口)

清晰化的作用是将模糊推理机得到的控制量(模糊量)变换为实际用于控制的清晰量。它包含以下两部分内容:

(1)将模糊的控制量经清晰化变换成为表示在论域范围的清晰量。

(2)将表示在论域范围的清晰量经尺度变换成为实际的控制量。

3.类型

模糊控制器的类型具有多种划分方式。

1)按照输入和输出变量的数目划分

模糊控制器按照输入变量和输出变量的数目,可以划分为单变量模糊控制器和多变量模糊控制器。所谓单变量模糊控制器,是指模糊控制器的输入变量和输出变量分别只有一

个。

2)按照模糊控制器的控制功能划分

模糊控制器按照控制功能,可以划分为固定型模糊控制器、变结构模糊控制器、自组织模糊控制器和自适应模糊控制器。

3.6模糊聚类分析

3.6.1问题的提出若有一批样品共有N个,每个样品有n个特征,则数据矩阵X如下:

矩阵X称为特征矩阵,其中每行代表一个样本,每列代表样本的一个特征,其中,样品i记作

3.6.2模糊聚类分析的基础知识

3.6.3-模糊聚类分析的一般步骤

1.建立数据矩阵

设论域U={x1,x2,…,xn}为被分类对象,每个对象又由m个指标表示其性状:

则得到原始数据矩阵为X=(xij)n×m。

常用的方法如下:

例3.6.2在对电视观众的喜好进行调查后,我们得到如表3-4所示的数据,试用一些简单的MATLAB语句实现均值、标准方差、标准中心化以及极差的操作。

2.建立模糊相似矩阵

建立xi与xj相似程度rij=R(xi,xj)的方法主要有以下几种:

1)相似系数法

(1)夹角余弦法:

(2)相关系数法:

2)距离法

一般地,取rij=1-c(d(xi,xj))α(适当选取参数c和α,使得0≤rij≤1)。采用的距离计算方法有以下几种:

3)贴近度法

3.聚类并画出动态聚类图

模糊动态聚类有如下方法:模糊传递闭包法、直接聚类法、最大树法和偏网法等。其中,模糊传递闭包法理论成熟,最易实现。

采用模糊传递闭包法,其步骤如下:

(1)求出模糊相似矩阵R的传递闭包t(R);

(2)按λ由大到小进行聚类;

(3)画出动态聚类图。

例3.6.3-在对教师的课堂教学质量进行评价时,我们一般会考虑以下五项指标:师德师表、教学过程、教学方法、教学内容以及基本功。每项指标的满分为20分,总分为100现要对{x1,x2,x3,x4}四位老师进行参评,参评成绩依次:x1=(17,15,14,15,16),x2=(18,16,13,14,12),x3=(18,18,19,17,18),

x4=(16,18,16,15,18),试对参评教师X进行分类。x

聚类动态图如图3-36所示。图3-36聚类动态图

3.7模糊综合评判模型

模糊综合评判是一种运用模糊数学原理分析和评价具有“模糊性”的事物的系统分析方法,它是一种以模糊推理为主的定性与定量相结合、精确与非精确相统一的分析评价方法。

1.一级模糊综合评判

设与被评价事物相关的因素有n个,记作

称之为因素集。又设所有可能出现的评语有m个,记作

称之为评语集。由于各种因素所处地位不同,作用也不一样,因而采用权重A={a1,a2,…,an}来衡量。

一级模糊综合评判的步骤如下:

例3.7.1仍以对教师的课堂教学质量评价为例,试考虑评估指标,自行建立评判模型并写出评判步骤。

解评判步骤依次如下:

(1)建立因素集U={u1,u2,u3,u4,u5},其中u1表示师德师表;u2表示教学过程;u3-表示教学方法;u4表示教学内容;u5表示基本功。

(2)建立评判集V={v1,v2,v3,v4},其中v1表示很受欢迎;v2表示较受欢迎;v3表示不太受欢迎;v4表示不受欢迎。

(3)进行单因素评判,得到

(4)由单因素评判构造综合评判矩阵:

(5)综合评判。设有两个学生,他们根据自己的评估对各因素所分配的权重分别为

2.多级模糊综合评判(以二级为例)

1)问题

对高等学校的评估可以考虑如下几个方面:

2)二级模糊综合评判的步骤

例3.7.2若对教师的课堂教学质量进行更为精确的评价,则需考虑更多的评价指标,此处假设有9项指标,试建立评判模型并写出评判步骤。

解对教师的课堂教学质量进行更为精确的评价需由9项指标u1,u2,…,u9确定,评价的结果分为:很受欢迎、较受欢迎、不太受欢迎和不受欢迎。由于因素较多,宜采用二级模型。

3.8模糊理论在图像处理中的应用

3.8.1基于模糊稀疏自编码器框架的单幅图像人脸识别算法1.研究背景在过去几年里,人脸图像分类与识别受到广泛关注,它被应用于很多领域,如信息安全领域。很多人脸识别算法被提出,包括基于全局特征学习的人脸识别算法和基于局部特征学习的人脸识别算法。

2.理论基础

1)稀疏自编码器

稀疏自编码器是深度神经网络的一个元素,它由三层组成,分别是输入层、隐藏层和输出层。这三层之间是全连接的,如图3-37所示。图3-37稀疏自编码器示意图

2)基于图像块的模糊粗糙集特征选择算法

基于局部块的特征学习算法是处理单幅人脸图像识别问题的主要方法之一。该算法通常将原始图像分为不重叠的固定大小的图像块并从每个独立的块中提取特征。然而,传统

的局部特征提取仅考虑了图像的结构而忽略了判别信息,并且忽略了位于两个不同块的邻域像素之间的关系。图3-38给出了图像块的结构示意。图3-38图像块示意图

基于图像块的模糊粗糙集特征选择算法示意图如图3-39所示。图3-39基于图像块的模糊粗糙集特征选择算法示意图

基于图像块的模糊粗糙集特征选择算法的主要优点包括:

①不需要关于数据任何初始或额外的信息;

②基于类标和特征之间的关系获得的局部特征可以充分描述原始数据并保留原始数据的分辨能力;

③基于局部块的模糊粗糙集策略比基于原始图像的模糊粗糙集策略要求更少的存储空间。

3.基于稀疏自编码器的全局特征学习

考虑到基于模糊粗糙集产生的规则具有不稳定性,并且稀疏自编码器可用于基于粗糙集学习的后处理,本算法第二层利用稀疏自编码器提取第一层局部特征中的潜在结构。假

设一个稀疏自编码器在隐藏层有m个神经元,在输出层有s个神经元。输入数据x∈Rn是第一层的输出。稀疏自编码器可定义为

当定义输出值等于输入值时,即a(3)=x,这个网络框架称为自编码器网络,它模拟了从输入到自身的映射。a(2)能完全描述输入值。此外,如果隐藏层中神经元的数量小于输入层中神经元的数量(m<n),就会得到原始数据的稀疏表示。这个网络称为稀疏自编码器网络。惩罚函数定义为

4.基于模糊稀疏自编码器的人脸识别算法

本节提出的两层特征学习框架的主要优点如下:

(1)该框架结合了局部信息和全局信息的优点。另外,相比于深度网络,该框架属于浅层网络,避免了处理单幅图像人脸识别时的过拟合问题。

(2)利用基于块的模糊粗糙集特征选择策略提取以目标为导向的局部特征。

(3)利用稀疏自编码器从收集到的局部信息中提取全局信息,挖掘了局部特征的结构信息,同时也减少了局部特征的冗余。

5.实验结果与分析

1)数据描述与实验设置

将所有人脸图像尺寸裁剪为26×26。图3-40展示了来自10组不同人脸数据集的图像,每组图像对应该数据集中的一个人。图(a)~图(j)分别代表数据集Y、AR、P05、P07P09、P27、P29、LFW、Cas和Jaf。、

图3-40人脸图像示例

2)单幅人脸图像分类算法比较

本章提出的算法TLFL与其对比算法的正确率如表3-5和表3-6所示,它们分别利用softmax和SVM作为分类器。表中的对比算法包括:

·OriFea表示利用原始特征训练分类器;

·AE表示稀疏自编码器;

·StackAE表示堆栈自编码器,为了对比的公平性,实验中采用两层堆栈自编码器;

注:AE是StackAE的一种特殊情况,AE是单层堆栈自编码器。

·LBP表示局部二值模式;

·HOG表示方向梯度直方图;

·TT是由Tan提出的一个人脸识别算法;

·LRA是处理单幅图像人脸识别的一种算法;

·DLR是由Yin提出的针对单幅人脸图像的识别算法;

·LSF-PC表示对单人脸图像提取局部谱特征;

·DPC表示从非重叠块中提取局部二值特征;

·TLFL是本章提出的算法。

3)TLFL算法与CNN算法的比较

CNN中包含5个参数,分别如下:

·batS表示在每一次随机梯度下降的迭代中,样本的更新比例,其取值范围为

[0.5,1]。

·alpha表示每次迭代的学习率,其取值范围为0.01~2。

·OM表示特征图的数量,其取值范围为1~12。

·KS表示卷积核大小,其值设定为[1,3,5,7,9,11]。

·numE表示迭代次数,其取值范围为1~200。

根据图3-41,对于数据集LFW、Cas和Jaffe,参数batS设定为0.5;对于其他人脸数据集,参数batS设定为1。在两层CNN算法中,为了取得更好的分类结果,对于不同的人脸数据集采用不同的参数,具体参数设置如表3-7所示。表3-8展示了对于不同数据集,TLFL算法的性能远超CNN算法。

3.8.2基于模糊超像素表征学习的PolSAR图像分类

1.研究背景

极化合成孔径雷达(PolSAR)图像分类是典型的计算机视觉应用之一。PolSAR能够在全天时和全天候条件下提供遥感图像信息,由于电磁波的发射和接收都是多极化的,相比于单极化SAR,它包含更多的有用信息。

2.模糊超像素算法

1)模糊超像素的概念

传统的超像素如图3-42(a)所示。图3-42超像素示意图

2)模糊超像素算法

为解决PolSAR图像分类问题,这里提出一种模糊超像素算法,称为FS算法。该算法根据像素的空间位置和PolSAR图像的性质在三维[Cov,X,Y]空间聚类像素,其中Cov是像素的协方差矩阵,X和Y是像素的空间位置。

构造新的目标函数,计算使J(U,C1,…,Cc)获得最小值的必要条件,新的目标函数定义为

如图3-43-所示,已知一幅图像由81个像素组成。图3-43-搜索区域及区域中的像素

模糊超像素生成算法主要分为四步:

(1)初始化模糊超像素聚类中心并且确定期望生成的超像素数量。

(2)根据聚类中心与期望的模糊超像素数量找出重叠搜索区域与非重叠搜索区域。

(3)将非重叠搜索区域中的像素直接划分到聚类中心像素对应的超像素中。对于重叠区域中的像素,计算像素与其对应的聚类中心像素之间的隶属度,并根据隶属度值判断像

素是属于某个特定的超像素还是属于待定像素。

(4)后处理步骤。

3.基于模糊超像素的PolSAR图像分类算法

基于模糊超像素的PolSAR图像分类算法的主要步骤包括超像素生成、极化特征选择、样本选择和分类。超像素算法通常用于其他算法的预处理方法。在基于超像素的分类算法中,每一个超像素被认为是一个处理单元。本节基于模糊超像素算法,提出一个简单的监督分类算法。在PolSAR图像中,每一个像素可以表示为一个协方差矩阵T,即

该算法的主要优点如下:

(1)易于理解与实现。

(2)由该算法生成的超像素的边界一致性优于其他超像素算法,同时该算法相较于其他超像素算法能产生更多的纯超像素和更少的混合超像素。

(3)基于该算法的PolSAR图像分类算法的性能优于基于其他超像素算法的性能。

4.实验结果与分析

1)仿真指标

本节方法进行仿真实验所使用的衡量指标如下:

(1)欠分割错误(Under-segmentationError,UE):一个超像素应仅覆盖一个目标。

UE定义为

(4)时间复杂度分析(TimeComplexity):传统FCM算法的时间复杂度为O(cIN),其中c是聚类中心总数,I是迭代次数,N是一幅图像中像素的数量。FS算法是一个使用修正的FCM为生成超像素特殊设计的算法,该算法利用局部搜索策略,即仅对在重叠搜索区域内的像素判断其是否属于某一个特定的超像素。局部搜索策略可避免执行数千次冗余的距离计算,另外,在实际应用中搜索区域中的像素最多面临4个聚类中心。因此,FS算法的复杂度为O(N),它与搜索区域内像素的数量线性相关。

2)仿真内容

下面对三幅PolSAR图像进行简单介绍。

(1)Flevoland。第一个数据集是L波段多视Pol

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论