模煳数学建模方法(132).ppt_第1页
模煳数学建模方法(132).ppt_第2页
模煳数学建模方法(132).ppt_第3页
模煳数学建模方法(132).ppt_第4页
模煳数学建模方法(132).ppt_第5页
已阅读5页,还剩127页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章模糊集的基本概念,一、什么是模糊数学,二、模糊数学的产生与基本思想,三、模糊数学的发展,四、为什么研究模糊数学,第一节.模糊数学概述,一、什么是模糊数学,秃子悖论:天下所有的人都是秃子,设头发根数n,n=1显然,若n=k为秃子,n=k+1亦为秃子,模糊概念,模糊概念:从属于该概念到不属于该概念之间无明显分界线,年轻、重、热、美、厚、薄、快、慢、大、小、高、低、长、短、贵、贱、强、弱、软、硬、阴天、多云、暴雨、清晨、礼品。,共同特点:模糊概念的外延不清楚。,术语来源,Fuzzy:毛绒绒的,边界不清楚的,模糊,不分明,弗齐,弗晰,勿晰,模糊概念导致模糊现象,模糊数学就是用数学方法研究模糊现象。,人工智能的要求,取得精确数据不可能或很困难,没有必要获取精确数据,模糊数学的产生不仅形成了一门崭新的数学学科,而且也形成了一种崭新的思维方法,它告诉我们存在亦真亦假的命题,从而打破了以二值逻辑为基础的传统思维,使得模糊推理成为严格的数学方法。随着模糊数学的发展,模糊理论和模糊技术将对于人类社会的进步发挥更大的作用。,模糊数学的概念处理现实对象的数学模型确定性数学模型:确定性或固定性,对象间有必然联系.随机性数学模型:对象具有或然性或随机性模糊性数学模型:对象及其关系均具有模糊性.随机性与模糊性的区别随机性:指事件出现某种结果的机会.模糊性:指存在于现实中的不分明现象.模糊数学:研究模糊现象的定量处理方法.,模糊数学是研究和处理模糊性现象的数学方法.众所周知,经典数学是以精确性为特征的.,然而,与精确形相悖的模糊性并不完全是消极的、没有价值的.甚至可以这样说,有时模糊性比精确性还要好.例如,要你某时到某地去迎接一个“大胡子高个子长头发戴宽边黑色眼镜的中年男人”.尽管这里只提供了一个精确信息男人,而其他信息大胡子、高个子、长头发、宽边黑色眼镜、中年等都是模糊概念,但是你只要将这些模糊概念经过头脑的综合分析判断,就可以接到这个人.模糊数学在实际中的应用几乎涉及到国民经济的各个领域及部门,农业、林业、气象、环境、地质勘探、医学、经济管理等方面都有模糊数学的广泛而又成功的应用.,数学建模与模糊数学相关的问题,模糊数学研究和处理模糊性现象的数学(概念与其对立面之间没有一条明确的分界线)与模糊数学相关的问题(一)模糊分类问题已知若干个相互之间不分明的模糊概念,需要判断某个确定事物用哪一个模糊概念来反映更合理准确模糊相似选择按某种性质对一组事物或对象排序是一类常见的问题,但是用来比较的性质具有边界不分明的模糊性,数学建模与模糊数学相关的问题,模糊聚类分析根据研究对象本身的属性构造模糊矩阵,在此基础上根据一定的隶属度来确定其分类关系模糊层次分析法两两比较指标的确定模糊综合评判综合评判就是对受到多个因素制约的事物或对象作出一个总的评价,如产品质量评定、科技成果鉴定、某种作物种植适应性的评价等,都属于综合评判问题。由于从多方面对事物进行评价难免带有模糊性和主观性,采用模糊数学的方法进行综合评判将使结果尽量客观从而取得更好的实际效果,第二节模糊子集及其运算,一.经典集合经典集合具有两条基本属性:元素彼此相异,即无重复性;范围边界分明,即一个元素x要么属于集合A(记作xA),要么不属于集合(记作xA),二者必居其一.,集合的表示法:(1)枚举法,A=x1,x2,xn;(2)描述法,A=x|P(x).AB若xA,则xB;AB若xB,则xA;A=BAB且AB.,集合A的所有子集所组成的集合称为A的幂集,记为(A).,并集AB=x|xA或xB;交集AB=x|xA且xB;余集Ac=x|xA.,集合的运算规律幂等律:AA=A,AA=A;交换律:AB=BA,AB=BA;结合律:(AB)C=A(BC),(AB)C=A(BC);吸收律:A(AB)=A,A(AB)=A;,分配律:(AB)C=(AC)(BC);(AB)C=(AC)(BC);0-1律:AU=U,AU=A;A=A,A=;还原律:(Ac)c=A;对偶律:(AB)c=AcBc,(AB)c=AcBc;排中律:AAc=U,AAc=;,U为全集,为空集.,集合的直积:XY=(x,y)|xX,yY.,二.模糊子集及其运算,2.1模糊子集与隶属函数,设U是论域,称映射A(x):U0,1确定了一个U上的模糊子集A,映射A(x)称为A的隶属函数,它表示x对A的隶属程度.使A(x)=0.5的点x称为A的过渡点,此点最具模糊性.当映射A(x)只取0或1时,模糊子集A就是经典子集,而A(x)就是它的特征函数.可见经典子集就是模糊子集的特殊情形.,例设论域U=x1(140),x2(150),x3(160),x4(170),x5(180),x6(190)(单位:cm)表示人的身高,那么U上的一个模糊集“高个子”(A)的隶属函数A(x)可定义为,也可用Zadeh表示法:,还可用向量表示法:,A=(0,0.2,0.4,0.6,0.8,1).,另外,还可以在U上建立一个“矮个子”、“中等个子”、“年轻人”、“中年人”等模糊子集.从上例可看出:(1)一个有限论域可以有无限个模糊子集,而经典子集是有限的;(2)一个模糊子集的隶属函数的确定方法是主观的.隶属函数是模糊数学中最重要的概念之一,模糊数学方法是在客观的基础上,特别强调主观的方法.,如:考虑年龄集U=0,100,A=“年老”,A也是一个年龄集,u=20A,40呢?扎德给出了“年老”集函数刻画:,1,0,U,50,100,再如,B=“年轻”也是U的一个子集,只是不同的年龄段隶属于这一集合的程度不一样,查德给出它的隶属函数:,1,0,25,50,U,B(u),2.2模糊集的运算,相等:A=BA(x)=B(x);包含:ABA(x)B(x);并:AB的隶属函数为(AB)(x)=A(x)B(x);交:AB的隶属函数为(AB)(x)=A(x)B(x);余:Ac的隶属函数为Ac(x)=1-A(x).,模糊集的并、交、余运算性质,幂等律:AA=A,AA=A;交换律:AB=BA,AB=BA;结合律:(AB)C=A(BC),(AB)C=A(BC);吸收律:A(AB)=A,A(AB)=A;分配律:(AB)C=(AC)(BC);(AB)C=(AC)(BC);0-1律:AU=U,AU=A;A=A,A=;还原律:(Ac)c=A;,对偶律:(AB)c=AcBc,(AB)c=AcBc;,对偶律的证明:对于任意的xU(论域),(AB)c(x)=1-(AB)(x)=1-(A(x)B(x)=(1-A(x)(1-B(x)=Ac(x)Bc(x)=AcBc(x),模糊集的运算性质基本上与经典集合一致,除了排中律以外,即AAcU,AAc.模糊集不再具有“非此即彼”的特点,这正是模糊性带来的本质特征.,例设论域U=x1,x2,x3,x4,x5(商品集),在U上定义两个模糊集:A=“商品质量好”,B=“商品质量坏”,并设,A=(0.8,0.55,0,0.3,1).B=(0.1,0.21,0.86,0.6,0).,则Ac=“商品质量不好”,Bc=“商品质量不坏”.,Ac=(0.2,0.45,1,0.7,0).Bc=(0.9,0.79,0.14,0.4,1).,可见AcB,BcA.,又AAc=(0.8,0.55,1,0.7,1)U,AAc=(0.2,0.45,0,0.3,0).,第三节模糊集的基本定理,模糊集的-截集A是一个经典集合,由隶属度不小于的成员构成.例:论域U=u1,u2,u3,u4,u5,u6(学生集),他们的成绩依次为50,60,70,80,90,95,A=“学习成绩好的学生”的隶属度分别为0.5,0.6,0.7,0.8,0.9,0.95,则,A0.9(90分以上者)=u5,u6,A0.6(60分以上者)=u2,u3,u4,u5,u6.,定理1设A,B(U)(A,B是论域U的两个模糊子集),,0,1,于是有-截集的性质:,(1)ABAB;(2)AA;(3)(AB)=AB,(AB)=AB.,定理2(分解定理)设A(U),xA,则A(x)=,0,1,xA定义(扩张原理)设映射f:XY,定义f(A)(y)=A(x),f(x)=y,模糊集的数积设A(U)(A是论域U的模糊子集),0,1,称A为与A数积,xA,(A)(x)=A(x),性质:(1)ABAB;(2)AA;,定理3(分解定理2)设A(U),则,第四节隶属函数的确定,1.模糊统计方法,与概率统计类似,但有区别:若把概率统计比喻为“变动的点”是否落在“不动的圈”内,则把模糊统计比喻为“变动的圈”是否盖住“不动的点”.,2.指派方法,一种主观方法,一般给出隶属函数的解析表达式。,3.借用已有的“客观”尺度,隶属函数参数化,1.三角形隶属函数,参数a,b,c确定了三角形MF三个顶点的x坐标。,参数a,b,c,d确定了梯形四个角的x坐标。当b=c时,梯形就退化为三角形。,2.梯形隶属函数,3.高斯形隶属函数,高斯MF完全由c和决定,c代表MF的中心;决定了MF的宽度。,4.一般钟形隶属函数,参数完全由b通常为正;如果b0,钟形将倒置。钟形MF实际上是概率中柯西分布的推广,因此又称为柯西MF。,trig(x;20,60,80),trap(x;10,20,60,90),g(x;50,20),bell(x:20,4,50),隶属函数的参数化举例:,以钟形函数为例,,a,b,c,的几何意义如图所示。,改变a,b,c,即可改变隶属函数的形状。,第二章模糊模式识别,第一节模糊模型识别,模型识别,已知某类事物的若干标准模型,现有这类事物中的一个具体对象,问把它归到哪一模型,这就是模型识别.,模型识别在实际问题中是普遍存在的.例如,学生到野外采集到一个植物标本,要识别它属于哪一纲哪一目;投递员(或分拣机)在分拣信件时要识别邮政编码等等,这些都是模型识别.,模糊模型识别,所谓模糊模型识别,是指在模型识别中,模型是模糊的.也就是说,标准模型库中提供的模型是模糊的.,模型识别的原理,为了能识别待判断的对象x=(x1,x2,xn)T是属于已知类A1,A2,Am中的哪一类?事先必须要有一个一般规则,一旦知道了x的值,便能根据这个规则立即作出判断,称这样的一个规则为判别规则.判别规则往往通过的某个函数来表达,我们把它称为判别函数,记作W(i;x).一旦知道了判别函数并确定了判别规则,最好将已知类别的对象代入检验,这一过程称为回代检验,以便检验你的判别函数和判别规则是否正确.,第二节最大隶属原则,模糊向量的内积与外积,定义称向量a=(a1,a2,an)是模糊向量,其中0ai1.若ai只取0或1,则称a=(a1,a2,an)是Boole向量.,设a=(a1,a2,an),b=(b1,b2,bn)都是模糊向量,则定义内积:ab=(akbk)|1kn;外积:ab=(akbk)|1kn.,内积与外积的性质,(ab)c=acbc;(ab)c=acbc.,模糊向量集合族,设A1,A2,An是论域X上的n个模糊子集,称以模糊集A1,A2,An为分量的模糊向量为模糊向量集合族,记为A=(A1,A2,An).,若X上的n个模糊子集A1,A2,An的隶属函数分别为A1(x),A2(x),An(x),则定义模糊向量集合族A=(A1,A2,An)的隶属函数为A(x)=A1(x1),A2(x2),An(xn)或者A(x)=A1(x1)+A2(x2)+An(xn)/n.其中x=(x1,x2,xn)为普通向量.,最大隶属原则,最大隶属原则设论域X=x1,x2,xn上有m个模糊子集A1,A2,Am(即m个模型),构成了一个标准模型库,若对任一x0X,有k1,2,m,使得Ak(x0)=A1(x0),A2(x0),Am(x0),则认为x0相对隶属于Ak.最大隶属原则设论域X上有一个标准模型A,待识别的对象有n个:x1,x2,xnX,如果有某个xk满足A(xk)=A(x1),A(x2),A(xn),则应优先录取xk.,例1在论域X=0,100分数上建立三个表示学习成绩的模糊集A=“优”,B=“良”,C=“差”.当一位同学的成绩为88分时,这个成绩是属于哪一类?,A(88)=0.8,B(88)=0.7,A(88)=0.8,B(88)=0.7,C(88)=0.,根据最大隶属原则,88分这个成绩应隶属于A,即为“优”.例2论域X=x1(71),x2(74),x3(78)表示三个学生的成绩,那一位学生的成绩最差?C(71)=0.9,C(74)=0.6,C(78)=0.2,根据最大隶属原则,x1(71)最差.,例3细胞染色体形状的模糊识别,细胞染色体形状的模糊识别就是几何图形的模糊识别,而几何图形常常化为若干个三角图形,故设论域为三角形全体.即X=(A,B,C)|A+B+C=180,ABC标准模型库=E(正三角形),R(直角三角形),I(等腰三角形),IR(等腰直角三角形),T(任意三角形).,某人在实验中观察到一染色体的几何形状,测得其三个内角分别为94,50,36,即待识别对象为x0=(94,50,36).问x0应隶属于哪一种三角形?,先建立标准模型库中各种三角形的隶属函数.,直角三角形的隶属函数R(A,B,C)应满足下列约束条件:(1)当A=90时,R(A,B,C)=1;(2)当A=180时,R(A,B,C)=0;(3)0R(A,B,C)1.,因此,不妨定义R(A,B,C)=1-|A-90|/90.则R(x0)=0.955.或者,其中p=|A90|,则R(x0)=0.54.,正三角形的隶属函数E(A,B,C)应满足下列约束条件:,(1)当A=B=C=60时,E(A,B,C)=1;(2)当A=180,B=C=0时,E(A,B,C)=0;(3)0E(A,B,C)1.,因此,不妨定义E(A,B,C)=1(AC)/180.则E(x0)=0.677.或者,其中p=AC,则E(x0)=0.02.,等腰三角形的隶属函数I(A,B,C)应满足下列约束条件:,(1)当A=B或者B=C时,I(A,B,C)=1;(2)当A=180,B=60,C=0时,I(A,B,C)=0;(3)0I(A,B,C)1.,因此,不妨定义I(A,B,C)=1(AB)(BC)/60.则I(x0)=0.766.或者,p=(AB)(BC),则I(x0)=0.10.,等腰直角三角形的隶属函数(IR)(A,B,C)=I(A,B,C)R(A,B,C);,(IR)(x0)=0.7660.955=0.766.,任意三角形的隶属函数T(A,B,C)=IcRcEc=(IRE)c.,T(x0)=(0.7660.9550.677)c=(0.955)c=0.045.,通过以上计算,R(x0)=0.955最大,所以x0应隶属于直角三角形.,或者(IR)(x0)=0.10;T(x0)=(0.54)c=0.46.仍然是R(x0)=0.54最大,所以x0应隶属于直角三角形.,阈值原则,设论域X=x1,x2,xn上有m个模糊子集A1,A2,Am(即m个模型),构成了一个标准模型库,若对任一x0X,取定水平0,1.,若存在i1,i2,ik,使Aij(x0)(j=1,2,k),则判决为:x0相对隶属于,若Ak(x0)|k=1,2,m,则判决为:不能识别,应当找原因另作分析.,该方法也适用于判别x0是否隶属于标准模型Ak.若Ak(x0),则判决为:x0相对隶属于Ak;若Ak(x0),则判决为:x0相对不隶属于Ak.,第三节择近原则,设在论域X=x1,x2,xn上有m个模糊子集A1,A2,Am(即m个模型),构成了一个标准模型库.被识别的对象B也是X上一个模糊集,它与标准模型库中那一个模型最贴近?这是第二类模糊识别问题.先将模糊向量的内积与外积的概念扩充.设A(x),B(x)是论域X上两个模糊子集的隶属函数,定义内积:AB=A(x)B(x)|xX;外积:AB=A(x)B(x)|xX.,内积与外积的性质,(1)(AB)c=AcBc;(2)(AB)c=AcBc;(3)AAc1/2;(4)AAc1/2.,证明(1)(AB)c=1-A(x)B(x)|xX,=1-A(x)1-B(x)|xX=Ac(x)Bc(x)|xX=AcBc.,证明(3)AAc=A(x)1-A(x)|xX,1/2|xX1/2.,下面我们用(A,B)表示两个模糊集A,B之间的贴近程度(简称贴近度),贴近度(A,B)有一些不同的定义.0(A,B)=AB+(1-AB)/2(格贴近度)1(A,B)=(AB)(1-AB),择近原则设在论域X=x1,x2,xn上有m个模糊子集A1,A2,Am构成了一个标准模型库,B是待识别的模型.若有k1,2,m,使得(Ak,B)=(Ai,B)|1im,则称B与Ak最贴近,或者说把B归于Ak类.这就是择近原则.,小麦品种的模糊识别(仅对百粒重考虑),多个特性的择近原则,设在论域X=x1,x2,xn上有n个模糊子集A1,A2,An构成了一个标准模型库,每个模型又由个特性来刻划:Ai=(Ai1,Ai2,Aim),i=1,2,n,待识别的模型B=(B1,B2,Bm).先求两个模糊向量集合族的贴近度:si=(Aij,Bj)|1jm,i=1,2,n,若有k1,2,n,使得(Ak,B)=si|1in,则称B与Ak最贴近,或者说把B归于Ak类.这就是多个特性的择近原则.,贴近度的的改进,格贴近度的不足之处是一般0(A,A)1.定义(公理化定义)若(A,B)满足(A,A)=1;(A,B)=(B,A);若ABC,则(A,C)(A,B)(B,C).,则称(A,B)为A与B的贴近度.,显然,公理化定义显得自然、合理、直观,避免了格贴近度的不足之处,它具有理论价值.但是公理化定义并未提供一个计算贴近度的方法,不便于操作.于是,人们一方面尽管觉得格贴近度有缺陷,但还是乐意采用易于计算的格贴近度来解决一些实际问题;另一方面,在实际工作中又给出了许多具体定义.,离散型,连续型,离散型,连续型,离散型,连续型,事实上,择近原则的核心就是最大隶属原则.如在小麦品种的模糊识别(仅对百粒重考虑)中,可重新定义“早熟”、“矮秆”、“大粒”、“高肥丰产”、“中肥丰产”的隶属函数.,重新定义“早熟”的隶属函数为,重新定义“矮秆”的隶属函数为,例4大学生体质水平的模糊识别.,陈蓓菲等人在福建农学院对240名男生的体质水平按中国学生体质健康调查研究手册上的规定,从18项体测指标中选出了反映体质水平的4个主要指标(身高、体重、胸围、肺活量),根据聚类分析法,将240名男生分成5类:A1(体质差),A2(体质中下),A3(体质中),A4(体质良),A5(体质优),作为论域U(大学生)上的一个标准模型库,然后用最大隶属原则,去识别一个具体学生的体质.5类标准体质的4个主要指标的观测数据如下表所示.,现有一名待识别的大学生x=x1,x2,x3,x4=175,55.1,86,3900,他应属于哪种类型?,第三章模糊聚类分析,第一节模糊矩阵,定义1设R=(rij)mn,若0rij1,则称R为模糊矩阵.当rij只取0或1时,称R为布尔(Boole)矩阵.当模糊方阵R=(rij)nn的对角线上的元素rii都为1时,称R为模糊自反矩阵.,定义2设A=(aij)mn,B=(bij)mn都是模糊矩阵,相等:A=Baij=bij;包含:ABaijbij;并:AB=(aijbij)mn;交:AB=(aijbij)mn;余:Ac=(1-aij)mn.,模糊矩阵的并、交、余运算性质,幂等律:AA=A,AA=A;交换律:AB=BA,AB=BA;结合律:(AB)C=A(BC),(AB)C=A(BC);吸收律:A(AB)=A,A(AB)=A;分配律:(AB)C=(AC)(BC);(AB)C=(AC)(BC);0-1律:AO=A,AO=O;AE=E,AE=A;还原律:(Ac)c=A;对偶律:(AB)c=AcBc,(AB)c=AcBc.,模糊矩阵的合成运算与模糊方阵的幂,设A=(aik)ms,B=(bkj)sn,定义模糊矩阵A与B的合成为:AB=(cij)mn,其中cij=(aikbkj)|1ks.,模糊方阵的幂定义:若A为n阶方阵,定义A2=AA,A3=A2A,Ak=Ak-1A.,合成()运算的性质:,性质1:(AB)C=A(BC);性质2:AkAl=Ak+l,(Am)n=Amn;性质3:A(BC)=(AB)(AC);(BC)A=(BA)(CA);性质4:OA=AO=O,IA=AI=A;性质5:AB,CDACBD.,注:合成()运算关于()的分配律不成立,即(AB)C(AC)(BC),(AB)C,(AC)(BC),(AB)C(AC)(BC),模糊矩阵的转置,定义设A=(aij)mn,称AT=(aijT)nm为A的转置矩阵,其中aijT=aji.,转置运算的性质:,性质1:(AT)T=A;性质2:(AB)T=ATBT,(AB)T=ATBT;性质3:(AB)T=BTAT;(An)T=(AT)n;性质4:(Ac)T=(AT)c;性质5:ABATBT.,证明性质3:(AB)T=BTAT;(An)T=(AT)n.,证明:设A=(aij)ms,B=(bij)sn,AB=C=(cij)mn,记(AB)T=(cijT)nm,AT=(aijT)sm,BT=(bijT)ns,由转置的定义知,cijT=cji,aijT=aji,bijT=bji.BTAT=(bikTakjT)nm=(bkiajk)nm=(ajkbki)nm=(cji)nm=(cijT)nm=(AB)T.,模糊矩阵的-截矩阵,定义7设A=(aij)mn,对任意的0,1,称A=(aij()mn,为模糊矩阵A的-截矩阵,其中当aij时,aij()=1;当aij时,aij()=0.显然,A的-截矩阵为布尔矩阵.,对任意的0,1,有,性质1:ABAB;性质2:(AB)=AB,(AB)=AB;性质3:(AB)=AB;性质4:(AT)=(A)T.,下面证明性质1:ABAB和性质3.,性质1的证明:ABaijbij;当aijbij时,aij()=bij()=1;当aijbij时,aij()=0,bij()=1;当aijbij时,aij()=bij()=0;综上所述aij()bij()时,故AB.,性质3的证明:,设A=(aij)ms,B=(bij)sn,AB=C=(cij)mn,cij()=1cij(aikbkj),k,(aikbkj)k,aik,bkjk,aik()=bkj()=1(aik()bkj()=1,cij()=0cij(aikbkj),k,(aikbkj)k,aik或bkjk,aik()=0或bkj()=0(aik()bkj()=0,所以,cij()=(aik()bkj().,(AB)=AB.,第二节模糊关系,与模糊子集是经典集合的推广一样,模糊关系是普通关系的推广.,设有论域X,Y,XY的一个模糊子集R称为从X到Y的模糊关系.模糊子集R的隶属函数为映射R:XY0,1.并称隶属度R(x,y)为(x,y)关于模糊关系R的相关程度.特别地,当X=Y时,称之为X上各元素之间的模糊关系.,例1设x,y为汽车,则“x比y好”这种关系就是模糊关系,例2设x,y指人,则“x和y相象”这种关系也是模糊关系,例3:设:,若X是指实数轴,则“x比y大得多”,隶属度函数:,模糊关系的运算,由于模糊关系R就是XY的一个模糊子集,因此模糊关系同样具有模糊子集的运算及性质.,设R,R1,R2均为从X到Y的模糊关系.相等:R1=R2R1(x,y)=R2(x,y);包含:R1R2R1(x,y)R2(x,y);并:R1R2的隶属函数为(R1R2)(x,y)=R1(x,y)R2(x,y);交:R1R2的隶属函数为(R1R2)(x,y)=R1(x,y)R2(x,y);余:Rc的隶属函数为Rc(x,y)=1-R(x,y).,(R1R2)(x,y)表示(x,y)对模糊关系“R1或者R2”的相关程度,(R1R2)(x,y)表示(x,y)对模糊关系“R1且R2”的相关程度,Rc(x,y)表示(x,y)对模糊关系“非R”的相关程度.,模糊关系的矩阵表示,对于有限论域X=x1,x2,xm和Y=y1,y2,yn,则X到Y模糊关系R可用mn阶模糊矩阵表示,即R=(rij)mn,其中rij=R(xi,yj)0,1表示(xi,yj)关于模糊关系R的相关程度.又若R为布尔矩阵时,则关系R为普通关系,即xi与yj之间要么有关系(rij=1),要么没有关系(rij=0).,例设身高论域X=140,150,160,170,180(单位:cm),体重论域Y=40,50,60,70,80(单位:kg),下表给出了身高与体重的模糊关系.,模糊关系的合成,设R1是X到Y的关系,R2是Y到Z的关系,则R1与R2的合成R1R2是X到Z上的一个关系.(R1R2)(x,z)=R1(x,y)R2(y,z)|yY当论域为有限时,模糊关系的合成化为模糊矩阵的合成.设X=x1,x2,xm,Y=y1,y2,ys,Z=z1,z2,zn,且X到Y的模糊关系R1=(aik)ms,Y到Z的模糊关系R2=(bkj)sn,则X到Z的模糊关系可表示为模糊矩阵的合成:R1R2=(cij)mn,其中cij=(aikbkj)|1ks.,模糊关系合成运算的性质,性质1:(AB)C=A(BC);性质2:A(BC)=(AB)(AC);(BC)A=(BA)(CA);性质3:(AB)T=BTAT;性质4:AB,CDACBD.,注:(1)合成()运算关于()的分配律不成立,即(AB)C(AC)(BC)(2)这些性质在有限论域情况下,就是模糊矩阵合成运算的性质.,第三节模糊等价矩阵,模糊等价关系,若模糊关系R是X上各元素之间的模糊关系,且满足:(1)自反性:R(x,x)=1;(2)对称性:R(x,y)=R(y,x);(3)传递性:R2R,则称模糊关系R是X上的一个模糊等价关系.,当论域X=x1,x2,xn为有限时,X上的一个模糊等价关系R就是模糊等价矩阵,即R满足:,IR(rii=1),RT=R(rij=rji),R2R.,R2R(rikrkj)|1knrij).,模糊等价矩阵的基本定理,定理1若R具有自反性(IR)和传递性(R2R),则R2=R.定理2若R是模糊等价矩阵,则对任意0,1,R是等价的Boole矩阵.,0,1,ABAB;(AB)=AB;(AT)=(A)T,证明如下:(1)自反性:IR0,1,IR0,1,IR,即R具有自反性;(2)对称性:RT=R(RT)=R(R)T=R,即R具有对称性;(3)传递性:R2R(R)2R,即R具有传递性.,定理3若R是模糊等价矩阵,则对任意的01,R所决定的分类中的每一个类是R决定的分类中的某个类的子类.,证明:对于论域X=x1,x2,xn,若xi,xj按R分在一类,则有rij()=1rijrijrij()=1,即若xi,xj按R也分在一类.所以,R所决定的分类中的每一个类是R决定的分类中的某个类的子类.,模糊相似关系,若模糊关系R是X上各元素之间的模糊关系,且满足:(1)自反性:R(x,x)=1;(2)对称性:R(x,y)=R(y,x);则称模糊关系R是X上的一个模糊相似关系.当论域X=x1,x2,xn为有限时,X上的一个模糊相似关系R就是模糊相似矩阵,即R满足:(1)自反性:IR(rii=1);(2)对称性:RT=R(rij=rji).,模糊相似矩阵的性质,定理1若R是模糊相似矩阵,则对任意的自然数k,Rk也是模糊相似矩阵.定理2若R是n阶模糊相似矩阵,则存在一个最小自然数k(kn),对于一切大于k的自然数l,恒有Rl=Rk,即Rk是模糊等价矩阵(R2k=Rk).此时称Rk为R的传递闭包,记作t(R)=Rk.上述定理表明,任一个模糊相似矩阵可诱导出一个模糊等价矩阵.,平方法求传递闭包t(R):RR2R4R8R16,模糊矩阵,第四节模糊聚类分析,数据标准化,设论域X=x1,x2,xn为被分类对象,每个对象又由m个指标表示其形状:xi=xi1,xi2,xim,i=1,2,n于是,得到原始数据矩阵为,平移标准差变换,其中,平移极差变换,模糊相似矩阵建立方法,相似系数法-夹角余弦法,相似系数法-相关系数法,其中,距离法,海明距离,欧氏距离,Boole矩阵法:,Boole矩阵法的步骤如下:,(1)求模糊相似矩阵的-截矩阵R;(2)若R在某一排列下的矩阵有形如,的特殊子矩阵,则将R中上述特殊形式子矩阵的0改为1,直到在任一排列下R中不再产生上述特殊形式子矩阵为止.,最佳分类的确定,在模糊聚类分析中,对于各个不同的0,1,可得到不同的分类,从而形成一种动态聚类图,这对全面了解样本分类情况是比较形象和直观的.但在许多实际问题中,需要给出样本的一个具体分类,这就提出了如何确定最佳分类的问题.,案例:基于六座城市的气候指标,设X=(xij)nm为n个元素m个指标的原始数据矩阵.为总体样本的中心向量.,对应于值的分类数为r,第j类的样本数为nj,第j类的样本标记为,第j类样本的中心向量为,作F-统计量:,如果满足不等式FF(r-1,n-r)的F值不止一个,则可根据实际情况选择一个满意的分类,或者进一步考查差(F-F)/F的大小,从较大者中找一个满意的F值即可.,实际上,最佳分类的确定方法与聚类方法无关,但是选择较好的聚类方法,可以较快地找到比较满意的分类.,蠓的分类,左图给出了9只Af和6只Apf蠓的触角长和翼长数据,其中“”表示Apf,“”表示Af.根据触角长和翼长来识别一个标本是Af还是Apf是重要的.,给定一只Af族或Apf族的蠓,如何正确地区分它属于哪一族?将你的方法用于触角长和翼长分别为(1.24,1.80),(1.28,1.84),(1.40,2.04)三个标本.,模糊判别方法先将已知蠓重新进行分类.,当=0.919时,分为3类1,2,3,6,4,5,7,8,9,10,11,12,13,14,15,三类的中心向量分别为(1.395,1.770),(1.560,2.080),(1.227,1.927).,A1=(0.200,0.637)(Af蠓),A2=(0.390,1.000)(Af蠓),A3=(0.000,0.821)(Apf蠓),再将三只待识别的蠓用上述变换分别变为,B1=(0.015,0.672),B2=(0.062,0.719),B3=(0.203,0.953).,采用贴近度,3(A,B)=,计算得:3(A1,B1)=0.89,3(A2,B1)=0.65,3(A3,B1)=0.92.3(A1,B2)=0.89,3(A2,B2)=0.69,3(A3,B2)=0.92.3(A1,B3)=0.84,3(A2,B3)=0.88,3(A3,B3)=0.83.根据择近原则及上述计算结果,第一只待识别的蠓(1.24,1.80)属于第三类,即Apf蠓;第二只待识别的蠓(1.28,1.84)属于第三类,即Apf蠓;第三只待识别的蠓(1.40,2.04)属于第二类,即Af蠓.,设Af是传粉益虫,Apf是某种疾病的载体,是否应修改你的分类方法?若需修改,为什么?,2000网易杯全国大学生数学建模竞赛DNA序列分类2000年6月,人类基因组计划中DNA全序列草图完成,预计2001年可以完成精确的全序列图,此后人类将拥有一本记录着自身生老病死及遗传进化的全部信息的“天书”。这本大自然写成的“天书”是由4个字符A,T,C,G按一定顺序排成的长约30亿的序列,其中没有“断句”也没有标点符号,除了这4个字符表示4种碱基以外,人们对它包含的“内容”知之甚少,难以读懂。破译这部世界上最巨量信息的“天书”是二十一世纪最重要的任务之一。在这个目标中,研究DNA全序列具有什么结构,由这4个字符排成的看似随机的序列中隐藏着什么规律,又是解读这部天书的基础,是生物信息学(Bioinformatics)最重要的课题之一。,虽然人类对这部“天书”知之甚少,但也发现了DNA序列中的一些规律性和结构。例如,在全序列中有一些是用于编码蛋白质的序列片段,即由这4个字符组成的64种不同的3字符串,其中大多数用于编码构成蛋白质的20种氨基酸。又例如,在不用于编码蛋白质的序列片段中,A和T的含量特别多些,于是以某些碱基特别丰富作为特征去研究DNA序列的结构也取得了一些结果。此外,利用统计的方法还发现序列的某些片段之间具有相关性,等等。这些发现让人们相信,DNA序列中存在着局部的和全局性的结构,充分发掘序列的结构对理解DNA全序列是十分有意义的。目前在这项研究中最普通的思想是省略序列的某些细节,突出特征,然后将其表示成适当的数学对象。,这种被称为粗粒化和模型化的方法往往有助于研究规律性和结构。作为研究DNA序列的结构的尝试,提出以下对序列集合进行分类的问题:1)下面有20个已知类别的人工制造的序列(见下页),其中序列标号110为A类,11-20为B类。请从中提取特征,构造分类方法,并用这些已知类别的序列,衡量你的方法是否足够好。然后用你认为满意的方法,对另外20个未标明类别的人工序列(标号2140)进行分类,把结果用序号(按从小到大的顺序)标明它们的类别(无法分类的不写入):A类;B类。请详细描述你的方法,给出计算程序。如果你部分地使用了现成的分类方法,也要将方法名称准确注明。这40个序列也放在如下地址的网页上,用数据文件Art-model-data标识,供下载:网易网址:教育频道在线试题;教育网:Newsmcm2000教育网:,2)在同样网址的数据文件Nat-model-data中给出了182个自然DNA序列,它们都较长。用你的分类方法对它们进行分类,像1)一样地给出分类结果。提示:衡量分类方法优劣的标准是分类的正确率,构造分类方法有许多途径,例如提取序列的某些特征,给出它们的数学表示:几何空间或向量空间的元素等,然后再选择或构造适合这种数学表示的分类方法;又例如构造概率统计模型,然后用统计方法分类等。,1.aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggaggacgaggtaaaggaggcttgtctacggccggaagtgaagggggatatgaccgcttgg2.cggaggacaaacgggatggcggtattggaggtggcggactgttcggggaattattcggtttaaacgggacaaggaaggcggctggaacaaccggacggtggcagcaaagga3.gggacggatacggattctggccacggacggaaaggaggacacggcggacatacacggcggcaacggacggaacggaggaaggagggcggcaatcggtacggaggcggcgga4.atggataacggaaacaaaccagacaaacttcggtagaaatacagaagcttagatgcatatgttttttaaataaaatttgtattattatggtatcataaaaaaaggttgcga5.cggctggcggacaacggactggcggattccaaaaacggaggaggcggacggaggctacaccaccgtttcggcggaaaggcggagggctggcaggaggctcattacggggag6.atggaaaattttcggaaaggcggcaggcaggaggcaaaggcggaaaggaaggaaacggcggatatttcggaagtggatattaggagggcggaataaaggaacggcggcaca7.atgggattattgaatggcggaggaagatccggaataaaatatggcggaaagaacttgttttcggaaatggaaaaaggactaggaatcggcggcaggaaggatatggaggcg8.atggccgatcggcttaggctggaaggaacaaataggcggaattaaggaaggcgttctcgcttttcgacaaggaggcggaccataggaggcggattaggaacggttatgagg9.atggcggaaaaaggaaatgtttggcatcggcgggctccggcaactggaggttcggccatggaggcgaaaatcgtgggcggcggcagcgctggccggagtttgaggagcgcg10.tggccgcggaggggcccgtcgggcgcggatttctacaagggcttcctgttaaggaggtggcatccaggcgtcgcacgctcggcgcggcaggaggcacgcgggaaaaaacg11.gttagatttaacgttttttatggaatttatggaattataaatttaaaaatttatattttttaggtaagtaatccaacgtttttattactttttaaaattaaatatttatt12.gtttaattactttatcatttaatttaggttttaattttaaatttaatttaggtaagatgaatttggttttttttaaggtagttatttaattatcgttaaggaaagttaaa13.gtattacaggcagaccttatttaggttattattattatttggattttttttttttttttttttaagttaaccgaattattttctttaaagacgttacttaatgtcaatgc14.gttagtcttttttagattaaattattagattatgcagtttttttacataagaaaatttttttttcggagttcatattctaatctgtctttattaaatcttagagatatta15.gtattatatttttttatttttattattttagaatataatttgaggtatgtgtttaaaaaaaatttttttttttttttttttttttttttttttaaaatttataaatttaa16.gttatttttaaatttaattttaattttaaaatacaaaatttttactttctaaaattggtctctggatcgataatgtaaacttattgaatctatagaattacattattgat17.gtatgtctatttcacggaagaatgcaccactatatgatttgaaattatctatggctaaaaaccctcagtaaaatcaatccctaaacccttaaaaaacggcggcctatccc18.gttaattatttattccttacgggcaattaattatttattacggttttatttacaattttttttttttgtcctatagagaaattacttacaaaacgttattttacatactt19.gttacattatttattattatccgttatcgataattttttacctcttttttcgctgagtttttattcttactttttttcttctttatataggatctcatttaatatcttaa20.gtatttaactctctttactttttttttcactctctacattttcatcttctaaaactgtttgatttaaacttttgtttctttaaggattttttttacttatcctctgttat,21.tttagctcagtccagctagctagtttacaatttcgacaccagtttcgcaccatcttaaatttcgatccgtaccgtaatttagcttagatttggatttaaaggatttagattga22.tttagtacagtagctcagtccaagaacgatgtttaccgtaacgtqacgtaccgtacgctaccgttaccggattccggaaagccgattaaggaccgatcgaaaggg23.cgggcggatttaggccgacggggacccgggattcgggacccgaggaaattcccggattaaggtttagcttcccgggatttagggcccggatggctgggaccc24.tttagctagctactttagctatttttagtagctagccagcctttaaggctagctttagctagcattgttctttattgggacccaagttcgacttttacgatttagttttgaccgt25.gaccaaaggtgggctttagggacccgatgctttagtcgcagctggaccagttccccagggtattaggcaaaagctgacgggcaattgcaatttaggcttaggcca26.gatttactttagcatttttagctgacgttagcaagcattagctttagccaatttcgcatttgccagtttcgcagctcagttttaacgcgggatctttagcttcaagctttttac27.ggattcggatttac

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论