数据处理模糊数学_第1页
数据处理模糊数学_第2页
数据处理模糊数学_第3页
数据处理模糊数学_第4页
数据处理模糊数学_第5页
已阅读5页,还剩113页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据处理-模糊数学,主讲人:付玉霞公共教学部数学教研室2011.5,东莞职业技术学院数学建模培训系列,基本内容:第一章:模糊数学基本概念第二章:模糊聚类分析第三章:模糊模式识别第四章:模糊综合评判决策,例某地区内有12个气象观测站,10年来各站测得的年降水量如表3所示。为了节省开支,想要适当减少气象观测站,试问减少哪些观察站可以使所得到的降水量信息仍然足够大?,解法一我们把12个气象观测站的观测值看成12个向量组,由于本题只给出了10年的观测数据,根据线性代数的理论可知,若向量组所含向量的个数大于向量的维数,则该向量组必然线性相关。于是只要求出该向量组的秩就可确定该向量组的最大无关组所含向量的个数,也就是需保留的气象观测站的个数。由于向量组中的其余向量都可由极大线性无关组线性表示,因此,可以使所得到的降水信息量足够大。用i=1,2,L,10分别表示1981年,1982年,1990年。aij(i=1,2,L,10,j=1,2,L,12)表示第j个观测站第i年的观测值,记A=(aij)1012。利用MATLAB可计算出矩阵A的秩r(A)=10,且任意10个列向量组成的向量组都是极大线性无关组,,例如,我们选取前10个气象观测站的观测值作为极大线性无关组,则第11,12这两个气象观测站的降水量数据完全可以由前10个气象观测站的数据表示。设xi(i=1,2,L,12)表示第i个气象观测站或第i个观测站的观测值。则有x11=0.0124x10.756x2+0.1639x3+0.3191x41.3075x51.0442x60.1649x70.8396x8+1.679x9+2.9379x10 x12=1.4549x1+10.6301x2+9.8035x3+6.3458x4+18.9423x5+19.8061x627.0196x7+5.868x815.5581x926.9397x10,到目前为止,问题似乎已经完全解决了,可其实不然,因为如果上述观测站的数据不是10年,而是超过12年,则此时向量的维数大于向量组所含的向量个数,这样的向量组未必线性相关。故上述的解法不具有一般性,下面我们考虑一般的解法,首先,我们利用已有的12个气象观测站的数据进行模糊聚类分析,最后确定从哪几类中去掉几个观测站。,解法二(用模糊数学的方法),例,模糊数学是研究和处理模糊性现象的数学方法.众所周知,经典数学是以精确性为特征的.,然而,与精确形相悖的模糊性并不完全是消极的、没有价值的.甚至可以这样说,有时模糊性比精确性还要好.例如,要你某时到某地去迎接一个“大胡子高个子长头发戴宽边黑色眼镜的中年男人”.尽管这里只提供了一个精确信息男人,而其他信息大胡子、高个子、长头发、宽边黑色眼镜、中年等都是模糊概念,但是你只要将这些模糊概念经过头脑的综合分析判断,就可以接到这个人.模糊数学在实际中的应用几乎涉及到国民经济的各个领域及部门,农业、林业、气象、环境、地质勘探、医学、经济管理等方面都有模糊数学的广泛而又成功的应用.,实际中,我们处理现实的数学模型可以分成三大类:第一类是确定性数学模型,即模型的背景具有确定性,对象之间具有必然的关系。第二类是随机性的数学模型,即模型的背景具有随机性和偶然性。第三类是模糊性模型,即模型的背景及关系具有模糊性。统计数学是将数学的应用范围从确定性的领域扩大到了不确定性的领域,即从必然现象到偶然现象,而模糊数学则是把数学的应用范围从确定领域扩大到了模糊领域,即从精确现象到模糊现象。,模糊是指客观事物差异的中间过渡中的“不分明性”或“亦此亦彼性”。如高个子与矮个子、年轻人与老年人、热水与凉水、环境污染严重与不严重等。在决策中,也有这种模糊的现象,如选举一个好干部,但怎样才算一个好干部?好干部与不好干部之间没有绝对分明和固定不变的界限。这些现象很难用经典的数学来描述。,第一章模糊数学基本概念,一、经典集合与特征函数,论域U中的每个对象u称为U的元素。,其中,函数称为集合A的特征函数。,二、模糊集合及其运算,1、模糊子集,例设论域U=x1(140),x2(150),x3(160),x4(170),x5(180),x6(190)(单位:cm)表示人的身高,那么U上的一个模糊集“高个子”(A)的隶属函数A(x)可定义为,也可用Zadeh表示法:,模糊集的运算,相等:A=BA(x)=B(x);包含:ABA(x)B(x);并:AB的隶属函数为(AB)(x)=A(x)B(x);取大运算交:AB的隶属函数为(AB)(x)=A(x)B(x);取小运算余:Ac的隶属函数为Ac(x)=1-A(x).,X=1,2,3,4,5,6,7,8,三、隶属函数的确定,1.模糊统计方法,与概率统计类似,但有区别:概率统计随机事件A是固定不变的,样本空间中样本点数是变动的,而模糊统计试验中,x是固定不变的,而模糊集A*是可变的。,2.指派方法,一种主观方法根据实践经验来确定,一般给出隶属函数的解析表达式。,模糊数学的基本思想是隶属度思想,应用模糊数学建立数学模型的关键是建立符合实际的隶属函数。如何确定一个模糊集的隶属函数至今还是尚未解决的问题这里仅介绍几种常用的确定隶属函数的方法,常用的隶属函数有Z函数(偏小型)、函数(中间型)、S函数(偏大型).偏小型一般适合于描述像“小,少,浅,淡,青年”等偏小程度的模糊现象。偏大型一般适合于描述像“大,多,深,浓,老年”等偏大程度的模糊现象。中间型一般适合于描述像“中,适中,不太多,不太浓,暖和,中年”等处于中间状态的模糊现象。,3.借用已有的“客观”尺度根据问题的实际意义来确定,在经济管理,社会管理中常用。如U表示产品,定义A模糊集“质量稳定”,可用产品的“正品率”作为A的隶属度。,常用的隶属函数有偏小型、中间型、偏大型.,第二章模糊聚类分析,(1)模糊矩阵间的关系及运算,定义:设都是模糊矩阵,定义,相等:,包含:,并:,交:,余:,例:,(2)模糊矩阵的合成,例:,(3)模糊矩阵的转置,(4)模糊矩阵的截矩阵,例:,例:设对于模糊等价矩阵,故R是模糊等价矩阵,当,得到分类为,当,得到分类为,于是,得到动态聚类图如右图所示,10.80.60.50.4,r54321,例:设有模糊相似矩阵,二、模糊聚类分析的一般步骤,、建立数据矩阵,(1)标准差标准化,(2)极差正规化,(3)极差标准化,、建立模糊相似矩阵,(1)相似系数法,夹角余弦法,相关系数法,(2)距离法,Hamming距离,Euclid距离,Chebyshev距离,(3)贴近度法,最大最小法,算术平均最小法,几何平均最小法,3、聚类并画出动态聚类图,(1)模糊传递闭包法,步骤:,解:,由题设知特性指标矩阵为,采用最大值规格化法将数据规格化为,用最大最小法构造模糊相似矩阵得到,用平方法合成传递闭包,取,得,取,得,取,得,取,得,取,得,画出动态聚类图如下:,应用一:教师课堂教学质量评价,数据标准化采取最大值规格化;相似矩阵的建立采取相关系数法.,动态聚类图如下:,作业:企业综合竞争力评价分类,5个公司6个指标的样品数据如下,试根据以下数据评价5个公司的综合竞争力。,金融机构财务分析,表1为2004年广东10个城市金融机构本外币存款、贷款的统计情况。试分析他们财务情况的相似性。,第三章模糊模式识别,模型识别,已知某类事物的若干标准模型,现有这类事物中的一个具体对象,问把它归到哪一模型,这就是模型识别.,模型识别在实际问题中是普遍存在的.例如,学生到野外采集到一个植物标本,要识别它属于哪一纲哪一目;投递员(或分拣机)在分拣信件时要识别邮政编码等等,这些都是模型识别.,模糊模型识别,所谓模糊模型识别,是指在模型识别中,模型是模糊的.也就是说,标准模型库中提供的模型是模糊的.,模型识别的原理,为了能识别待判断的对象x=(x1,x2,xn)T是属于已知类A1,A2,Am中的哪一类?事先必须要有一个一般规则,一旦知道了x的值,便能根据这个规则立即作出判断,称这样的一个规则为判别规则.判别规则往往通过的某个函数来表达,我们把它称为判别函数,记作W(i;x).一旦知道了判别函数并确定了判别规则,最好将已知类别的对象代入检验,这一过程称为回代检验,以便检验你的判别函数和判别规则是否正确.,一、最大隶属原则,最大隶属原则:,最大隶属原则:,二、择近原则,1、贴近度,表示两个模糊集A,B之间的贴近程度。,C=,C=,故B比A更贴近于.,茶叶等级识别,假设茶叶分为I,II,III,IV,V种,请识别A为哪一种。U=条索、色泽、净度、汤色、香气、滋味指标数如下:I=(0.5,0.4,0.3,0.6,0.5,0.4)II=(0.3,0.2,0.2,0.1,0.2,0.2)III=(0.2,0.2,0.2,0.1,0.1,0.2)IV=(0,0.1,0.2,0.1,0.1,0.1)V=(0,0.1,0.1,0.1,0.1,0.1)待识别茶叶指标数:,利用计算贴近度得,,,,,由此可得A为I型茶叶,计算的MATLAB程序如下:,a=0.50.40.30.60.50.40.30.20.20.10.20.20.20.20.20.10.10.200.10.20.10.10.100.10.10.10.10.1;b=0.40.20.10.40.50.6;fori=1:5x=a(i,:);b;t(i)=min(max(min(x)1-min(max(x);endt,2、择近原则,应用:用模糊贴近度法评价土壤重金属污染程度,对于数值越小越好的指标,采取如下隶属函数:,对于数值越大越好的指标,采取如下隶属函数:,采用最小平均贴近度得,作业:用模糊贴近度法评价各采样点水环境质量等级:,第四章模糊综合评判决策,在实际工作中,对一个事物的评价或评估,常常涉及多个因素或多个指标,这时就要求根据这多个因素对事物作出综合评价,而不能只从某一因素的情况去评价事物,这就是综合评判.模糊综合评判决策是对受多种因素影响的事物作出全面评价的一种十分有效的多因素决策方法.,经典综合评判决策:评总分法、加权评分法,一、模糊集中意见决策,为了对论域U=u1,u2,un中的元素进行排序,由m个专家组成专家小组M,分别对U中的元素排序,得到m种意见:V=v1,v2,vm,其中vi是第i种意见序列,即U中的元素的某一个排序.若uj在第i种意见vi中排第k位,则令Bi(uj)=nk,称,为uj的Borda数.此时论域U的所有元素可按Borda数的大小排序,此排序就是是比较合理的.,例1设U=a,b,c,d,e,f,|M|=m=4人,v1:a,c,d,b,e,f;v2:e,b,c,a,f,d;v3:a,b,c,e,d,f;v4:c,a,b,d,e,f;,B(a)=5+2+5+4=16;B(b)=2+4+4+3=13;B(c)=4+3+3+5=15;B(d)=3+0+1+2=6;B(e)=1+5+2+1=9;B(f)=0+1+0+0=1;按Borda数集中后的排序为:a,c,b,d,e,f.,例2设有6名运动员U=u1,u2,u3,u4,u5,u6参加五项全能比赛,已知他们每项比赛的成绩如下:200m跑u1,u2,u4,u3,u6,u5;1500m跑u2,u3,u6,u5,u4,u1;跳远u1,u2,u4,u3,u5,u6;掷铁饼u1,u2,u3,u4,u6,u5;掷标枪u1,u2,u4,u5,u6,u3;,B(u1)=5+0+5+5+5=20;B(u2)=4+5+4+4+4=21;B(u3)=2+4+2+3+0=11;B(u4)=3+1+3+2+3=12;B(u5)=0+2+1+0+2=5;B(u6)=1+3+0+1+1=6;按Borda数集中后的排序为:u2,u1,u4,u3,u6,u5.,若uj在第i种意见vi中排第k位,设第k位的权重为ak,则令Bi(uj)=ak(nk),称,为uj的加权Borda数。,B(u1)=7,B(u2)=5.75,B(u3)=1.98,B(u4)=1.91,B(u5)=0.51,B(u6)=0.75.按加权Borda数集中后的排序为:u1,u2,u3,u4,u6,u5,二、模糊综合评判,(一)一级模糊综合评判,根据运算的不同定义,可得到以下不同模型:,其中:,应用一:晋升的数学模型,某校规定,在对一位教师的评价中,若”好”与”较好”占50%以上可晋升为教授,教授分教学型教授和科研型教授,在评价指标上分别给出不同的权重:教学型教授:A1=(0.20.50.10.2);科研型教授:A2=(0.20.10.50.2).学科评议组由七人组成,对该老师的评价如下,请判别该教能否获得晋升,可晋升为哪一类教授?,政治表现42100教学水平61000科研能力00511外语水平22111,好较好一般较差差,归一化得,应用二:农业经营决策中的应用,分数亩产量产品质量亩用工量亩纯收入生态影响5550-600113014500-550220-30110-13023450-500330-4090-11032400-450440-5070-9041350-400550-6050-705060506,某产粮区进行耕作制度改革,制定了甲乙丙三个方案,以下表作为评价指标,5个因素权重定为(0.20.10.150.30.25),亩产量产品质量亩用工量亩纯收入生态影响甲592.5355725乙5292381053丙412132852,请确定应该选择哪一方案?,亩产量的隶属函数:,亩用工量的隶

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论