第九章_模糊聚类分析_181-202_54812_第1页
第九章_模糊聚类分析_181-202_54812_第2页
第九章_模糊聚类分析_181-202_54812_第3页
第九章_模糊聚类分析_181-202_54812_第4页
第九章_模糊聚类分析_181-202_54812_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三篇 评价、决策方法与模型近年来,围绕着评价与决策方法,各种相关知识不断渗入,使得评价与决策的方法不断丰富,相关研究也不断深入。综合评价与决策逐渐成为一个多学科边缘交叉、相互渗透、多点支撑的新兴研究领域。从某种意义上来讲,没有评价就没有决策。评价是一种认知过程,是科学决策的前提,而决策是评价的最终目的。目前流行的几种现代综合评价、决策方法包括模糊综合评价、层次分析法、数据包络分析法、决策分析法、人工神经网络评价法、灰色综合评价法、组合评价法等等。各种评价、决策方法有简有繁,相互区别但又相互联系。各种评价、决策方法各具特色,对某类具体问题选择评价、决策方法提供了借鉴。基于篇幅的限制,本篇仅对模

2、糊聚类分析、模糊综合评价、层次分析法、决策分析法介绍其基本原理、模型建立和求解方法,并讨论各方法在经济管理中的应用。第九章 模糊聚类分析1965年,模糊理论的创始人,美国加利福尼亚大学伯克利分校的计算机和自动控制理论专家L.A.Zadeh教授发表了题为“Fuzzy Set”的论文,这标志着模糊信息处理的诞生,并于20世纪60年代在各科学会议上,从模糊信息处理观点出发,阐述了他的理论。这一理论是描述和处理事务的模糊性和系统的不确定性,模拟人所特有的模糊逻辑思维功能,从定性到定量,创造了研究模糊性或不确定性问题的理论方法。Zadeh教授在随后的研究工作中,准确地阐述了模糊性的含义,制定了刻画模糊性

3、的数学方法。即模糊集合、隶属度、隶属函数等,迄今已成为了一个较为完整的数学分支。目前对模糊数学的研究十分活跃,模糊集合理论进一步丰富了经典数学的理论系统,为人们处理模糊信息提供了很多好的方法。现在,模糊数学的公理化基础已经建立,正接受实践的检验,并进一步得到完善。自从1976年模糊数学传入我国以来,通过广大模糊数学研究工作者的努力,模糊数学在我国得到了极大的发展,目前水平己居于世界前列。模糊数学在实际应用中几乎涉及到了国民经济的各个领域及相关部门,模糊数学在医学、气象、环境、农业、能源、军事、经济管理和地质勘探等方面都得到了广泛的应用。从模糊理论诞生到今天四十年来,模糊理论和技术得到了迅速的发

4、展,在这个领域国内外许多学者做了大量卓有成效的研究工作。模糊理论与技术的一个突出优点就是能较好地描述和模仿人的思维方式,并能总结和反映人的体会和经验,对复杂事务和系统可进行模糊度量、模糊识别、模糊推理、模糊控制与模糊决策。尤其是将模糊理论与人工智能在神经网络和专家系统等方面相互结合的研究已深入到计算机技术、多媒体技术、自动控制技术以及信息采集与处理技术等一系列高新技术的开发、研究与利用,为推动决策科学、应用科学、管理科学与社会科学的进步作出了极大的贡献。这种学术理论体系不断完善的新成果正在迅速地转变为生产力,促进了全人类社会物质文明的不断发展。第一节 关系及分类客观世界的各种事物之间存在着不同

5、的相互关系。在数学上使用“关系”作为一种数学模型来描述事物之间的联系,例如,大小关系、次序关系、等价关系、兄弟关系、函数关系等。普通集合也存在关系。1.关系的定义定义9.1.1 从到的关系是指论域为笛卡儿乘积(直积)的一个子集,即,称为从到的二元关系。特别地,当时,称之为上的二元关系。二元关系统称为关系。例1 设,定义关系,称为“小于”关系。于是这表明“小于”关系是笛卡儿乘积的子集。例2 设周一,周二,周三,周四,周五,周六,周日和晴,阴,雨。某一周的天气情况是:周一阴,周二雨,周三晴,周四晴,周五雨,周六雨,周日雨,则形成关系(周一,阴),(周二,雨),(周三,晴),(周四,晴),(周五,雨

6、),(周六,雨),(周日,雨),关系是笛卡儿乘积的一个子集。2.关系的表示法关系可以分别用表格、图形和矩阵表示,下面以例2为例进行说明。(1)表格。见表9-1表9-1 关系的表格表示周一周二周三周四周五周六周日晴0011000阴1000000雨0100111(2)图形。见图9-1,如果,则连一条直线,否则不连。论域 论域周一 晴周二周三 阴周四周五周六 雨周日图9-1用连线图表示关系(3)矩阵。见图9-2。对一般情况,设论域为有限。关系,。周一 周二 周三 周四 周五 周六 周日图9-2 关系的矩阵表示3.特征函数定义9.1.2 设是论域上的集合,记为集合的特征函数。特征函数表征了元素对集合的

7、隶属程度。表示,反之表示。第二节 模糊关系及矩阵在数学上,概念的外延可以通过“集合”来表达。然而,日常生活中涉及的众多的概念常有内涵的“模糊(Fuzzy)性”,这必然导致外延的“不清晰性”。例如,对于高矮之分等。正是考虑到现实世界中很多事物的分类边界是不分明的,而这种不分明的划分在人们的识别、判断和认知过程中起着重要的作用,为了用数学的方法来处理这种问题,扎德于1965年提出了模糊集合的概念。他用隶属度函数来刻画出中间过渡的事物对差异双方所具有的倾向性。可以认为隶属函数是普通集合中特征函数的推广。将特征函数的值域由二值扩展到区间时,就描述了一个模糊集合。1.模糊集合隶属函数定义9.2.1 论域

8、上的模糊集合由隶属函数来表征,其中在闭区间上取值,的值反映了中的元素对于的隶属程度。例1 设论域周一,周二,周三,周四,周五,周六,周日,从周一到周四是好天气,周五到周日都是坏天气。按普通集合观点,特征函数为,其隶属度为(周一)=1,(周二)=1,(周三)=1,(周四)=1;(周五)=0,(周六)=0,(周日)=0。 利用模糊集合概念能较好区分好坏天气,选取之间的数对天气情况进行细分。这时对于天气的隶属度可以写成(周一)=0.9,(周二)=0.8,(周三)=0.7,(周四)=0.6;(周五)=0.3,(周六)=0.2,(周日)=0.1。2.模糊关系定义9.2.2 设论域和,称的一个模糊子集为从

9、到的模糊二元关系,记为。其隶属度函数为映射:这时隶属度表示与具有关系的程度。特别地,当时,称为上的模糊关系。例2 论域100,150,200,250,300,350,400,450,500,550,600,650,700,750,800(公斤亩),高产水稻。由于全国各地的自然条件差异和生产水平不同,人们对水稻亩产多少才算高产的理解不一样,亩产量与“高产水稻”之间的关系是模糊关系。通过对不同地区种植水稻的123个农民的问卷调查,获得表9-2的结果。表9-2 亩产量与“高产水稻”的模糊关系公斤/亩100150200250300350400450500550600650700750800频数1251

10、01518252015332211累计频数1381835517696111114117119121122123累计频率0.010.020.070.150.270.410.620.780.900.930.950.970.980.991表9-2中的累计频数就是的一个模糊子集。将累计频数变换到区间成为累计频率,这时累计频率就是隶属函数。(500,高产水稻)=0.90表明亩产500公斤与“高产水稻”的相关程度为90%。定义9.2.3 设分别为和上的两个模糊关系。则与的合成,记为其中,则为矩阵与的合成(也称为模糊矩阵乘积或模糊乘积)。其中“”与“”为逻辑符号,分别表示取大、取小。定义9.2.4 模糊关系

11、的传递闭包定义为:。由于可见,这个性质称为传递性。集合论中的“关系”抽象地刻画了事物的“精确性”的联系,而“模糊关系”则从更深刻的意义上表现了事物间更广泛的联系。从某种意义上讲,模糊关系的抽象形式更接近于人的思维。在经济生活与经济科学中存在大量的模糊关系,而分类也是经济分析与经营管理中常常使用的方法,模糊关系理论是许多应用原理和方法的基础。3.模糊矩阵定义9.2.5 设,是到的模糊关系,记,记,则称为模糊矩阵。例3 设是个工作人员的集合,是项工作的集合。若用表示能胜任的程度,就可获得到的模糊矩阵。设(即有4个工作人员),(即有5项工作),则模糊矩阵:例如第2个人能胜任第4项工作的程度为0.5。

12、定义9.2.6 设论域为有限集合,上的一个模糊关系为,与其对应的模糊矩阵为,若满足:(1) 自反性:(2) 对称性:(3) 传递性:则称为一个模糊等价矩阵,其关系是模糊等价关系。若只满足自反性和对称性则为相似关系。定理9.2.1 设是模糊相似矩阵,则存在一个最小自然数,使得传递闭包,对于一切大于的自然数,恒有。此时,为模糊等价矩阵。下面介绍一个实用求传递闭包的简捷方法二次方法。例4 设,求传递闭包。解:容易验证,是模糊相似矩阵,用二次方法求其传递闭包。,故传递闭包。4.模糊矩阵的-截矩阵定义9.2.7 设为模糊矩阵,对于任意的,称为模糊矩阵的-截矩阵,其中显然,截矩阵为布尔矩阵。例5 设,则当

13、时的-截矩阵为。第三节 模糊聚类分析的一般步骤在科学技术、经济管理中常常需要按一定的标准(相似程度或亲疏程度)进行分类。例如,根据生物的某些性状可对生物分类,根据土壤的性质可对土壤分类等。对所研究的事物按一定标准进行分类的数学方法称为聚类分析,它是多元统计“物以类聚”的一种分类方法。由于科学技术、经济管理中的分类界限往往不分明,因此采用模糊聚类方法通常比较符合实际。传统的聚类把每个样本严格地划分到某一类。随着模糊集理论的提出,传统聚类被推广为模糊聚类。在模糊聚类中,每个样本不再仅属于某一类,而是以一定的隶属度属于每一类。换句话说,通过模糊聚类分析,可得到样本属于各个类别的不确定性程度,即建立起

14、了样本对于类别的不确定性的描述,这样就更能准确地反映现实世界。模糊聚类分析步骤可以分为:数据标准化、建立模糊相似矩阵、聚类。一、数据标准化1.数据矩阵设论域为被分类的对象,每个对象又由个指标表示其性状,即,于是,得到原始数据矩阵为。2.数据标准化在实际问题中,不同的数据可能有不同的量纲。为了使不同量纲的数据也能进行比较,需要对数据进行适当的变换。根据模糊矩阵的要求将数据压缩到区间。通常需要做如下几种变换:(1)平移-标准差变换,其中。经过变换后,每个变量的均值为0,标准差为1,且消除了量纲的影响。但是这样得到的还不一定在区间上。(2)平移-极差变换,显然有,而且也消除了量纲的影响。(3)对数变

15、换,取对数以缩小变量间的数量级。二、建立模糊相似矩阵建立模糊相似矩阵又称为标定,即标出衡量被分类对象间相似程度的统计量。设论域,依照传统聚类方法确定相似系数,建立模糊相似矩阵,与的相似程度。确定的方法主要借用传统聚类分析的相似系数法、距离法以及其他方法。具体用何种方法,可根据问题的性质,选取下列公式之一计算。1.相似系数法(1)数量积法,其中。显然,若中出现负值,也可采用以下方法将压缩到上:令,则。当然也可用上述的平移-极差变换。(2)夹角余弦法(3)相关系数法,其中。(4)指数相似系数法,其中,。(5)最大最小法。(6)算术平均最小法。(7)几何平均最小法。2.距离法(1)直接距离法,其中为

16、适当选取的参数,它使得,表示与的距离。经常采用的距离有以下几种:海明距离:;欧氏距离:;切比雪夫距离:。(2)倒数距离法其中为适当选取的参数,使得。(3)指数距离法上述三种距离法中若采用海明距离,则又分别称为绝对值减数法、绝对值倒数法、绝对值指数法。3.主观评分法请专家或有实际经验者直接对与的相似程度评分,作为的值。(1)百分制采用百分制,将评出的总分数除以100,即得闭区间的一个。为降低主观性,可以请多个专家参与评分,再取平均定出。(2)相似度和自信度假定请个专家组成专家组,这时有,其中,为第个专家所给出与的相似度,是专家对自己给出相似度时的自信度。和都是在区间的数值。三、聚类1.模糊等价矩

17、阵聚类(1)传递闭包法根据标定所建立的模糊矩阵,不一定具有传递性,只是模糊相似矩阵。首先将改造成模糊等价矩阵。根据定理9.2.1,用二次方法求传递闭包。再让由大变到小,就可形成动态聚类图。例1 设论域表示农业小区域,已知每个小区域的气候取决于4个指标:热量、水分、霜冻、霜雹,即,其数值如表9-3所示。表9-3 农业小区域及指标关系指标农业小区域热量()1223356654水分()3.52.53.5330.51.51.533霜冻()1213154421霜雹()0211120122 由于所给数据,且没有单位,所以直接选取数量积法建立模糊相似矩阵,无需做变换。 用公式,选取使得对一切,有。在本例中由

18、数量积法可得。于是,得到的模糊相似矩阵为用二次方法求的传递闭包:,得到模糊等价矩阵为将由大到小进行聚类取,分为10类:,。取,分为9类:,。取,分为8类:,。取,分为7类:,。取,分为5类:,。取,分为2类:,。取,分为1类:,。(2)布尔矩阵法设是论域上的模糊相似矩阵,若要得到的元素在水平上的分类,使用布尔矩阵的具体做法如下: 求模糊相似矩阵的-截矩阵,显然为布尔矩阵。 判断是否是等价的。如果在任一排列下都没有下列形式的特殊子矩阵:,则具有传递性,为等价矩阵,可以证明为等价矩阵。 如果判断是等价的,则由可得在水平上的分类。 如果判断不是等价的,只要将中上述特殊形式子矩阵的0一律改成1,直到不

19、再出现特殊形式子矩阵为止,修改后的为等价矩阵,可以获得水平上的分类。例2 每个环境单元可以包括空气、水分、土壤、作物4个要素,环境单元的污染状况由污染物在4个要素中含量的超限度来描述,设论域为5个单元,它们的污染数据如表9-4所示。表9-4 环境单元污染状况环境单元指标空气()水分()土壤()作物()55322345552315312451按绝对值减数法进行标定,取,由得模糊相似矩阵。用布尔矩阵法分类: 取,得,分为5类:,。取,得,分为4类:,。取,得,分为3类:,。取,得,先互换的第1、2行,再互换第1、2列,得,再按布尔矩阵法进行改造,得,分为2类:,。取,得,先互换的第1、2行,得,再

20、按布尔矩阵法进行改造,得,分为1类:,。2.直接聚类(1)直接聚类法在建立模糊相似矩阵后,既不求传递闭包,也不用布尔矩阵法,而是直接从模糊相似矩阵进行聚类。其步骤如下:取(最大值),对每个作相似类,且,即将满足的与放在一类,构成相似类。相似类与等价类的不同之处是,不同的相似类可能有公共元素,即可出现,。此时只要将有公共元素的相似类合并,即可得水平上的等价分类。取为次大值,从中直接找出相似程度为的元素对(即),将对应于的等价分类中所在的类与所在的类合并,将所有这些情况合并后,即得对应于的等价分类。取为第三大值,从中直接找出相似程度为的元素对(即),类似的将对应于的等价分类中所在的类与所在的类合并

21、,将所有这些情况合并后,即得对应于的等价分类。依次类推,直到合并到成为一类为止。(2)最大树法以被分类元素为顶点,以相似矩阵的元素为权重的一棵最大的树,取定,砍断权重低于的枝,得到一个不连通的图,各个连通的分支便构成了在水平上的分类。下面介绍求最大树的克鲁克(Kruskal)法。设,先画出所有顶点,从模糊相似矩阵中按从大到小的顺序依次画枝,并标上权重,要求不产生圈,直到所有顶点连通为止,这就得到一棵最大树。例3 用最大树法求例2环境单元的分类。解:论域,模糊相似矩阵,画出最大树,如图9-3(a)所示。(a)(e)(d)(c)(b)x1x1x1x1x1x3x3x3x3x3x4x4x4x4x4x5

22、x5x5x5x5x2x2x2x2x20.80.80.80.80.60.60.60.50.4图9-3环境单元分类砍去最大树枝权重低于的枝,即得在水平上的分类。取,分为5类:,如图9-3(b)所示。取,分为4类:,如图9-3(c)所示。取,分为3类:,如图9-3(d)所示。取,分为2类:,如图9-3(e)所示。取,分为1类:,如图9-3(a)所示。最大树法所得的结果与布尔矩阵法分类结果是一致的。第四节 应用案例:模糊聚类分析法在经济管理中的应用例1 亚洲玉米螟测报的数学模型。亚洲玉米螟是影响我国玉米生产的主要害虫之一。过去,人们对玉米螟种群动态的研究,一般仅考虑时间因子,即研究种群随时间变化的规律

23、,也有从玉米螟空间格局加以研究的。而本例是把种群的数量动态与空间格局联系起来加以研究。同时还应指出,玉米螟的种群动态是一个具有模糊性的问题,玉米螟对玉米的危害程度也具有模糊性。因此,本例利用模糊数学方法,建立亚洲玉米螟测报的数学模型。解 第一步:采集样本,确定主要因子,建立数据矩阵。设论域是武汉地区1951-1985年间的历史资料(26个样本),每个样本由8个主要指标来描述,即 。8个主要指标的含义如下:上年7月、8月的平均气温;:上年12月,当年1、2月的平均气温;:当年4月温湿系数;:当年4月雨日数(降水量不小于的天数);:当年4月日照数;:当年4月风速();:当年5月上旬的温湿系数;:当

24、年5月上旬田间调查的玉米螟卵块数。由历史资料提供的原始数据如表9-5所示。表9-5玉米螟原始数据样本号指 标128.53.55.901885.52.620.35.6228.75.24.5210192.33.420.67.9327.94.44.8111161.12.922.86.3430.04.95.351897.12.819.41.7528.75.24.489185.92.820.13.4628.42.74.9119122.12.716.38.1728.35.44.7117146.53.018.54.1828.65.34.449177.73.019.08.6931.05.45.3312140.

25、82.717.41.61028.54.64.4612159.52.920.84.11129.84.95.5916146.22.717.42.11228.64.55.6315110.32.717.51.51327.85.25.5816126.32.721.66.51429.63.45.6219121.22.919.76.11527.72.85.2915148.23.623.56.81627.84.65.5916190.12.420.77.01728.44.75.1912126.43.118.94.11829.33.05.4715149.53.122.73.91928.15.24.6316158.

26、03.720.27.82028.53.93.9310187.12.918.97.12128.64.55.3316134.33.118.97.22228.13.34.8617127.12.416.77.42328.15.44.7311199.91.921.32.72430.16.05.0915177.82.717.21.32528.85.44.7513139.02.720.43.12627.94.35.1216151.02.018.79.3第二步:标定-建立模糊相似矩阵。采用指数相似系数,第个样本与第个样本的相似系数为,其中是第个因子的方差,即,。可得模糊相似矩阵为第三步:聚类。(1)用二次方法

27、求传递闭包,得模糊等价矩阵为(2)聚类。当由0.916降到0.679时,得到一系列等价的布尔矩阵(省略)。(3)根据武汉地区的实际情况,将玉米螟对玉米的危害程度划分为(轻)、(较重)、(重)、(严重)4个等级。取,将原始样本分为4类。类(危害轻年份):,;类(危害较重年份):;类(危害重年份):,;类(危害严重年份):。(4)回报与预测。将1986年和1987年的有关因子的8个数据输入上述模型,经过运算,同样取,可以判定:1986年和1987年归并类,即这两年为危害轻年份。类似地,将要预测年份的有关8个因子的数据输入上述模型,经过运算,同样可判定该年份归并哪一类,即可判定该年份危害的轻重程度。

28、此模型对防治玉米螟有一定的实用价值。例2 模糊聚类分析在市场划分中的应用。在市场经济条件下,市场划分是一项重要的战略措施,它有许多显著的特点:使企业的产品经销有针对性,可以更好地满足顾客的需求;在市场经营上便于专业化,销售人员可以集中力量对一些特定顾客进行宣传和推销,从而提高市场经营的效果。因此,将市场动态地划分为各个层次的若干种类群是很有意义的。由于在给定的一个市场中,顾客的购买行为是有差异的,因而,根据对顾客购买行为的差异的观测数据,可将市场进行划分。例如,设一个市场具有个顾客和种商品,那么,可以用矩阵来表示顾客的购买行为,其中表示第个顾客对第种商品的购买行为的程度。解 第一步:设论域(2

29、0个国家和地区)。以一个国家或地区作为一个需求单位,每个国家或地区用10个特征指数来衡量(如,地理指数地理位置、人口密度等;人口状况指数生活方式、商品使用率等;经济指数国民生产总值、进出口贸易总值等;社会结构指数君主立宪制、议会制等),即,原始数据如表9-6所示。表9-6国际市场划分原始数据123456789101美国2112.0007.5906172.36.963218.927-37.125552.95389323.52 加拿大197.4701.9064801.80.83856.8251.358716.07098932.43 墨西哥92.6161.961883.80.40512.086-3.

30、104586.2409893354.94 澳大利亚116.2491.4854955.50.40518.2320.443717.144981221.95 中国香港13.6801.4852257.10.04717.137-2.305664.956844530.06印度117.6566.064121.313.7948.150-1.710363.565384198.07日本1053.32018.8395305.01.170110.670-7.625206.14284312.48 新加坡8.1215.8222138.30.01117.635-3.402515.0218483.09泰国21.7852.11

31、3313.30.2637.156-1.848554.27938483.010埃及18.7610.991296.80.3758.837-1.997570.578383340.811伊朗19.2746.745627.30.0117.26111.739794.79968427.712 黎巴嫩3.0861.9261262.50.0622.414-1.709595.918384299.013 摩洛哥13.3290.231478.90.0183.807-1.935573.074683343.914 索马里0.2490.069252.90.0210.440-0.258564.10268335.615 赞比亚

32、-2.9000.064252.90.0210.7560.572664.77668337.616苏丹5.3070.048244.80.0031.110-0.575637.40868337.117韩国47.5832.488794.70.54220.399-5.284516.577984383.818 巴基斯坦19.7270.511215.00.1464.061-1.025315.37438499.219秘鲁8.8941.795400.80.3862.1461.386510.493389313.620 马来西亚16.2498.379881.80.0947.8493.228580.209684100.0第二步:标定。用欧式距离公式来定义两个需求单位之间的需求相似程度,这样一来,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论