




免费预览已结束,剩余35页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本科毕业设计(论文) 模糊聚类在广东各区域经济发展中的应用学 院 应用数学学院 专 业 统计学 年级班别 学 号 学生姓名 指导教师 2012年 6 月模糊聚类在广东各区域经济发展中的应用 应用数学学院 摘要改革开放以来,面对全球经济一体化步伐的加快和中国加入世贸组织的背景,作为珠江三角洲地区重要组成部分的广东省充分利用国际、国内两种资源、两个市场,经济社会得到了前所未有的快速发展,成为全国最具活力的省份之一。但广东省各地区的经济发展状况并不一致,存在较大差异,故此需对其各城市进行分类,根据实际情况制定发展方案,以便更好促进各地区发展。本文以广东省21个城市的14个经济指标作为样本集,对此进行模糊聚类分析,并以F统计量进行检验,得到最佳聚类结果:第1类广州;第2类深圳;第3类东莞;第4类珠海,佛山,中山;第5类汕头,潮州,揭阳;第6类河源,清远;第7类惠州,江门;第8类韶关,梅州,湛江,茂名,肇庆;第9类汕尾,阳江,云浮。结果符合广东省经济现况,对广东省未来经济发展规划有指导作用。关键词:模糊聚类,广东省,经济发展,分类注:本论文题目来源于教师选题。AbstractAfter reform and openness, Guangdong, as one of the most important parts of Pearl River Delta, makes good use of both international and national resources and markets with the background of faster integration of global economy and China joining WTO. Its economy and society developed faster than ever and it becomes one of the most vital provinces in China. However, there is a big gap of economic level between different cities in Guangdong. Thus, this paper, according to practical situations, classifies those cities and raises development plans for each city in order to promote development.There are 21 cities and 14 economic indicators as sample set which is analyzed by fuzzy cluster and tested by F-statistic in order to get the optimal cluster result. The first class is Guangzhou. The second class is Shenzhen. The Third class is Dongguan. The forth class are Zhuhai and Foshan. The fifth class are Shantou, Chaozhou and Jieyang. The sixth class are Heyuan and Qingyuan. The Seventh class are Huizhou and Jiangmen. The eighth class are Shaoguan, Meizhou, Zhanjiang, Maoming and Zhaoqing. The ninth class are Shanwei, Yangjiang and Yunfu. The result fits the reality of economy in Guangdong province and it has directive function for future economic development.Keywords: Fuzzy cluster, Guangdong Province, economic development, Classification目录1绪论11.1广东省的背景11.2题目意义及目的21.3题目研究方法21.4论文结构32基础理论知识42.1 系统聚类分析42.1.1系统聚类分析的原理42.1.2系统聚类分析方法42.2模糊聚类分析52.2.1模糊聚类分析基础知识52.2.2模糊聚类分析一般步骤73实例分析113.1 指标分析113.2 原始数据113.3 数据处理133.4系统聚类143.5 模糊聚类163.5.1 数据标准化163.5.2 建立模糊相似矩阵163.5.3 聚类(模糊等价矩阵,动态聚类图)173.5.4 F统计量确定最佳值193.6结果分析214广东省经济发展的建议234.1大力发展革新外资经济模式234.2 大力促进本土人力资本的发展234.3 大力培育本土外向型企业的发展244.4全面推进广东外向型经济发展244.5 全面提升粤港澳的外经贸合作25结论26参考文献27致谢28附录A291绪论1.1广东省的背景广东省,简称“粤”,省会广州,辖21个省辖市,其中副省级城市2个(广州、深圳),地级市19个1。汉语拼音GungDng。广东是中国大陆南端沿海的一个省份,位于南岭以南,南海之滨,与香港、澳门、广西、湖南、江西和福建接壤,与海南隔海相望。是一个以汉族为主体的省份。广东在语言风俗、历史文化等方面都有着独特一面,内部有三大民系,与中国北方地区有很大的不同。广东人口已超一亿人高居全国第一位。广东商业蓬勃,经济实力已超越新加坡、台湾和香港成为中国经济最发达,人口最多,文化最开放的省份。外国人士众多,其中东人士居高。广东是经济大省,总量全国第一,人均全国第四,经济实力仅次于江苏,位居中国第二。 以制造和第三产业为主的经济强省,走在中国经济改革开放的前列。连续十几年经济总量领先于中国其他省份,如地区生产总值、社会消费品零售总额、居民储蓄存款、专利申请量、税收、进出口总额、旅游总收入、移动电话拥有量、互联网用户、货物运输周转总量等。其中进出口总额年均占全国约1/4,从1985年至2008年连续23年居全国第一2;年财政总收入占全国约1/7;累计吸引外商投资占全国约1/4;GDP从1989年至2011年连续23年居全国第一。2008年国内生产总值突破35696.46亿元,连续20年保持全国经济总量第一位置,继超过亚洲“四小龙”中的新加坡,后又超越香港和台湾。2009生产总值为39081.59亿元,人均GDP40748元,折合为5965亿美元。财政总收入完成8620亿元。2010年全省生产总值(GDP)45472.83亿元,比上年增长12.2%。形成以制造业为主,具有食品、纺织业、机械、家用电器、汽车、医药、建材、冶金工业体系。拥有银行业金融机构机构网点和从业人员总数均居全国首位。率先成立中国第一家证券公司、第一家金融电子结算中心、第一个外汇调剂中心,发行了中国银行第一张信用卡等,广发银行1993年11月8日在澳门开设分行,并作为中国商业银行在境外开设的首家银行,深圳发展银行是中国第一家面向社会公众公开发行股票并上市的商业银行。广东充分发挥毗邻港澳的优势,深化区域金融合作,全力建设金融强省,对周边地区的金融辐射力越来越强。目前,广东已基本形成了以货币、外汇、产权等市场为主体的金融市场体系。上市公司股权分置基本完成,地方金融改革取得重大突破。现与港澳合作打造粤港澳都市圈。各省区市GDP含金量中次于上海北京位居前三,广东省成为首个5万亿元俱乐部成员,江苏、山东紧随其后,突破4万亿元。以广州、深圳为中心,以珠江口东岸、西岸为重点,2020年粤港澳建成全球最具竞争力大都市圈,打造一个具有综合竞争力的世界级的城市群。 2011年人均GDP为50500元,位居中国第四名,仅次于江苏、浙江、内蒙古。 中国最富裕30城市排行榜中东莞市、佛山市、珠海市、中山市分别排名第一、第四、第六、第七3。1.2题目意义及目的改革开放以来,面对全球经济一体化步伐的加快和中国加入世贸组织的背景,作为长江三角洲地区重要组成部分的广东省充分利用国际、国内两种资源、两个市场,经济社会得到了前所未有的快速发展,成为全国最具活力的省份之一。以制造和第三产业为主的经济强省、中国第一经济强省,走在中国经济改革开放的前列。连续十几年经济领先于中国其他省份,在许多经济指标上都列各省第一位。但广东地区各城市之间发展并很不平衡,要想更好地推动该地区各城市全面发展,促进其实现现代化、国际化和一体化,就急需对广东省21个地区的经济发展的综合实力进行科学的评估分析,以便能准确地对各城市的经发展进程进行定位,为其策划合适的发展方案。由于城市的经济发展受到地域、环境、文化等多种因素共同影响,而各因素本身又带有一定的模糊性和不确定性,因此借助于模糊统计方法加以解决分析能更为准确科学分析问题。为其实现跨越式和一体化的发展提供科学指导依据,同时也可为我国其他地区的发展研究提供参考。1.3题目研究方法有的学者分别用聚类和因子分析法对广东省区经济发展状况进行对比研究,有的学者用主成分分析法对省份经济实力进行了比较。但是,现有关于对省区经济发展状况的分类方法尚存在一些缺陷和不足,主要表现在,因子分析法和主成分分析法只能对各省区经济发展状况进行定量的排序,如何分类只是由主观判断来决定,而传统的聚类分析法是一种分类界限非常鲜明的硬性划分,缺少伸缩性。模糊聚类分析是当前在模糊数学中应用最多的几个方法之一,它可以根据不同的要求和分类标准获得不同的聚类结果,大大地提高了聚类的灵活性。由于具有较好的可伸缩性,模糊聚类是解决界限不清晰的聚类问题的较好办法。因此,采用模糊聚类对广东省区域经济发展状况进行分类更具合理性。模糊聚类是数理统计领域研究“物以类聚”的一种多元综合分析方法,其基本原理是根据研究对象的自身属性,选用适当的聚类因子,构造模糊相似矩阵,然后依据一定的隶属度对研究对象进行分型划类4。为了避免对广东各市域的经济发展程度定位分类之间存在主观性和随意性,本文以广东所有的21个市作为评价单元,选取2010年的相关数据,在MATLAB平台上,通过模糊聚类分析方法,依据综合实力的主要指标对各城市进行归类,其目的是找出广东省地区各城市自身的定位,对其经济发展水平有一个比较具体、清晰的认识,以期为以后各地区经济建设提供基础性的研究资料。1.4论文结构本文共分为五章。第一章 绪论。主要介绍了论文的选题背景和意义及题目研究方法。第二章 系统聚类分析、模糊聚类分析。主要介绍了系统聚类分析及模糊聚类分析方法的数学原理和聚类的主要步骤。第三章 对广东省各市域经济进行分析,以模糊聚类分析为主,系统聚类分析为辅作参照。建立广东省经济发展的指标评价体系,根据模糊聚类分析方法,逐步得到标准化后的数据矩阵、模糊相似矩阵、模糊等价矩阵和动态聚类图,并利用F统计量,对所得到的聚类结果进行检验,确定最佳的分类方法。第四章 对广东省经济发展的建议。针对广东省经济发展所存在的问题,提出相关的建议。第五章 结论。对本文的研究工作进行全面的总结。2基础理论知识2.1 系统聚类分析2.1.1系统聚类分析的原理系统聚类分析(Hierachical cluster analysis)在聚类分析中应用最为广泛。凡是具有数值特征的变量和样品都可以通过选择不同的距离和系统聚类方法而获得满意的数值分类效果。系统聚类法就是把个体逐个地合并成一些子集,直至整个总体都在一个集合之内为止。(1)系统聚类分析的主要步骤5:首先,计算n个变量或样品两两之间的距离dij,记作D:=dij;其次,确定类数并合并距离最近的两类为一新类;再次,重新计算新类与当前各类的距离并合并;最后,画聚类图。2.1.2系统聚类分析方法系统聚类分析可以利用SPSS软件(社会科学用统计软件包,StatisticalPackagefortheSocialScience)完成,SPSS系统聚类法主要的计算方法有七种6(如下表),表2.1 系统聚类计算方法名称含义解释Betweengroups linkageWithingroups linkageNearest neighborFurthest neighborCentrod clusteringMedian clusteringWards method组间距离法组内距离法最短距离法最长距离法重心法中间距离法离差平方和法并类后,组间距离最小并类后,组内距离最小以两类中样品最短距离为类距离以两类中样品最长距离为类距离以两类中样品均值为类距离以两类中样品中间距离为类距离以不同类内离差平方和为距离2.2模糊聚类分析2.2.1模糊聚类分析基础知识模糊集理论是20世纪60年代由美国的自动控制专家查德(L.A.Zadeh)教授首先提出来的,将模糊集理论运用到类分析中便产生了模糊聚类分析。模糊集合论的提出虽然较晚,但其理论已经广泛应用于许多领域。实践证明,模糊数学在病虫测报、种植区划、品种选育、图像识别、天气预报、地质地震、交通运输、医疗诊断、信息控制、人工智能等诸多领域的应用也已初见成效。从该学科的发展趋势来看,它具有极其强大的生命力和渗透力。模糊聚类分析的数学原理如下67:定义2.1乘积空间:令XxY=(x,Y)|xX,yY,称XxY为X的全域乘积空间。定义2.2称乘积空间XxY的一个模糊子集R为集合X到集合Y的一个模糊关系。模糊关系R由其隶属函数R(x,y)所刻画,表示元素具有模糊关系R的程度,0UR1 。当X,Y都为有限集时,模糊关系R可以用一个模糊矩阵表示:R=Rxi,yj 定义2.3 (1)若对于任一 xX,都有Rx,x=1,则称R具有自反性。(2)若对于任一 x,yX,都有Rx,y=Rx,y,则称R具有对称性。(3)若对于任一 x,y,zX都有Rx,zyYRx,yRx,z,则称R具有传递性。只满足(1)、(2)的模糊关系称为模糊相似关系;同时满足(1)、(2)、(3)的模糊关系称为模糊等价关系。上述不等式右端等于R2 ,故Rx,yRx,z,所以,当R为模糊传递关系时,有R 2是R的子集。定义2.4 如果模糊矩阵R满足R 2 是R的子集,称R为模糊传递矩阵。称包含R又被另一包含R的模糊传递矩阵t(R)为R的模糊传递闭包。(1)对任意的nn阶模糊矩阵R,总有t(R)RUR2 UURk(2)对任意一个nn阶模糊矩阵R,则t(R)=Uk=1Rk(3)对任一nn阶模糊相似矩阵R,则t(R)=Rn+1=Rn+m,其中m为任意自然数。定义2.5 如果集合X含有n个元素,R是X到X上的模糊相似关系,则 Rn=Rn+1=Rn+m一定是X上的模糊等价关系。如果在集合中X的元素间已经建立一个模糊等价关系R,我们取定0,1间的一个水平值 ,规定:若Rx,y ,则x与y属于同一类,这样就可以对集合X进行聚类。随着从1至0的选取不同,分类由细变粗,我们可以根据分类结果画出模糊聚类谱系图。定义2.6 设论域U=x1,x2,xn为样本空间(样本总数为n),而每个样本xi 有m个特征(即由试验或观察得到的m个数据): xi=xi1,xi2,xim i=1,2,n.于是得到原始数据矩阵,如表2.2所示,其中xk=1ni=1nxikk=1,2,m,x称为总体样本的中心向量。表2.2样本指标12 k mx1x11x12x1kx1mx2x21x22x2kx1mxixi1xi2xikximxnxn1xn2xnkxmmxx1x2xkxm设对应于值的分类数为r,第j类的样本数为nj,第j类的样本记为:x1j,x2j,xnjj,第j类的聚类中心为向量xj=x1j,x2j,xmj,其中xkj为第k个特征的平均值,即xjj=1nji=1njxjik k=1,2,m作F统计量F=j=1rnjxj-x2/r-1j=1ri=1njxij-xj2/n-r 式2.1其中xj-x=k=1mxkj-xk2为xj与x间的距离,xij-xj为第j类中第i个样本xij与其中心xj间的距离。称式2.1为F统计量,它是遵从自由度为r-1, n-1的F分布。它的分子表征类与类之间的距离,分母表征类内样本间的距离。因此,F值越大,说明类与类之间的距离越大;类与类之间的差异越大,分类就越好。定理1 设Rnn 是模糊相似矩阵,则存在一个最小自然数k(k n),使得传递闭包t(R) = Rk,对于一切大于k的自然数l,恒有Rl=Rk。此时,t(R)为模糊等价矩阵。2.2.2模糊聚类分析一般步骤模糊聚类分析一般分3个步骤进行4,即:1) 采集样本,确定主要因子,建立数据矩阵。2) 标定建立模糊相似矩阵3) 聚类(求动态聚类图)a 传递闭包法 b.布尔矩阵法第一步 数据标准化定义:如果对于任意i=1,2,m;j=1,2,,n,都有rij0,1,则称矩阵R=rijmn为模糊矩阵,例如R=100.10.50.70.3就是一个23模糊矩阵。若rij0,1,则模糊矩阵变成布尔矩阵。(1)数据矩阵设论域U=x1,x2,xn为被分类的对象,没个对象又由m个指标表示其性状,即:xi=xi1,xi2,xim i=1,2,n 于是,得到原始数据矩阵为:x11x12x1mx21x22x2mxn1xn2xnm(2)数据标准化在实际问题中,不同的数据一般有不同的量纲。为了使有不同的量纲的量也能进行比较,通常需要对数据作适当的变换。但是,即使这样,得到的数据也不一定在区间0,1上。因此这里所说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间0,1上。通常需要作如下几种变换。1)平移.标准差变换xik,=xik-xksk i=1,2,n;k=1,2,m,其中xk=1ni=1nxik , sk=1ni=1nxik-xk2经过变换后,每个变量的均值为0,标准差为1,且消除了量纲的影响。但是,这样得到的xik,还不一定在区间0,1上。2)平移.极差变换xik,,=xik,-min1inxik,max1inxik,-min1inxik, (k=1,2,m) 显然有0xik,,1,而且也消除了量纲的影响。3)对数变换xik,=lgxik i=1,2,n;k=1,2,m第二步:标定(建立模糊相似矩阵)设论域U=x1,x2,xn, xi=xi1,xi2,xim,依照传统聚类方法确定相似系数,建立模糊相似矩阵,xi与xj的相似程度rij=Rxi,xj。确定rij=Rxi,xj的方法主要借用传统聚类分析的相似系数法、距离法以及其他方法。具体用什么方法,可根据问题的性质,选取下列公式之一,计算rij(1)相似系数法1)数量积法rij=1 ,i=j1Mk=1mxikxjk,ij其中M=maxijk=1mxikxjk2)夹角余弦法rij=k=1mxikxjkk=1mxik2k=1mxjk23)相关系数法4)指数相似系数法5)最大最小法6)算术平均最小法7)几何平均最小法(2)距离法1)直接距离法 海明(Hamming)距离;欧几里得(Euclid)距离;切比雪夫(Chebyshev)距离2)倒数距离法3)指数距离法(3)主观评分法第三步 聚类(求动态聚类图)根据标定所得的模糊矩阵,只是一个模糊相似矩阵R,不一定具有传递性,即R不一定是模糊等价矩阵。为了进行分类,还需要将R改造成模糊等价矩阵R*。根据定理1,用二次方法求R的传递闭包t(R),t(R)就是所求的模糊等价矩阵R*,即t(R)= R*.再让由大变到小,就可以形成动态聚类图。最后画出动态聚类图。即将l取遍t(R)中所有互不相同的元素,随着l从1降到0时,t(R)所确定的分类随之由细到粗变化,这样就能够得到一系列的聚类,把这些聚类的结果画在同一幅图里就得到动态聚类图。我们就可以根据需要选择比较合适的聚类结果。根据定义2.6,计算出每个对应的F 值,然后在所有F 值当中选出最恰当的一个,它所对应的就是最佳阀值,从而可以确定最佳的聚类方法。3实例分析3.1指标分析衡量一个地区的经济发展情况人们往往仅选用国民生产总值作为重要的指标,但是这样并不科学我们要综合考虑各种经济指标,全面评价一个省份的经济发展现状所遵循的一般原则有:1.全面性原则;2.科学性原则:3.层次性原则;4.目的性原则;5可比性原则;6.与评价方法一致原则:7.可操作性原则。根据以上原则,本文选用了14个经济指标8。分别为:土地面积(平方公里);地区人口(万人);国内生产总值GDP(亿元);财政收入(亿元);人均GDP(亿元);第一产业占GDP比重;第二产业占GDP比重;第三产业占GDP比重;固定资产投资额(亿元);出口额(亿美元);各市居民消费定基价格分类指数;农民人均收入(元);城镇居民人均可支配收入(元);旅游业收入(亿元)。这14项指标分别从城市规模、经济实力、结构优化、资金实力和开放程度等角度构建了反映广东各地区经济发展综合实力程度的指标体系。本文以广东省的广州、珠海、汕头、佛山、韶关、河源、梅州。惠州、汕尾、东莞、中山、江门、阳江、湛江、茂名、肇庆、清远、潮州、揭阳、云浮21个市为样本,结合上面这14 个指标,构成了一个比较科学的评价体系,能够从城市规模、经济水平、产业结构、交流能力和人民生活水平等不同方面反映出广东省各城市的经济发展状况,区分出不同城市的发展水平,以此进行聚类。3.2 原始数据根据广东省统计年鉴(2011),对21个市上述的指标进行初步整理,得到14个经济指标的原始数据。表 3.1 广东省21个城市的经济实力指标值土地面积(平方公里)人口(万人)GDP(亿元)财政收入(亿元)人均GDP(元)第一产业占GDP比重第二产业占GDP比重广州7286.55 1270.96 10748.28 872.65 87458.01 1.75 37.24 深圳1952.84 1037.20 9581.51 1106.82 94296.46 0.07 47.21 珠海1653.84 156.16 1208.60 124.53 77888.50 2.68 54.77 汕头2248.39 539.62 1208.97 72.65 22775.60 5.34 56.10 佛山3848.49 719.91 5651.52 306.05 80312.67 1.86 62.68 韶关18385.01 283.02 683.10 47.81 24050.39 14.04 41.78 河源15641.98 295.82 475.14 25.09 16301.49 12.72 51.46 梅州15876.06 424.46 612.85 38.95 14553.95 20.27 41.19 惠州11355.64 460.11 1729.95 131.23 38649.99 5.92 58.94 汕尾4901.91 293.90 465.08 26.23 15845.42 16.68 45.73 东莞2471.70 822.48 4246.45 277.84 52798.19 0.39 50.89 中山1800.14 312.27 1850.65 139.38 60796.72 2.75 58.04 江门9540.60 445.08 1570.42 104.29 35621.72 7.45 55.54 阳江7965.47 242.53 639.84 26.77 26675.51 21.92 42.45 湛江13225.44 700.38 1405.06 66.23 20161.33 20.59 41.11 茂名11424.76 582.64 1492.09 51.95 25495.93 18.40 39.59 肇庆14822.19 392.22 1085.87 76.80 27986.65 17.52 42.06 清远19152.90 370.38 1088.18 72.79 29486.89 11.03 56.65 潮州3100.22 267.21 559.24 23.25 21107.10 7.21 55.31 揭阳5266.07 588.30 1009.51 38.65 17264.28 10.98 57.35 云浮7779.12 236.29 400.97 23.54 17073.63 25.12 41.18 续 表 3.1 广东省21个城市的经济实力指标值第三产业占GDP比重固定资产投资额(亿元)出口额(亿美元)各市居民消费定基价格分类指数农民人均收入城镇居民人均可支配收入旅游业收入广州61.01 3263.57 483.79 112.69 12675.55 30658.49 1254.61 深圳52.72 1944.70 2041.80 114.96 0.00 32380.86 628.77 珠海42.55 501.55 208.62 110.36 10187.10 25381.58 219.34 汕头38.56 361.68 49.35 112.81 6517.94 15178.59 88.48 佛山35.44 1719.63 330.38 112.19 12202.28 27244.68 231.30 韶关44.18 433.73 6.59 109.52 6317.20 18020.61 106.82 河源35.83 242.74 17.15 113.03 5644.64 13177.19 46.07 梅州38.54 195.52 9.51 109.42 6366.69 14727.66 72.83 惠州35.15 894.02 202.32 112.11 9077.20 23565.24 140.82 汕尾37.59 366.99 11.12 112.67 6315.52 13915.46 42.36 东莞48.72 1114.98 696.03 107.33 20486.46 35690.02 191.32 中山39.22 660.37 225.04 111.39 14928.00 25356.59 125.17 江门37.01 631.77 104.09 111.19 8588.65 21152.50 120.10 阳江35.62 329.20 16.06 111.26 6654.51 14640.57 42.68 湛江38.30 526.57 16.84 114.08 6909.21 15305.05 65.32 茂名42.01 244.54 5.59 111.19 6801.63 14360.23 71.86 肇庆40.42 625.21 25.97 110.33 7524.04 16832.37 102.78 清远32.33 996.92 19.33 112.86 6385.65 15768.21 108.43 潮州37.47 182.78 23.41 110.17 6373.20 13669.14 54.19 揭阳31.66 564.07 30.80 111.82 6128.42 14907.37 47.52 云浮33.70 312.66 8.13 113.67 6743.91 14612.53 48.67 注:数据来源于广东省统计年鉴(2011)3.3 数据处理用X表示样本集,样本对象为广东省21个城市,即广州,深圳,珠海,汕头,佛山,韶关,河源,梅州,惠州,汕尾,东莞,中山,江门,阳江,湛江,茂名,肇庆,清远,潮州,揭阳,云浮,分别用x1、x2、x3、x4、x5、x6、x7、x8 、x9、 x10、 x11、 x12、 x13、 x14、 x15、 x16、 x17 、x18、 x19 、x20 、x21表示。3.4 系统聚类本文主要采用组间距离法。距离测度方法主要有六种5 ,即欧式距离、绝对值距离、切比雪夫距离、兰式距离、马式距离和卡方距离。本文主要运用欧式距离法,计算公式为:dij=k=1mxik-xjk2使用SPSS对样本矩阵进行系统聚类,得到结果为:图3.1 系统聚类树形图* * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 10 -+ 20 -+ 21 -+ 4 -+ 19 -+-+ 7 -+ | 8 -+ +-+ 15 -+ | | 14 -+ | | 16 -+-+ +-+ 17 -+ | | 18 -+ | | 6 -+ | | 9 -+-+ | 13 -+ | 11 -+-+ | 12 -+ | | 3 -+-+ +-+ 5 -+ +-+ | 1 -+ +-+ 2 -+表3.2 系统聚类分类结果20类19类18类17类16类15类14类13类12类11类10类9类8类7类6类5类广州1111111111111111深圳2222222222222222珠海3333333333333311汕头4444444444444433佛山5555555553333311韶关6666666665555433河源7777777776664433梅州8777777776664433惠州9888888887776544汕尾10999999998444433东莞1110101010101010109887655中山12111111111111111110998765江门131212121288887776544阳江141313131312121212111055433湛江151414141413131376664433茂名161515151312121212111055433肇庆17161616151414665555433清远18171717161514665555433潮州191844444444444433揭阳10999999998444433云浮2019189999998444433注:此表只列出2到16类的分类情况。由上表可知当样本集聚成5类时,有x1,x3,x5,x2,x9,x13,x11,x12,x4,x6,x7,x8, x10, x14, x15, x16, x17,x18, x19,x20, x21当样本集聚成6类时,有x1,x3,x5,x2,x9,x13,x11,x12,x4,x6,x7,x8, x10, x14, x15, x16, x17,x18, x19,x20, x21当样本集聚成7类时x1,x3,x5,x2,x9,x13,x11,x12,x4,x6,x7,x8, x10, x14, x15, x16, x17,x18, x19,x20, x21此系统聚类结果作为参照,接下来作模糊聚类。3.5 模糊聚类3.5.1 数据标准化由于样本集数据有单位,且各指标中心距离差异大,所以选取平移.极差变换来对原始数据集作标准化,有公式: xik,,=xik,-min1inxik,max1inxik,-min1inxik, (k=1,2,m) 把数据导入MATLAB平台,通过处理得到标准化矩阵X(代码见附录):0.32 1.00 1.00 0.78 0.91 0.07 0.00 1.00 1.00 0.23 0.70 0.62 0.78 1.00 0.02 0.79 0.89 1.00 1.00 0.00 0.39 0.72 0.57 1.00 1.00 0.00 0.85 0.48 0.00 0.00 0.08 0.09 0.79 0.10 0.69 0.37 0.10 0.10 0.40 0.50 0.54 0.15 0.03 0.34 0.08 0.05 0.10 0.21 0.74 0.24 0.06 0.02 0.71 0.32 0.09 0.04 0.13 0.51 0.51 0.26 0.82 0.07 1.00 0.13 0.50 0.16 0.64 0.60 0.62 0.16 0.96 0.11 0.03 0.02 0.12 0.56 0.18 0.43 0.08 0.00 0.29 0.31 0.22 0.05 0.80 0.13 0.01 0.00 0.02 0.50 0.56 0.14 0.02 0.01 0.74 0.28 0.00 0.00 0.81 0.24 0.02 0.01 0.00 0.81 0.16 0.23 0.00 0.00 0.27 0.31 0.07 0.03 0.55 0.27 0.13 0.10 0.30 0.23 0.85 0.12 0.23 0.10 0.62 0.44 0.46 0.08 0.19 0.12 0.01 0.00 0.02 0.66 0.33 0.20 0.06 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络管理员考试必知要点试题及答案
- 用户反馈的计算机二级VB试题与答案
- 软考网络管理员评估试题及答案合集
- 2025年软件设计师考试快速掌握技巧试题及答案
- 2025年不同文化对公司战略的挑战及试题及答案
- 未来公司的治理结构与风险控制探索试题及答案
- 行政法学考试常见知识点:试题及答案
- 计算机教程与编程实践试题及答案
- 2025租房合同协议书
- 网络架构所需技能分析试题及答案
- 附件1:肿瘤防治中心评审实施细则2024年修订版
- 委托书万能模板快来保存2024年
- 光伏电站物料清单模板
- 2024年四年级英语下册 Module 4 Things we enjoy Unit 12 The ugly duckling第2课时教案 牛津沪教版(三起)
- 中职教育二年级上学期《三工位隔离开关》教学课件
- 2024-2030年中国母乳低聚糖(HMO)行业发展形势与未来前景展望报告
- 江苏省江阴市江阴初级中学2023-2024学年中考三模英语试题含答案
- 新能源汽车技术专业《汽车构造》-课程标准
- 江苏省南京市鼓楼区2023-2024学年八年级下学期期末考试物理试题
- (高清版)JTG 3363-2019 公路桥涵地基与基础设计规范
- 安全生产重在提升执行力
评论
0/150
提交评论