采用聚类分析的方法对两种葡萄进行分类_第1页
采用聚类分析的方法对两种葡萄进行分类_第2页
采用聚类分析的方法对两种葡萄进行分类_第3页
采用聚类分析的方法对两种葡萄进行分类_第4页
采用聚类分析的方法对两种葡萄进行分类_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

模式识别结业论文(采用聚类分析的方法对两种葡萄进行分类)采用聚类分析的方法对两种葡萄进行分类摘要根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,建立聚类分析模型。首先因为样品酒的60个指标之间具有较强的相关性,所以对变量指标进行R型聚类分析,降低变量个数;然后采用Q型聚类分析对样本进行分类。把两组样品葡萄分为5类。红葡萄分类结果:第一类:样品8(反式白藜芦醇苷指标为5.283,而其他样品都小于1);第二类:样品3(氨基酸指标为8397.28远大于该指标均值2385.31)第三类:样品10(VC含量10.25,远大于均值0.477);第四类:样品1、2、4、5、6、7、9、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27;第五类:酒样品11(花色苷指标为104.92,远大于均值7.787);关键词:R型聚类Q型聚类1问题分析要根据酿酒葡萄和葡萄酒的质量的这两种葡萄进行分级,首先对原始酿酒葡萄的理化指标数据进行整理,并把葡萄酒的平均质量指标作为葡萄的变量指标进行考虑。由于白葡萄和红葡萄的分析方法相同,所以我们以红葡萄为例来进行分析。首先定性考察反映红葡萄指标状况的60个方面,可以看出某些指标之间可能存在较强的相关性。比如氨基酸的总量与天门冬氨酸、苏氨酸、丝氨酸、谷氨酸、脯氨酸、甘氨酸、丙氨酸、胱氨酸、缬氨酸、蛋氨酸、异亮氨酸、酪氨酸、苯丙氨酸、赖氨酸、组氨酸、精氨酸之间可能存在较强的相关性,白藜芦醇与反式白藜芦醇苷、顺势白藜芦醇苷、反式白藜芦醇、顺势白藜芦醇之间可能存在较强的相关性,还原糖与果糖和葡萄糖之间存在较强的相关性,为了验证这种想法,运用MATLAB软件计算60个指标的相关系数矩阵.其次由相关性矩阵可以判断某些指标之间确实存在很强的相关性,因此可以考虑从这些指标中选取几个有代表性的指标进行聚类分析。为此,把60个指标根据其相关性进行R型聚类,聚成20类,再从每个类中选取代表性的指标。首先对每个变量的数据分别进行标准化处理。变量间相近性度量采用相关系数,类间相近性度量的计算选用类平均法,编写MATLAB程序,从而求出聚类树形图。最后根据这20个变量指标对27中红葡萄进行聚类分析。首先对每个变量的数据分别进行标准化处理,样本间相似性采用欧氏距离度量,类间距离的计算选用类平均法,编写MATLAB程序,从而得到葡萄聚类树形图。2模型的建立与求解根据求得的相关系数矩阵,采用R型分析和Q型分析的方法对葡萄进行分类,具体的数学模型如下:(1)首先对葡萄的指标进行标准化处理,然后通过下面的模型可以求出葡萄变量指标的相关系数矩阵;(2)然后采用最短距离法求出相关系数矩阵中两个类中最近两点间的距离,再采用dendrogram函数,即可画出葡萄变量指标的聚类树形图;最后对每个变量指标的数据分别进行标准化处理,样本间间的相似性采用欧氏距离度量,类间距离的计算选用类平均法,然后再次使用dendrogram函数求出葡萄的聚类树状图,从而得到葡萄的分类结果。3模型的结果与分析1)红葡萄分类的结果与分析如下:(1)对红葡萄变量的聚类树状图:图1对红葡萄变量的聚类树状图由图形和MATLAB程序可知,把葡萄的变量指标分为20类,其中还原糖,果糖,葡萄糖,可溶性物质,PH值、可滴定酸,顾酸比,干物质含量,果穗质量,百粒质量,果梗比,出汁率,果皮质量,L*,果皮颜色a+,果皮颜色b*,H,C,18个变量指标之间有较大的相关性,被聚到一起;氨基酸,脯氨酸,花色苷3个变量指标之间存在有较大的相关性,被聚到一起;丝氨酸,缬氨酸,异亮氨酸,亮氨酸,赖氨酸,组氨酸,精氨酸之间存在较大的相关性,被聚成一类;白藜芦醇和顺势白藜芦醇苷之间存在较大的相关性,被聚成一类;黄酮醇。槲皮素,异鼠李素,总糖之间存在较大的相关性,被聚成一类;苏氨酸,谷氨酸,丙氨酸,苹果酸,柠檬酸,多酚氧化酶,褐变度,DPPH自由基,总酚,单宁,葡萄总黄酮之间存在较大的相关性,被聚成一类;其余各自成一类。这样就从60个指标中选定20个分析指标,可以根据这35个指标对27种红葡萄进行聚类分析。(2)27种红葡萄聚成5类的树状图图227种红葡萄聚成5类的树状图由图可知,各种红葡萄之间存在较大的差异,可把27种葡萄分为4类,结果为:第一类:红葡萄样品8;第二类:红葡萄样品3;第三类:红葡萄样品10;第四类:红葡萄样品1,2,4,5,6,7,9,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27;第五类:红葡萄酒样品11.从以上结果结合聚类图中的合并距离可以看出,红葡萄样品8与其他样品有非常大的不同,主要表现在该样品的苹果酸,柠檬酸,褐变度,黄酮醇,远高于其他样品;红葡萄样品3与其他样品的情形不同,单独聚为一类,主要表现在样品3的氨基酸含量远远高于所有样品氨基酸含量的平均值;红葡萄样品10与其他样品不同,单独聚为一类,主要表现在样品10的多酚氧化酶活力指标远大于该指标的平均值;红葡萄样品11单独聚为一类,主要在于该样品的花色苷,白藜芦醇,果皮颜色等偏高德缘故;其他样品之间极为类似,所以被聚在一类。针对这种情况,厂家在购买葡萄时,应该注意挑选,以使所买葡萄包含所有的类别,以提高葡萄的市场价值。2、白葡萄分类结果与分析如下:(1)对白葡萄变量的聚类树状图:图3白葡萄变量的聚类树状图由图形和MATLAB程序可知,把白葡萄的变量指标分为20类,其中柠檬酸,反式白藜芦醇苷2变量指标之间有较大的相关性,被聚到一起;白藜芦醇,顺势白藜芦醇苷2个变量指标之间存在有较大的相关性,被聚到一起;褐变度,顺势白藜芦醇2个变量指标之间存在较大的相关性,被聚成一类;PH值和顾酸比2个变量指标之间存在较大的相关性,被聚成一类;氨基酸总量,天门氨酸,苏氨酸,丝氨酸,谷氨酸,脯氨酸,甘氨酸,丙氨酸,缬氨酸,蛋氨酸,异亮氨酸,亮氨酸,酪氨酸,苯丙氨酸,赖氨酸,组氨酸,精氨酸,蛋白质,酒石酸,苹果酸,总酚,单宁,葡萄总黄酮,黄酮醇,槲皮素,山奈酚,异鼠李素,总糖,还原糖,果糖,葡萄糖,可溶性固形物,干物质含量,L*,果皮颜色b*,H,C,这37个变量指标之间存在较大的相关性,被聚成一类。这样就从60个指标中选定20个分析指标,可以根据这20个指标对28种白葡萄进行聚类分析。(2)28种白葡萄聚成5类的树状图图428种白葡萄聚成5类的树状图由图可知,各种白葡萄之间存在较大的差异,可把28种葡萄分为5类,结果为:第一类:白葡萄样品21;第二类:白葡萄样品15;第三类:白葡萄样品11;第四类:白葡萄样品2,3,4,5,6,7,8,9,10,11,12,13,14,16,18,19,20,22,23,24,25,26,27,28;第五类:红葡萄酒样品17.从以上结果结合结合聚类图中的合并距离可以看出,白葡萄21与其他样品有非常大的不同,主要表现在,该样品褐变度和b*指标非常高,而葡萄总黄酮远低于其他样品;样品15与其他样品极为不同,被单独聚为一类,主要是该样品的白藜芦醇,果穗质量,百粒质量非常高的缘故;白葡萄样品11被单独聚为一类,主要表现在该样品的固酸比,果穗质量,L*偏高;样品17与其他样品不同,单独聚为一类,主要是在该样品的VC含量,果梗比非常高的原因;其他的样品极为相似,被聚在一起。针对这种情况,厂家在购买葡萄时,应该注意买各种各样的葡萄,以使所买葡萄包含所有的类别。4模型的评价该聚类分析模型通过R型聚类对葡萄的变量指标进行聚类,通过Q型聚类在变量指标聚类下对酿酒葡萄进行聚类,把葡萄聚成了5类,符合客观实际。聚类前,对相关系数矩阵做了定性的分析,可看出某些变量指标之间存在存在相关性,所以首先就考虑,聚类变量,减少变量个数,简化运算,很容易得出结果。该模型还可以通过改变对葡萄的分类的大小,使分类结果更加详细或粗略。另外,该数学模型也存在一些不足之处,例如考虑问题不太全面,模型太过单一。参考文献:[1].许国根.模式识别与智能计算的MATLAB实现[M].北京.北京航空航天大学出版社,2012.7[2].韩中庚.数学建模方法及其应用[M].北京.高等教育出版社,2009.6程序:(1)红葡萄程序functionhongputaoh=xlsread('分类1红酒')%读入整理后的红葡萄的数据r=corrcoef(h)%求出读入数据的相关系数d=tril(r)%取出相关系数矩阵的下三角元素fori=1:60%对角线元素化为0d(i,i)=0endd=d(:)d=nonzeros(d)%取出非零元素d=d';d=1-d;z=linkage(d)y=cluster(z,20)dendrogram(z,60)%画出聚类树状图%将白葡萄的变量分为30类dendrogram(z,60)%画出聚类树状图ind1=find(y==20);ind1=ind1'%找出包含每一类中的来自原始数据集的对象ind2=find(y==19);ind2=ind2'ind3=find(y==18);ind3=ind3'ind4=find(y==17);ind4=ind4'ind5=find(y==16);ind5=ind5'ind6=find(y==15);ind6=ind6'ind7=find(y==14);ind7=ind7'ind8=find(y==13);ind8=ind8'ind9=find(y==12);ind9=ind9'ind10=find(y==11);ind10=ind10'ind11=find(y==10);ind11=ind11'ind12=find(y==9);ind12=ind12'ind13=find(y==8);ind13=ind13'ind14=find(y==7);ind14=ind14'ind15=find(y==6);ind15=ind15'ind16=find(y==5);ind16=ind16'ind17=find(y==4);ind17=ind17'ind18=find(y==3);ind18=ind18'ind19=find(y==2);ind19=ind19'ind20=find(y==1);ind20=ind20'functionhonhputao2h=xlsread('分类1红酒');%输入红葡萄的数据h(:,44:60)=[];%把有较大相关性的指标聚在一起h(:,41:42)=[];h(:,39)=[];h(:,34)=[];h(:,24:31)=[];h(:,22)=[];h(:,20)=[];h(:,17:19)=[];h(:,14)=[];h(:,13)=[];h(:,11)=[];h(:,9)=[];h(:,7)=[];h(:,6)=[];h=zscore(h)%对聚类后的数据进行标准化处理y=pdist(h)z=linkage(y)y=cluster(z,5)%将红葡萄分为5类dendrogram(z,'average')%画出红葡萄的聚类树状图dendrogram(z,'average')%画出红葡萄的聚类树状图dendrogram(z,27)%画出红葡萄聚类树状图ind1=find(y==5);ind1=ind1'%找出包含每一类中的来自原始数据集的对象ind2=find(y==4);ind2=ind2'ind3=find(y==3);ind3=ind3'ind4=find(y==2);ind4=ind4'ind5=find(y==1);ind5=ind5'(2)白葡萄程序functionbaiputao1b=xlsread('分类2白酒')%读入整理后的白葡萄的数据r=corrcoef(b)%求出读入数据的相关系数d=tril(r)%取出相关系数矩阵的下三角元素fori=1:60%对角线元素化为0d(i,i)=0endd=d(:)d=nonzeros(d)%取出非零元素d=d';d=1-d;z=linkage(d)y=cluster(z,20)%将白葡萄的变量分为30类dendrogram(z,60)%画出聚类树状图ind1=find(y==20);ind1=ind1'%找出包含每一类中的来自原始数据集的对象ind2=find(y==19);ind2=ind2'ind3=find(y==18);ind3=ind3'ind4=find(y==17);ind4=ind4'ind5=find(y==16);ind5=ind5'ind6=find(y==15);ind6=ind6'ind7=find(y==14);ind7=ind7'ind8=find(y==13);ind8=ind8'ind9=find(y==12);ind9=ind9'ind10=find(y==11);ind10=ind10'ind11=find(y==10);ind11=ind11'ind12=find(y==9);ind12=ind12'ind13=find(y==8);ind13=ind13'ind14=find(y==7);ind14=ind14'ind15=find(y==6);ind15=ind15'ind16=find(y==5);ind16=ind16'ind17=find(y==4);ind17=ind17'ind18=find(y==3);ind18=ind18'ind19=find(y==2);ind19=ind19'ind20=find(y==1);ind20=ind20'functionbaiputao2h=xlsread('分类2白酒');%输入白葡萄的数据h(:,58:60)=[];%把有较大相关性的指标聚在一起h(:,56)=[];h(:,50)=[];h(:,47)=[];h(:,39:46)=[];h(:,37)=[];h(:,32)=[];h(:,29:31)=[];h(:,27)=[];h(:,25)=[];h(:,24)=[];h(:,11:20)=[];h(:,2:9)=[];h=zscore(h)%对聚类后的数据进行标准化处理y=pdist(h)z=linkage(y)y=cluster(z,5)%将白葡萄的变量分为30类dendrogram(z,'average')%画出红葡萄的聚类树状图dendrogram(z,28)%画出白葡萄聚类树状图ind1=find(y==5);ind1=ind1'%找出包含每一类中的来自原始数据集的对象ind2=find(y==4);ind2=ind2'ind3=find(y==3);ind3=ind3'ind4=find(y==2);ind4=ind4'ind5=find(y==1);ind5=ind5'目录第一章总论 11.1项目背景 11.1.1项目名称及承办单位 11.1.2承办单位 11.1.3项目建设地点 11.1.4可行性研究报告编制单位 11.2报告编制依据和研究范围 11.2.1报告编制依据 11.2.2研究范围 21.3承办单位概况 21.4项目提出背景及必要性 31.4.1项目提出的背景 31.4.2项目建设的必要性 41.5项目概况 51.5.1建设地点 51.5.2建设规模与产品方案 51.5.3项目投资与效益概况 51.6主要技术经济指标 6第二章市场分析及预测 82.1绿色农产品市场分析及预测 82.1.1生产现状 82.1.2市场前景分析 92.2花卉市场分析及预测 112.2.1产品市场现状 112.2.2市场需求预测 122.2.3产品目标市场分析 132.3中药材产品市场分析及预测 132.3.1产品简介 132.3.2产品分布现状分析 152.3.3市场供求状况分析 162.3.4市场需求预测 17第三章建设规模与产品方案 203.1项目的方向和目标 203.2建设规模 203.3产品方案 213.3.1优质高产粮食作物种植基地 213.3.2无公害蔬菜种植基地 213.3.3中药材种植基地 213.3.4花卉种植基地 21第四章建设场址及建设条件 224.1建设场址现状 224.1.1建设场址现状 224.1.2厂址土地权属类别及占地面积 224.2建设条件 224.2.1气象条件 224.2.2水文及工程地质条件 234.2.4交通运输条件 234.2.5水源及给排水条件 244.2.6电力供应条件 244.2.7通讯条件 244.3其他有利条件 244.3.1农产品资源丰富 244.3.2劳动力资源充沛 254.3.3区位优势明显 25第五章种植基地建设方案 265.1概述 265.1.1种植基地运营模式 265.1.2种植基地生产执行标准 265.23000亩优质高产粮食作物种植基地建设方案 285.2.1品种选择 285.2.2耕作技术 285.2.3种植基地建设内容和产量预期 335.32000亩无公害蔬菜种植基地建设方案 345.3.1概述 345.3.2无公害蔬菜质量标准 345.3.3蔬菜栽培与田间管理 355.3.4种植基地建设内容和产量预期 375.42000亩中药材种植基地建设方案 385.4.1概述 385.4.2GAP基地建设要求 385.4.3选择优良品种 395.4.4金银花栽培与田间管理 395.4.5种植基地建设内容和产量预期 435.52000亩花卉种植基地建设方案 445.5.1概述 445.5.2技术方案 455.5.3种植基地建设内容和产量预期 49第六章田间工程及配套设施建设方案 516.1概述 516.23000亩绿色粮食作物种植基地灌溉方案 516.2.1总体布局 516.2.2设计依据 526.2.3灌溉制度的确定 526.2.4渠道衬砌工程设计 536.32000亩无公害蔬菜种植基地灌溉方案 556.3.1总体布局 556.3.2设计依据 556.3.3主要设计参数 566.3.4灌水器选择与毛管布置方式 566.3.5滴灌灌溉制度拟定 576.3.6支、毛管水头差分配与毛管极限长度确定 586.3.7网统布置与轮灌组划分 596.3.8管网水力计算 606.3.9水泵扬程及选型 646.42000亩中药材种植基地灌溉方案 656.4.1设计依据 656.4.2设计参数 656.4.3喷头选型和布置间距 656.4.4灌溉制度 666.4.5取水工程规划布置 686.4.6管网水力计算 706.4.7机泵选型 726.52000亩花卉种植基地灌溉方案 726.5.1设计依据 726.5.2微灌主要设计参数 726.5.3微灌灌水器选择与毛管布置方式 736.5.4微灌灌溉制度拟定 746.5.5微灌支、毛管水头差分配与毛管极限长度确定 756.5.6微灌网统布置与轮灌组划分 766.5.7微灌管网水力计算 776.5.8水泵扬程及选型 816.6田间道路工程 866.7灌溉工程 866.7.1机井工程 866.7.2提灌站改造 876.8沟道治理工程 896.9田间配套设施 906.9.1仓储工程 906.9.2农业技术培训中心 93第七章节能、节水 967.1研究依据 967.2能耗分析 977.3节能措施 97第八章环境与生态影响分析 988.1环境影响现状分析 988.2生态环境影响分析 988.2.1建设期对生态环境的影响 988.2.2运营期对生态环境的影响 988.3生态环境保护措施 988.3.1采用的依据和标准 988.3.2建设期对环境的保护措施 998.3.3运营期对环境的保护措施 1008.4环境影响评价 100第九章企业组织与劳动定员 1019.1公司体制及组织机构 1019.2劳动定员 1019.3人员来源及培训 1029.3.1人员来源 1029.3.2人员培训 102第十章项目组织管理与实施进度计划 10310.1基本要求 10310.2项目组织 10310.3项目管理 10310.4建设周期计划 104第十一章风险分析 10511.1风险因素 10511.2风险因素分析及风险程度 10511.3防范和降低风险的对策 106第十二章投资估算和资金筹措 10812.1投资估算 10812.1.1投资估算的编制范围 10812.1.2投资估算依据 10812.1.3投资估算方法 10812.2总投资估算 10912.4资金筹措 10912.5资金使用计划 109第十三章财务经济评价及社会效益评价 11013.1产品成本和费用估算 11013.1.1项目计算期及基准收益率 1101

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论