数学建模论文-基于统计分析的葡萄酒评价模型.doc数学建模论文-基于统计分析的葡萄酒评价模型.doc

收藏 分享

资源预览需要最新版本的Flash Player支持。
您尚未安装或版本过低,建议您

1基于统计分析的葡萄酒评价模型摘要随着经济的快速发展,人们对葡萄酒的品质要求越来越高。目前,葡萄酒的评价都是建立在评酒员感官评价的基础上。但是,由于评酒员的评价尺度、评价位置和评价方向的差异,导致了评价结果的不稳定性。因此,一个迫切的任务是如何从葡萄的理化指标和葡萄酒的理化指标来评价葡萄酒的质量。首先,利用秩和检验对两组评酒员的评价结果进行了显著性差异分析,得出了两组评酒员对红葡萄酒的评价结果具有显著性差异,对白葡萄酒的评价结果没有显著性差异,同时,使用方差分析得出第二组评酒员的评价结果更可信。其次,运用聚类分析法分析了酿酒葡萄的理化指标和葡萄酒质量的关系,把酿酒葡萄分成五个等级。再次,采用相关性分析方法和回归分析法分析了酿酒葡萄和葡萄酒的理化指标之间的联系,找出了一些重要因子,并对这些重要因子进行了回归分析,获得了重要因子之间的确定性关系。最后,利用主成分分析和回归分析法找出了酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的线性关系红葡萄1234567891011054110165101527009380357905630001170345600871037540232702589YXXXXXXXXXXX;白葡萄1234567891011121305834025730150305047075390592402485009510025006840037029670376906530YXXXXXXXXXXXXX,通过该关系式可以大致的预测出葡萄酒的质量。关键词秩和检验;主成分分析法;聚类分析法;相关性分析法;回归分析法2一、问题重述与分析11问题重述随着经济的快速发展,人们对葡萄酒的品质要求越来越高。目前,葡萄酒的评价都是建立在评酒员感官评价的基础上。但是,由于评酒员的评价尺度、评价位置和评价方向的差异,导致了评价结果的不稳定性。因此,一个迫切的任务是如何准确地评价葡萄酒的质量。为此,我们将解决以下问题问题一判断两组评酒员的的评价结果有无显著性差异,并找出更可信的一组结果;问题二根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级;问题三分析酿酒葡萄与葡萄酒的理化指标之间的联系;问题四分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。12问题分析本题是一个葡萄酒的评价问题。目前,葡萄酒的评价都是建立在评酒员的感官评价的基础上。感官评价主要包括外观、口感、香气和平衡四个方面,它们必然与酿酒葡萄和葡萄酒的理化指标存在重要的关联。首先,数据的处理。在经过分析和验证后,适当修正题中的个别有误数据后,利用有效数据进行建模求解。另外,由于数据之间的单位有区别,为了便于比较和分析,我们对所以的数据都进行了标准化。其次,模型建立和求解。针对问题一,利用秩和检验对两组评酒员的评价结果进行显著性差异分析,并使用方差选择出比较可信的评价结果。针对问题二,运用聚类分析法分析酿酒葡萄的理化指标和葡萄酒质量的关系,以此评判酿酒葡萄的等级。针对问题三,采用相关性分析方法分析酿酒葡萄和葡萄酒的理化指标之间的联系,找出了一些重要因子,以重要因子进行了回归分析,获得了重要因子之间的确定性关系。针对问题四,利用主成分分析和回归分析法找出了酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的一些线性性关系。最后,模型检验,利用酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的线性性关系检验葡萄酒的质量。3二、符号说明符号意义IJLR第I组第J个评酒员对第L种红葡萄酒的总评分IJLW第I组第J个评酒员对第L种白葡萄酒的总评分ILR第I组评酒员对第L种红葡萄酒的平均总评分IJW第I组评酒员对第L种白葡萄酒的平均总评分ILRS第I组评酒员对第L种红葡萄酒的方差ILWS第I组评酒员对第L种白葡萄酒的方差三、模型假设1)评酒员都具有较好的资质水平;2)所有芳香物质对葡萄酒的质量具有正影响;3)仅仅考虑酿酒葡萄与葡萄酒理化指标中的一级指标;4)葡萄酒的酿制过程对葡萄酒的质量没有影响。四、模型建立与求解41问题一411分析与建模问题一要求我们分析两组评酒员的评价结果是否具有显著性差异,并判断哪组数据更可靠。评酒员对葡萄酒的评价是根据外观、口感、香气和平衡四个方面进行感官评价的。为了研究的简单,我们仅以该四个方面的评价分数之和作为葡萄酒的质量。显著性差异的分析法主要包括Z检验、T检验、秩和检验和符号检验等等。由于本题中的样本量较小,总方差未知,我们采用秩和检验对两组评酒员的评价结果进行显著性差异的分析。秩和检验的具体步骤第一步将两个样本数据混合并由小到大进行等级排列(最小的数据秩次编为1,最大的数据秩次编为21NN);第二步把容量较小的样本中各数据的等级相加,即秩和,用T表示;第三步把T值与秩和检验表中某Α显著性水平下的临界值相比较,如果21TTT,则两样本差异不显著;如果1TT或2TT,则表明两样本差异显著。关于可信性结果的判断,由于我们假设评酒员都具有较高的水平,因此,评价结果波动小的一组的可靠性强一些,故我们使用方差分析判断两组结果的可信4性。412模型求解为了解决两组红葡萄酒的品酒员的评价结果有无显著性差异及哪个结果更可信,我们运用公式101101JIJLILRR,101101JIJLILWW求得样品的平均分数,再根据公式1012101JILIJLILRRRS,1012101JILIJLILWWWS求得各组样品分数的方差,结果如表1和图1所示。从中可以看出,两组红葡萄酒的评价结果无显著性差异,两组白葡萄酒的评价结果有显著性差异;第一组样品的方差波动较大,表现出了结果的不稳定性,所以第二组的结果更可信。表1红葡萄酒中的数据处理样品编号第一组第二组秩和检验LR1LRS1LR2LRS2177923296817369024102758441674146003683756128247462764007494769378971237160704858152365721122909093675520456631901005747742379665356410305887232801665860111598049564782231603243107986336688325600187117147904616342400406127241260468322610001713739420968813760016914771142972620840818815784486465737210053316673740169918090025117803346174582501609187672721654452401722197642344726496400635207664504758351603832217925796722319604265227944824716218400878237741044771222900035247613469715965013822579595856823936126743926172374056972777327151845000125表2第二组白葡萄酒的数据处理样品编号第一组第二组秩和检验LW1LWS1LW2LWS21828377923290150327421809675844160761837835981756128240879347944024769378903834571113881523650016666841464475520450306277753525742379602109871416524723280105443972983498049564006331074319141798633604048117231594171479040761912633104217241260400448136591536973942090225314721028771142904249157241184478448640185416741602673740101984177881297680334611187311408976727210649019722417676423440129620778579676645040544721764155447925796087922271124879448240088323759392977410440593524733100017613469082032577130497959585013002681365617439261014952764812996773200110288137241796228402234051015202530020406080100120140160180200编号白葡萄酒质量的方差第一组第二组051015202530020406080100120140编号红葡萄酒质量的方差第一组第二组图1红葡萄酒质量的方差图图2白葡萄酒质量的方差图642问题二421分析与建模由问题一的结果可知,第二组评价结果比较可信,因此我们在接下来的分析中都采用第二组评价的数据。针对问题二,由于葡萄的理化指标种类很多,我们运用运用聚类分析法3,对这些酿酒葡萄进行分类,然后加入葡萄酒质量评分,进行分级。聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用K均值、K中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致依据研究对象(样品或指标)的特征,对其进行分类的方法,减少研究对象的数目。各类事物缺乏可靠的历史资料,无法确定共有多少类别,目的是将性质相近事物归入一类。各指标之间具有一定的相关关系。422模型的求解为了根据葡萄的理化指标和葡萄酒的质量对葡萄进行分级,由附表2可以求得每个重要指标下的的每种含量的平均值。用SPSS软件进行聚类分析得到有关酿酒葡萄分类的树形图,如图3和图4,因此,我们可以得到酿酒葡萄的分级,红葡萄分为五级,白葡萄分为五级,见表3和表4葡萄样品44─┬─────┐葡萄样品2727─┘├─┐葡萄样品1515───────┘├─┐葡萄样品2222─────────┘│葡萄样品1212─┬─┐├───┐葡萄样品1818─┘├─────┐││葡萄样品66───┘├─┘├─┐葡萄样品77─────────┘││葡萄样品1717───┬─┐│├───────┐葡萄样品2424───┘├─────────┘││葡萄样品55─────┘││葡萄样品1313─────┬───────────┘├─┐葡萄样品1919─────┘││葡萄样品2020───────────┬─────────┐││葡萄样品2626───────────┘├───┘├───────────┐葡萄样品2525─────────────────────┘││葡萄样品1111───────────────┬───┐││葡萄样品1616───────────────┘├───────┘├───────┐葡萄样品2121───────────────────┘││葡萄样品22─────────┬─────────┐││葡萄样品99─────────┘├───────────────┐││葡萄样品2323───────────────────┘├───┘├─┐葡萄样品88─────────────┬─────────────┐│││葡萄样品1414─────────────┘├───────┘││葡萄样品11───────────────────────────┘││葡萄样品1010───────────────────────────────────────────────┘│葡萄样品33─────────────────────────────────────────────────┘图3红葡萄的层次聚类分析的树形图7葡萄样品5─┬───────────┐葡萄样品20─┘│葡萄样品9───────┬───┐├─┐葡萄样品28───────┘├─┤│葡萄样品23───────┬───┘││葡萄样品26───────┘││葡萄样品2─────┬─────┐││葡萄样品19─────┘││├───┐葡萄样品10─────┬─┐├─┘││葡萄样品25─────┘├─┐│││葡萄样品12───────┘├─┘││葡萄样品14─────────┘│├───┐葡萄样品4─────┬─┐│││葡萄样品22─────┘├───────┘││葡萄样品17───────┘│├─┐葡萄样品21───────────────────┘││葡萄样品8─────┬───────┐│├─┐葡萄样品11─────┘├─────────┘││葡萄样品16─────────────┘││葡萄样品3─────────────────────────┘├───────┐葡萄样品6───┬───┐││葡萄样品18───┘├─────┐││葡萄样品7───────┘├───────────┐│├─────────────┐葡萄样品15─────────────┘├─┘││葡萄样品24─────────────────────────┘││葡萄样品1─────────────────────┬─────────────┘│葡萄样品13─────────────────────┘│葡萄样品27─────────────────────────────────────────────────┘图4红葡萄的层次聚类分析的树形图表3红葡萄质量分级表红葡萄分级酒样品第一级样品2、9、23、8、14、1第二级样品3、10第三级样品13、14、20、26、25、11、16、21第四级样品4、7、15、22第五级样品12、18、6、7、17、24、5表4白葡萄质量分级表白葡萄分级酒样品第一级样品9、20、5第二级样品21、17、22、4、14、12、25、10、19、2、26、23第三级样品27、13、1第四级样品3、16、11、8第五级样品24、15、7、18、643问题三431分析与建模我们将使用回归分析法和相关性分析法分析了酿酒葡萄与葡萄酒的理化指标之间的联系。回归分析(REGRESSIONANALYSIS是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析它基于观测数据建立
编号:201311221001471784    类型:共享资源    大小:340.00KB    格式:DOC    上传时间:2013-11-22
  
8
关 键 词:
教育专区 毕业设计 精品文档 数学建模
  人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:数学建模论文-基于统计分析的葡萄酒评价模型.doc
链接地址:http://www.renrendoc.com/p-111784.html

当前资源信息

4.0
 
(2人评价)
浏览:29次
liyun上传于2013-11-22

官方联系方式

客服手机:17625900360   
2:不支持迅雷下载,请使用浏览器下载   
3:不支持QQ浏览器下载,请用其他浏览器   
4:下载后的文档和图纸-无水印   
5:文档经过压缩,下载后原文更清晰   

精品推荐

相关阅读

人人文库
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

网站客服QQ:2846424093    人人文库上传用户QQ群:460291265   

[email protected] 2016-2018  renrendoc.com 网站版权所有   南天在线技术支持

经营许可证编号:苏ICP备12009002号-5