2012年全国大学生数学建模竞赛A题国家二等奖论文 葡萄酒的评价.doc_第1页
2012年全国大学生数学建模竞赛A题国家二等奖论文 葡萄酒的评价.doc_第2页
2012年全国大学生数学建模竞赛A题国家二等奖论文 葡萄酒的评价.doc_第3页
2012年全国大学生数学建模竞赛A题国家二等奖论文 葡萄酒的评价.doc_第4页
2012年全国大学生数学建模竞赛A题国家二等奖论文 葡萄酒的评价.doc_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

葡萄酒的评价摘要本文主要采用了方差分析、聚类分析、BP神经网络、偏最小二乘回归分析以及主成分分析方法,对葡萄酒的质量评价问题进行了深入探讨。 对于问题1,本文选用方差分析模型,首先分别求出了两组评酒员的组间评价结果,再通过计算得出第一、二组评酒员对红葡萄酒的质量评价无显著性差异,对白葡萄酒的评价有显著性差异。最后通过计算两组评酒员分别对于红酒和白酒评分的方差,得出第二组的方差更小,从而结果更可靠。对于问题2,在问题1的求解基础上,采用结果更可靠的第二组专家的评分结果,作为评价葡萄酒质量的依据。先用R型聚类分析法对酿酒葡萄的理化指标进行分类,选出其中较具有代表的理化指标,在此基础上,再根据选出的理化指标用Q型聚类分析模型对各样品葡萄进行分类。然后利用葡萄酒的得分建立 BP神经网络模型对酿酒葡萄进行分级,最后综合前面两种模型的结论得到酿酒葡萄的分级表,将两种酿酒葡萄分为I、II、III、IV四个等级,即红葡萄4、13、25、26、27 为I级;3、5、7、9、17、20、21、22、23、24为II级;1、2、8、10、14、16为III级;6、11、12、15、18、19为IV级,白葡萄1、3、4、6、9、10、15、18、19、21、23、27、28 为I级;2、5、14、17、20、22、24、25、26为II级;7、8、11、12、13为III级;16为IV级。对于问题3,考虑酿酒葡萄与葡萄酒的各项理化指标个数较多,我们建立偏最小二乘回归模型,求得酿酒葡萄与葡萄酒的主要理化指标两者之间的联系。经计算可得出结论:在红色的酿酒葡萄中,花色苷对红色葡萄酒的影响最大,其他的影响都不大;而在白色的酿酒葡萄中,果皮颜色对白色葡萄酒各项指标都存在着较大的影响。对于问题4,建立主成分分析模型分别分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,然后再用基于主成分分析的综合评价模型论证能否用葡萄酒和葡萄酒的理化指标对葡萄酒的质量进行评价。得出结论为:酿酒葡萄中的单宁、蛋白质和果皮质量与澄清度有关;酿酒葡萄中的酯类和酚类与香气有关;葡萄酒的单宁、酒石酸、苹果酸和柠檬酸与口感有密切联系。 葡萄酒的质量与葡萄及葡萄酒的理化指标有密切联系,可以用它们来部分评价葡萄酒的质量。本文中用到了多种统计学方法,将统计学方法应用于葡萄酒质量分析与评价中,可以更加清楚地了解葡萄酒成分与感官质量之间的相互关系,为葡萄酒的质量控制、预测、预报、等级区分提供了一种有效的途径。最后,对模型的优缺点进行了分析,并提出了合理的模型改进方向。关键词:BP神经网络模型 偏最小二乘回归分析 聚类分析 葡萄酒一、问题重述1.问题的背景葡萄是我们日常生活中常见的水果之一,随着人民生活水平的提高,用葡萄酿造的葡萄酒正被越来越多的人所享用。葡萄、葡萄酒源自伊朗,葡萄酒之历史,是人类孜孜不倦努力创造的文化史的一部分。在远古时代的黑暗中,她步伐缓慢,而且显得暧昧模糊。这第一步大概就开始于某一天,人类偶然创造出葡萄酒;从此以后,葡萄酒随着时代的变迁而变化。人类创造发明了葡萄酒,葡萄酒相应地给人以影响,这种影响又进一步驱使人们奔向新的工作目标的原因。葡萄酒就是在这种漫长的因果关系中,不断地与每个时代的人们的感官知觉相适应,并一直成长到今天。发展到今天,随着酿造工艺和技术的提高,葡萄酒的种类越来越多,质量越来越好,但如何对葡萄酒的质量进行确定呢?确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。2.问题的提出请根据所给资料尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析对问题1的分析,由附件1所给数据可知,附件中有两个数据有明显错误,故先对其进行修正。此外,另有一空数据缺失,补全该空的空缺数据。对于解决显著性差异问题,常采用方差分析模型和检验法求解,在本题的第一问中,我们采用了方差分析法,发现该方法可以很好地解决本题所提出的问题。除此之外,第一问还要求确定哪组结果更可信,通过计算各组评酒员分别对红酒和白酒打分的方差可以判断两组评酒员打分的波动性大小,取波动性较小的一组,说明该组品酒员对各样品酒打分比较合理,即评价结果更可信。对问题2的分析,问题要求根据葡萄酒的理化指标和葡萄酒的质量对葡萄酒进行分级,可先用第二组专家对各样品葡萄酒所打的分数排出各葡萄酒的得分顺序,即各葡萄酒的质量高低。对于数据量大的多指标的分级问题,已有很多成型的算法,如:主成分分析、层次分析、聚类分析、BP神经网络。由于在本题中采用主成分分析法和层次分析法步骤太过于繁琐,不易得出结论。因此,我们选用聚类分析和神经网络模型求解本题并得到了比较精确的结论。对问题3的分析,本题要求分析酿酒葡萄与葡萄酒的理化指标之间的关系,解决这类问题常用的方法有灰色关联分析、典型相关分析、线性回归分析、偏最小二乘回归分析。由于偏最小二乘回归分析集中了主成分分析、典型相关分析和线性回归分析等各种方法的特点,在分析结果中,除了可以提供一个更为合理的回归模型外,还可以同时完成一些类似于主成分分析和典型相关分析的研究内容,提供一些更丰富、深入的信息,故在本题中采用偏最小二乘回归分析法。对问题4的分析,由于酿酒葡萄和葡萄酒的理化指标对葡萄酒的影响程度难以直接量化,影响葡萄酒质量的因素种类不确定。本文采用主成分发分析法分别确定酿酒葡萄的理化指标对葡萄酒质量的影响以及葡萄酒的理化指标对葡萄酒质量的影响,同时用基于主成分分析法的综合评价法对能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量进行论证。对于本文中的各个问题,分别采用了不同的模型和方法,并对各模型进行了评价和推广。三、模型假设1、 假设第一组的评酒员为A组评酒员,第二组的评酒员为B组评酒员;2、 假设每种样品葡萄酒的最后得分为各位品酒员打分的均值;3、 除个别数据外,文中所给的其他数据均是真实可信的,能反映各品酒员对各葡萄酒样品的客观评价;4、 从附件2中可以得知,酿酒葡萄的理化指标比较多,且有些一级指标已经包含了二级指标,故不考虑二级指标对解题结果的影响;5、假设评酒员对样品酒所打的分数主要服从正态分布。四、符号说明:表示第一组的评酒员对种酒样品所打的总分;:表示第二组的评酒员对种酒样品所打的总分()如表示第一组评酒员对白酒样品2打的总分;:第组对第种酿酒葡萄样品的总体观测值;:第组对第种葡萄酒样品的总体观测值;:偏差得分方程;:评酒员对酒的评价得分;:评分方差值;:各个样本之间的欧式距离;:输入层第个神经元与隐含层第个神经元的连接权值;:隐含层第个神经元的阀值;:输入第个神经元;:自变量组酿酒葡萄指标值向量,;:因变量组葡萄酒的指标向量,;:指标观测值;自变量组第个主成分;:因变量组第个主成分;:数据标准化后的样本自变量;:数据标准化后的样本因变量。五、模型的建立与求解问题1模型I 方差分析模型1.1 数据处理先对附件1中的错误数据进行修正,由于对持久性指标打的分值不能超过8分,故附录一中第一组白葡萄酒品尝评分的第233行第10列以及第298行第12列的数据均是错误的,分别取该错误数字的末位,即分别修改为7和6。而对于第76行第6列中空缺的数据,常用的方法是插值或拟合,由于各评酒员对同一种样品酒的同一指标所打的分数没有明显的线性组合关系或其他显著规律,故不宜采用插值或拟合的方法。通过观察数据可以发现10个评酒员中已有6个评酒员对该指标打了6分,故可考虑将该空缺值补为6。另外,求得已知9个评酒员对该指标的平均分为6.22,由于所打分数均为整数,可取为6,由此可以说明将该空缺值补为6是比较合理的。数据完整后,先求出各评酒员对各样品酒所打的总分,然后再求得各组评酒员对各样品酒打分的均值,如表1所示。 表1 各样品酒的得分表品样分评A组红酒评分A组白酒评分组红酒评分B组白酒评分酒样品162.78268.177.9酒样品280.374.27475.8酒样品380.478.374.675.6酒样品468.679.471.276.9酒样品573.37172.181.5酒样品672.268.466.375.5酒样品771.577.565.374.2酒样品872.370.46672.3酒样品981.572.978.280.4酒样品1074.274.368.879.8酒样品1170.172.361.671.4酒样品1253.963.368.372.4酒样品1374.665.968.873.9酒样品14737272.677.1酒样品1558.772.465.778.4酒样品1674.97469.967.3酒样品1779.378.874.580.3酒样品1859.973.165.476.7酒样品1978.672.272.676.4酒样品2078.677.875.876.6酒样品2177.176.472.279.2酒样品2277.27171.679.4酒样品2385.675.977.177.4酒样品247873.371.576.1酒样品2569.277.168.279.5酒样品2673.881.37274.3酒样品277364.871.577酒样品2881.379.61.1 基本步骤 在实际的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。为了使生产过程稳定,达到优质、高产,需要对影响产品质量的因素进行分析,找出有显著性影响的那些因素,除了从机理方面进行研究外,常常要作许多试验,对结果作分析、比较,寻求规律。用数理统计分析试验结果、鉴别各因素对结果影响显著程度大小的方法称为方差分析。步骤1:假设检验,只考虑一个因素对所关心的指标的影响,取两个水平,在水平上总体和总体服从正态分布,这里未知,可以互不相同,但假定有相同的方差。在每个水平下分别检验了27种红酒和28种白酒的质量,且各种酒的得分相互独立。要判断两组评酒员的评价结果有无显著性差异,作以下的检验假设:.其中,且相互独立。步骤2:选择检验统计量,方差分析采用的检验统计量是F统计量,即F值检验。记,是第组数据的平均值,是总平均值。考察全体数据对的偏差平方和经分解可得记:则其中,是各组均值对总方差的偏差平方和,称为组间平方和;是各组内的数据对均值偏差平方和的总和。反映不同水平间的差异,则表示在同一水平下随机误差的大小。F统计量为给定显著性水平,查表,当时,则拒绝。步骤3:计算检验统计量的观测值和概论P值,由上述公式并代入相关数据可得以下结果:ANOVA TableSource SS df MS F ProbFColumns98.5877 1 98.5877 2.6381 0.11061Error 1868.5192 50 37.3704Total 1967.1069 51表2 两组红酒得分的单因素方差分析表图1 两组红酒得分的box图ANOVA TableSourceSS df MS F ProbFColumns79.9216 1 79.92164.74180.033826Error910.1468 5416.8546Total990.068455表3 两组白酒得分的方差分析表图2 两组白酒得分的box图 由上述结果可知,对于两组评酒员对红酒的评价,,对于两组评酒员对白酒的评价,。查阅资料可知,方差分析一般用的显著性水平是:取,拒绝,称因素的影响非常显著;取,不拒绝,称因素的影响不显著;取,拒绝,称因素的影响显著;取,不拒绝,称因素的影响不显著。由,;,1Q_h2(i)=1-press(i)/ss(i-1);elseQ_h2(1)=1;endif Q_h2(i)0.0975fprintf(提出的成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论