S06014A.doc_第1页
S06014A.doc_第2页
S06014A.doc_第3页
S06014A.doc_第4页
S06014A.doc_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): S06014 所属学校(请填写完整的全名): 河南工程学院 参赛队员 (打印并签名) :1. 余翅飞 2. 崔盼盼 3. 郭雪峰 指导教师或指导教师组负责人 (打印并签名): 数模指导组 日期: 2012年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):关于葡萄酒质量评价的分析摘要确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评打分,从而确定葡萄酒的质量,而在葡萄酒的质量鉴定国家标准中,明确地规定了:卫生指标、理化指标以及感官评价。因此,探讨葡萄酒和酿酒葡萄检测的理化指标之间的联系以及对葡萄酒的质量评价很有意义。 对于问题一,我们先对评酒员给出的分数进行正态分布检验,符合正态分布,可以采取置信区间法对每组数据进行筛选,减少特异值对整体的影响。建立t检验模型得到最终结果:两组评酒员之间的评价结果无显著性差异。根据两组检验结果的方差分析得到第二组评酒员的评价结果差异性较小,更稳定,所以更加可信。对于问题二,先用主成分分析法得出9个红葡萄主成分和10个白葡萄主成分及其得分,再用Spss软件对样品的各个主成分得分向量进行聚类分析,结合品酒员对葡萄酒的评分得到结果:红葡萄分为好、中、差三个等级,白葡萄分为好、坏两个等级,以及29号样品为孤立点,我们最后抽出5个样品用判别分析法对分类等级进行预测,得到聚类判别的准确率为100%。对于问题三,我们分别算出红、白两种葡萄与葡萄酒理化指标之间的相关系数,建立相关度等级划分层,然后利用搜索取值法分别找出各等级范围内的相关系数,高度相关的指标进行线性拟合,拟合结果:酒中与葡萄中相同的指标之间存在正相关关系;除酒中色泽L*与葡萄花色苷之间存在负相关关系,其余高度相关的不同指标之间皆是正相关关系。分析中度相关指标结果:酿酒葡萄中的大部分指标含量对葡萄酒中的色泽L*、a*及b*是负相关的,葡萄的干物质含量和出汁率对葡萄的色泽L*分别是负、正相关,对于b*是分别是正、负相关,而葡萄中的花色苷、单宁、总酚、总黄酮、DPPH自由基及蛋白质含量是决定葡萄酒中的指标多少的关键。对于问题四,我们建立基于Kmeans函数的组合比较模型,利用Kmeans函数对酿酒葡萄理化指标、葡萄酒理化指标、葡萄芳香物质、酒中芳香物质逐个分级,对分级编号进行调整,并进行标准化处理,画出对应的箱线图。对箱线图分析可以得出单个因素不能用来对葡萄酒的质量进行评价。因此把四个因素两两组合,对六种组合做相同的处理,画出对应的箱线图,通过对箱线图的比较,可得出以下结论:酿酒葡萄理化指标和葡萄酒理化指标可以作为葡萄酒质量的评价的重要参考,但是这两个指标还不能完全替代品酒员对葡萄酒质量的评价。关键词:置信区间法 主成分分析 聚类分析 线性拟合 组合比较模型一、问题重述现实当中确定葡萄酒的质量时一般是通过聘请一批有资质的品酒员进行品评,各个评酒员品酒后对酒的各类指标进行打分,然后求出总分,即为该葡萄酒的质量。酿酒葡萄的好坏直接影响到葡萄酒的质量,酿酒葡萄和葡萄检测的理化指标在一定程度上反映出葡萄和葡萄酒的质量。根据附件中一些葡萄酒的评价结果,葡萄酒和酿酒葡萄的成分数据,完成以下问题。首先,分析出附件一中品酒员的评价结果有没有显著性差异,比较得出更可靠的一组,。其次,根据酿酒葡萄的理化指标和葡萄酒的质量,对酿酒葡萄划分等级。接着分析得出酿酒葡萄和葡萄酒的理化指标之间的关系。最后,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并且论证是否能够用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。二、问题分析问题一,我们考虑到各个品酒员之间的差异,采取了置信区间法对每组数据进行合理、可信的筛选,但在利用置信区间法之前我们需要判断一下评酒员给出的分数是否符合正态分布。由置信区间法得到两组红、白酒的置信得分,根据置信得分建立t检验模型。问题二,我们根据酿酒的理化指标和葡萄酒的质量对酿酒葡萄分级,所以对酿酒葡萄分分级要考虑两个方面因素。酿酒葡萄的理化指标有53个指标,其中26个一级指标,27个二级指标。由于一级指标在很大程度上可以反映酿酒葡萄,葡萄酒的质量决定因素可直接由品酒师得分判断。这样综合酿酒葡萄的一级指标和葡萄酒的质量进行分级。我们可以直接将一级指标和葡萄酒的质量直接放一块,即为27个指标,进行分类,可以先将指标降维,再利用聚类分析。问题三,我们首先建立相关系数模型:,利用EXCEL软件进行数据处理,分别算出红色的酿酒葡萄与葡萄酒的理化指标之间的相关系数,根据相关系数的大小来判断各项理化指标之间的线性相关度,时,可视为两个指标之间高度相关;时可视为中度相关;时,可视为低度相关;时,可视为相关程度很弱,不相关。高度相关的指标进行线性拟合和相关性检验,得到各指标之间的线性函数,进行结果分析。问题四,要先分析出酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响,可以通过单独分析酿酒葡萄理化指标、葡萄酒理化指标对葡萄酒质量的影响,然后再把两者放在一块综合考虑,根据数据处理的结果,对两种指标与葡萄酒质量之间的关系进行分析,进而可以论证出是否能够用葡萄和葡萄酒理化指标来评价葡萄酒质量。由于红葡萄和红葡萄酒、白葡萄和白葡萄酒的各项指标基本相同,因此我们只分析了有关红葡萄和红葡萄酒的有关数据和问题,得到一定的结论,同理可得白葡萄和白葡萄酒的相关结论。三、问题假设(1)假设理化指标的检验是准确的。(2)假设对数据处理当中数据的微小改变忽略不记。(3)假设评酒员的评价结果可靠性很高。(4)假设附录中的理化指标可以概括酿酒葡萄和葡萄酒中的全部的指标。(5)假设附录中所给数据均是正确的。(6)假设所给芳香物能够很好体现酒中的芳香性。(7)假设一级指标基本可以反映酿酒葡萄与葡萄酒之间的联系。四、符号说明峰度;偏度;标准差;置信得分;显著性水平;Pt检验结果;主成分分析的个指标变量;主成分分析的评价对象个数;第个评价对象的第个指标的取值;主成分分析的指标相关系数矩阵;第个指标与第个指标的相关系数;相关系数矩阵的特征值;相关系数矩阵对应的特征向量;主成分个数;主成分的信息贡献率;主成分的累积贡献率;相关系数;、变量;拟合可信度;五、模型的建立与求解5.1基于置信区间法的t检验对于问题一,我们考虑到各个品酒员之间的差异,采取了置信区间法对每组数据进行合理、可信的筛选,但在利用置信区间法之前我们需要判断一下评酒员给出的分数是否符合正态分布。5.1.1正态分布检验根据附录一中的数据,可以计算出各个品酒员对每种样品酒的打分,然后利用matlab程序计算出出每种葡萄酒样品的10个打分的峰度、偏度和标准差。根据峰度、偏度计算出 :, (1) 结果见附录表1,matlab程序见附录一。然后进行U检验,两种检验同时得出,即,从数据结果(见附录一)可以看出各组数据都服从正态分布。5.1.2置信区间法数据处理对于每种葡萄酒样品的10个打分记为,是来自的样本,则的置信水平为的置信区间为:建立每种样品置信得分公式如下: (2)其中,分别为样本均值和样本标准差。这里我们取,则,所以上式可化简为,根据以上的结果编写matlab程序见附录二,计算出每种葡萄酒样品的10个打分的置信区间,进而把在区间内的数据筛选出来,对区间内的数据求平均值,该平均值即为该种样品酒的最后得分见表2。表2每种样品酒的置信得分置信得分第一组红酒第一组白酒第二组红酒第二组白酒葡萄酒样品162.50 81.40 70.00 76.75 葡萄酒样品280.75 75.80 74.50 77.33 葡萄酒样品382.33 81.25 74.80 76.00 葡萄酒样品464.50 79.00 72.20 76.33 葡萄酒样品572.75 74.75 72.75 81.17 葡萄酒样品670.00 65.67 66.50 76.00 葡萄酒样品772.67 78.40 66.60 73.00 葡萄酒样品874.00 75.00 67.25 73.50 葡萄酒样品980.33 72.00 78.50 80.67 葡萄酒样品1074.80 73.50 68.60 80.20 葡萄酒样品1170.83 74.00 63.00 74.50 葡萄酒样品1255.00 57.25 68.40 74.20 葡萄酒样品1375.83 65.40 68.80 73.50 葡萄酒样品1473.43 72.80 72.20 77.00 葡萄酒样品1558.00 73.00 66.33 78.25 葡萄酒样品1674.00 72.00 69.50 66.67 葡萄酒样品1779.60 77.67 74.83 79.20 葡萄酒样品1860.00 72.00 64.17 76.00 葡萄酒样品1979.40 73.67 73.25 76.80 葡萄酒样品2079.33 80.75 77.00 75.50 葡萄酒样品2174.00 79.40 72.40 79.83 葡萄酒样品2277.75 72.33 71.00 79.50 葡萄酒样品2384.50 76.50 78.33 77.50 葡萄酒样品2476.50 74.50 72.00 77.75 葡萄酒样品2568.00 77.20 67.17 81.29 葡萄酒样品2673.33 82.33 73.33 74.50 葡萄酒样品2774.20 62.50 71.13 78.00 5.1.3 t检验模型的建立t检验作为假设检验的一种方法,其基本步骤和假设检验相同。首先提出假设无效假设:两组评酒员的评价结果之间不存在显著差异,即这两组评酒员的评价结果相同,实验的处理效应(分数间的差异)为0。备择假设:两组评酒员的评价结果之间不相同,即存在处理效应,其意义是指两组评酒员的评价结果之间存在本质上的差异。接着确定显著性水平,令显著性水平为为: 0.05。最后选定检验方法,这里假设无效假设成立,即两组评酒员的评价结果无差异,二者来自同一总体,则为双样本等方差假设。在无效假设成立的前提下计算t值: (3) (4) (5)若计算出P则无效假设成立,从而接受否定;若计算出P则无效假设不成立,从而接受否定。我们分别对两组中红、白两种酒根据模型利用EXCEL软件进行t检验,结果如下:第一组与第二组红、白酒的检验结果见表3。表3第一、二组红、白酒的检验结果两组红酒t-检验: 双样本异方差假设两组白酒t-检验: 双样本异方差假设变量 1变量 2变量 1变量 2平均72.9011170.90889平均74.4667976.82643方差55.6765616.45899方差37.757549.808572观测值2727观测值2828假设平均差0假设平均差0df40df40t Stat1.218835t Stat-1.81041P(T=t) 单尾0.115023P(T=t) 单尾0.038875t 单尾临界1.683851t 单尾临界1.683851P(T=t) 双尾0.230046P(T0.05;红酒检验结果:P=0.07774910.05。因此接受无效假设,从而得出结论:两组评酒员之间的评价结果无显著性差异。白酒检验结果: 变量一方差55.676564大于变量二方差16.458987;红酒检验结果:变量一方差37.757541同样大于变量二方差9.808572。而方差越大说明数据的差异性越大,稳定性越差,所以根据结果可以得出第二组评酒员的评价结果差异性更小,稳定性更高,更加可信。5.2主成分分析和聚类分析建立对于问题二,要综合考虑据酿酒的理化指标和葡萄酒的质量对酿酒葡萄分级,由于一级指标在很大程度上可以反映酿酒葡萄,葡萄酒的质量决定因素可直接由品酒师得分判断。这样综合酿酒葡萄的一级指标和葡萄酒的质量,即总指标进行分级。我们建立基于主成分贡献得分聚类综合评价模型,先用主成分分析得到主成分得分,红葡萄有9个主成分,白葡萄有10个主成分。 5.2.1酿酒葡萄基于主成分贡献的分类评价模型根据酿酒的理化指标和葡萄酒的质量对酿酒葡萄分级,所以对酿酒葡萄分分级要考虑两个方面因素。酿酒葡萄的理化指标有53个指标,其中26个一级指标,27个二级指标。由于一级指标在很大程度上可以反映酿酒葡萄,葡萄酒的质量决定因素可直接由品酒师得分判断。这样综合酿酒葡萄的一级指标和葡萄酒的质量进行分级。首先,对酿酒葡萄的26个一级指标和品酒师得分27个指标进行主成分分析法找主成分的得分。步骤如下:对原始数据标准化处理,即将各个指标转换成标准指标。 (6)第个指标的样本均值为: (7)第个指标的样本标准差为: (8)则标准化指标变量为:, (9)计算相关系数矩阵,即: 式中 (10)计算相关系数矩阵的特征值,及对应的特征向量,其中,由特征向量组成m个新指标变量。 (11)选择个主成分,计算特征值的信息贡献率为: (12)主成分的累积贡献率为: (13)当接近于1()时,则选取前个指标变量作为个主成分,代替原来m个指标变量,从而可以对个主成分进行综合分析。其中主成分的得分即为相关系数矩阵的特征值,及对应的特征向量。用matlab程序(见附录),得到酿酒红葡萄前9个主成分方差贡献率大于87%,所以主成分选择前9个,并且得到主成分的得分。得到酿酒白葡萄的前10个主成分方差贡献率大于85%,所以主成分选择前10个,并且得到主成分的得分。5.2.2基于主成分贡献聚类评价模型根据主成分分析可以得出样本的主成分得分矩阵,得分矩阵作为样本矩阵表示为: (14)均值表示为: (15)标准差表示为: (16)极差表示为: (17)ZScores进行标准化转换: (18)变换后的数据均值为0,标准差为1,消去了量纲的影响,当抽样样本改变时,它仍能保持相对稳定性。对数据进行处理后再对样本进行分类,利用SPSS软件中的系统聚类法,通过比较可知,选择组间平均距离链接法结果较好,对个样本分类,红葡萄样品可以得出聚类图见图一。图一结果分为三类见表4。表4红葡萄分类结果分类第一类第二类第三类葡萄样品号11 13 10 12 16 22 4 9 8 619 20 23 17 27 5 7 2 1 18 15 21 325 26 14 24再结合葡萄酒质量品酒员得分,最终分为三个等级见表5。表5红葡萄分级结果分级好中差葡萄样品号25 26 14 2419 20 23 17 27 5 7 2 1 18 15 21 311 13 10 12 16 22 4 9 8 6同理,对白葡萄样品进行聚类分析得到聚类图见图二。图二结果分为两类见表6。表6白葡萄分类结果分类第一类第二类葡萄样品号5 20 28 9 11 12 23 2 4 14 26 21 17 3 158 16 6 7 18 10 24 1 13 19 25 22再结合葡萄酒质量品酒员得分,最终分为三个等级见表7,另外葡萄酒样品27是独立点。表7白葡萄分级结果分级好差葡萄样品号5 20 28 9 11 12 23 2 4 14 26 21 17 3 158 16 6 7 18 10 24 1 13 19 25 22我们利用判别分析法对分类结果进行检验,这里我们选择白葡萄样品为检验对象,根据问题二中对白葡萄样品的聚类分析可知,白葡萄样品可以聚为两类,其中白葡萄样品5,20,28,9,11,12,23,2,4,14,26,21,17,3,15为第一类,白葡萄样品8,16,6,7,18,10,24,1,13,19,25,22为第二类,利用已经分好的类,我们任意挑选出几个样品作为假定的未分类,在这里我们随机选择出3,7,12,18,22组作为预测组,利用SPSS软件中的判别分析窗口,输入表中的数据,选择十一个主成分和部分样品等级作为自变量,选择等级为分组变量,用Fisher函数系数,使用步进式方法,可以计算出组内相关系数、组内协方差、分组协方差和总协方差,得到预测结果如下表8。表8判别分析结果检验案例数目实际组最高组第二最高组判别式得分预测组P(Dd | G=g)P(G=g | D=d)到质心的平方 Mahalanobis 距离组P(G=g | D=d)到质心的平方 Mahalanobis 距离函数 1pdf初始1220.93110.9720.00810.0287.082-1.7252110.47110.8110.51920.1893.4380.2163未分组的10.39410.9960.72520.00411.7371.7884110.8110.9810.05820.0197.9241.1775110.52510.9930.40320.00710.3011.571621*0.19910.5021.64920.4981.665-0.3487未分组的20.24810.5841.33510.4162.013-0.4838220.59110.9910.28910.0099.687-2.1769110.69210.9870.15720.0138.8261.3331021*0.2310.5561.4420.4441.889-0.26411110.46210.8050.54120.1953.3820.20112未分组的10.70510.9120.14420.0884.8190.55713220.41210.7690.67410.2313.075-0.81714110.4510.7970.57120.2033.3070.181512*0.30910.6671.03310.3332.427-0.62216220.076113.1521018.92-3.41417110.62110.990.24520.019.4181.43118未分组的20.13510.9992.23210.00116.551-3.13219220.44310.9950.58810.00511.163-2.40520110.29810.6531.08520.3472.349-0.10621110.26110.9981.26220.00213.6742.0622未分组的20.90110.9520.01610.0486.001-1.51323110.13810.9992.19820.00116.4572.41924110.33610.6980.92720.3022.598-0.02625220.7510.9840.10110.0168.369-1.95726110.73510.9850.11520.0158.4891.27527110.28810.9981.12720.00213.2221.998从表8中可以看出,白葡萄样品3,7,12,18,22的预测分组分别是1,2,1,2,2,这个结果与问题二中聚类的结果一样,由此可以得出结论对问题二的聚类判别的准确率为100%。5.3基于相关系数法的线性拟合对于问题三,我们首先建立相关系数模型: (19)利用EXCEL软件进行数据处理,分别算出红色的酿酒葡萄与葡萄酒的理化指标之间的相关系数见表9,根据相关系数的大小来判断各项理化指标之间的线性相关度,时,可视为两个指标之间高度相关;时可视为中度相关;时,可视为低度相关;时,可视为相关程度很弱,不相关。利用MATLAB软件编程对表9进行搜索取值得到:其中加粗部分表示这两个指标之间高度相关,加粗带倾斜部分表示同种指标之间的相关系数,倾斜部分表示这两个指标之间中度相关。表9红色葡萄与酒各指标之间的相关系数花色苷单宁总酚酒总黄酮白藜芦醇DPPHL*(D65)a*(D65)b*(D65)氨基酸总量0.1060.4960.3360.2010.3340.400-0.236-0.1000.356蛋白质0.2960.4710.4350.438-0.0050.384-0.484-0.0330.047VC含量-0.089-0.092-0.129-0.099-0.028-0.1220.1220.107-0.368花色苷0.9230.7200.7740.7090.2000.671-0.834-0.349-0.240酒石酸0.0340.2810.2710.1570.2180.237-0.2430.0100.462苹果酸0.6930.2980.3530.267-0.1860.246-0.346-0.559-0.310柠檬酸0.3800.1450.139-0.082-0.2040.018-0.254-0.269-0.015多酚氧化酶力0.4810.1420.1540.124-0.1280.074-0.411-0.0070.102褐变度0.7670.4450.4590.443-0.0950.381-0.564-0.335-0.244DPPH自由基0.5670.7530.8140.7640.4210.778-0.707-0.123-0.055总酚0.6130.8170.8750.8830.4590.874-0.754-0.1680.055单宁0.6610.7180.7430.7010.3150.701-0.677-0.093-0.204葡萄总黄酮0.4410.6840.8150.8230.5670.813-0.609-0.0670.048白藜芦醇-0.0350.0490.0760.0470.0140.0730.162-0.449-0.110黄酮醇0.4080.5790.4050.2990.0740.422-0.524-0.0490.223可滴定酸-0.216-0.066-0.115-0.1800.109-0.0610.1980.2660.074固酸比0.3150.2380.2390.323-0.0930.217-0.246-0.4350.067干物质含量0.2300.4150.2960.2450.0760.330-0.204-0.2490.392果穗质量-0.104-0.267-0.184-0.2370.076-0.1960.0210.223-0.037百粒质量-0.263-0.329-0.255-0.248-0.045-0.2290.3090.150-0.176果梗比0.5010.4730.4010.2980.1920.333-0.473-0.063-0.090出汁率0.3280.3600.3980.4820.2570.423-0.440-0.008-0.100果皮质量-0.039-0.077-0.100-0.097-0.022-0.034-0.0260.3290.053L* 1-0.366-0.464-0.444-0.343-0.033-0.3920.4940.049-0.189a*(+红;-绿)-0.369-0.298-0.287-0.286-0.281-0.2960.594-0.542-0.064b*(+黄;-蓝)-0.129-0.121-0.081-0.182-0.246-0.1270.349-0.6260.0255.3.1相同理化指标相关系数分析得出:除白藜芦醇与色泽b*的相关系数分别为0.014和0.025均在不相关范围内,以及色泽L*和色泽a*在低度相关范围内,其余各项相同指标之间的相关系数均在中高度线性相关范围内,这在很大程度上说明了葡萄酒中的理化指标含量与酿酒葡萄中的这些相同的指标含量有很大的线性联系。因为酿酒葡萄中花色苷、总黄酮和总酚与葡萄酒中花色苷、总黄酮和总酚之间的相关系数都是在高度相关范围内,所以以花色苷指标为例研究酿酒葡萄中的理化指标含量与葡萄酒中的这些相同指标含量之间的联系。5.3.2花色苷研究过程如下:27个酒样品酿酒葡萄与葡萄酒中的花色苷含量见表10。表10葡萄与葡萄酒中的花色苷含量酒中花色苷葡萄中花色苷酒中花色苷葡萄中花色苷酒中花色苷葡萄中花色苷973.878408.028138.71444.203198.614115.704517.581224.36711.8387.78774.37723.523398.770157.93984.07932.343313.78489.282183.51979.685200.08065.324251.01774.027280.190120.606251.570140.257413.940172.626117.02646.186122.59252.792270.108144.88190.82560.767171.50260.660158.56949.643918.688241.397234.42059.424151.48158.469387.765240.84371.90240.228138.45534.190根据表10中数据利用matlab软件可以画出酒中花色苷与葡萄中花色苷之间的线性拟合拟合结果见图三。图三有图一结果分析得到酒中花色苷与葡萄中花色苷含量之间的线性关系符合函数:,并且拟合可信度0.5较高,说明可以对高度相关的指标进行线性拟合。同理根据附录四结果可以分析得到酒中总黄酮与葡萄中总黄酮含量之间的线性关系符合函数:;酒中总酚与葡萄中总酚含量之间的线性关系符合函数:。由此可以得出酒中指标与葡萄中相同指标之间存在正相关关系。5.3.3不同指标之间的相关系数分析我们由表九可以得到不单是同种指标之间的相关系数很大,不同指标之间的相关系数也有很大值出现,因此我们对这些指标进行如3.2相同过程处理见附录四,通过处理最终得出葡萄总黄酮与酒中DPPH含量之间的线性关系符合函数:;酒中DPPH与酿酒葡萄总酚含量之间的线性关系符合函数:;酒中总黄酮与酿酒葡萄中总酚含量之间的线性关系符合函数:;酿酒葡萄中总黄酮与酒中总酚含量之间的线性关系符合函数:;酿酒葡萄总酚与酒中单宁含量之间的线性关系符合函数:;酒总酚与酿酒葡萄DPPH含量之间的线性关系符合函数:;酒中色泽与酿酒葡萄花色苷含量之间的线性关系符合函数:。可以发现除酒中色泽L*与酿酒葡萄花色苷之间存在负相关关系,其余皆是正相关关系。由以上结果我们最终可以得出结论:酿酒葡萄中花色苷含量对葡萄酒中的花色苷存在正相关联系,但对葡萄酒中的色泽却存在负相关联系,这说明酿酒葡萄中的花色苷含量对葡萄酒中的花色苷和色泽L理化指标含量的影响是相反的,即酿酒葡萄中花色苷含量越高,葡萄酒中花色苷含量也越高但是葡萄酒中的色泽L却越低,可见酿酒葡萄中的花色苷对葡萄酒中的理化指标含量很重要;酿酒葡萄中DPPH自由基含量对葡萄酒中的总酚存在正相关联系,并且酿酒葡萄中DPPH自由基与葡萄酒中的花色苷、单宁、总黄酮、色泽L*都是中度相关的,并且与色泽L*是中度负相关,因此酿酒葡萄中DPPH自由基含量对葡萄酒中的指标很重要;酿酒葡萄中的单宁与葡萄酒中的花色苷、单宁、总酚、总黄酮、DPPH自由基、色泽L*都是中度相关的,且对色泽L*是中度负相关的,这说明酿酒葡萄中的单宁含量对葡萄酒中的指标含量也很重要;而酿酒葡萄中的总酚含量对葡萄酒中的单宁、总酚、酒总黄酮和DPPH自由基都存在正相关联系,这说明酿酒葡萄中的总酚含量对葡萄酒的理化指标含量很重要;酿酒葡萄中的总黄酮含量对葡萄酒中的总酚、酒总黄酮和DPPH自由基也都存在正相关联系;这也说明酿酒葡萄中的总黄酮含量对葡萄酒的理化指标含量也很重要。另外,我们得到酿酒葡萄中的大部分指标含量对葡萄酒中的色泽L*、a*及b*是负相关的。我们同样利用EXCEL软件进行数据处理,分别算出白色的酿酒葡萄与葡萄酒的理化指标之间的相关系数见表11。加粗部分表示这两种理化指标之间中度相关。表11白色葡萄与酒各指标之间的相关系数单宁总酚酒总黄酮白藜芦醇DPPHL*(D65)a*(D65)b*(D65)氨基酸总量0.428 0.480 0.293 -0.216 0.206 -0.414 0.080 0.280 蛋白质0.362 0.419 0.605 -0.223 0.225 0.079 0.451 -0.132 VC含量-0.166 -0.100 -0.155 0.130 0.233 0.220 -0.093 -0.101 花色苷-0.217 -0.298 -0.163 0.065 -0.176 -0.079 -0.119 0.067 酒石酸0.182 0.005 -0.188 -0.309 0.099 -0.253 -0.305 0.312 苹果酸0.046 0.122 0.467 -0.249 -0.123 0.099 0.378 -0.271 柠檬酸0.248 0.080 0.163 -0.098 -0.049 -0.083 -0.232 0.165 多酚氧化酶活力-0.237 -0.403 -0.232 0.156 -0.369 0.006 -0.024 -0.046 褐变度-0.054 -0.018 0.233 -0.012 0.049 0.023 0.026 0.097 DPPH自由基0.409 0.449 0.133 0.082 0.386 -0.053 0.056 0.028 总酚0.428 0.547 0.744 -0.136 0.422 0.122 0.401 -0.200 单宁0.574 0.573 0.346 -0.002 0.426 -0.248 0.045 0.198 葡萄总黄酮0.495 0.588 0.697 -0.101 0.429 0.102 0.434 -0.206 白藜芦醇-0.062 0.037 -0.095 -0.213 -0.052 -0.311 0.074 0.218 黄酮醇0.411 0.386 0.614 -0.095 0.360 -0.198 -0.003 0.239 可滴定酸0.056 0.009 -0.128 0.054 0.063 0.311 0.182 -0.310 固酸比0.039 0.082 0.138 -0.159 -0.089 -0.371 -0.176 0.355 干物质含量0.229 0.265 0.114 -0.015 0.048 -0.721 -0.339 0.684 果穗质量0.071 0.061 0.094 -0.052 -0.036 0.457 0.455 -0.536 百粒质量0.242 0.172 0.139 -0.136 0.144 0.457 0.459 -0.499 果梗比-0.349 -0.434 -0.521 0.064 -0.050 0.072 -0.458 0.076 出汁率-0.294 -0.292 -0.049 0.091 -0.151 0.689 0.414 -0.757 果皮质量0.373 0.397 0.273 -0.092 0.137 0.324 0.300 -0.323 L* 0.060 0.106 0.133 -0.228 0.318 -0.142 -0.189 0.154 a*0.031 -0.002 -0.001 0.169 -0.136 -0.130 -0.030 0.114 b*-0.082 -0.059 -0.070 -0.152 0.038 -0.250 -0.256 0.277 从表11的结果来看:酿酒葡萄中的蛋白质含量对葡萄酒中的总黄酮含量、酿酒葡萄中的总酚含量对葡萄酒中的总酚和总黄酮含量、酿酒葡萄中的单宁含量对葡萄酒中的总酚和单宁含量以及酿酒葡萄中的葡萄总黄酮含量对葡萄酒中的总酚和酒总黄酮含量都是中度正相关。可见这与红色的酿酒葡萄与葡萄酒之间的指标联系是一致的,即单宁含量、总酚含量、总黄酮含量、酿酒葡萄中DPPH自由基含量对葡萄酒中的理化指标都很重要,红色的还有花色苷、白色的还有蛋白质对葡萄酒中的理化指标也很重要。与红色的不同的是白色的酿酒葡萄的出汁率越大,葡萄酒的色泽L含量就越大色泽b*就越小,酿酒葡萄的干物质含量与色泽L*和b*的关系与此相反,说明酿酒葡萄的干物质含量和出汁率对葡萄酒的色泽有很大的联系。 5.4基于Kmeans法组合比较模型对于问题四需要分析酿酒葡萄理化指标和葡萄酒理化指标对葡萄酒质量的影响,影响葡萄酒质量的因素可以分为四大类:酿酒葡萄理化指标、葡萄酒理化指标、葡萄芳香物质、葡萄酒芳香物质。我们将品酒员得分作为一个很重要的判断标准。 第一组:我们先分别考虑四个因素对葡萄酒质量的影响,把品酒师对葡萄酒的打分以及四个影响因素分别用matlab中的Kmeans函数分为三类,再对分类结果进行标准化处理,根据标准化后的数据在一个窗口画出这五个方面的箱线图见图四。图四(图中加黑粗线表示中位线)图中五列分别为:酿酒葡萄理化指标、葡萄酒理化指标、葡萄芳香物质、葡萄酒芳香物质,品酒员打分的箱线图,根据上图可以看出,只有葡萄芳香物质和葡萄酒芳香物质箱线图的中位数离品酒员评分中位数比较近,但是最大值和最小值相差较远,另外三个箱线图与品酒师打分的箱线图相差更大,所以单个因素不能用来对葡萄酒的质量进行评价。第二组:进一步考虑酿酒葡萄理化指标、葡萄酒理化指标、葡萄芳香物质、葡萄酒芳香物质中的任意两个结合,共有六种情况:酿酒葡萄理化指标+葡萄酒理化指标、酿酒葡萄理化指标+葡萄芳香物质、酿酒葡萄理化指标+葡萄酒芳香物质、葡萄酒理化指标+葡萄芳香物质、葡萄酒理化指标+葡萄酒芳香物质、葡萄芳香物质+葡萄酒芳香物质。同理可以得到加品酒员评分的七个箱线图见图五。图五(图中加黑粗线表示中位线)根据图中的箱线可知,组合1的箱线图与品酒师打分箱线图较为一致,但是中位线还有一定偏差,因此酿酒葡萄理化指标和葡萄酒理化指标可以作为葡萄酒质量的评价的重要参考,但是这两个指标还不能完全替代品酒员对葡萄酒质量的评价。六、模型的优缺点分析模型一中的置信区间法筛选数据能够很好的降低品酒员对样品酒的特殊喜爱性,更好,更公正的对样品酒进行评定。而利用t检验检验这两组评酒员之间是否存在显著性差异很明显是很好的,唯一有些不足的是对二级理化指标数据没有具体分析。模型二中很巧妙的利用品酒员对葡萄酒评价,将品酒员得分反映到质量上,相当于结合了第一问的结果,增加了问题一和问题二间的联系。另外,进行分类时是借助主成分分析法得到主成分的得分即主成分特征向量,对其进行聚类,避免由方差贡献得到主成分系数的误差。最后,抽取样本用判别分析对分级结果进行检验,检验结果与分类完全一致,说明分的等级很好。但是,其中缺陷也有,没有对二级指标进一步分析。模型三中首先计算各指标之间的相关系数,然后进行了相关度划分,很清楚的说明了各指标之间的相关程度,为建立线

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论