葡萄酒论文.doc_第1页
葡萄酒论文.doc_第2页
葡萄酒论文.doc_第3页
葡萄酒论文.doc_第4页
葡萄酒论文.doc_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

河南师范大学2013-2014学年 葡萄酒的评价专 业: 小组成员: 2013高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了全国大学生数学建模竞赛章程和全国大学生数学建模竞赛参赛规则(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 年 月 日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(全国组委会评阅前进行编号):葡萄酒的评价摘要确定葡萄酒质量一般是通过聘请一批有资质的评酒员进行品评。由于人为主观因素的影响,对酒质量的评价总存在随机性差异,为此找到一种简单有效的客观方法来评酒就显得尤为重要。本文通过研究酿酒葡萄的好坏与所酿制葡萄酒质量的关系、葡萄酒与酿酒葡萄检测的理化指标得关系,以及葡萄酒理化指标与葡萄酒质量的关系,在给定数据的基础上建立准确的数学模型,用客观有效的方法来评价葡萄酒的质量。针对问题一,在matlab软件的基础上,首先计算出每组评酒员中的每个评酒员对27中酒样品的总体得分,并将每组中的10个总得分求平均值,然后将两组的平均值再次求平均,以便进行方差分析。利用计算得出的来判断两组评酒员的评价结果无显著性差异,根据方差大小得知第一组评酒员评价的结果更可信。综合得知,主观因素对葡萄酒质量的评价具有不确定性。针对问题二,为对酿酒葡萄进行分级,可以对相应的葡萄酒进行分级。根据酿酒葡萄的理化指标进行聚类,再根据第一问中的各种样品酒的质量评价,确定每一类的等级高低。该方法只能较为笼统的酿酒葡萄进行分级,因此引出模型II,即运用主成分分析的方法,可以对酿酒葡萄的理化指标进行主成分分析,如红葡萄酒具有三个主成分为综合性、口感和外观香气的协调,然后针对酿酒葡萄在各个主成分上的得分再结合附件1葡萄酒中细化指标,可以区别酿酒葡萄在三个主成分上的分级。针对问题三,为了分析酿酒葡萄与葡萄酒的理化指标之间的联系,对附件数据进行分析,葡萄酒所含的指标在酿酒葡萄中都有,因此只对共有的指标进行分析,首先对两者理化指标数据进行标准化预处理,消除量纲的差异,运用相关系数的方法,针对每个指标进行相关系数分析,可得出对于红葡萄,花色苷,单宁,总酚,酒总黄酮,DPPH的线性相关性比较强,对于白葡萄,单宁,总酚,酒总黄酮的线性相关性比较强。在此基础上,运用逐步回归的方法进行分析,找出酿酒葡萄的所有指标对葡萄酒指标的影响,从而确定两者之间的联系,可得出葡萄酒的理化指标是受酿酒葡萄中的一个或多个理化指标影响的。针对问题四,要求理化指标与葡萄酒质量之间的联系,在前几问的基础上,可考虑将这三个变量统一化。由于理化指标的值是多个指标的含量,而葡萄酒的质量则是专家打的分数,因此,直接分析理化指标对葡萄酒质量的影响是不好实现的,而第一问和第二问均将葡萄酒质量与酿酒葡萄酒理化指标转换为了秩和,则也可将葡萄酒的理化指标转化为秩和。要研究理化指标的秩和排序对葡萄酒质量秩和排序的影响,可用相关性分析比较相关系数的大小。最后,根据相关性的结果加以分析。关键词:葡萄酒评价 排序检验法 主成分分析 综合评分 多重比较一 、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、模型假设1、假设酿酒工艺和储存条件等对葡萄酒质量及理化指标无影响;2、假设葡萄酒的质量不受评分时的环境因素影响;3、假设所给的两组评分数据是独立的;4、假设对理化指标的检测误差在可接受范围之内。三、符号说明符号符号说明品酒员对葡萄酒样品评分排序的秩次第个样品的总秩和酿酒葡萄的指标值 酿酒葡萄的指标值对理想点对应指标的接近度检验统计量排序间的方差酒样的理化指标向量四、问题分析问题一的分析问题一需要分析两组评酒员的评价结果有无显著性差异,因此首先对附件1的数据进行处理,将每个评酒员在对葡萄酒进行品尝后对其分类指标的打分求和得到其总分,此总分即为葡萄酒的质量,求出每个酒样品的评价结果。在对差异性进行分析时,首先对每个样品酒的总分进行非参数检验,得出总分的差异性是否显著,再对每个指标的评分进行非参数检验,得出针对单个指标的差异性是否显著,另一方面因为对样品酒的评价涉及到多个因素,因此我们建立模糊综合评价模型对每个样品酒进行综合评价,根据两组综合评价的结果找出其中评价结果不一样的数量看其差异性是否显著。对两组评酒员评价结果的可靠性进行分析时,利用格拉布斯准则对不同评分组的评分结果进行剔除奇异值,如果对其中一组数据剔除的奇异值比较多,则认为此种评价不可靠。问题二的分析为了对酿酒葡萄进行分级,可以对相应的葡萄酒进行分级。根据酿酒葡萄的理化指标进行聚类,再根据第一问中的各种样品酒的质量评价,确定每一类的等级高低。该方法只能较为笼统的酿酒葡萄进行分级,因此再运用主成分分析的方法,对酿酒葡萄的理化指标进行主成分分析,然后针对酿酒葡萄在各个主成分上的得分再结合附件1葡萄酒中细化指标,可以区别酿酒葡萄在三个主成分上的分级。问题三的分析 问题三需要分析出酿酒葡萄和葡萄酒的理化指标之间的联系,通过对附件2数据的分析可知,葡萄酒所含的理化指标包含在酿酒葡萄的理化指标中,所以只对它们共有的理化指标进行分析,针对每一种理化指标求出酿酒葡萄和葡萄酒的相关系数,最后分析两者的相关性。接着运用逐步回归的方法,对葡萄酒和酿酒葡萄的所有理化指标进行分析,确定其联系。问题四的分析:根据第三问用逐步回归得出的结果可知葡萄酒的各项理化指标影响葡萄酒的各项理化指标,因此只需分析葡萄酒的各项理化指标对葡萄酒质量的影响, 运用因子分析的方法对葡萄酒的理化指标进行因子分析,再与问题二种的各项主成分进行比较可知,每类因子都可作为评价葡萄酒质量的一项指标。五、模型的建立与求解5.1问题一的模型建立与求解5.1.1 基于排序检验与符号秩检验的显著性评价对于白葡萄酒和红葡萄酒,两个组别分别给出了各自的感官评价,对于同一个葡萄酒样本,不同的评酒员的打分存在差异,但一定假设范围内的差异是允许的。要分析两组评酒员的评价结果有无显著性差异,应构造统计量,检验两组评4分的差异是否在一定的置信区间内,若不在,则认为评分差异性显著。考虑到本题的背景,两组评分的差异可体现在对样本酒的排名差异上。由于该问属于食品评价中的感官评价问题,因此,可结合感官评价中的排序检验与非参数检验中的符号秩检验,对两组评分的显著性进行评价。l 样品秩次和秩和的求解评酒员对每一个酒样均从四大方面进行了评分。根据题意,葡萄酒的质量由总分所确定。因此,我们将每一个方面的评分加和,得到i 品酒员对葡萄酒样品j的总评分。以红葡萄酒的评价为例,对于品酒员i ,将其对27 种样品的评分进行排序,评分最高的酒样秩次为1,当多个样品有相同秩次时,则取平均秩次。记在i 品酒员的评价排序中, j 酒样的秩次为,可得到秩次矩阵为: (1)因此,第j 个样品的总秩和为: (2)最终,根据样品的总秩和对27 个样本进行排序,秩和越小代表该酒样的得分越高,排名越好,第一名记为1.样品j 的排序为j X 。因此,对于红葡萄酒,两个组共得到了两个排序结果。图1-1、1-2 分别为红、白葡萄酒的两组排序比较,纵坐标为每组综合排序中对应酒样的秩次: 图1-1 红葡萄酒两组排序比较图1-2 白葡萄酒两组排序比较接下来,对两个排序结果进行显著性检验。l Wilcoxon 符号秩检验Wilcoxon 符号秩检验为一种非参数检验方法,具有无需对总体分布作假定的优点。该方法是在成对观测数据的符号检验基础上发展起来的,用于检验产生数据的总体是否具有相同的均值,比传统的单独用正负号的检验更加灵敏1。Wilcoxon 符号秩检验的步骤为2:(1)计算差数:求出成对观测数据的差;(2)编秩次:按差数的绝对值,由小到大编上等级,并标上原数的正负号。根据Mann-Whitney U 检验,对绝对值按大小顺序编上等级。u 值计算: (3)(3)等级编号完成后恢复正负号,求出正等级之后和负等级之和选择两者中较小一个最为检验统计量T 。(4)根据显著性水平a 查附表得到临界值Ta ,若,则拒绝原假设。通过spss 软件,分别对红葡萄酒和白葡萄酒的两组酒样排序进行检验验结果如表1和表2所示:表1 红葡萄酒符号秩检验显著性水平标准差检验统计量Sig.决策两组之间差异中位数为037.054166.500.914无显著性差异37.054166.500.914无显著性差异表2 白葡萄酒符号秩检验显著性水平标准差检验统计量Sig.决策两组之间差异中位数为039.054182.500.859无显著性差异39.054182.500.859无显著性差异因此,由表中信息可以看出,在显著性水平为0.05、0.01 的两种情况下,两组品酒员对于两种酒的评价均无显著性差异,则显著性水平对检验结果无影响。 可认为,该检验方法是比较稳健的,即评价结果较为可信。5.1.2 可信度评价模型l 基于组内方差比较的可信度评价感官评分的差异体现在酒样之间的差异与品酒员之间的差异上。一个良好的评价方案中,品酒员之间的差异应该尽可能小,即10个排序之间越集中越好。由于求出的对于两种葡萄酒,两组品酒员的评价结果无显著性差异,因此,我们通过比较哪组组内的差异小来确定哪组可信度高。本题中每个品酒员得到的评分不满足正态分布,因此一般的组间方差齐次性检验不适用。由于每组都通过综合10个品酒员得到了一个评分的总排序,因此,可通过10个排序与总排序之间的方差大小进行评价。(1)第品酒员的排序与该组总排序方差: (4)(2)第一组品酒员的平均组内方差: (5)通过计算,得到两组品酒员对红、白葡萄酒的方差如表3所示:红葡萄酒白葡萄酒平均组内方差第一组第二组第三组第四组39.5740.2153.3248.99从表中结果可直观看出,对于红葡萄酒而言,第一组的方差更小,即第一组的更可信;对于白葡萄酒而言,第二组的方差更小,即第二组的评分更可信。所以总结为: 红葡萄酒:第一组; 白葡萄酒:第二组。 l 基于理想排序的方差可信度评价由于两组排序均无差异,因此,可将两组20个评酒员的20个排序综合,求秩和得到一个新的排序。由于此排序综合了20个评酒员的结果,因此,更能反应酒样的排序真实性,即认为该综合排序为理想排序。记样品在第一组、第二组排序内的秩次为,综合之后排序秩次为。红葡萄酒三种排序的比较图如下:图1-3红葡萄酒的三种排序比较因此,两组秩次排序与综合排序的平均方差见表4为:红葡萄酒白葡萄酒方差第一组第二组第三组第四组5.856.3329.8129.53由表1-4中的数据分析可得,与理想排序间的方差越小则代表该组越可信。因此,此步分析结果与上步得出的结果一致。l 两种评价检验总结两种方法得到的可信度保持一致,均为红葡萄酒第一组好,白葡萄酒第二组好,因此,结合这两种方法,可认为得到的结果是稳健的。5.2 模型二的建立与求解5.2.1 芳香指标与香气评分的相关性分析与附表2中所给出的理化指标不同,附表3中单独给出了酿酒葡萄与葡萄酒的芳香物质指标。对于葡萄酒而言,其芳香物质对于葡萄酒的香气起着决定性的作用,与其香气密切相关【2】。鉴于芳香物质的种类过多,因此,我们通过spss软件,将芳香物质指标与感官分析评分中的三个香气指标的总分进行相关性分析。在相关性分析中,不需要区分自变量和因变量,两个变量之间是平等关系,通过相关分析可以了解变量之间的关系密切程度【3】。将芳香物质指标与感官分析评分中的三个香气指标的总分进行相关性分析,相关性系数可表征指标对香气的重要程度,相关性系数越接近于1或-1,则该指标对香气的影响越大,剔除相关性系数接近于零的指标。得到的结果如表5表6所示:表5 红葡萄酒芳香物质相关性分析保留指标置信区间芳香物质相关物质0.05甲苯-0.385乙酸戊酯-0.482乙酸乙酯-0.8721-乙醇-0.4441-辛稀-3-醇-0.473(E)-3,7-二甲基-2,6-辛二烯-1-醇0.460表6 白葡萄酒芳香物质相关性分析保留指标置信区间(E)-2-乙烯醛萘0.05-0.5330.401注:分析结果中已经将缺失值较多的化学物质剔除将相关性分析后最终的指标加入酿酒葡萄的理性指标中,用二级指标代替一级指标,对于同一个指标测多次时,取测量的平均值。最终得到总共65个指标,再对所有理性指标进行综合分析。5.2.2基于TOPSIS法的秩次排序由于现有葡萄酒的质量评价大都基于感官评价的评分结果,因此,我们将问题一中求得的样品感官质量排序结果作为酿酒葡萄分级的标准,以逼近理想点的方法,对加入芳香物质的葡萄各个指标进行秩次排序。(1)确定理想点根据题意,要求将酿酒葡萄的理化指标与葡萄酒的质量相结合对葡萄质量进行综合评价,而目前专家打分则是葡萄酒质量评价的标准。因此,将第一问中秩次最低,即得分最高的葡萄样本设为“理想点”,以该理想点的各项指标作为最理想的指标值。对于红、白葡萄,选取第一问中各自更可信的一组数据确定理想点。即:红葡萄23号,白葡萄5号(2)计算各样本逼近理想点的接近度d 由于采用理想点逼近的方法,因此指标虽多,达到了65个,但可不必对指标进行降维。设理想点的各项指标值组成的向量为:其他样本的指标向量为: (6)因此,对于红葡萄的27种酒样,可得到2765的接近度矩阵: (7)同理,对于白葡萄的28 种酒样,可得到2865 的接近度矩阵。(3)秩次排序在求得6、7 的接近度矩阵后,对于每一个指标,对接近度进行排序。按照问题一中求秩次的方法,求秩次,根据秩次求得i 种酿酒葡萄的秩和: (8)5.2.3 基于多重比较的酿酒葡萄分级根据酿酒葡萄的秩和,运用排序检验中的统计分组方法对酿酒葡萄进行分组定级。以红葡萄为例:(1)根据各样品的秩和,从小到大将样品初步排序,本题中,秩和最小的为23 号葡萄,最大的为样品18。(2)计算临界值r ( I ,a ): (9)P 为样本数目,J 为指标数,a 代表显著性水平。式中q( I ,a )值可查表得到。本题中,临界值r ( I ,a )为: (3)比较和分组以下列的顺序检验这些秩和的差数:最大减最小,最大减次小,最大减次大,然后次大按照同样方式依次减下去。对于所得到的秩差,与r ( p,a )进行比较。如:与r ( p,a )比较,与r ( p -1,a )比较,与r (2,a )比较。若相互比较的秩和只差小于对于的r 值,则表示两个样品以及秩和位于这两个样品之间的所有样品无显著差异,在这些样品以下可用一横线表示,即: (10)横线内的样品不必再比较。若小于r 值,则表示两个样品有显著性差异,其下面不划横线。通过查表得到I 不同时q( I ,a )的值,从而得到r ( p,a )的值进行分组分析。通过Matlab 编程【5】,选取99%的置信区间,得到画线结果如图1、2 所示,横坐标表示葡萄种类编号,两竖虚线内的葡萄归为一级,越靠左的品种级别越高(程序见附录):图1 红葡萄分组图示根据划线图的分组总原则为:(1)参考葡萄酒分级的划分原则,根据参考文献的葡萄酒分级分为五级:(一级:60分一下;二级:60-69;三级:70-79;四级:80-89;五级:90-95)将葡萄的等级大致分为五级左右。(2)根据横线划分情况,尽量不破坏横线重合,选取破坏横线最少且区间两端秩和之差相对平均的方法。首先,将秩和与其他样本差距较大的样本独立分组,例如红葡萄酒中的23号样本和白葡萄酒中的5号样本;图2 白葡萄分组图示如图所示,红葡萄被分为了五个级别,白葡萄分为了四个级别,分组具体情况如表7表8所示(等级一代表质量最好):表7红葡萄分级结果 等级组内酒样秩和区间一2365.5二4,5,9,10,17,19,24,25739-896三2,3,8,13,14,15,16,20,22908-982四1,6,7,11,21,26,27989-1073五12,181162.5-1222表8 白葡萄分级结果等级组内酒样秩和区间一595二2,4,6,9,10,14,20,21,23,25,26,28684-836三1,3,7,11,12,15,17,18,22867.5-1034四8,13,16,19,24,271045-11575.3 模型三的建立与求解5.3.1 两组指标的主成分分析酿酒葡萄的理化指标与葡萄酒质量的理化指标数目过多,且部分指标对各自的品质影响小,且数目过多难以建立指标之间的联系。因此,首先可对各指标进行降维,减小指标个数。本问中采取主成分分析的方法对指标进行降维。主成分分析可将原来众多的具有一定相关性的变量重新组合成一组新的相互无关的综合变量来代替原来的变量。其一般步骤4:(1)由相关系数矩阵得到特征值及各主成分的方差贡献率等,根据累计贡献率确定主成分保留个数;(2)利用施密特正交方法,对每一个求其对应基本方程组的解,对数据进行转换得到主成分;(3)将观测值代入主成分表达式中计算各个主成分的值;(4)由因子载荷解释主成分的意义。用一级指标代替二级指标,通过spss软件,以特征值贡献率之和大于80%筛选成分,得到红葡萄的主成分数如表9所示为: 表9 主成分数目红葡萄红葡萄白葡萄红葡萄酒白葡萄酒成分数数目121345通过系数矩阵,分析得知红葡萄酒的4个主成分分别主要体现在:总酚、色泽C、色泽H、反式白藜芦醇成分上;白葡萄酒的5个主成分分别主要体现在:色泽C、总酚、顺式白藜芦醇苷、反式白藜芦醇、色泽H成分上。5.3.2 两组主成分间的回归分析由于葡萄酒的理化指标数目小于葡萄的理化指标数,因此以酿酒葡萄的理化:指标主成分为自变量,葡萄酒的理化指标主成分为因变量,对于后者的每一个主成分,与葡萄的所有主成分做回归分析,对于红葡萄酒和白葡萄酒,分别得到了4个和5个回归方程首先选取红葡萄酒指标的四个主成分与红葡萄的12种主成分做线性回归,假设它们之间存在线性关系式 (10)通过SPSS做逐步回归分析,算得系数矩阵为:回归方程为: (11)同理,将白葡萄酒理化指标的5个主成分作为因变量和白葡萄的13种主成分回归后系数矩阵为:回归方程为: (12)回归方程的检验:(1)回归方程显著性检验多元线性回归方程的总离差平方和SST 可分解为剩余平方和SSE 与回归平方和SSR。当原假设为 且 成立时: , 为的无偏估计量。因此,给出显著性水平,即可进行回归方程的显著性检验6。s a表10 红葡萄酒回归方程显著性检验模型平方和df均方FSig.回归方程一回归22.15154.43024.170.000残差3.849210.183总计26.00026回归方程二回归18.20644.55212.848.000残差7.794220.345总计26.00026回归方程三回归5.35015.3506.4760.017残差20.650250.826总计26.00026回归方程四回归7.96117.96111.0320.003残差18.039250.722总计26.00026表11 白葡萄酒回归方程显著性检验模型平方和df均方FSig.回归方程一回归14.01434.6718.633.000残差12.986240.541总计27.00027回归方程二回归19.60429.80233.132.000残差7.396250.296总计27.00027回归方程三回归3.87713.8774.3600.047残差23.123260.889总计27.00027回归方程四回归9.19124.5956.4510.006残差17.809250.712总计27.00027回归方程五回归5.60315.6036.8090.015残差21.397260.823总计27.00027Sig的值均小于0.05,故拒绝原假设,接受背择假设,认为上述所有回归方程均通过检验,即线性关系显著。(2)参数显著性检验由于篇幅限制,此处只给出红葡萄酒的回归方程一与白葡萄酒回归方程一的参数检验结果: 表12 红葡萄方程的参数显著性检验模型分标准化系数标准系数tSig.B标准误差试用版常量6.019E-7.082.0001.000主成分1.750.084.7508.937.000主成分4.305.084.3053.630.002主成分7.284.084.2843.387.003主成分3-.283.084-.283-.3.368.003主成分12.187.084.1872.232.037 表13 白葡萄方程的参数显著性检验模型分标准化系数标准系数tSig.B标准误差试用版常量-9.215E-7.139.0001.000主成分2.493.142-.493-3.480.002主成分1.420.142.4202.966.007主成分5.316.142-.316-2.234.035由于所做的为逐步回归,所剩下的主成分系数均通过了参数检验。分析回归分析方程可知:1.红葡萄酒中理化指标总酚与红葡萄的理化指标花色苷、蛋白质、脯氨酸、天门冬氨酸、VC含量有线性关系;2.红葡萄酒中理化指标色泽C与红葡萄的理化指标花色苷、脯氨酸、百粒质量、VC含量有线性关系;3.红葡萄酒中理化指标色泽H与红葡萄的理化指标VC含量有线性关系;4.红葡萄酒中理化指标反式白藜芦醇与红葡萄的理化指标蛋白质有线性关系。5.白葡萄酒中理化指标色泽C与白葡萄的理化指标丝氨酸、葡萄总黄酮、苯丙氨酸有线性关系;6.白葡萄酒中理化指标总酚与白葡萄的理化指标丝氨酸、葡萄总黄酮有线性关系;7. 白葡萄酒中理化指标顺式白藜芦醇苷与白葡萄的理化指标果皮质量有线性关系;8. 白葡萄酒中理化指标反式白藜芦醇与白葡萄的理化指标精氨酸、苯丙氨酸有线性关系;9. 白葡萄酒中理化指标色泽H与白葡萄的理化指标黄酮醇有线性关系。5.4 模型四的建立与求解5.4.1 葡萄酒理化指标的转换对于一、二问中,我们已经用排列检验的方法,通过秩和排序,将感官评价结果(即葡萄酒的质量评分)与酿酒葡萄的理化指标做了统一的数据转换,即都转换为了秩和,并对秩和进行排序得到了样品的排名。为了将葡萄酒的理化指标也与两者统一起来,因此,也按照模型二中的方法,对葡萄酒理化指标进行秩和排序。对芳香性物质与香气评分进行相关性检验,保留的成分的相关系数见表14所示:表14 红葡萄酒芳香物质相关性分析保留指标置信区间芳香物质相关性系数95%乙醇0.3833-甲基-1-丁醇0.553香叶基乙醚0.585辛酸丙酯0.4393,7-二甲基-10.4015-甲基糠醛0.432苯乙醇0.434确定指标总数后,通过逼近理想点法,同样对葡萄酒根据其理化指标得到秩和排序(具体过程见模型二)。对于红、白葡萄酒,分别将感官评分排序、葡萄理化指标排序、葡萄酒理化指标排序作图,得到较直观的表达:图3 红葡萄酒三种排序图4 白葡萄酒三种排序5.4.2 三种排序的相关性检验经过四问的数据转换,理化指标与感官指标均被转换为了秩和排序。要验证酿酒葡萄的理化指标、葡萄酒的理化指标对葡萄酒质量的影响,我们将模型一中葡萄酒质量的秩和排序分别与另外两者之间进行相关性检验,以相关性系数的大小评判后者对葡萄酒质量评价有无影响。通过SPSS,以三个秩和排序数据做皮尔斯相关性检验【7】,如下表所示:表15 红葡萄酒的相关性检验(95%置信区间)红葡萄红葡萄酒红酒质量Pearson相关性0.6070.742显著性(双侧)0.0010N2727表16 白葡萄酒的相关性检验(95%置信区间)白葡萄白葡萄酒白酒质量Pearson相关性0.5100.556显著性(双侧)0.0060.002N2828结果分析:(1)由上表分析相关性系数可知,所有值的Sig.均小于0.01。即对于两种酒,葡萄与酒的理化指标与葡萄酒质量均在a = 0.01的水平上显著相关,且红葡萄酒的相关性系数大于白葡萄酒。(2)可认为葡萄酒的质量与酒和葡萄的理化指标均成正相关,葡萄酒与葡萄的理化指标水平越高时,葡萄酒的质量越高,反正越低。(3)虽然理化指标与葡萄酒质量呈显著性相关,但是相关性系数并没有太高,特别是白葡萄酒,相关性系数只有0.5 左右,即单个理化指标并不能完全代表葡萄酒质量。为了对两个理化指标的综合结果进行检验,我们进行以下的进一步分析。 设葡萄的理化指标与葡萄酒的理化指标相比,其对葡萄酒质量影响所占权重为,将两个理化指标加权得到新的总秩和为: (13)将两个指标综合得到的新秩和排序与葡萄酒质量做相关性检验,观察相关性系数的变化。设定不同的 ,将 分别取0、0.2、0.4、0.5、0.6、0.8、1.0,得到的总秩和排序与葡萄酒质量的相关性系数将随之变化,见图5,图6:图5 红葡萄权重变化的相关系数变化图图6 白葡萄权重变化的相关系数变化图 根据两个图可得如下分析:(1)对于红葡萄酒,随着红葡萄理化指标权重的增加,与红酒质量的相关性系数一直减小。因此,对于红葡萄酒而言,只用酒的理化指标来衡量葡萄酒的质量更为合理。且最大相关系数大于0.7,则可认为只用红葡萄酒的理化指标评判红葡萄酒的质量较为合理;(2)对于白葡萄酒,相关性系数随着白葡萄理化指标权重的增加先增加后减小,当其权重在0.2-0.4之间时相关系数达到最大。因此,用白葡萄与白葡萄酒的理化指标综合评判白葡萄酒的质量更为合理。但是最大相关系数不如红葡糖酒的大。总结如下:用红葡萄酒的理化指标评价红葡糖酒的质量更为合理;用白葡萄酒的理化指标与白葡萄的理化指标综合评价白葡萄酒的质量更为合理。六、模型的评价与推广一排序检验法的评价:(1)模型优点:1.当样品数量较大,且不是比较样品间的差别大小时,选用排序检验法具有一定的优势;2.对于排序检验所得的数据,可以更充分地检测出各个样品之间的显著性差异;3.当试验目的是就某一项性质对多个产品进行比较时,比如甜度、新鲜程度等,适用排序检验法是进行这种比较的最简单的方法,比其他任何方法更节省时间。(2)模型缺点:排序检验法只能按照一种特性进行,如要求对不同的特性进行排序,则按不同的特性安排不同的排序;二符号秩和检验(Wilcoxon检验)的评价:(1)模型优点1. 不受总体分布限制,适用面广;2. 适用于等级资料及两端无缺定值的资料;3. 既考虑差数符号,又考虑差数大小(2)模型缺点:1.相同秩次较多时,统计量要校正;2.如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布,这时人为地将精确测量值变成顺序的秩,将丢失部分信息,造成检验功效下降。参考文献1祝国强.谈谈两总体比较的非参数检验方法J.Journal of Mathematical Medical,524-525,2011. 2郑莉莉.葡萄酒香气成分分析的研究进展J.中外葡萄与葡萄酒.38-40,2008. 3李运,李记明.统计分析在葡萄酒质量评价中的应用J.第四期:酿酒科技,80-82,2009. 4余祖德,陈俊芳.基于最大熵的两极逼近理想点的配送路线选择J.工业工程与管理,第1期:48-51,2007. 5周开利.MATLAB基础及其应用教程M.北京:北京大学出版社,170-171,2007.6汪晓银,周保平.数学建模与数学实验M.北京:科学出版社,1-6,2010.7Pavel B.Brazdil.A comparion of ranking methods for classification附录:白葡萄分等级的MATLAB程序clcclear%输入28个白葡萄样品的秩和A=95684766788793804809819.5820824829836867867.5916.5924944947.5961964.5968.510341045.5105910741075.510931157;%求出两两白葡萄样品的秩和之差并存入B向量之中k=1;for i=1:28for j=1:(28-i)B(k)=A(29-i)-A(j);k=k+1;endendB% %输入q(i,0.01),并根据r(i,0.01)=q(i,0.01)*sqrt(j*p*(p+1)/12,求出临界值CI=3.644.124.44.64.764.884.995.085.165.235.295.355.45.455.495.545.575.615.655.685.715.745.775.85.825.855.87;I=(sqrt(61*29*28)/12)*I;n=1;for l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论