葡萄酒评分数模国赛赛题_第1页
葡萄酒评分数模国赛赛题_第2页
葡萄酒评分数模国赛赛题_第3页
葡萄酒评分数模国赛赛题_第4页
葡萄酒评分数模国赛赛题_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 1 葡萄酒的评价葡萄酒的评价 摘要摘要 本文主要研究评酒员对葡萄酒质量的评价与酿酒葡萄、 葡萄酒和酿酒葡萄的 理化指标之间的联系。在求解过程中,我们使用了变异系数评价法、配对 t 检验 法、 快速均值聚类法建立数学模型,再利用 spss 软件和 matlab 对数据进行处理 分析。具体结果如下: 针对问题一:首先对数据进行处理:求出每一位品酒师对每一种葡萄酒的总 评分,分别计算出两组品酒师对每一个样品的平均打分。利用 spss 软件对打分 进行配对 t 检验, 得出两组评酒员的评价结果有显著差异。再运用比较变异系数 的方法分析数据: 通过组间评分和组内评分数据的差异化系数求解并比较,得出 第

2、二组结果更可信的结论。 针对问题二: 题目要求利用葡萄酒的质量和酿酒葡萄的理化指标同时对酿酒 葡萄进行分级, 因此我们将第二组品酒师对葡萄酒的打分作为衡量葡萄酒质量的 重要参数。 再对酿酒葡萄的理化指标进行无量纲化处理, 利用主成分分析法从酿 酒葡萄的理化指标中提取主成分。最后将提取出的主成分和葡萄酒质量结合,用 spss 对葡萄样品进行系统聚类分析确定最终的分级。 针对问题三: 题中要求酿酒葡萄与葡萄酒的理化指标之间的关系,我们将其 转化为求解对于同一样品的这两组理化指标之间的关系矩阵。先用 matlab 求出 每一组变量的相关系数, 再用 pca 算法求得酿酒葡萄与葡萄酒的理化指标之间的

3、定量关系。 针对问题四: 依然把第二组品酒师的评分作为衡量葡萄酒质量的标准。 以酿 酒葡萄、葡萄酒为样本,通过多元线性回归法构建反映酿酒葡萄和葡萄酒的理化 指标以及芳香物质与葡萄酒质量之间关系的方程, 得出可以用葡萄酒和酿酒葡萄 的理化指标来评价葡萄酒的质量。最后通过回归方程的检验和预测,确定葡萄酒 质量与各影响因素之间的数量关系。 关键词:非参数假设检验;方差分析;聚类分析;pca 分析法;多项式回归; 一、 问题重述 1.1 问题的背景 葡萄酒的质量是葡萄酒的一种特性,它表示着葡萄酒的优秀程度。确定葡萄 酒质量时一般是通过聘请一批有资质的评酒员进行品评,评酒员品评葡萄酒时, 主要通过感官评

4、价来评分。感官指标主要指色泽、香气、滋味和典型性方面的要 求, 每个评酒员在对葡萄酒进行品尝后对其分类指标打分, 然后求和得到其总分, 从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡 萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。 题中提供的附件 1 给出了某一年份一些葡萄酒的评价结果,附件 2 和附件 3 分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。 1.2 问题的提出 请尝试建立数学模型讨论下列问题: 1.根据题中提供的附件 1,分析两组评酒员的评价结果有无显著性差异,哪 一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒

5、葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响, 并论证能否用葡萄和 葡萄酒的理化指标来评价葡萄酒的质量? 二、模型假设及说明 1假设样本之间相互独立。 2假设理化指标是真实可信的。 3假设评酒员对葡萄酒的个人喜好差异可以忽略不计。 4. 假设芳香物质中仪器没有测出的物质含量为 0。 5假设葡萄酒的质量没有受其他的理化指标的影响。 6假设酿酒葡萄没有其他的影响指标,如光照、地域等。 7假设品酒师品酒的环境相同。 三、问题分析 问题一中,要求分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一 组结果更可信。因为红葡萄酒和白葡

6、萄酒的制作工艺不同,所含的成分不同,有 可能会导致两组评论员对两种颜色的葡萄酒样品的评分标准产生差异, 所以在处 理数据时,应将其分颜色进行讨论。运用配对 t 检验法,对第一组红葡萄酒各种 酒样品的平均得分和第二组红葡萄酒各种酒样品的平均得分进行显著性检验。 然 后运用方差分析法和比较变异系数,来判断出哪一组结果更可信。 问题二中, 要解决的问题是根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒 葡萄进行评级。 由于酿酒葡萄的理化指标太多, 数据复杂, 得先对数据进行处理, 采用主成分分析法,得到主成分的表达式,然后根据表达式得到主成分的具体数 据,实现降维。要实现对葡萄进行评级,需把性质相近的葡萄

7、分在同一类,所以 要进行聚类分析。考虑到即使是同一类葡萄,样本不同所酿的酒的质量也会有差 异, 于是根据同一类别中所有葡萄所酿造的葡萄酒样本质量水平对酿酒葡萄进行 评级。 问题三中,需要研究葡萄酒与酿酒葡萄的理化指标之间的联系。因为题中提 供的数据极为复杂,需先对数据进行因子分析,得到共性因子,将得到的因子作 为新变量,进行典型相关分析,从而判断出两者的联系。 问题四中,可以将问题分为两部分,一是考虑酿酒葡萄和葡萄酒的理化指标 与葡萄酒的质量的关系,二是判断这两种物质的理化指标能否评价葡萄酒的质 量。针对第一部分,首先我们把两类指标放在一起,作出散点图,判断其是线性 还是非线性关系。判断之后进

8、行相关性分析,选出相关性强的指标,建立多项式 回归模型。得出结果后,对模型进行检验。第二部分的解决需要考虑附表 3 中的 芳香物质对葡萄酒的质量是否有影响,把芳香物质、葡萄和葡萄酒的理化指标当 作影响因素,其处理方法与第一部分一样,如果加入芳香物质后的模型能够较好 的和数据拟合, 那么就说明仅使用葡萄和葡萄酒的理化指标评价葡萄酒的质量是 不全面的,反之则说明能够全面的评价葡萄酒的质量。 四、符号说明 i y: 葡萄酒的理化指标; j x: 葡萄的理化指标; i x: 631 ,xx 与 i y线性相关性高的 j x组成的向量; i a: 由回归系数组成的向量; * i u: 与红葡萄酒质量相关

9、较大的理化指标和芳香物质; * i u: 与白葡萄酒质量相关较大的理化指标和芳香物质; t: 对酿酒葡萄样品的理化指标进行主成分分析后得到的主成分 五、模型建立及求解 5.1 问题一 5.1.1 非参数假设检验 1. 数据的处理 从附件1中可知,评酒员品评葡萄酒时,主要是看外观、闻香气、尝味道三 种方式,即为感官评价。在评酒员对葡萄酒的感官评价中,除了葡萄酒本身的成 分在一定程度上决定了评酒员的评分有一定的差异外, 评酒员间也存在着评价尺 度、 评价位置和评价方向等方面的差异, 这些都会导致不同评酒员对同一酒样的 评价有很大的差异, 但是这些并不能直接说明两组评酒员的评价结果是否有显著 性差异

10、。因此,在对感官评价结果进行统计分析时, 必须先对两组评酒员对葡萄 酒的评分进行相应的处理。 首先,将两组评酒员对不同品种葡萄酒的分类指标的打分进行求和,得到总 分,确定葡萄酒的质量(表格见附录 1) 。其次,将两组评酒员对同一种酒样品 的评分求和,再求其均值,可得到四组数据,即第一组评酒员对每种红葡萄酒样 品评分的平均值,第二组评酒员对每种红葡萄酒样品评分的平均值,第一组评酒 员对每种白葡萄酒样品评分的平均值, 第二组评酒员对每种白葡萄酒样品评分的 平均值(表格见附录 2) 。最后,从以上数据的处理结果中可以看出两组葡萄酒 样本是独立的样本,设第一组评酒员对每种红葡萄酒样品评分的平均值为样本

11、 一, 第二组评酒员对每种红葡萄酒样品评分的平均值为样本二,用非参数假设检 验中的mann whitneyu检验法对两组样本进行显著性检验。 表1 第一组评酒员对每种红葡萄酒样品评分的平均值 酒样品 1 2 3 4 5 6 7 8 9 平均得分 62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 酒样品 10 11 12 13 14 15 16 17 18 平均得分 74.2 70.1 53.9 74.6 73 58.7 74.9 79.3 59.9 酒样品 19 20 21 22 23 24 25 26 27 平均得分 78.6 78.6 77.1 77

12、.2 85.6 78 69.2 73.8 73 表2 第二组评酒员对每种红葡萄酒样品评分的平均值 酒样品 1 2 3 4 5 6 7 8 9 平均得分 68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 酒样品 10 11 12 13 14 15 16 17 18 平均得分 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4 酒样品 19 20 21 22 23 24 25 26 27 平均得分 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5 注:在处理附件 1 的数据时,发现附件 1 葡

13、萄酒品尝评分表中的第一组评酒 员对白葡萄酒的品尝评分的第 233 行 j 列的数据为 77,根据口感分析中的持久 性最高得分只能为 8 分,因此认为此处数据应为 7,于是将数据 77 改为 7 进行 处理分析。 2. mann whitneyu检验的基本原理 一般做显著性检验时, 往往事先假定总体服从某种特定的分布, 如正态分布, 然后对其均值、方差等参数做差异的显著性检验。但某个随机变量是否服从某种 特定的分布是需要进行检验的。在总体分布情况不明时,用来检验总体是否来自 同一个总体的假设的一类统计方法统称为非参数检验。 mann whitneyu检验主要用于判别两个独立样本所属的总体是否有相

14、同的 分布,它是最强的非参数检验之一。该假设的原假设为:两组独立样本来自的两 总体分布无显著性差异。mann whitneyu检验通过对两组样本平均秩的研究来 实现推断。 其中秩的计算如下: 设样本 12 , m x xx和样本 12 , n y yy分别抽自相互独立的连续型随机变量总 体 f x和 g x, 并设这两个样本的合并样本 1212 , mn x xxy yy的各个单元 之间互不相等,则合并的样本容量nmn。对合并后的样本,按从小到大的 顺序排列,并以 i r为 i y在混合样本的秩。则y样本 12 , n y yy的秩和 1 n yi i wr , 同样地,以 i q记 i x在

15、混合样本的顺序统计量中的位置,则x样本 12 , m x xx的 秩和 1 m xi i wq 。 由此可知,1 21 /2 xy wwnn n 。 因此, 用 x w作 为统计量和用 y w作为统计量是相互等价的。 3. 模型的建立 设样本)27, 2 , 1(, 21 mxxx m 和样本)28, 2 , 1(, 21 nyyy n 分别抽自 相互独立的连续型随机变量总体 f x和 g x,则原假设为 0: hf xg x, 备择假设为 1: hf xg x。 在原假设为真时,若min,m n ,且/0,1m n,是一个常数, 则wilcoxon秩和统计量 y w的概率分布和累积概率分布分

16、别为: ,m n y td p wd n n (1) , ,1 / 2,1 / 2 m m i d y ti p wddn nn nmn n n (2) 其中, ,m n td表示从1,2,nmn这n个数中任取n个数, 其和恰为d的取法 种数。 xy w的渐近正态性简记为: 3 1 /2,1 /12()/(12(1) g xyii i wn mnmn nnmttn n (3) 当 0 p h时,拒绝原假设。 4. 模型的求解 运用 spss 软件对以上问题进行求解,可得到以下计算结果,见表 3。 表 3 两组评论员对红葡萄酒样品评分均值的秩检验表 品酒分数 mann whitneyu统计量 2

17、24.500 wilcoxon w 602.500 z -2.423 渐近分布双侧检验 0.015 双侧精确检验 0.015 单侧精确检验 0.007 intpo probability 0.000 表 3 给出在两组样本抽自的总体相同的原假设下, 出现目前统计量的值或者 更极端值的双侧检验概率为 0.015,小于 0.05,故拒绝原假设,认为两组评酒员 对 27 种红葡萄酒样品的评分均值独立样本来自的两总体分布有显著性差异。 同理可得,在两组评酒员对 28 种白葡萄酒样品的评分均值抽自的总体相同 的原假设下,出现目前统计量的值或者更极端值的双侧检验概率为 0.029,小于 0.05, 拒绝原

18、假设,认为两组评酒员对白葡萄酒样品的评分均值独立样本来自的 两总体分布也有显著性差异(表格见附录 3) 。 综上所述,可得附件 1 中两组评酒员对葡萄酒样品的评价结果,无论是对红 葡萄酒样品还是对白葡萄酒样品都有显著性差异, 即两组评酒员的评价结果有显 著性差异。 5.1.2 单因素方差分析 1. 单因素方差分析的基本原理 单因素方差分析即一维方差分析, 是检验由单一因素影响的多组样本因某因 变量的均值是否有显著差异的问题。如果各组之间有显著差异,则说明该因素对 因变量有显著影响,因素的不同水平会影响因变量的取值。 方差分析把因变量的方差分解为由因素的不同取值能够解释的部分, 和剩余 的不能解

19、释的部分,然后比较两部分,当能用因素解释的部分明显大于剩余的部 分时,则认为因素差异是显著的。 方差分析有 3 个假设,即观测时彼此独立的、观测为正态分布的样本、由因 素各水平分成的各组方差相等。当假设满足时,则可以进行单因素方差分析。与 假设检验方法相比,方差分析不仅可以提高检验效率,同时由于它将所有的样本 信息结合在一起,还增加了分析的可靠性。单因素方差分析步骤为: 步骤 1,建立原假设; 在方差分析中,原假设构造为 012112 :,:, kk hh 不全相 等。其中, k 为映射的第k个水平下的观测变量的总体均值,即单因素方差分析 的原假设为不同因素水平下的观测变量各总体均值无显著差异

20、。 步骤 2,构造统计量; /1 / ssbkmsb f msessenk (4) 其中,n为总样本数, ssb、 sse、 sst 分别服从自由度为 1 ,1knkn 的 2 x分布。f统计量服从1,knk各自由度的f分布。 步骤 3,计算统计量的观测值和概率p值; 该步骤的目的是计算检验统计量的观测值和相应的概率p值。spss 会自动 将相关数据代入f统计量进行计算。若f值显著大于 1,则控制变量对观测变量 造成了显著影响;反之,则没有造成显著影响。 步骤 4,给定显著性水平,得出结论。 给定显著性水平,并与检验统计量的概率p值进行比较。如果概率p值小 于显著性水平,则拒绝原假设,即认为控

21、制变量不同水平下观测变量各总体的 均值存在显著性差异;反之,则没有产生显著影响。 2. 单因素方差分析的 spss 操作求解 利用 spss 进行单因素方差分析求解,所得结果如表 4: 表 4 第一组评酒员对 27 种红葡萄酒样品评分的方差分析 变异来源 ss df ms f 显著性 评酒员 3172.537 9 352.504 7.450 0.000 酒样品 14017.667 26 539.141 11.394 0.000 误差 11071.963 234 47.316 总变异 28262.167 270 由表 4 可得评酒员间的f值为 7.4501, 显著性 0.000 f 18 1 0

22、.10152132 5.50 14 36 00.1),说明第1对典型变量是有价值的, 而第2对典型相关是无价值的,无需再讨论。 表8 第一组变量在典型变量中的标准典型系数 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 1 f 0.8571 0.2097 0.3312 -0.0857 -0.0046 0.1385 0.2904 0.0269 3 f -0.2066 0.4707 0.3380 0.0764 0.0630 0.3324 -0.0663 0.6289 表9 第二组变量在典型变量中的标准典型系数 1 g 2 g 1 y 0.9929 0.1182 2 y -0.118

23、8 -0.9576 上表给出标准化变量典型相关变量的系数,由此可得第1对典型变量 1 f=0.8571 1 x+0.2097 2 x+0.3312 3 x-0.0857 4 x -0.0046 5 x+0.1385 6 x+0.2904 7 x+0.0269 8 x 1 g=0.9929 1 y-0.1188 2 y 从中可见, 相应于第一个特征值的典型变量 1 f主要代表反映共性因子 1 x, 即 反映了对共性因子贡献较大的红酿酒葡萄的理化指标花色苷、苹果酸和单宁。相 应于第一个特征值的典型变量 1 g主要代表反映共性因子 1 y,即反映了对共性因 子贡献较大的红葡萄酒的理化指标单宁、总酚、

24、花色苷和 dpph 半抑制面积。 4冗余分析 冗余分析是典型相关的重要内容,它是以原变量与典型变量间相关为基础, 通过计算变量组由自己的典型变量解释与由对方的典型变量解释的方差百分比 与累计百分比,反映由典型变量预测原变量的程度。 运用sas可得到表10,从中可以看到变量组由自己的典型变量解释与由对方 的典型变量解释的累计百分比为84.64%, 能较好的反应典型变量预测原变量的程 19 度,所以典型相关分析的结果通过了检验,即 1 f和 1 g有很好的相关性是成立的。 表10 累计百分比 canonical r-square cumulative proportion 1 0.8464 0.4

25、232 5.3.3 结论 由于 1 f和 1 g最相关,这就说明红葡萄酒中的理化指标花色苷、苹果酸和单 宁与红酿酒葡萄的理化指标单宁、总酚、花色苷和dpph半抑制面积相关,且当红 酿酒葡萄的理化指标单宁、总酚、花色苷和dpph半抑制面积含量越多时,红葡萄 酒中的理化指标花色苷、苹果酸和单宁含量越多。 综上所述,酿酒葡萄与葡萄酒的理化指标之间有一定的相关性,可能是正相 关,也可能是负相关,即当酿酒葡萄与葡萄酒的某些理化指标之间是正相关时, 酿酒葡萄含有的某些理化指标越多,葡萄酒种含有的某些理化指标也就越多,反 之则越少。 5.4 问题四 5.4.1 酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响

26、1. 各理化指标与红葡萄酒质量 绘出红酿酒葡萄和红葡萄酒的一级理化指标与红葡萄酒质量之间的散点图 (图7为果皮颜色a*、b*和l*对红葡萄酒质量的散点图) ,从图5可以清楚的看出, 理化指标果皮颜色与红葡萄酒质量之间的数值规律均呈非线性。因此,我们采用 多项式回归对数据进行处理分析。 果皮颜色对红葡萄酒质量的散点图 60 62 64 66 68 70 72 74 76 78 80 0.00020.00040.00060.00080.000100.000 理化指标值 红葡萄酒质量 a*(d65) b*(d65) l*(d65) 图7 果皮颜色对红葡萄酒质量的散点图 对红酿酒葡萄和红葡萄酒的所有一

27、级理化指标与红葡萄质量之间的相关性 20 进行分析,剔除掉相关系数的绝对值小于0.4的理化指标,留下相关性较大的13 个指标作为多项式回归方程中的影响因素, 这13个指标(13, 2 , 1 * ixi)分别为红 酿酒葡萄的理化指标中的蛋白质、dpph自由基、总酚、葡萄总黄酮、ph值、果皮 颜色a*、果皮颜色b*,和红葡萄酒的理化指标中的单宁、总酚、酒总黄酮、白藜 芦醇、dpph半抑制体积和l*(d65)。 2.红葡萄酒多项式回归模型的构建与求解 设依变量 y 与自变量 m xx, 1 有关系:),()( 1m xxfye,但),( 1m xxf未 知,一般可以用高次多项式去估计。 设),()

28、( 1m xxfye的估计是三元二次多项式: j m ji iij m j jjj m j j xxbxbxbby 11 2 1 1 0 如果拟合不好,可以选更高次。 通过 spss13.0 软件进行逐步回归分析,求得多项式回归方程: 911. 0299. 0609. 0400. 0731. 0359. 0 * 13 * 9 * 7 * 2 * 5 * 41 rxxxxxxe 3. 红葡萄酒多项式回归方程的检验 对于回归方程显著性检验结果见表 11。由表 11 可以看出,整个回归方程在 0.4 水平上显著,表明整个回归方程是极显著的。在该回归方程中,复相关系数 r 为 0.911,决定系数 r

29、2 为 0.830,经检验复相关系数达到极显著。 表 11 回归方程显著性检验方差分析 sum of squares df mean square f regression 21.574 4 5.394 26.812 residual 4.426 22 0. 201 total 26.000 26 对于回归方程各项系数的显著性检验结果见表 12。由表 12 可以看出,各项 系数均在 0.01 水平上达到显著,这说明构建的回归方程是符合原有的样本集。 表 12 回归方程各项系数的显著性检验 unstandardized coefficients standardized coefficients

30、 t sig. b std.error beta (constant) 0.359 0.124 2.895 0.008 x4 0.731 0.121 0.731 6.024 0.000 x9x13 0.299 0.121 0.289 2.461 0.002 x5 0.400 0.097 0.400 4.109 0.000 x2x7 0.609 0.165 0.352 3.701 0.001 通过检验,可以看出所构建的多项式回归方程是符合要求的,并且真实地反 映了原有的数据集,但是整个回归方程仍然只是反映了原有数据集的大部分信 息。而部分信息在回归方程的构建过程中丧失,这一点是无法避免的。 根据

31、得到的回归方程预测红葡萄酒的质量,得到的数据与实际质量比较,如 表 13 所示。图 8,可在直观上说明回归方程式合理的。 表 13 回归方程所得红葡萄酒质量的预测值与实际值比较 红葡萄酒 样品 1 2 3 4 5 6 7 8 9 实际质量 -0.607 0.876 1.027 0.172 0.398 -1.06 -1.311 -1.135 1.932 预测质量 0.140 0.826 0.996 -0.536 0.898 -0.302 -1.079 -1.315 1.767 红葡萄酒 样品 10 11 12 13 14 15 16 17 18 实际质量 -0.431 -2.241 -0.557

32、 -0.431 0.524 -1.21 -0.155 1.002 -1.286 预测质量 -0.033 -2.53 -0.782 0.137 0.211 -0.932 0.051 0.323 -1.012 红葡萄酒 样品 19 20 21 22 23 24 25 26 27 实际质量 0.524 1.329 0.424 0.273 1.655 0.248 -0.582 0.373 0.248 预测质量 0.379 0.592 0.133 0.451 1.563 0.502 -0.38 0.1 -0.184 图 8 回归方程所得红葡萄酒质量的预测值与实际值比较 4. 各理化指标对白葡萄酒质量的影

33、响 同理,得到各理化指标对白葡萄酒质量(w2)的多项式回归方程: * 8 * 6 * 4 * 7 * 6 * 3 * 8 * 7 * 3 * 4 * 4 * 42 411. 0717. 0558. 0313. 0694. 0347. 0 xxxxxxxxxxxxe 其中8 , 2 , 1 * ixi表示相关分析后留下的与白葡萄酒质量相关性较大的理 化指标,分别为白酿酒葡萄的理化指标中的酒石酸、总糖、可溶性固形物、可滴 定酸、干物质含量、果穗质量、果皮颜色 l*、果皮颜色 b*。 该多项式回归方程同样通过显著性检验,可见,酿酒葡萄和葡萄酒的理化指 标与葡萄酒质量之间的关系极显著。 5.4.2 酿

34、酒葡萄和葡萄酒的理化指标及芳香物质对葡萄酒质量的影响 题目给出的附件 3 中没有显示数据的地方表示仪器没有检测到样品该成 分,则在计算时将其没有显示数据的地方做补零处理。 根据 5.4.1 中数据处理的方法,得到芳香物质对葡萄酒质量的多项式回归 方程: 938. 0754. 0207. 0220. 0400. 0494. 0147. 0 * 6 * 2 * 17 * 16 * 5 * 41 ruuuuuue 779. 0064. 0231. 0840. 8051. 2 * 5 * 3 * 10 * 10 * 82 ruuuuue 其中,)19, 2 , 1( * iui 表示与红葡萄酒质量相关

35、较大的理化指标和芳香物 质,分别是红酿酒葡萄中的蛋白质、dpph自由基、总酚、葡萄总黄酮、ph值、果 皮颜色a*,红葡萄酒中的酒总黄酮、白藜芦醇、dpph半抑制体积,和芳香物质红 酿酒葡萄中的乙酸乙酯、柠檬烯、2-乙基-1-己醇、辛酸丙酯、3,7-二甲基-1,6- 辛二烯-3-醇、 辛酸3-甲基丁酯、 丁二酸二乙酯及红葡萄酒中的-蒎烯、 (z)-3,7- 二甲基-2,6-辛二烯醛、 (e)-3,7-二甲基-2,6-辛二烯-1-醇。 )10, 2 , 1( * iui 表示与白葡萄酒质量相关较大的理化指标和芳香物质,分 别是红酿酒葡萄中的总糖、可溶性固形物、果穗质量、果皮颜色b*,和芳香物质 白

36、酿酒葡萄中的辛酸乙酯、辛酸3-甲基丁酯及白葡萄酒中的乙醛、甲苯、乙酸戊 酯、(e)-2-已烯醛。 根据得到的回归方程预测红葡萄酒的质量,得到的数据与实际质量比较,如 表14 所示。图9,可在直观上说明回归方程式合理的,回归方程均通过系数的 显著性检验。 表 14 回归方程所得红葡萄酒质量的预测值与实际值比较 红葡萄酒 样品 1 2 3 4 5 6 7 8 9 实际质量 -0.607 0.876 1.027 0.172 0.398 -1.06 -1.311 -1.135 1.932 预测质量 -0.418 -0.094 0.438 1.069 -0.593 -0.279 0.013 0.014

37、0.75 红葡萄酒 样品 10 11 12 13 14 15 16 17 18 实际质量 -0.431 -2.241 -0.557 -0.431 0.524 -1.21 -0.155 1.002 -1.286 预测质量 -0.264 0.326 -0.272 -0.461 0.684 0.681 -0.437 -0.356 0.043 红葡萄酒 样品 19 20 21 22 23 24 25 26 27 实际质量 0.524 1.329 0.424 0.273 1.655 0.248 -0.582 0.373 0.248 预测质量 0.818 1.814 -0.272 -0.461 4.53

38、-0.325 -0.312 -0.223 -0.329 图9 各理化指标和芳香物质对红葡萄酒样品的影响 5.4.3 结论 酿酒葡萄和葡萄酒的理化指标对葡萄酒质量存在着显著的影响, 但不能说可 以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量, 因为葡萄酒的质量还与酒中 所含芳香物质有显著关系,应当将三者结合起来,来评价葡萄酒的质量。 六、模型评价与推广 6.1 模型优点 本文巧妙的采用了相关性分析,主成分分析,多项式回归等方法,将定量分 析和定性分析相结合。先把复杂的数据进行降维,使得复杂的数据处理简单化, 大大的减少了工作量, 然后对处理后的数据进行检验从而保证了降维后的数据的 准确性,这既减少

39、了运算量,还保证了所得结论的可信度。 6.2 模型的缺点 全文主要采用统计方法解决问题,显得方法较为单一。在数据处理过程中, 因题中所提供的数据有缺失或错误,虽然填补上了缺失数据或改正数据,但是其 仍会对结论造成一定的影响。 6.3 模型推广 本文主要研究评酒员对葡萄酒质量的评价与酿酒葡萄、 葡萄酒和酿酒葡萄的 理化指标之间的联系,运用了多种统计方法较好地解决了题中的问题,因此这些 模型也可以尝试在食品的质量分析,污染程度分析,空气质量分析等众多领域中 应用,解决更多的现实问题,为人们的生活提供便利。 参考文献 1 梁彦冰,崔雪松,spss15.0 统计分析与实践应用宝典,北京:中国铁道出 版

40、社,2010. 2 徐向宏,何明珠,试验设计与 design-expert spss 应用,北京:科学出版 社,2010. 3 王惠文,王劫,黄海军,主成分回归的建模策略研究,北京航空航天大学学 报,34(6):662-664,2008. 4 李静萍,谢邦昌,多元统计分析方法与应用,北京:中国人民大学出版社, 2008. 5 何晓群,刘文卿,应用回归分析,北京:中国人民大学出版社,2001. 6 于秀林,任雪松多元统计分析,北京:中国统计出版社,2002. 7 叶双峰 关于主成分分析做综合评价的改进, 数理统计与管理, 20(2): 52-61, 2001. 8 李华,葡萄酒品尝学,北京:科学

41、出版社,2006. 9 姜启源, 谢金星, 叶俊, 数学模型 (第三版) , 北京: 高等教育出版社, 2003. 10 程依明,概率论与数理统计教程,北京:高等教育出版社,2004. 11 iefrank, bruce rkowalskiprediction of wine quality and geographic origin from chemical measurements by parital least-squares regression modelingj,analytica chimica acta,1 984, 8(162):241-251. 12 meilgaard

42、 m , civille cv , car bt sensory evaluation techniquesm2ed new york:crc press,inc,1991,53-57. 附录 1 第一组红葡萄酒样品的质量 品酒员 酒样号 1 2 3 4 5 6 7 8 9 10 1 51 66 49 54 77 61 72 61 74 62 2 71 81 86 74 91 80 83 79 85 73 3 80 85 89 76 69 89 73 83 84 76 4 52 64 65 66 58 82 76 63 83 77 5 74 74 72 62 84 63 68 84 81 71

43、 6 72 69 71 61 82 69 69 64 81 84 7 63 70 76 64 59 84 72 59 84 84 8 64 76 65 65 76 72 69 85 75 76 9 77 78 76 82 85 90 76 92 80 79 10 67 82 83 68 75 73 75 68 76 75 11 73 60 72 63 63 71 70 66 90 73 12 54 42 40 55 53 60 47 61 58 69 13 69 84 79 59 73 77 77 76 75 77 14 70 77 70 70 80 59 76 76 76 76 15 69

44、50 50 58 51 50 56 60 67 76 16 72 80 80 71 69 71 80 74 78 74 17 70 79 91 68 97 82 69 80 81 76 18 63 65 49 55 52 57 62 58 70 68 19 76 84 84 66 68 87 80 78 82 81 20 78 84 76 68 82 79 76 76 86 81 21 73 90 96 71 69 60 79 73 86 74 22 73 83 72 68 93 72 75 77 79 80 23 83 85 86 80 95 93 81 91 84 78 24 70 85

45、90 68 90 84 70 75 78 70 25 60 78 81 62 70 67 64 62 81 67 26 73 80 71 61 78 71 72 76 79 77 27 70 77 63 64 80 76 73 67 85 75 第二组红葡萄酒样品的质量 第一组白葡萄酒样品的质量 品酒员 酒样号 1 2 3 4 5 6 7 8 9 10 1 68 71 80 52 53 76 71 73 70 67 2 75 76 76 71 68 74 83 73 73 71 3 82 69 80 78 63 75 72 77 74 76 4 75 79 73 72 60 77 73 73

46、60 70 5 66 68 77 75 76 73 72 72 74 68 6 65 67 75 61 58 66 70 67 67 67 7 68 65 68 65 47 70 57 74 72 67 8 71 70 78 51 62 69 73 59 68 59 9 81 83 85 76 69 80 83 77 75 73 10 67 73 82 62 63 66 66 72 65 72 11 64 61 67 62 50 66 64 51 67 64 12 67 68 75 58 63 73 67 72 69 71 13 74 64 68 65 70 67 70 76 69 65 14

47、 71 71 78 64 67 76 74 80 73 72 15 62 60 73 54 59 71 71 70 68 69 16 71 65 78 70 64 73 66 75 68 69 17 72 73 75 74 75 77 79 76 76 68 18 67 65 80 55 62 64 62 74 60 65 19 72 65 82 61 64 81 76 80 74 71 20 80 75 80 66 70 84 79 83 71 70 21 80 72 75 72 62 77 63 70 73 78 22 77 79 75 62 68 69 73 71 69 73 23 79

48、 77 80 83 67 79 80 71 81 74 24 66 69 72 73 73 68 72 76 76 70 25 68 68 84 62 60 66 69 73 66 66 26 68 67 83 64 73 74 77 78 63 73 27 71 64 72 71 69 71 82 73 73 69 27 品酒员 酒样号 1 2 3 4 5 6 7 8 9 10 1 85 80 88 61 76 93 83 80 95 79 2 78 47 86 54 79 91 85 68 73 81 3 85 67 89 75 78 75 66 79 90 79 4 75 77 80 6

49、5 77 83 88 78 85 86 5 84 47 77 60 79 62 74 74 79 74 6 61 45 83 65 78 56 80 67 65 84 7 84 81 83 66 74 80 80 68 77 82 8 75 46 81 54 81 59 73 77 85 83 9 79 69 81 60 70 55 73 81 76 85 10 75 42 86 60 87 75 83 73 91 71 11 79 46 85 60 74 71 86 62 88 72 12 64 42 75 52 67 62 77 56 68 70 13 82 42 83 49 66 65

50、76 62 65 69 14 78 48 84 67 79 64 78 68 81 73 15 74 48 87 71 81 61 79 67 74 82 16 69 49 86 65 70 91 87 62 84 77 17 81 54 90 70 78 71 87 74 92 91 18 86 44 83 71 72 71 85 64 74 81 19 75 66 83 68 73 64 80 63 73 77 20 80 68 82 71 83 81 84 62 87 80 21 84 49 85 59 76 86 83 70 88 84 22 65 48 90 58 72 77 76

51、70 80 74 23 71 66 80 69 80 82 78 71 87 75 24 82 56 79 73 67 59 68 78 86 85 25 86 80 82 69 74 67 77 78 77 81 26 75 66 82 75 93 91 81 76 90 84 27 58 40 79 67 59 55 66 74 73 77 28 66 75 89 69 88 87 85 76 88 90 第二组白葡萄酒样品的质量 品酒员 酒样号 1 2 3 4 5 6 7 8 9 10 1 84 78 82 75 79 84 81 69 75 72 2 79 76 77 85 77 79

52、 80 59 76 70 3 85 74 71 87 79 79 80 45 83 73 4 84 78 74 83 69 82 84 66 77 72 5 83 79 79 80 77 87 82 73 84 91 6 83 75 74 69 75 77 80 67 77 78 7 78 79 74 69 69 82 80 61 72 78 8 74 78 74 67 73 77 79 66 73 62 9 77 78 89 88 84 89 85 54 79 81 10 86 77 77 82 81 87 84 61 73 90 11 79 83 78 63 60 73 81 61 60

53、76 12 73 81 73 79 67 79 80 44 64 84 13 68 78 79 81 78 72 75 62 65 81 14 75 77 76 76 78 82 79 68 78 82 15 83 77 88 80 84 83 80 63 76 70 16 68 63 75 60 67 86 67 71 52 64 17 77 69 79 83 79 87 88 75 78 88 18 75 83 82 79 74 84 78 71 74 67 19 76 75 78 70 81 80 83 66 78 77 20 86 74 75 78 85 81 78 61 73 75

54、21 81 80 79 85 83 76 80 58 85 85 22 80 76 82 88 75 89 80 66 72 86 23 74 80 80 80 74 79 75 73 83 76 24 67 80 77 77 79 78 83 65 72 83 25 79 76 79 86 83 88 83 52 85 84 26 80 72 75 83 71 83 83 53 62 81 27 72 79 84 79 76 83 77 63 79 78 28 75 82 81 81 78 84 79 71 76 89 附录 2 第一组评酒员对每种白葡萄酒样品评分的平均值 酒样品 1 2 3

55、 4 5 6 7 平均得分 82 74.2 85.3 79.4 71 68.4 77.5 酒样品 8 9 10 11 12 13 14 平均得分 71.4 72.9 74.3 72.3 63.3 65.9 72 酒样品 15 16 17 18 19 20 21 平均得分 72.4 74 78.8 73.1 72.2 77.8 76.4 酒样品 22 23 24 25 26 27 28 平均得分 71 75.9 73.3 77.1 81.3 64.8 81.3 第二组评酒员对每种白葡萄酒样品评分的平均值 酒样品 1 2 3 4 5 6 7 平均得分 77.9 75.8 75.6 76.9 81.

56、5 75.5 74.2 酒样品 8 9 10 11 12 13 14 平均得分 72.3 80.4 79.8 71.4 72.4 73.9 77.1 酒样品 15 16 17 18 19 20 21 平均得分 78.4 67.3 80.3 76.7 76.4 76.6 79.2 酒样品 22 23 24 25 26 27 28 平均得分 79.4 77.4 76.1 79.5 74.3 77 79.6 附录 3 两组评论员对白葡萄酒样品评分均值的秩检验表 品酒分数 mann whitneyu统计量 239.000 wilcoxon w 617.000 z -2.172 渐近分布双侧检验 0.0

57、30 双侧精确检验 0.029 单侧精确检验 0.015 intpo probability 0.000 30 附录 4 白酿酒葡萄样品评价因子的特征根和累计贡献率 附录 5 红酿酒葡萄的理化指标的特征向量矩阵 t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 氨基酸 总量 0.1 1 -0. 04 0.1 6 0.1 8 0.1 9 -0. 09 0.1 7 -0. 09 0.0 2 0.0 4 -0. 04 -0. 19 天门冬 氨酸 0.0 8 0.1 6 0.1 0.1 1 -0. 08 0.1 9 0.2 0.1 3 -0. 01 0.1 1 -0. 19 -0. 1 苏氨酸 0.1 4 0.0 5 0.0 7 0.1 1 -0. 28 -0. 14 -0. 04 -0. 06 -0. 11 0.1 8 0.0 3 -0. 12 丝氨酸 -0. 05 0.1 6 0.0 6 0.2 4 -0. 01 -0. 05 0.1 3 -0. 16 0.0 5 0.0 4 -0. 08 0.0 5 谷氨酸 -0. 01 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论