




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
_1葡萄酒质量评价模型的探究赵田阳(安徽师范大学数学计算机科学学院,安徽省芜湖市,241003)关键词:单因素方差分析;F 检验;多元回归分析法;典型相关性分析;灰色相关度分析摘 要:葡萄酒的 质量一般通过评酒员品尝后对其分类指标打分求得,不同组评酒员评价结果有所区别。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和 酿酒葡萄检测的理化指标也会在一定程度上反映葡萄酒和葡萄的质量。本文首先采用 单因素方差分析法进行显著性差异检验和 F 检验,分析多 组评价结果的可信度,获 取最佳可信度的数据,在此基础上通过建立多元回 归分析模型,对酿酒葡萄的等级进行划分;然后采用典型相关分析方法建立酿酒葡萄和葡萄酒理化指标间的数学模型,并分析二者间的联系;最后通过灰色系统关系分析法,分析酿 酒葡萄及葡萄酒的理化指标对葡萄酒质量的影响。中图分类号:O29 文献标识码:A 文章编号:1001-2435 (2007) xx-xxxx-xxThe Exploration of Wine Quality Evaluation ModelZHAO Tian-yang(School of Mathematics and Computer Science Anhui Normal University , Wuhu Anhui, 241003, China)Key words: One-way ANOVA, F Test, multiple regression analysis, canonical correlation analysis, grey related degree analysisAbstract:Wine quality is generally measured by the scores of classifying index after judges tasted the wine. Different judges have different evaluation results. Wine quality has a direct relation with the wine grapes. Physical-chemical indexes of the wine and the wine grapes can reflect their quality to some extends. The paper firstly uses one-way ANOVA to detect its significant difference and analyze the reliability of different groups to obtain a group of data that is more reliable. On these basis, establishing the multiple regression analysis model to divide the wine grapes into different level. Then, using canonical correlation analysis to build a mathematical model that indicates the relation between wine grapes and wine. Finally, studying the affection of the physical-chemical indexes to the wine quality by grey related degree analysis.1 引言 11.1 问题背景近年来,葡萄酒逐渐为广大老百姓所喜爱,喝葡萄酒、品葡萄酒也渐渐被认为是有品位的、高雅的象征。然而,真正懂得辨别葡萄酒的质量却不是件容易的事。一般来说,鉴定葡萄酒的质量是通过聘请一批资深的评酒员进行品评,每个评酒员1收稿日期:基金项目:项目(编号)作者简介: 赵田阳(1993 年生) ,女,计算机科学与技术在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。另外,葡萄酒的质量与原料即酿酒葡萄有直接的关系。再者,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。本文数据来源于 2012 年全国大学生数学建模竞赛 A 题。1.2 现有研究现状及本文贡献2006 年的修订版葡萄酒国家标准中,主要提及了葡萄酒的分类方法以及检测标_2准,对于葡萄酒的品级也做了大致区分,但从实际的执行效果来看依然存在较多问题,对于葡萄酒级别的划分也偏主观,难以形成有效的实际指导作用。国外对葡萄酒质量评价的研究成果比较丰富,其中 Cortez 用支持向量机制建立了葡萄酒质量分类模型,分级效果较好;Moreno 基于红酒的矿物质元素含量,用概率神经网络成功将 54 个样本分为两类 1。国内对葡萄酒质量评价的研究多集中在统计学方法分析和专家的感官评价,文献5采用 SPSS 分析软件对 40 个样本进行了聚类分析,文献4 采用置信区间法分析酒样间的客观差异。本文运用了单因素方差分析和 F 检验分析了评酒员评价结果的可信程度,运用多元回归分析建立了葡萄酒质量评价模型,划分葡萄酒的分类等级,最后还运用典型相关分析和灰色系统关系分析法,研究酿酒葡萄和葡萄酒理化指标间的联系,验证了葡萄酒评价模型的合理性,能够起到好的分类效果。1.3 符号说明表 1 符号说明表Table1 Symbol Explanations符号 解释 符号 解释H0 原假设 VBH1 备择假设 2s组间均方差 2 总体方差 VW 组内方差 均值 aij 因子载荷S2 样本方差 Fj X 的公因子F 检验统计量h2 的共同度 显著性水平)1(i典型相关系数F(m,n) F 分布 矩阵特征根 权重系数2 评价结果差异性及可行性分析2.1 问题分析采用单因素方差分析法,对两组评酒员的评价结果进行显著性差异分析。利用F 检验法求出第一、二小组对红、白葡萄酒评价结果的拒绝域和接受域,根据接受域的长度确定可信度较大的小组。2.2 模型建立及求解结果2.2.1 显著性检验 (1)单因素方差分析的模型首先在单因素试验结果的基础上,求出总方差 V、组内方差 、组间方差 。vwBV= 2ij-xwiji2Bib-其中,总方差衡量的是所有观测值对总均值 的偏离程度,反映了抽样随xij机误差的大小,组内方差衡量的是所有观测值 对组均值 的偏离程度,而组间方ijx差则衡量的是组均值 对总均值 的偏离ix程度,反映系统的误差。在此基础上,还可以得到组间均方差和组内均方差 :2 Bs2 w Ba-1v2 wb在方差相等的假定下,要检验 n 个总体的均值是否相等,须首先给定原假设和备择假设 。H01: = =2n:均值不完全不相等1则可以应用 F 统计量进行方差检验:_3F= =2BBwWa-1bvs该统计量服从分子自由度 a-1,分母自由度为 ab-a 的 F 分布。给定显著性水平a,如果根据样本计算出的 F 统计量的值小于等于临界值 ,则说明原假a-1, b设 不成立,总体均值不完全相等,差异H0并非仅由随机因素引起 3。对单因素方差分析的显著性检验可以通过分析 Prob 值(即P 值)来判断。通过 MATLAB 方差分析函数分析数据得出两小组对 27 种红葡萄酒和白葡萄酒的方差分析表(如表 2、表 3 所示)及箱型图(如图 1、图 2 所示) 。表 2 第一组评酒员对红葡萄酒的评价结果方差分析表Table2 The Anova Table of Red Wine Evaluation Result of the First Team差异来源 SS df MS F ProbF3组间: 87.15 1 87.1474 2.5 0.12误差: 1813.2 52 34.8692 总和: 1900.35 53图 1 第一组分析结果箱形图Fig1 Box-plot of the First Group表 3 第二组评酒员对白葡萄酒的评价结果方差分析表Table3 The Anova Table of Red Wine Evaluation Result of the Second Team差异来源 SS df MS F ProbF3组间: 80.42 1 80.4224 4.49 0.039误差: 932.35 52 17.9298 总和: 17.9298 图 2 第二组分析结果箱形图Fig2 Box-plot of the Second Group其中表 5.3 的 P 值为 P(1)= 0.12,表5.3 的 P 值为 P(2)= 0.039,因为 P(1)0.05,所以两小组评酒员对红葡萄酒的评价结果没有显著性差异;P(2) 22 2122其中 , 分别为第一组和第二组评21 22酒员对红葡萄酒评价结果的样本方差, 。则FF(26 ,26) 取 = 0.05由附录 1 所示表格得出:= 53.9141 , = 15.8244 2 1 22F = 3.0470而 F0.05(26,26) = 1.94 ,则所得的拒绝域 F F0.05(26,26) 即 F 1.94 , 故 F 在拒绝域中,拒绝 。HO即得出结论 1:第一组评和第二组评酒师对红葡萄酒的评价结果中第二组的结果可信度较高。同理对第二小组评酒员对红葡萄酒的评价结果进行 F 检验,得出结论 2:第一组评和第二组评酒师对白葡萄酒的评价结果中第二组的结果可信度较高。_4综上所述:两组评酒师对葡萄酒的评价结果中第二组的结果可信度较高。3 酿酒葡萄分级研究3.1 问题分析研究第二小组评酒师的评分,采用因子分析法将酿酒葡萄的理化指标归为较少类,并以此作为自变量,酿酒葡萄的综合评价为因变量,建立多元线性回归模型,借助 Matlab 软件求得多元回归方程,从而计算出评酒师对 27 种酿酒葡萄的综合评分,最后,设计分段标准来进行酿酒葡萄的最终等级划分。3.2 模型建立及求解结果3.2.1 因子分析法的基本原理采用因子分析法从研究变量内部相关的依赖关系出发,将酿酒葡萄所有的理化指标进行分类,将相关性较高归在同一类,进而将众多的理化指标归为少数的几类。 1.模型原理(1)对变量作因子分析=1 121kFaa=2 2= nknnaa21其矩阵表示为:= +(12)()(12)1ak1n(12)即: X =AF+ 其中 X= TnX),(2112(,)TnA =( ) =ijaF称为 X 的公共因子或潜因子,矩阵FA 称为因子载荷矩阵, 称为 X 的特殊因子。A =( ), 为因子载荷。数学上可以ijaij证明,因子载荷 就是第 i 变量与第 j 因ij子的相关系数,反映了第 i 变量在第 j 因子上的重要性 3。2.相关概念解释(1)因子载荷称为因子载荷(实际上是权数) 。ija因子载荷的统计意义:就是第 i 个变量与第 j 个公共因子的相关系数,即变量 依 赖于 的份量(比重) 。 (2)变量共同度变量 的共同度因子载荷阵 A 中第 i行元素的平方和,即:= , 2=12 ija),(n为了说明它的统计学意义,对下式两边同时求方差,即= iikii aFa21),(n= + + +() 2(1)i2()ik() = + +2+2+1ia22ik2= +22由于 已经标准化了,所以有: + =1 223.因子旋转 建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义。求出主因子解后,如果各个主因子的典型代表变量不很突出,还需要进行因子_5旋转,通过适当的旋转得到比较满意的主因子。 4.因子得分因子得分简单地说就是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。这时需要将公共因子用变量的线性组合来表示,也即由酿酒葡萄的各项理化指标值来估计它的因子得分。 5.求解过程根据上述原理和 SPSS 软件中的因子分析法得出理化指标旋转成分矩阵及红葡萄酒因子碎石图(如图 3 所示)分析,重新归类的结果如表 4 所示。图 3 红葡萄因子碎石图Fig3 Factor Analysis Image of Red Grapes表 4 酿酒红葡萄的理化指标归类Table4 The Classification of the Red Grapes Physical-chemical Indexes 种类 理化指标第 1 类 葡萄总黄酮、总酚、DPPH 自由基、单宁、花色苷、出汁率、蛋白质第 2 类 总糖、干物质含量、可溶性固形物、还原糖第 3 类 苹果酸、多酚氧化酶活力、褐变度第 4 类 果皮颜色 a*、果皮颜色 b*、白藜芦醇第 5 类 果皮质量、果穗质量、百粒质量第 6 类 可滴定酸、固酸比、PH 值第 7 类 酒石酸、柠檬酸第 8 类 VC 含量、黄酮醇5.2.2 多元线性回归分析以因子分析得到的 8 类理化指标 为自 变量第二组评酒师对 27 种葡萄酒的评价结果为因变量。= + (1.1) 8 =1 ,( =1,2, 27)其中 ,, , 为比重系数, 是不可8测的随机误差,且假定 。),( 20N根据上述 8 类酿酒葡萄理化指标数据和 27种葡萄酒的质量的数据有如下方程组:278,2,71,27, 18211xxY (1.2)其中 相互独立且都服从271,.),0(2N式(1.2)又可表示成矩阵形式: (1.3)XY这里, , Ty),(271,82, ,T),(71),0(2nIN为 阶单位矩阵.nI 8,272,71, , 8121xxX 为 27 阶矩阵 称为资料矩阵或设计9矩阵,并假设它是列满秩的,即 )(Xrank由模型(1.2)以及多元正态分布的性质可知, 仍服从 27 维正态分布,它的期Y望向量为 ,方差和协方差阵为 ,即nI2),(2nnIXN_6然后再利用 MATLAB 软件和已知数据来进行多组试验,将 的值尽量271,控制到最小,并得出相对稳定的权重系数:= =*T),(87654321T01.07.299令 ,其中 ,*YXbyY),(27= ,*T,(87654321,jix,( =1,2, 27,=1,2, 8)得到了第二组评酒员对红葡萄酒质量的总评分,即: TY)0932.6,875410.,3128.75,4906621,980,72.4(做如表 5 的等级划分:表 5 红葡萄等级划分表Table5 The Table of the Grading of Red Grapes 百分制得分 质量等级80 以上 17580 270-75 365-70 460-65 555-60 655 以下 7于是对红葡萄酒而言这 27 种酿酒葡萄的等级如表 6 所示。表 6 红葡萄等级归类表Table6 The Table of the Rank Classification of Red Grapes等级 酿酒葡萄号1 32 1、5、9、17、24、263 2、12、23、204 7、4、11、13、22、14、8、19、18、6、215 27、15、166 10、257 无用同样的方法对第二组评酒师白葡萄酒的评价结果进行重新归类,碎石图如图4 所示。图 4 白葡萄因子碎石图Fig4 Factor Analysis Image of White Grapes相应的得到相对稳定的权重系数: = =*T),( 10987654321 T(0.75,.8,0.,.2,.537,46-4)得到第二组评酒员对红葡萄酒质量的总评分: TY)8904.162,73159.2,43 ,75067628538.16920,.13952(*根据 的数值制定出相应的等级标准如表*Y7 所示。表 7 白葡萄等级划分表Table7 The Table of the Grading of White Grapes百分制得分 质量等级200 以上 1180-200 2_7160-180 3140-160 4120-140 50-120 6100 以下 7于是对红葡萄酒而言这 27 种酿酒葡萄的等级如表 8 所示。表 8 白葡萄等级归类表Table8 The Table of the Rank Classification of White Grapes等级 酿酒葡萄号1 32 无3 284 24、55 6、15、20、25、26、276 2、4、7、9、10、11、12、14、17、18、21、237 1、8、13、16、19、4 酿酒葡萄与葡萄酒理化指标分析4.1 问题分析先对酿酒葡萄的理化指标进行因子分析,得到精简的 8 类理化指标,将其和葡萄酒的 9 类理化指标进行典型相关分析,通过 SPSS 软件得出它们的相关关系,进而可以推出酿酒葡萄和葡萄酒的理化指标之间的相关关系。4.2 模型建立及求解结果4.2.1 典型相关分析的基本原理和模型首先,我们要在这两组变量即理化指标中找出一个线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取线性相关系数仅次于第一对线性相关系数且与之不相关的第二对线性组合,这样一被提取直进行下去,直到两组的变量的相关性完毕为止。所选的这些 线性组合对称为典型变量,其相关系数被称为典型相关系数(用于度量两组线性变量之间联系的强度)6。设 , ),(1(8)1(2)1XX,分别表示题)(9)()2(1)2( 目中两组随机变量即酿酒葡萄和葡萄酒的理化指标,设有综合变量 、 ,使得存iUiV在线性组合:)1(8)1(2)1( XaXaUiiii )2()()2(1bbViiii 令 )(ii )(1Vii为确保变量的唯一性,假设 ,)(Xai满 = =1,)2(1Xbi足 () )1(i() )2(1bi在此条件下若存在 , 使得)(和 的相关系数达到最大,)1(ai )2(1i则称 、 是 、 的)(1Xi )(bi)1(X)2(典型相关系数。同样的方法我们可以求出第二对、第三对典型相关变量,这些典型相关变量反映了 、 的典型相关)1()2(情况。4.2.2 典型相关分析的求解1.令T=1)98(X(1)(2)T(1)1 (1)2 (1)8 (2)1 (2)2 (2)8=( ) ,8811891298219922= ,1 ( )1X_8= ,2 ( )2X= = 1 ( ,)1)(212.计算两个矩阵 A 和 B1212其中 为 88 矩阵, 为 99 矩阵。可以证明 )()(randr3.计算矩阵 、 的非零特征根AB, 为221n )()2(1,r对应的 的特征向量,21,r为 对应的 的)()(1,rb B221,r特征向量。则最大特征向量特征根 对应的特征向量 ,),(1(8)(21)aa即第一对典型相关,()(9)(21)bb系数,故有: )1(8)1(2)1(1 XaXaU)2()()2( bbV令 )1(1 )(1Vi以此类推可以得到其他对典型性相关系数。经过以上的分析,仅对红葡萄和红葡萄酒的理化指标用 SPSS 软件中典型相关性分析的得到典型性相关方程: 1=0.45510.6152+0.11730.115141 =0.05910.4812+0.64830.78740.1715+0.7566+1.0257+0.54588+0.03892 =0.61311.5712+1.5173+0.37140.21250.28960.5707+0.0810.9289其中 表示酿酒葡萄的理化指标,821,x表示葡萄酒的理化指标。9,y经过分析和数据输入可知对白葡萄及白葡萄酒进行相似的分析后,所得结论不变。5 理化指标对葡萄酒质量影响的分析5.1 问题分析采用灰色系统关联度分析法,以葡萄酒的质量为母序列,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,再以所得结果为标准,论证用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的合理性。5.2 模型建立及求解结果5.2.1 原理和方法灰色关联度分析一般包括下列计算和步骤:(1) 原始数据变换; (2) 计算关联系数;(3) 求关联度;(3) 排关联序;(4) 列关联矩阵。 8设有 m 个原始数据序列: nmnxx 212112n 为各序列数据的个数,另有母序列: (01020)计算关联系数公式:0=()+()0()+()其中 表示 k 时刻两比较序列的绝0()对差,即 0i (k)=x0 (k)xi (k) (1 im);max 和 min 分别表示所有比较序列各个时刻绝对差中的最大值与最小值。因比较序列相交,故一般取 min 0; 为分辨系_9数,(0, 1),一般情况下可取 0.10.5。求关联度公式:r i N k0 1 L kiN10 ( )不难理解,关联度与下列因素有关:1)母序列 X0 不同,则关联度不同;2)子序列 Xi 不同,则关联度不同;3)参考点 0 (或数据变换)不同,关联度不同;4)数据序列长度 N 不同,关联度不同;5)分辨系数 不同,关联度不同。 95.2.2 模型求解以 27 组葡萄质量向量为母序列,将 27 组红葡萄和红葡萄酒的理化指标以及 28种白葡萄和白葡萄酒的理化指标数据,通过 Matlab 软件计算分别得到这四组数据与母序列的关联度向量,将各组所得关联度分量值按升序排列并以时间为横坐标绘制图形,通过观察曲线的同步变化程度来衡量红葡萄与红葡萄酒、白葡萄与白葡萄酒之间关联度。比较红葡萄与红葡萄酒的理化指标关联系数图像的走势发现,二者的发展趋势大致相同,成正相关;比较白葡萄与白葡萄酒的理化指标关联系数图像的走势发现,二者相走势相反,成负相关,因此对于红葡萄而言,葡萄和酒的理化指标对酒质量的影响相同,而白葡萄与之相反。图 5 红葡萄关联系数Fig5 Correlative Coefficients of Red Grapes图 6 红葡萄酒关联系数Fig6 Correlative Coefficients of Red Wine图 7 白葡萄关联系数Fig7 Correlative Coefficients of White Grapes图 8 白葡萄酒关联系数Fig8 Correlative Coefficients of White Wine再论证用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的合理性:由上述结论知,葡萄与酒的理化指标都能够与酒的质量建立关系,红葡萄及红葡萄酒的理化指标与酒的质量成正相关;由文献5分析知,白葡萄及白葡萄酒的理化指标与酒的质量成负相关,因此能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。6 模型评价6.1 单因素方差分析模型评价采用单因素方差分析方法分析两组评酒员评分之间的差异,避免了只比较平均_10值的误区,与 Z 检验、T 检验相比又提高了效率。这种方法适合于所有的主观评价项目。然而,单因素方差分析法也存在局限性,这种局限性不是方法本身造成的,而是平均值这个概念造成的。当样本数据误差较大且数据不对称时,用平均值来衡量样本数据时不准确的,此时,可以用中位数、众数等代替。6.2 多元回归分析模型评价回归分析法在分析多因素模型时简单而又方便,它能够解释变量之间出现多重共线性关系,通过标准的统计方法计算出每个因素的权重,清晰的计量各个因素之间的相关程度与拟合程度的高低,提高预测记过的准确性。然而,对于某些不确定的问题,因子存在多
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑施工特种作业-建筑司索指挥信号工真题库-4
- 山东会考语文题目及答案
- 2023年学业水平合格考试三年分类汇编(真题)-专题一宇宙中的地球04地球的圈层结构
- 2023-2024学年福建省福州市八县(市)协作校高二下学期期末联考数学试题(解析版)
- 2025届湖南省新高考教学教研联盟高三第一次联考语文试题(解析版)
- 2024-2025学年山西省太原市高一上学期期末考试语文试题(解析版)
- 高中数学高一下学期期末考试试卷(含答案)
- 鹅卵石施工工艺
- 债务委托协议合法
- 汽车风窗玻璃清洗液产品质量河南省监督抽查实施细则
- 2025年烟花爆竹经营单位主要负责人模拟考试题及答案
- 租房合同到期交接协议书
- 中国废旧轮胎橡胶粉项目投资计划书
- 子宫内膜异位性疾病护理
- 人工智能芯片研究报告
- 2025贵州中考:历史高频考点
- pc构件吊装安全专项施工方案
- 汽车质量意识培训
- 新疆开放大学2025年春《国家安全教育》形考作业1-4终考作业答案
- 管网工程有限空间内清淤作业检测修复安全专项施工方案
- 成本预算绩效分析实施案例
评论
0/150
提交评论