版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
aaaa酿酒葡萄与葡萄酒理化指标及其质量的分析与评估摘要本文通过运用SPSS首先对两组品酒员对葡萄酒的评价进行了差异显著性分析以及评Cronbach€系数分析对品酒员评价的可信度进行了分析,得到了两组品酒员评价之间存在显著性差异,并且第一组品酒员的评价结果更为可信。接下来我们取第一组评酒员给每个样品酒所给出的总分的平均分表示该样品葡萄酒质量的量化指标进行相关讨论我们通过对葡萄及葡萄酒的理化指标归一化处理,将它们之间的联系现实的更为明显,紧接着我们利用因子分析、主成分分析将决定葡萄酒质量的因素维度较低,从而达到简化模型的目的,并通过分析将各成分因子重新命名,再将命名后的主成分和评论员对葡萄酒的评价作为依据对酿酒葡萄等级评定,并引入层次分析法对评定体系进行改进构想。最后利用MATLAB求解主成分因子与葡萄酒质量之间的函数关系,并用BP人工神经网络进行验证及讨论。最后我们在每一个问题后面进行了深入的反思与总结,得出了一些具体的改进思路及方法,并得出在原有问题上的修正。关键字SPSSMATLABCronbach€系数分析主成分分析层次分析法 BP人工神经网络模型的改进与修正问题重述随着经济的日益发展,人们生活水平的不断提高,葡萄酒的受众随之增加,品酒行业逐渐专业化。品质是现代葡萄酒生产追求的目标之一,针对酒类的质量检测也成为食品行业工作的重中之重。根据已有数据,运用数学建模的方法,对葡萄酒进行评价是一个重要问题。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。从上述相关关系出发,参考相关数据,针对酿酒葡萄与葡萄酒的理化指标和葡萄酒的质量这几个变量,进行分析并建立数学模型,讨论关于葡萄酒的评价问题:特别注意指出模型中的优点和不足之处,并做出改进方向。符号说明符号说明符号说明aj,j第i个品酒员对第j款酒所给的总分K整个品尝的次数S2X总得分的方差S2i所有在第i位品酒师打分的方差Y葡萄酒的单宁X1葡萄酒的总酚X2葡萄酒的黄酮醇S第一组的总平均分L.理化指标向量符号说明S香气指标Ni第i类芳香物质(1WiW8)其他影响因素k香气指标关于芳香物质函数的常系数M测得葡萄酒评分Z葡萄酒标准分值(真实葡萄酒评分)U外观指标V口感指标W整体评价指标*,y代表原来数据群体的因子a香气指标占总分的权重*,*两类新的性质因子外观指标占总分的权重y口感类物质成分因子Y口感指标占总分的权重1y2色泽类物质成分因子5整体评价指标占总分的权重模型建立与求解数据处理3.1.2.数据预处理由于试题中给出的附件酒样品未按照顺序排列,我们首先将数据进行了预处理,每组数据均按照样品号和品酒员号顺序排列,加和得到每一剂量酒样品的总评分数,并求得各项明细指标的平均值;其次将多组同类理化指标取平均值,以便分析讨论,进行模型的建立与求解。3.1.3.数据处理方法数据的预处理和部分图示,采用办公软件MicrosoftExcel2010;数据的归一化处理,采用办公软件MicrosoftExcel2010;数据结果的显著差异分析,采用SPSS19.0;数据结果的信度分析,采用SPSS19.0;数据结果的主成分分析,采用SPSS19.0;数据处理的拟合分析,采用MATLAB2012a3.2.问题1.1:附件1中两组评酒员评价结果的显著性差异分析要比较两组评论员之间是否具有显著性差异,而每组有10个评论员,27或28个葡萄酒样品,由于附件中的数据都是单项给出的,整体可比性不强,所以我们先用EXCEL将数据进行了初步的整理(求出每个品酒员对各样品的总分,以及各个明细样品的平均值),以第一组对红葡萄酒样品一的评价为例,处理结果如表1所示:表1.红葡萄酒样品一的评价项目品酒员12345678910平均值葡萄酒样品1外观分析澄清度544443432433.5色调1088666686666.6香气分析纯正度655545544544.6浓度867767774646.1质量161412121414121412121212.8口感分析纯正度655545644554.8浓度866766866666.3aa持久性8767a67876666.6质量221916191616191916161617.2平衡/整体评价11109109109999109.4总分1008478827579848169757277.9初步分析:针对处理后的数据,我们初步的想法是将每组中各个品酒员对每项样品的总分作为一个样本,因此每个样本里将有270项数据。针对红葡萄酒评价的两组样本,利用SPSS进行一次相互独立样本之间的T检验,探测两个样本是否具有显著性差异。但随后通过查阅统计分析中T检验法的一些特性得到了相反的结论:鉴于本题样本是每十个总分针对一个葡萄酒样本,并不满足独立样本T检验方法的适用范围,每组样本中的数据是有一定关联的,因此我们采用了另外一种检验方法一一配对样本T检验法。二次分析首先,我们对红葡萄酒的评价进行差异性分析(白葡萄酒的处理方法与其一致),将每项葡萄酒样品各项明细评分的平均分作为一个样本(包括总分的平均分),则每个样本里共有11x27=297项数据,两组数据之间都是针对相同的样品和指标进行评价,所以两组中每项数据都是一一配对,互相关联的。其次,我们对两组葡萄酒的全部总分数据共27*10*2=540组,进行综合处理并作图1、图2所示,可以得知两组数据在数值上差异较大,初步判断两组数据具有显著性差异,关于信度分析下文将给出分析讨论。第L"妣卄酒样—的评升垣口品潛员|号■品酒员£号口品泗员3垣口品潛员|号■品酒员£号口品泗员3号口品酒员q号•品泗员£号口品尬员E号■品洒员了号。品酒员R号■拈洒员白号•晶酒员卬号 『冃将品 ■晶洲.员I号■品酒员£号□品洒员3口品酒员*母■品酒员5号■品酒员6■号■晶泡员T号口品酒员,号,晶iff员。号■品酒员1。号再次,我们以两组红葡萄酒样品1再次,我们以两组红葡萄酒样品1为例,对其数据做了归一化处理,利用雷达图表示,如图3所示。加强了上述关于显著性差异的推论。aaaa图3.图3.红葡萄酒样品归一化雷达图表示因此通过以上对数据和检验方法的分析,我们采用配对T检验法对两组样本进行差异显著性分析。基本假设:每组评论员对各项酒的评价分数成正态分布。评论员都具有一定的专业品酒技术,对每种酒的各个指标的评价不会有大的偏差(保证评分的关联度)。模型的建立与求解:将处理后的数据导入到SPSS软件中,针对两组红葡萄酒评价中的各项指标评分的平均值进行配对样本T检验法,设定置信度区间为95,得到结果如下:表2.成对样本统计量均值N标准差均值的标准误对1 红葡萄酒各项平均分113.285629719.397301.12555红葡萄酒各项平均分212.820929718.634121.08126表3.成对样本相关系数N相关系数Sig.对1 红葡萄酒各项平均分1红葡萄酒各项平均分2297.996.000表2为描述性统计表,给出了红葡萄酒的各项平均分的平均值,标准差以及标准误。表3为样本间的配对性的测验结果,可以看到测出的P值(即sig值)等于0V0.001,因此在95%的置信水平上差异显著,即两组红葡萄酒的各项平均分的平均值显著相关,验证了我们之前的推论,因此也符合配对样本T检验的前提条件。表4.成对样本检验成对差分 T df Sig.(双侧)表4.成对样本检验成对差分TdfSig.(双侧)均值标准差均值的标准误差分的95%置信区间下限上限均值标准差均值的标准误差分的95%置信区间下限上限对1 红葡萄酒各项平均分1红葡萄酒各项平均分2.464681.88444.10935.24949.679884.250296.000表4为最终的配对样本T检验结果报表。其中t表示用公式:X-Xt=— 1 2,52,S2-2rSSVn所计算出的值,是最终计算出P值的依据。df为自由度,sig(双侧显著性概率)则为我们所需要的P值。可以看到最终结果是P=0.000<0.001,因此在95%的置信水平上差异显著,所以两组评论员评分无显著性差异的假设不成立,即两组评论员对红酒的评分具有显著性差异。图四为以上结果的综合图形描绘。图4.结果的综合图形描绘对于白葡萄酒的组,利用同样的方法进行差异性分析,在SPSS软件里同样也得到如下结果,如表5、表6、表7所示:表5.成对样本统计量均值N标准差均值的标准误对1 白葡萄酒各项平均分113.501930819.645421.11940白葡萄酒各项平均分213.914930820.210871.15162表6.成对样本相关系数
N相关系数Sig.对1 白葡萄酒各项平均分1白葡萄酒各项平均分2308.996.000表7.成对样本检验成对差分TdfSig.(双侧)均值标准差均值的标准误差分的95%置信区间下限上限对白葡萄酒各项平均分11 白葡萄酒各项平均分2-.412991.93277.11013-.62969-.19628-3.750307.000麝讨憎謁翳豔各坝平均分1-白袖制酒咎呗平均分2图5.白葡萄酒成对样本检验如图5所示,此时P值仍小于0.001,因此两组评论员对白葡萄酒的评价在95%的置信水平上也具有差异显著性,从而可得出结论:无论是针对红葡萄酒还是白葡萄酒,两组评酒员的评价结果都有显著性差异。问题反思:对于该问题,我们将每项葡萄酒评分做了平均化处理,再把处理出来的平均分作为样本,这样每个样本中的数据变成了与每个指标得分情况对应的一元数值,然后用配对样本T检验法对其进行差异显著性分析。通过这种方法处理出来的结果具有一定的科学性与准确性。但是由于数据是进行了平均化处理后的数据,因此模型所反映出的情况不具有完整性,对此我们便有了下面这种改进思路:将每组中10名品酒师对27项样品的评价总分作为一个10x27的矩阵(\Q...a1,27:: (其中气,j第i个品酒员对第j款酒所给的总分)。…a ・..a丿10,27/每个矩阵分别对应该组品酒师的评分具体情况,再用这两组数据构成的矩阵进行多元数据的T检验,如此处理出的结果就应该更具有完整性与可靠性。但由于本组成员所了解的统计学知识还不足以去运用这样多元性的、更为精确的处理手段,因此就将这作为一个以后改进的思路。问题1.2:附件1中两组评酒员评价结果的信度分析我们针对两组中每位品酒师对每种酒所给出的总分得出10x27的矩阵TOC\o"1-5"\h\za a1,27•• • : : 对其中的元素逐行进行可信度分析。…a...d丿10,27 '模型讨论 首先我们根据品酒师打分为主观作用,我们选择评价评分者信度的KendallW协同检验模型,通过SPSS对红白葡萄4组数据进行模拟分析,得到的渐进显著性系数p均小于0.05(等于0.00),协同系数均为0.50左右,无法得出明确的结论。 经过思考,我们发现Kendall模型对于采用等级评定方式评分的情况是可取的,然而当评分者用其他非等级评定的方式(如百分制)评定时,其信度系数是不合适的,因为其信度系数仅能反映评分者之间的相对一致性,并没有考虑评分者之间存在的评分绝对差别,在这种情况下评分者之间的系统误差也看会被成是随机误差,此时计算出的信度系数不能正确反映评分者信度的高低。所以我们选择内部一致性信度分析。问题假设 为简化模型,排除品酒员主观因素和个人偏好不同而造成的影响,我们做出如下假设: 1、 每位品酒员鉴定的同一种葡萄酒特质完全相同。 2、 对于每一种类葡萄酒被任何一品尝相当于对其质量进行一次客观的测试,每一项指标的评价,相当于一道题目的得分。 3、 葡萄酒的特质可以从品酒员的品尝时考虑的方面(即客观测试的一系列“题目”)测量出来。模型的建立及求解对于抽象出来的测试模型,由于每道测试题目表示一个特质指标的评价,所以我们不能采用简单的二分法计分。因而我们选择Cronbach侦系数分析。 S2为总得分的方差;S2为x i S2为总得分的方差;S2为x iK-lS2 是所有在第i位品酒师打分的方差。a!,i 我们先用EXCEL进行数据处理,得到27x10的矩阵:、a1,10 ,以红葡萄酒为例。 表8.第一组红葡萄酒 表8.第一组红葡萄酒[Q…27.1Cronbach'sAlpha基孑标准化项的CronbachsAlpha项改qi7liolCronbachsAlphar基于最訛项的CronbachsAlpha项数| .861|86710aJ27,10 第二组红葡萄酒表9.可靠惟统计量表11所示。表11.表11所示。表11.第二组白葡萄酒CronbachsAlpha是于标准化项的CronbachsAlpha顼數770.rf-3.60110可靠U蜕计垦CronbachsAlpha的CronbathsAlpha项数1 717I10I可靠惟焼计皇 如表8、表9所示,不难看出对于红葡萄酒,第一组标准化CronbachsAlpha较高,即第一组品酒师对红葡萄酒的评价更为可靠。同样地对于白葡萄酒,第一组标准化 CronbachsAlph比匕第二组更高,如表10、 表10.第一组白葡萄酒即第一组更为可信。再对第一组进行进一步讨论,对于第一组十位品酒师对红白葡萄酒的评价的项已删除的Cronbach'sAlpha值(详见附录)进行分析,没有任何一位品酒师对于整体的标准化CronbachsAlpha有明显影响,所以十位品酒师的评价分数也均可信。 综上所述,无论对于红葡萄酒还是白葡萄酒,两组品酒师的评价均存在显著差异,其屮第一组品酒师的评价结果更可信,并且第一组十位品酒师的评价都属于可信范围。 3.4.问题2:根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级3.4.1.问题分析
如果单用葡萄酒为酿酒葡萄打分,则直接在葡萄酒的外观、香气、口感质量权重中赋予权值,所得之和即可作为对酿酒葡萄的评分。而本题却引入了另一类变量,就是葡萄的理化指标。这是一项很庞大杂乱的数据,所以我们想到利用主成分分析法对这些数据进行主要因子分析,找出这些指标的公共因子,求的每一样品在这些因子上的成份得分系数矩阵,给数据降低维度,再以此作为研究酿酒葡萄等级评定的依据。模型建立(以红葡萄为例)首先对数据进行归一化处理,再用SPSS因子分析对处理后的数据进行因子分析。并选择具有Kaiser标准化的正交旋转法进行处理。得到的结果如表12所示:表12.成份矩阵a成份12345678花色苷.852总酚.851单宁.759DPPH自由基.734葡萄总黄酮.704果梗比.585蛋白质.584L-.578黄酮醇.562-.524百粒质量-.542出汁率.533干物质含量.847总糖.792还原糖.777可溶性固形物.758氨基酸总量.559白藜芦醇.812A.724可滴定酸-.599果皮质量-.597.530B.500.590褐变度.618.673多酚氧化酶活力.661苹果酸.639酒石酸果穗质量.610
表12.成份矩阵a成份12345678花色苷.852总酚.851单宁.759DPPH自由基.734葡萄总黄酮.704果梗比.585蛋白质.584L-.578黄酮醇.562-.524百粒质量-.542出汁率.533干物质含量.847总糖.792还原糖.777可溶性固形物.758氨基酸总量.559白藜芦醇.812A.724可滴定酸-.599果皮质量-.597.530B.500.590褐变度.618.673多酚氧化酶活力.661苹果酸.639酒石酸果穗质量.610VC含量-.546固酸比柠檬酸-.571提取方法:主成份。-.546-.571VC含量-.546-.571固酸比柠檬酸提取方法:主成份。a.已提取了8个成份。SPSS经过因子分析和旋转处理后一共得到了8个主成分,但在8个主成分之中,葡萄的理化指标所载负荷主要是分配在前四个成分当中。而观察这四个成分的高负荷指标,成分一中高负荷的指标主要有单宁、酮类酚类物质以及蛋白质等,而这些物质,特别是
单宁,在很大程度上影响到了葡萄酒的口感,因此可将该成分命名为“口感类物质”;
成分二中高负荷的指标有糖类、氨基酸类、VC含量等营养成分类物质的指标,可命名为“营养类物质”;成分三主要有a.b色泽,以及果皮含量指标,可命名为“色泽类物质”;成分四主要有苹果酸,酒石酸等指标,可命名为“酸类物质”。这样通过软件做出的成份得分系数,就可求得对应的因子变量解,如表13所示:表13.成份得分系数矩阵成份12345678氨基酸总量.00,4 .129.17:5 .06') .000.210.05,) .052蛋白质.089.04:.115 .027.04.053.139.140VC含量.039.15!5 .00:! .107 .086.071.212 .11花色苷.115.001 .178.004.002.064 .012.01酒石酸.009.00!5 .16!5 .015 .048 .00) .017.464苹果酸.024.000.319.018 .120.14) .039 .04柠檬酸.076 .06!5 .142.067.022.021.122 .509多酚氧化酶活力.108 .00) .142.106.04褐变度.03) .05L .285.024 .023 .065.006.03DPPH自由基.186.01J .06() .082.096.096.042.06总酚.197.047.04:.00! .022.02.070.11单宁.171.04:.065.047.062.042.22) .074葡萄总黄酮.233.031.07'' .064.075.04:! .046.09白藜芦醇.045.04:.01!) .014.357.157.00:5 .10黄酮醇.04:3 .052.004.130.063.460.053 .020总糖.022.245.04:.020.046.017.125.181还原糖.047 .178.01() .00.01; .009.024.008可溶性固形物.014.234.005.061.018.030.065.14,可滴定酸.033.032.005.051.033.012.39.058固酸比.006 .084.040.015.00,1 .09) .424.08,干物质含量.005.189.023.016.012.016.05) .056果穗质量.029.00:J .00,L .342.044.02i .074.121百粒质量.053.013.01!i .296.065.01i .02!i .07.果梗比.04'9 .06,\ .033.12) .05; .298.02; .03表13.成份得分系数矩阵成份12345678氨基酸总量-.004.129-.173-.069.000.210-.059.052蛋白质.089-.041-.113.027-.041.053.139.140VC含量.039-.155-.002-.107.086.071-.212-.110花色苷.115-.007.178.004.002-.064.012-.014酒石酸.009-.005-.165-.015-.048-.009.017.464苹果酸.024.000.319-.018.120-.140-.039-.043柠檬酸-.076-.065.142.067.022.021-.122.509多酚氧化酶活力-.108.061.229.111-.100.142.106-.040褐变度-.030-.051.285-.024-.023.065.006-.036DPPH自由基.186-.013-.060.082.096.096.042-.065总酚.197.047-.041-.002.022-.021.070-.115单宁.171-.041.065.047.062.042-.220.074葡萄总黄酮.233.031-.077.064.075-.043.046-.095白藜芦醇.045-.041-.019.014.357.157-.003-.103黄酮醇-.043.052.004.130.063.460-.058.020总糖.022.245-.041.020.046.017.125-.180还原糖-.047.178-.010-.001-.016.009.024.008可溶性固形物.014.234.005.061.018.030.065-.144可滴定酸.033.032.005.051.033.012-.391.058固酸比-.006.084.040.015-.004-.090.424-.084干物质含量.005.189.023.016.012.016-.050.056果穗质量.029-.003-.004.342.044-.026.074.121百粒质量.053.013-.015.296.065-.015-.025-.073果梗比-.049-.064.033-.120-.056.298-.026-.036出汁率.199-.014.002-.021.003-.184-.050-.021果皮质量.017.047.057.411.059.172-.098.028L-.118-.006-.034.107.080.192.199-.207B.048.045.065.106.358-.088-.064.082A.007.013.001.052.360.019-.010-.054出汁率.199-.014.002-.021.003-.184-.050-.021果皮质量.017.047.057.411.059.172-.098.028L-.118-.006-.034.107.080.192.199-.207B.048.045.065.106.358-.088-.064.082A.007.013.001.052.360.019-.010-.054提取方法:主成份。旋转法:具有Kaiser标准化的正交旋转法。构成得分。并据此算得每个样品在每类成分上的得分,结果如表14所示:
表14.基于四类主成分负荷f的样本得分表样品口味类物质营养类物质色泽类物质酸类物质1.001.310.173.05-1.012.001.410.300.22-0.793.000.682.21-1.11-0.664.00-0.88-0.23-0.32-0.605.000.43-0.02-0.231.796.000.021.36-0.310.087.00-1.010.540.41-1.318.00-0.35-0.132.940.999.002.78-0.73-0.89-0.7310.000.11-2.66-0.39-0.8211.00-1.060.05-0.13-0.3612.00-0.841.74-0.140.4813.00-0.27-0.76-0.74-0.5714.00-0.38-0.291.220.5215.00-0.18-0.380.240.0816.00-0.31-0.740.17-1.2717.000.530.93-0.252.0618.00-0.840.96-0.04-0.1919.00-0.06-0.14-0.27-0.6920.00-0.40-0.05-0.991.0221.00-0.230.49-1.18-1.3222.00-0.480.750.26-0.9823.002.40-0.09-0.340.9324.000.21-0.07-0.081.1825.00-0.48-1.68-0.610.4226.00-0.86-1.01-0.421.7227.00-1.27-0.52-0.060.04由于要求对葡萄进行评级,因此我们决定用百分制的得分来作为评级的依据,由于时间关系我们对评分的系统只能做一个简单化的处理。现在我们掌握的数据一共有4个主成分因子得分,还有一个葡萄酒质量得分(由于在一问中已经论证了第一组的评论员打分更可信,于是这里葡萄酒质量得分以第一组为标准),所以我们将赋予主成分与葡萄酒所得分数1:1:1:1:6的权重,以此求得酿酒葡萄的最终评分。如此,则每个成份所占分数为10分,评论员评价所占分数为60分。最后的等级评价我们将效仿目前权威的葡萄酒评分系统-美国著名的葡萄酒评论家罗伯特•帕克推崇的是葡萄酒100分制评分体系,帕克的评分系统会给每一款酒一个基础的分数(50分)。在50分的基础上,按酒的质量特点加分,将酒的品质分成四类。而我们也效仿这一模式对酿酒葡萄进行分级,将葡萄分成如下六个等级:96-100Extraordinary顶级:各类指标全面优秀的酿酒葡萄。90-95Outstanding优秀:营养成分饱满,味道纯正的酿酒葡萄。80-89Aboveaverage优良:综合指标尚佳的酿酒葡萄。70-79Average一般:略有瑕疵,尚无大碍的酿葡萄。60-69Belowaverage低于-般:不值得推荐50-59Unacceptable次品根据成份得分系数以及评论员评价数据处理后各样品的酿酒葡萄得分明细以及对应等级如表15所示:表15.酿酒红葡萄得分明细及等级样品口味类物质营养类物质色泽类物质酸类物质瓶酒员评价最总得分等级1.006.355.8210.250.9437.6260.99低于般2.006.616.093.391.5748.1865.84低于般3.004.8210.000.181.9648.2465.19低于般4.000.954.992.082.1441.1651.33次品5.004.185.432.309.2143.9865.11低于般6.003.188.272.124.1543.3261.04低于般7.000.646.583.870.0442.9054.02次品aa8.002.275.20a10.006.8443.3867.68低于般9.0010.003.960.711.7548.9065.32低于般10.003.400.001.931.4944.5251.34次品11.000.515.562.552.8542.0653.53次品12.001.079.052.515.3432.3450.31次品13.002.463.921.062.2244.7654.42次品14.002.184.875.825.4643.8062.13低于般15.002.684.683.444.1535.2250.17次品16.002.363.943.260.1744.9454.68次品17.004.457.382.2510.0047.5871.66一般18.001.067.442.773.3635.9450.57次品19.002.9747.1659.39次品20.002.155.370.476.9447.1662.09低于般21.002.556.480.000.0046.2655.29次品22.001.957.003.491.0146.3259.77次品23.009.055.272.036.6651.3674.37一般24.003.665.332.667.4246.8065.86低于般25.001.952.011.385.1541.5252.02次品26.001.013.391.849.0144.2859.53次品27.000.004.412.714.0443.8054.96次品3.4.3.针对白葡萄的模型建立依照对红葡萄的等级评价,我们也首先对白葡萄进行了主成分分析(结果见附件),同样也将白葡萄指标分成了对应的4个主成分,并求得了样品在每个成分上的得分,最后进行归总评分,得出表16的结果: 表16.酿酒白葡萄得分明细及等级白葡萄口味类物质营养类物质色泽类物质酸类物质瓶酒员评价最总得分等级1.004.205.535.972.8649.2067.76低于般2.005.776.064.388.6944.5269.43低于般3.004.477.896.0210.9751.1880.54优良4.005.3210.005.897.6147.6476.47一般5.007.268.434.546.5242.6069.35低于般6.003.398.127.915.9641.0466.43低于般7.003.727.499.372.6146.5069.70低于般8.000.725.294.509.1342.8462.49低于般9.007.476.76a7.219.6343.7474.81一般10.007.7944.5873.01一般11.000.998.516.3912.6143.3871.89一般12.005.917.457.1210.0037.9868.47低于般13.000.007.878.797.9139.5464.11低于般14.005.138.634.695.2843.2066.92低于般15.002.414.887.555.4643.4463.74低于般16.003.610.005.715.2144.4058.94次品17.002.438.586.359.2747.2873.91一般18.001.677.747.794.5443.8665.59低于般19.005.272.234.8110.7643.3266.40低于般20.006.987.194.774.8646.6870.48一般21.005.498.933.626.9345.8470.81一般22.006.664.498.398.7942.6070.92一般23.006.817.225.538.0445.5473.14一般24.008.517.6410.547.8843.9878.55一般25.007.854.334.958.0746.2671.47一般26.0010.006.487.368.0948.7880.72优良27.005.685.2113.629.4438.8872.83一般28.008.148.256.876.5548.7878.60一般3.4.4.模型的改进申构想我们对于酿酒匍萄的评级把标准主要是建立的数据的归一化以及主成分提取的基础之上,由于时冋关糸,对影响酿酒匍萄等级的给个因素只是进行了一个简单的权重化处理,所以我们对此的改进构想是运用层次分析法将各个因子构建一个多层次,决定权重因素更多,更为复杂的等级评价系统,将€W1 W1、W2…Wn1A„••••••作为各因素的比较矩阵;W=11-)作为权重向量;W1W2 WnWn WnW1 Wn^/利用AW小求得其最大特征向量,并以此作为排序求得最终的权重向量,最后再进行评级处理,这样将使得评定结果更具可靠性。aaaa 3.5.问题3:分析酿酒葡萄与葡萄酒的理化指标之间的联系 先将葡萄酒以及酿酒葡萄的指标整合在一起,总共包括35组指标。经过对数学建模中相关性的研究,得知在SPSS软件中共有三种研究相关性的方法,分别为双变量相 关性分析、偏变量相关性分析以及距离相关性分析。而前两种方法主要是针对两组或三组数据进行关联度测试,而本题中是要求对多项指标进行对比,因此我们先采用距离相关分析法对这35组指标进行初步的关联度探测。 通过SPSS的处理,得到了各指标间的相似性距离,也就是Pearson相关系数。可以看到葡萄酒与酿酒葡萄各项指标之间存在较多Pearson相关较大的组合,比如酒的花色苷与葡萄的花色苷,酒的总酚、酒总黄酮与葡萄的DPPH自由基,酒的单宁与果梗比 ..... 由于具有相似性的指标太多,所以我们抽取几组具有代表性的指标进行更进一步的分析。3.5.1.色 酒的色泽与酿酒葡萄的颜色比较,由于花色苷是影响酒和酒的酿酒葡萄的重要因素,所以酒中花色苷与葡萄中花色苷的理化指标的联系反映了葡萄的颜色对葡萄酒色泽 的影响。于是我们对以上两组理化指标做了一次双因素相关性分析,结果如表17所示:表17.相关性花色苷W花色苷花色苷W Pearson相关性1.923**显著性(双侧).000N2727花色苷 Pearson相关性.923**1显著性(双侧).000N2727**.在.01水平(双侧)上显著相关。 两者在0.01的置信水平上显著相关,且相关系数为0.923,说明酒的花色苷含量跟 葡萄花色苷有很密切的关系,或者说,酒的色泽从很大程度上取决与葡萄的颜色。下面用MATLAB对它们进行二次拟合,处理数据如下:LinearmodelPoly2:f(x)=p1*xA2+p2*x+p3Coefficients(with95%confidencebounds):p1= 0.000412 (-0.002904,0.003728)p2= 2.22 (0.9547,3.485)p3= 22.21 (-63.17,107.6)Goodnessoffit:SSE:2.041e+005R-square:0.8516AdjustedR-square:0.8393RMSE:92.22该拟合结果在95%的置信区间内,准确性较高。最终对应的公式为:y=0.000412x工2+2,22xx+22.21图6.拟合对比图3.5.2.味单宁是决定酒味道的主要理化指标,而在通过上面的处理方法我们得知酒的单宁指标与酿酒葡萄的总酚,总黄酮指标具有很高的相似性,Pearson相关系数分别为0.817、0.684.于是这里我们将研究酒的风味与酿酒葡萄的总酚,总黄酮的关系。用SPSS中多元线性回归分析对酒的单宁,葡萄的单宁、总分以及黄酮醇进行处理,得到结果如表18所示:表18.相关性酒的单宁葡萄总酚黄酮醇Pearson相关性 酒的单宁1.000.817.579葡萄总酚.8171.000.346黄酮醇.579.3461.000Sig.(单侧) 酒的单宁.000.001葡萄总酚.000.039黄酮醇.001.039N 酒的单宁272727葡萄总酚272727黄酮醇272727这里三组数据之间处理后的sig值都为0,它们在置信区间内显著相关,因此对它们做回归拟合的可靠性很高。下面是线性回归分析对这三组数据进行的回归分析,所得系数如表19所示:表19.系数a表19.系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量)1.893.6942.727.012葡萄总酚.307.046.7016.683.000.8811.136黄酮醇.024.008.3363.206.004.8811.136非标准化系数标准系数共线性统计量模型B标准误差试用版tSig.容差VIF1(常量)1.893.6942.727.012葡萄总酚.307.046.7016.683.000.8811.136黄酮醇.024.008.3363.206.004.8811.136因变量:酒的单宁对应的酒的单宁(Y)与葡萄总酚(XI)、黄酮醇(X2)的线性关系式如下:Y€1.893+0.307X1+0.024X2拟合结果与原数据对比图形如下:图7.拟合结果与原数据对比同样对白葡萄中酒的单宁(y)与葡萄总酚(x1)、黄酮醇(x2)进行多元化回归分析,所得结果如表20:表20.系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)1.222.3943.100.005白葡萄总酚.063.066.254.953.350白葡萄总黄酮.81.387a.因变量:白葡萄酒单宁063x1+0.102x2+1.222回归后的残差统计如表21:表21.残差统计量a极小值极大值均值标准偏差N预测值1.55183.07211.8506.3286028残差-.938142.23665.00000.6410628标准预测值-.9093.717.0001.00028I标准残差I-1.408 3.357 .0001 .962I28a.因变量:白葡萄酒单宁3.6.问题4.1:因子分析简化模型寻求函数关系的拟合3.6.1.问题分析从葡萄和葡萄酒的理化指标来看,其成分较为复杂,如果直接对所有理化指标和葡萄酒品质的关系进行分析,其对应关系过于复杂,难以得出结论。为简化模型,我们对其进行如下处理:我们以品酒师信度较高的第一组的总平均分S作为代表每一个样品酒品质的标准。i对于各种理化性质,我们只考虑一级指标,暂时不考虑芳香类物质(后文会提出所求函数关系关于芳香类物质的修正)为减少变量个数,我们通过因子分析、主成分分析及其嵌套将原来与得分S相关联的i理化指标向量L简化为两个可以代表原来数据群体的因子x,yTOC\o"1-5"\h\zi,j ii我们通过Matlab对总平均分S与因子x,y的关系进行三维的拟合,最终得到近似的i ii关系s=S€F(x,y)ii ii3.6.2.数据处理及模型建立:首先,因为影响葡萄酒质量的应该是各理化成分的相对含量,为了结果的准确性,所以我们有必要对所有葡萄酒所得总平均分进行归一化处理。 另一方面为了减小变量向量的维度,我们利用SPSS对红白葡萄理化性质指标进行因子分析分析,所得旋转成分矩阵见附录。对于红葡萄我们得到8个因子即可以看成一个8维的特征向量,对于白葡萄我们的到了9个因子即一个9维的特征向量。虽然对于原来红白葡萄所含的理化性质指标的数量有了显著的减少,但是对于寻求一个与葡萄酒相关的固定的关系依旧存在较大困难。于是我们进行了二次因子分析,将原来的8维向量和9维向量简化为2维,以便拟合出较为准确的函数关系。由于红葡萄与白葡萄各方面类似,为了简洁起见,下面我们一红葡萄及红葡萄酒为例,来分析红葡萄理化性质、红葡萄酒理化性质与红葡萄酒质量的关系。红葡萄的理化性质与红葡萄酒质量的关系首先我们利用SPSS对红葡萄31种一类理化指标进行因子分析(主成分分析),得出8个性质因子,即8种代表性成分。其旋转成分矩阵及成分得分系数矩阵详见附录。通过对其旋转成分矩阵系数分析根据前面问题的分析可将它们命名为口感类物质、营养类物质、色泽类物质、酸类物质等。表22 表23GS转柜帷GS转柜帷b成份12,吹J901体轶.965早宁.933酒总頓狷.918feiSL-.802花色宥em5色洋m758芭洋ts.750白薦点醇.403597'^^8%善霭丄r橱tt正立提旋转在3次送代后收敖*12TEteW.143-.214単宁.175-.029.1&4005.172-.008白禮莒醴.099.366。戶FK丰*中常IJ偉譚且183OSF色再L-.164-,097也洋a-.03S-15?枝溼H.013451淒當.穽?备為『痴題正支族语養毎分*为进一步简化模型,便于得出简洁可靠的结果,我们对于以上8类物质再次进行主成分分析,其旋转成分矩阵,成分得分系数矩阵如表22、表23所示,两类新的性质因子我们将其命名为工,4,MATLABcustomequation进行拟合,求出葡萄酒所得总平均分S1 2 i与工,4关系如图8所示:1 2Svs.xl?Svs.xl?x2|ao-570图8•葡萄酒总平均分S.与气,%关系Generalmodel:f(x,y)=a+b*sin(m*pi*x*y)+c*exp(-(w*y)A2)Coefficients(with95%confidencebounds):a=72.04(68.14,75.93)b=8.093(-5014,5030)c=8.421(-1.642,18.48)m=-0.04297(-27.03,26.95)w=5.886(-9.009,20.78)红葡萄酒的理化性质与红葡萄酒质量的关系相似地,我们首先将葡萄酒理化性质指标进行归一化处理,并用SPSS进行主成分分析,得出了成分因子y,y,旋转成分矩阵和成分得分系数矩阵如表24、表25:1 2表25表24表2512.965.9112.965.918也洋L815曰砌ERE■4Q2,59了優取方f表:普成KE糕法:貝右Kaiser准侣的正立旋轩透*a.碇乐等在3次懣代后岐般*成附彳与分海掀距件戒份I2花色有.14@-.214单亍175-.0291&4005洒邑,E9耳.172--00S.099.366DFFH半卜睥]牛段.i83.057色津1--,1S4-.097色澤a-038452色g013451&r标泄祀的正立KEL 卅. 一根据对齐全旋转成分的分析,y可以命名为口感类物质,y可以命名为类色泽类物质。1 2通过MATLABcustomequation对总平均分S与其成分因子y,y进行拟合,结果如图十:i 1 2图9.图9.总平均分S与其成分因子y,y拟合结果i 1 2Generalmodel:f(x,y)=a+b*sin(m*pi*x*y)+c*exp(-(w*y)A2)Coefficients(with95%confidencebounds):a=-2659(3938e+07,3.938e+07)b=0.9314(-3.979,5.842)c=2732(-3.938e+07,3.938e+07)m=1.694(0.3754,3.012)w=0.01401(-101,101)模型的深度讨论分析首先对比两种模型,经过分析可以得出模型2对于葡萄酒质量的预测能力要强于模型1,其原因可以归为如下几点:葡萄酒的理化指标与葡萄酒质量的关联度要高于葡萄的理化指标与葡萄酒质量的关联度,我们可以从SPSS相关性分析的结果以及相关资料查阅均可以得出。由于葡萄理化指标较多,导致进行了主成分分析的嵌套猜得到成对的因子,然而此时成对的因子已经缺乏现实意义,因而缺乏一定的代表性,导致预测的准确性降低4.模型改进如果为了追求变量考虑的全面性,即葡萄与葡萄酒的理化指标同时考虑,如果我们利用现有的算法,那么就必须在首次得出的8个有关红葡萄的因子与2个有关红葡萄酒的因子进行汇总再次进行因子分析,经试验,如果想得出成对的因子,那么需要连续进行因子分析,然而这样的情况下,得出的因子早就失去了意义导致结果不准确。另一方面由于葡萄酒的因子与葡萄的因子对葡萄酒质量评分影响的权重是不同的,所以简单的归一化处理也会对结果造成很大误差。为得到较为准确的预测,那么便需要利用人工智能算法来在算法结构上进行优化,然而这样一来便无法得出具体的关系,所以我们决定将人工智能算法用于以上我们得出的结论的准确性的检验与论述。问题4.2:基于BP人工神经网络对于结果的检验与讨论1.模型优势基于BP神经网络的时间序列预测模型与传统模型不同的是:此模型只需以历史数据作为输入,通过抑制与激活神经结点,自动决定影响性能的参数及影响程度,自动形成模型,无需进行模型假设,再加上神经网络对复杂的非线性系统具有曲线拟核能力,预测能力强,所以是合适的对比检验模型。其流程图如图10:HIdden OutputLuayer>0 1.图10.神经网络流程图我们以红葡萄酒为例进行分析。我们取27组红葡萄酒中的23组作为训练组,以其理化指标向量作为输入端,以可信度较高的第一组打出的总评分为输出端对其进行训练。经过反复训练调试,我们训练出性质如图11、图12的一组神经网络,并且其对于4组检验数据,结果误差不超过0.02,性质较为可靠,可以用于预测及对于上题结果准确性的检验。Epotl1:0~ime;Perfonnance:加9Gradient:制Mu;VaiaaticriGe畑jPra^HGEpotl1:0~ime;Perfonnance:加9Gradient:制Mu;Vaiaaticr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学数学北师大版四年级上册《路程、时间与速度》教学设计
- 东营消防安全专业培训
- 建筑AI解决方案
- 2024北京八年级(上)期末地理汇编:认识地区章节综合(中图版)
- 2023设备租赁合同模板
- 2023年银行从业资格考试公共基础重要知识点
- 制药机械配件项目建设实施方案
- 2026年蛋鸡养殖场电力供应协议合同
- 2026年宠物美容店香波代购协议
- 2023年检验类之临床医学检验技术(中级)通关题库
- 钢结构厂房监理规划(完整版)
- 寻求月子中心合作协议书
- 电镀行业危险化学品培训
- 含权贸易合同范本
- 七年级语文上册重点字词复习提纲
- 2026年浙江万里学院辅导员招聘备考题库附答案
- 2025年国际中文教师证书考试笔试测试卷及参考答案
- 2026年河南应用技术职业学院单招职业倾向性测试必刷测试卷带答案解析
- 临终关怀模拟教学中的知情同意与法律伦理
- ECMO辅助下体外心肺复苏(ECPR)实施方案
- 公路养护安全知识课件
评论
0/150
提交评论