酿酒葡萄与葡萄酒理化指标及其质量的分析与评估_第1页
酿酒葡萄与葡萄酒理化指标及其质量的分析与评估_第2页
酿酒葡萄与葡萄酒理化指标及其质量的分析与评估_第3页
酿酒葡萄与葡萄酒理化指标及其质量的分析与评估_第4页
酿酒葡萄与葡萄酒理化指标及其质量的分析与评估_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

酿酒葡萄与葡萄酒理化指标及其质量的分析与评估摘要本文通过运用SPSS首先对两组品酒员对葡萄酒的评价进行了差异显著性分析以及评CRONBACH系数分析对品酒员评价的可信度进行了分析,得到了两组品酒员评价之间存在显著性差异,并且第一组品酒员的评价结果更为可信。接下来我们取第一组评酒员给每个样品酒所给出的总分的平均分表示该样品葡萄酒质量的量化指标进行相关讨论我们通过对葡萄及葡萄酒的理化指标归一化处理,将它们之间的联系现实的更为明显,紧接着我们利用因子分析、主成分分析将决定葡萄酒质量的因素维度较低,从而达到简化模型的目的,并通过分析将各成分因子重新命名,再将命名后的主成分和评论员对葡萄酒的评价作为依据对酿酒葡萄等级评定,并引入层次分析法对评定体系进行改进构想。最后利用MATLAB求解主成分因子与葡萄酒质量之间的函数关系,并用BP人工神经网络进行验证及讨论。最后我们在每一个问题后面进行了深入的反思与总结,得出了一些具体的改进思路及方法,并得出在原有问题上的修正。关键字SPSSMATLABCRONBACH系数分析主成分分析层次分析法BP人工神经网络模型的改进与修正1问题重述随着经济的日益发展,人们生活水平的不断提高,葡萄酒的受众随之增加,品酒行业逐渐专业化。品质是现代葡萄酒生产追求的目标之一,针对酒类的质量检测也成为食品行业工作的重中之重。根据已有数据,运用数学建模的方法,对葡萄酒进行评价是一个重要问题。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。从上述相关关系出发,参考相关数据,针对酿酒葡萄与葡萄酒的理化指标和葡萄酒的质量这几个变量,进行分析并建立数学模型,讨论关于葡萄酒的评价问题特别注意指出模型中的优点和不足之处,并做出改进方向。2符号说明符号说明符号说明第I个品酒员对第J款酒所给的总分S香气指标K整个品尝的次数第I类芳香物质(1I8)总得分的方差Q其他影响因素所有在第I位品酒师打分的方差K香气指标关于芳香物质函数的常系数Y葡萄酒的单宁M测得葡萄酒评分X1葡萄酒的总酚Z葡萄酒标准分值(真实葡萄酒评分)X2葡萄酒的黄酮醇U外观指标第一组的总平均分V口感指标理化指标向量W整体评价指标代表原来数据群体的因子香气指标占总分的权重两类新的性质因子外观指标占总分的权重口感类物质成分因子口感指标占总分的权重色泽类物质成分因子整体评价指标占总分的权重3模型建立与求解31数据处理312数据预处理由于试题中给出的附件酒样品未按照顺序排列,我们首先将数据进行了预处理,每组数据均按照样品号和品酒员号顺序排列,加和得到每一剂量酒样品的总评分数,并求得各项明细指标的平均值;其次将多组同类理化指标取平均值,以便分析讨论,进行模型的建立与求解。,IJA2XSIIS,IJLXY12IN313数据处理方法数据的预处理和部分图示,采用办公软件MICROSOFTEXCEL2010;数据的归一化处理,采用办公软件MICROSOFTEXCEL2010;数据结果的显著差异分析,采用SPSS190;数据结果的信度分析,采用SPSS190;数据结果的主成分分析,采用SPSS190;数据处理的拟合分析,采用MATLAB2012A32问题11附件1中两组评酒员评价结果的显著性差异分析要比较两组评论员之间是否具有显著性差异,而每组有10个评论员,27或28个葡萄酒样品,由于附件中的数据都是单项给出的,整体可比性不强,所以我们先用EXCEL将数据进行了初步的整理(求出每个品酒员对各样品的总分,以及各个明细样品的平均值),以第一组对红葡萄酒样品一的评价为例,处理结果如表1所示表1红葡萄酒样品一的评价项目品酒员12345678910平均值澄清度5444434324335外观分析色调10886666866666纯正度6555455445446浓度8677677746461香气分析质量1614121214141214121212128纯正度6555456445548浓度8667668666663持久性8767678766666口感分析质量2219161916161919161616172平衡/整体评价111091091099991094葡萄酒样品1总分10084788275798481697572779321初步分析针对处理后的数据,我们初步的想法是将每组中各个品酒员对每项样品的总分作为一个样本,因此每个样本里将有270项数据。针对红葡萄酒评价的两组样本,利用SPSS进行一次相互独立样本之间的T检验,探测两个样本是否具有显著性差异。但随后通过查阅统计分析中T检验法的一些特性得到了相反的结论鉴于本题样本是每十个总分针对一个葡萄酒样本,并不满足独立样本T检验方法的适用范围,每组样本中的数据是有一定关联的,因此我们采用了另外一种检验方法配对样本T检验法。322二次分析首先,我们对红葡萄酒的评价进行差异性分析(白葡萄酒的处理方法与其一致),将每项葡萄酒样品各项明细评分的平均分作为一个样本(包括总分的平均分),则每个样本里共有1127297项数据,两组数据之间都是针对相同的样品和指标进行评价,所以两组中每项数据都是一一配对,互相关联的。其次,我们对两组葡萄酒的全部总分数据共27102540组,进行综合处理并作图1、图2所示,可以得知两组数据在数值上差异较大,初步判断两组数据具有显著性差异,关于信度分析下文将给出分析讨论。图1图2再次,我们以两组红葡萄酒样品1为例,对其数据做了归一化处理,利用雷达图表示,如图3所示。加强了上述关于显著性差异的推论。图3红葡萄酒样品归一化雷达图表示因此通过以上对数据和检验方法的分析,我们采用配对T检验法对两组样本进行差异显著性分析。323基本假设1每组评论员对各项酒的评价分数成正态分布。2评论员都具有一定的专业品酒技术,对每种酒的各个指标的评价不会有大的偏差(保证评分的关联度)。324模型的建立与求解将处理后的数据导入到SPSS软件中,针对两组红葡萄酒评价中的各项指标评分的平均值进行配对样本T检验法,设定置信度区间为95,得到结果如下表2成对样本统计量均值N标准差均值的标准误红葡萄酒各项平均分11328562971939730112555对1红葡萄酒各项平均分21282092971863412108126表3成对样本相关系数N相关系数SIG对1红葡萄酒各项平均分1红葡萄酒各项平均分2297996000表2为描述性统计表,给出了红葡萄酒的各项平均分的平均值,标准差以及标准误。表3为样本间的配对性的测验结果,可以看到测出的P值(即SIG值)等于00001,因此在95的置信水平上差异显著,即两组红葡萄酒的各项平均分的平均值显著相关,验证了我们之前的推论,因此也符合配对样本T检验的前提条件。表4成对样本检验成对差分差分的95置信区间均值标准差均值的标准误下限上限TDFSIG双侧对1红葡萄酒各项平均分1红葡萄酒各项平均分2464681884441093524949679884250296000表4为最终的配对样本T检验结果报表。其中T表示用公式1221XTSRSN所计算出的值,是最终计算出P值的依据。DF为自由度,SIG(双侧显著性概率)则为我们所需要的P值。可以看到最终结果是P00000001,因此在95的置信水平上差异显著,所以两组评论员评分无显著性差异的假设不成立,即两组评论员对红酒的评分具有显著性差异。图四为以上结果的综合图形描绘。图4结果的综合图形描绘对于白葡萄酒的组,利用同样的方法进行差异性分析,在SPSS软件里同样也得到如下结果,如表5、表6、表7所示表5成对样本统计量均值N标准差均值的标准误白葡萄酒各项平均分11350193081964542111940对1白葡萄酒各项平均分21391493082021087115162表6成对样本相关系数N相关系数SIG对1白葡萄酒各项平均分1白葡萄酒各项平均分2308996000表7成对样本检验成对差分差分的95置信区间均值标准差均值的标准误下限上限TDFSIG双侧对1白葡萄酒各项平均分1白葡萄酒各项平均分2412991932771101362969196283750307000图5白葡萄酒成对样本检验如图5所示,此时P值仍小于0001,因此两组评论员对白葡萄酒的评价在95的置信水平上也具有差异显著性,从而可得出结论无论是针对红葡萄酒还是白葡萄酒,两组评酒员的评价结果都有显著性差异。325问题反思对于该问题,我们将每项葡萄酒评分做了平均化处理,再把处理出来的平均分作为样本,这样每个样本中的数据变成了与每个指标得分情况对应的一元数值,然后用配对样本T检验法对其进行差异显著性分析。通过这种方法处理出来的结果具有一定的科学性与准确性。但是由于数据是进行了平均化处理后的数据,因此模型所反映出的情况不具有完整性,对此我们便有了下面这种改进思路将每组中10名品酒师对27项样品的评价总分作为一个1027的矩阵1,1,271010,27A(其中,IJA第I个品酒员对第J款酒所给的总分)。每个矩阵分别对应该组品酒师的评分具体情况,再用这两组数据构成的矩阵进行多元数据的T检验,如此处理出的结果就应该更具有完整性与可靠性。但由于本组成员所了解的统计学知识还不足以去运用这样多元性的、更为精确的处理手段,因此就将这作为一个以后改进的思路。33问题12附件1中两组评酒员评价结果的信度分析我们针对两组中每位品酒师对每种酒所给出的总分得出1027的矩阵1,1,271010,27AA对其中的元素逐行进行可信度分析。331模型讨论首先我们根据品酒师打分为主观作用,我们选择评价评分者信度的KENDALLW协同检验模型,通过SPSS对红白葡萄4组数据进行模拟分析,得到的渐进显著性系数P均小于005(等于000),协同系数均为050左右,无法得出明确的结论。经过思考,我们发现KENDALL模型对于采用等级评定方式评分的情况是可取的,然而当评分者用其他非等级评定的方式(如百分制)评定时,其信度系数是不合适的,因为其信度系数仅能反映评分者之间的相对一致性,并没有考虑评分者之间存在的评分绝对差别,在这种情况下评分者之间的系统误差也看会被成是随机误差,此时计算出的信度系数不能正确反映评分者信度的高低。所以我们选择内部一致性信度分析。332问题假设为简化模型,排除品酒员主观因素和个人偏好不同而造成的影响,我们做出如下假设1、每位品酒员鉴定的同一种葡萄酒特质完全相同。2、对于每一种类葡萄酒被任何一品尝相当于对其质量进行一次客观的测试,每一项指标的评价,相当于一道题目的得分。3、葡萄酒的特质可以从品酒员的品尝时考虑的方面(即客观测试的一系列“题目”)测量出来。333模型的建立及求解对于抽象出来的测试模型,由于每道测试题目表示一个特质指标的评价,所以我们不能采用简单的二分法计分。因而我们选择CRONBACH系数分析。其中21NIXSK式中,K为整个品尝的次数;2XS为总得分的方差;2IS为是所有在第I位品酒师打分的方差。我们先用EXCEL进行数据处理,得到2710的矩阵1,1,027127,10A,以红葡萄酒为例。表8第一组红葡萄酒表9第二组红葡萄酒如表8、表9所示,不难看出对于红葡萄酒,第一组标准化CRONBACHSALPHA较高,即第一组品酒师对红葡萄酒的评价更为可靠。同样地对于白葡萄酒,第一组标准化CRONBACHSALPHA比第二组更高,如表10、表11所示。表10第一组白葡萄酒表11第二组白葡萄酒即第一组更为可信。再对第一组进行进一步讨论,对于第一组十位品酒师对红白葡萄酒的评价的项已删除的CRONBACHSALPHA值(详见附录)进行分析,没有任何一位品酒师对于整体的标准化CRONBACHSALPHA有明显影响,所以十位品酒师的评价分数也均可信。综上所述,无论对于红葡萄酒还是白葡萄酒,两组品酒师的评价均存在显著差异,其中第一组品酒师的评价结果更可信,并且第一组十位品酒师的评价都属于可信范围。34问题2根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级341问题分析如果单用葡萄酒为酿酒葡萄打分,则直接在葡萄酒的外观、香气、口感质量权重中赋予权值,所得之和即可作为对酿酒葡萄的评分。而本题却引入了另一类变量,就是葡萄的理化指标。这是一项很庞大杂乱的数据,所以我们想到利用主成分分析法对这些数据进行主要因子分析,找出这些指标的公共因子,求的每一样品在这些因子上的成份得分系数矩阵,给数据降低维度,再以此作为研究酿酒葡萄等级评定的依据。342模型建立(以红葡萄为例)首先对数据进行归一化处理,再用SPSS因子分析对处理后的数据进行因子分析。并选择具有KAISER标准化的正交旋转法进行处理。得到的结果如表12所示表12成份矩阵A成份12345678花色苷852总酚851单宁759DPPH自由基734葡萄总黄酮704果梗比585蛋白质584L578黄酮醇562524百粒质量542出汁率533干物质含量847总糖792还原糖777可溶性固形物758氨基酸总量559白藜芦醇812A724可滴定酸599果皮质量597530B500590褐变度618673多酚氧化酶活力661苹果酸639酒石酸果穗质量610VC含量546固酸比柠檬酸571提取方法主成份。A已提取了8个成份。SPSS经过因子分析和旋转处理后一共得到了8个主成分,但在8个主成分之中,葡萄的理化指标所载负荷主要是分配在前四个成分当中。而观察这四个成分的高负荷指标,成分一中高负荷的指标主要有单宁、酮类酚类物质以及蛋白质等,而这些物质,特别是单宁,在很大程度上影响到了葡萄酒的口感,因此可将该成分命名为“口感类物质”;成分二中高负荷的指标有糖类、氨基酸类、VC含量等营养成分类物质的指标,可命名为“营养类物质”;成分三主要有A、B色泽,以及果皮含量指标,可命名为“色泽类物质”;成分四主要有苹果酸,酒石酸等指标,可命名为“酸类物质”。这样通过软件做出的成份得分系数,就可求得对应的因子变量解,如表13所示表13成份得分系数矩阵成份12345678氨基酸总量004129173069000210059052蛋白质089041113027041053139140VC含量039155002107086071212110花色苷115007178004002064012014酒石酸009005165015048009017464苹果酸024000319018120140039043柠檬酸076065142067022021122509多酚氧化酶活力108061229111100142106040褐变度030051285024023065006036DPPH自由基186013060082096096042065总酚197047041002022021070115单宁171041065047062042220074葡萄总黄酮233031077064075043046095白藜芦醇045041019014357157003103黄酮醇043052004130063460058020总糖022245041020046017125180还原糖047178010001016009024008可溶性固形物014234005061018030065144可滴定酸033032005051033012391058固酸比006084040015004090424084干物质含量005189023016012016050056果穗质量029003004342044026074121百粒质量053013015296065015025073果梗比049064033120056298026036出汁率199014002021003184050021果皮质量017047057411059172098028L118006034107080192199207B048045065106358088064082A007013001052360019010054提取方法主成份。旋转法具有KAISER标准化的正交旋转法。构成得分。并据此算得每个样品在每类成分上的得分,结果如表14所示表14基于四类主成分负荷的样本得分表样品口味类物质营养类物质色泽类物质酸类物质100131017305101200141030022079300068221111066400088023032060500043002023179600002136031008700101054041131800035013294099900278073089073100001126603908211001060050130361200084174014048130002707607405714000380291220521500018038024008160003107401712717000530930252061800084096004019190000601402706920000400050991022100023049118132220004807502609823002400090340932400021007008118250004816806104226000861010421722700127052006004由于要求对葡萄进行评级,因此我们决定用百分制的得分来作为评级的依据,由于时间关系我们对评分的系统只能做一个简单化的处理。现在我们掌握的数据一共有4个主成分因子得分,还有一个葡萄酒质量得分(由于在一问中已经论证了第一组的评论员打分更可信,于是这里葡萄酒质量得分以第一组为标准),所以我们将赋予主成分与葡萄酒所得分数11116的权重,以此求得酿酒葡萄的最终评分。如此,则每个成份所占分数为10分,评论员评价所占分数为60分。最后的等级评价我们将效仿目前权威的葡萄酒评分系统美国著名的葡萄酒评论家罗伯特帕克推崇的是葡萄酒100分制评分体系,帕克的评分系统会给每一款酒一个基础的分数(50分)。在50分的基础上,按酒的质量特点加分,将酒的品质分成四类。而我们也效仿这一模式对酿酒葡萄进行分级,将葡萄分成如下六个等级96100EXTRAORDINARY顶级各类指标全面优秀的酿酒葡萄。9095OUTSTANDING优秀营养成分饱满,味道纯正的酿酒葡萄。8089ABOVEAVERAGE优良综合指标尚佳的酿酒葡萄。7079AVERAGE一般略有瑕疵,尚无大碍的酿葡萄。6069BELOWAVERAGE低于一般不值得推荐5059UNACCEPTABLE次品根据成份得分系数以及评论员评价数据处理后各样品的酿酒葡萄得分明细以及对应等级如表15所示表15酿酒红葡萄得分明细及等级样品口味类物质营养类物质色泽类物质酸类物质瓶酒员评价最总得分等级100635582102509437626099低于一般20066160933915748186584低于一般300482100001819648246519低于一般40009549920821441165133次品50041854323092143986511低于一般60031882721241543326104低于一般70006465838700442905402次品800227520100068443386768低于一般900100039607117548906532低于一般100034000019314944525134次品110005155625528542065353次品120010790525153432345031次品130024639210622244765442次品140021848758254643806213低于一般150026846834441535225017次品160023639432601744945468次品1700445738225100047587166一般180010674427733635945057次品190029851822018747165939次品200021553704769447166209低于一般210025564800000046265529次品220019570034910146325977次品230090552720366651367437一般240036653326674246806586低于一般250019520113851541525202次品260010133918490144285953次品270000044127140443805496次品343针对白葡萄的模型建立依照对红葡萄的等级评价,我们也首先对白葡萄进行了主成分分析(结果见附件),同样也将白葡萄指标分成了对应的4个主成分,并求得了样品在每个成分上的得分,最后进行归总评分,得出表16的结果表16酿酒白葡萄得分明细及等级白葡萄口味类物质营养类物质色泽类物质酸类物质瓶酒员评价最总得分等级10042055359728649206776低于一般20057760643886944526943低于一般300447789602109751188054优良400532100058976147647647一般50072684345465242606935低于一般60033981279159641046643低于一般70037274993726146506970低于一般80007252945091342846249低于一般90074767672196343747481一般100077772472361944587301一般1100099851639126143387189一般1200591745712100037986847低于一般130000078787979139546411低于一般140051386346952843206692低于一般150024148875554643446374低于一般160036100057152144405894次品170024385863592747287391一般180016777477945443866559低于一般1900527223481107643326640低于一般200069871947748646687048一般210054989336269345847081一般220066644983987942607092一般230068172255380445547314一般2400851764105478843987855一般250078543349580746267147一般2600100064873680948788072优良2700568521136294438887283一般280081482568765548787860一般344模型的改进构想我们对于酿酒葡萄的评级把标准主要是建立的数据的归一化以及主成分提取的基础之上,由于时间关系,对影响酿酒葡萄等级的给个因素只是进行了一个简单的权重化处理,所以我们对此的改进构想是运用层次分析法将各个因子构建一个多层次,决定权重因素更多,更为复杂的等级评价系统,将121WNA作为各因素的比较矩阵;11,2WN作为权重向量;利用AW求得其最大特征向量,并以此作为排序求得最终的权重向量,最后再进行评级处理,这样将使得评定结果更具可靠性。35问题3分析酿酒葡萄与葡萄酒的理化指标之间的联系先将葡萄酒以及酿酒葡萄的指标整合在一起,总共包括35组指标。经过对数学建模中相关性的研究,得知在SPSS软件中共有三种研究相关性的方法,分别为双变量相关性分析、偏变量相关性分析以及距离相关性分析。而前两种方法主要是针对两组或三组数据进行关联度测试,而本题中是要求对多项指标进行对比,因此我们先采用距离相关分析法对这35组指标进行初步的关联度探测。通过SPSS的处理,得到了各指标间的相似性距离,也就是PEARSON相关系数。可以看到葡萄酒与酿酒葡萄各项指标之间存在较多PEARSON相关较大的组合,比如酒的花色苷与葡萄的花色苷,酒的总酚、酒总黄酮与葡萄的DPPH自由基,酒的单宁与果梗比由于具有相似性的指标太多,所以我们抽取几组具有代表性的指标进行更进一步的分析。351色酒的色泽与酿酒葡萄的颜色比较,由于花色苷是影响酒和酒的酿酒葡萄的重要因素,所以酒中花色苷与葡萄中花色苷的理化指标的联系反映了葡萄的颜色对葡萄酒色泽的影响。于是我们对以上两组理化指标做了一次双因素相关性分析,结果如表17所示两者在001的置信水平上显著相关,且相关系数为0923,说明酒的花色苷含量跟葡萄花色苷有很密切的关系,或者说,酒的色泽从很大程度上取决与葡萄的颜色。下面用MATLAB对它们进行二次拟合,处理数据如下LINEARMODELPOLY2FXP1X2P2XP3COEFFICIENTSWITH95CONFIDENCEBOUNDSP100004120002904,0003728P222209547,3485P322216317,1076GOODNESSOFFITSSE2041E005RSQUARE08516ADJUSTEDRSQUARE08393RMSE9222该拟合结果在95的置信区间内,准确性较高。最终对应的公式为2041,21YXX图6拟合对比图表17相关性花色苷W花色苷PEARSON相关性1923显著性(双侧)000花色苷WN2727PEARSON相关性9231显著性(双侧)000花色苷N2727在01水平(双侧)上显著相关。352味单宁是决定酒味道的主要理化指标,而在通过上面的处理方法我们得知酒的单宁指标与酿酒葡萄的总酚,总黄酮指标具有很高的相似性,PEARSON相关系数分别为0817、0684于是这里我们将研究酒的风味与酿酒葡萄的总酚,总黄酮的关系。用SPSS中多元线性回归分析对酒的单宁,葡萄的单宁、总分以及黄酮醇进行处理,得到结果如表18所示表18相关性酒的单宁葡萄总酚黄酮醇酒的单宁1000817579葡萄总酚8171000346PEARSON相关性黄酮醇5793461000酒的单宁000001葡萄总酚000039SIG(单侧)黄酮醇001039酒的单宁272727葡萄总酚272727N黄酮醇272727这里三组数据之间处理后的SIG值都为0,它们在置信区间内显著相关,因此对它们做回归拟合的可靠性很高。下面是线性回归分析对这三组数据进行的回归分析,所得系数如表19所示表19系数A非标准化系数标准系数共线性统计量模型B标准误差试用版TSIG容差VIF常量18936942727012葡萄总酚307046701668300088111361黄酮醇02400833632060048811136A因变量酒的单宁对应的酒的单宁(Y)与葡萄总酚(X1)、黄酮醇(X2)的线性关系式如下189307X1024Y拟合结果与原数据对比图形如下图7拟合结果与原数据对比同样对白葡萄中酒的单宁(Y)与葡萄总酚(X1)、黄酮醇(X2)进行多元化回归分析,所得结果如表20表20系数A非标准化系数标准系数模型B标准误差试用版TSIG常量12223943100005白葡萄总酚0630662549533501白葡萄总黄酮102116235881387A因变量白葡萄酒单宁06310212YXX回归后的残差统计如表21表21残差统计量A极小值极大值均值标准偏差N预测值1551830721185063286028残差93814223665000006410628标准预测值9093717000100028标准残差1408335700096228A因变量白葡萄酒单宁36问题41因子分析简化模型寻求函数关系的拟合361问题分析从葡萄和葡萄酒的理化指标来看,其成分较为复杂,如果直接对所有理化指标和葡萄酒品质的关系进行分析,其对应关系过于复杂,难以得出结论。为简化模型,我们对其进行如下处理1我们以品酒师信度较高的第一组的总平均分IS作为代表每一个样品酒品质的标准。2对于各种理化性质,我们只考虑一级指标,暂时不考虑芳香类物质(后文会提出所求函数关系关于芳香类物质的修正)3为减少变量个数,我们通过因子分析、主成分分析及其嵌套将原来与得分IS相关联的理化指标向量,IJL简化为两个可以代表原来数据群体的因子,IXY4我们通过MATLAB对总平均分IS与因子,IXY的关系进行三维的拟合,最终得到近似的关系IS,IFXY362数据处理及模型建立首先,因为影响葡萄酒质量的应该是各理化成分的相对含量,为了结果的准确性,所以我们有必要对所有葡萄酒所得总平均分进行归一化处理。另一方面为了减小变量向量的维度,我们利用SPSS对红白葡萄理化性质指标进行因子分析分析,所得旋转成分矩阵见附录。对于红葡萄我们得到8个因子即可以看成一个8维的特征向量,对于白葡萄我们的到了9个因子即一个9维的特征向量。虽然对于原来红白葡萄所含的理化性质指标的数量有了显著的减少,但是对于寻求一个与葡萄酒相关的固定的关系依旧存在较大困难。于是我们进行了二次因子分析,将原来的8维向量和9维向量简化为2维,以便拟合出较为准确的函数关系。由于红葡萄与白葡萄各方面类似,为了简洁起见,下面我们一红葡萄及红葡萄酒为例,来分析红葡萄理化性质、红葡萄酒理化性质与红葡萄酒质量的关系。1红葡萄的理化性质与红葡萄酒质量的关系首先我们利用SPSS对红葡萄31种一类理化指标进行因子分析(主成分分析),得出8个性质因子,即8种代表性成分。其旋转成分矩阵及成分得分系数矩阵详见附录。通过对其旋转成分矩阵系数分析根据前面问题的分析可将它们命名为口感类物质、营养类物质、色泽类物质、酸类物质等。表22表23为进一步简化模型,便于得出简洁可靠的结果,我们对于以上8类物质再次进行主成分分析,其旋转成分矩阵,成分得分系数矩阵如表22、表23所示,两类新的性质因子我们将其命名为12,X,MATLABCUSTOMEQUATION进行拟合,求出葡萄酒所得总平均分IS与12,X关系如图8所示图8葡萄酒总平均分IS与12,X关系GENERALMODELFX,YABSINMPIXYCEXPWY2COEFFICIENTSWITH95CONFIDENCEBOUNDSA72046814,7593B80935014,5030C84211642,1848M0042972703,2695W58869009,20782红葡萄酒的理化性质与红葡萄酒质量的关系相似地,我们首先将葡萄酒理化性质指标进行归一化处理,并用SPSS进行主成分分析,得出了成分因子12,Y,旋转成分矩阵和成分得分系数矩阵如表24、表25表24表25根据对齐全旋转成分的分析,1Y可以命名为口感类物质,2Y可以命名为类色泽类物质。通过MATLABCUSTOMEQUATION对总平均分IS与其成分因子1,进行拟合,结果如图十图9总平均分IS与其成分因子12,Y拟合结果GENERALMODELFX,YABSINMPIXYCEXPWY2COEFFICIENTSWITH95CONFIDENCEBOUNDSA26593938E07,3938E07B093143979,5842C27323938E07,3938E07M169403754,3012W001401101,101363模型的深度讨论分析首先对比两种模型,经过分析可以得出模型2对于葡萄酒质量的预测能力要强于模型1,其原因可以归为如下几点1葡萄酒的理化指标与葡萄酒质量的关联度要高于葡萄的理化指标与葡萄酒质量的关联度,我们可以从SPSS相关性分析的结果以及相关资料查阅均可以得出。2由于葡萄理化指标较多,导致进行了主成分分析的嵌套猜得到成对的因子,然而此时成对的因子已经缺乏现实意义,因而缺乏一定的代表性,导致预测的准确性降低。364模型改进如果为了追求变量考虑的全面性,即葡萄与葡萄酒的理化指标同时考虑,如果我们利用现有的算法,那么就必须在首次得出的8个有关红葡萄的因子与2个有关红葡萄酒的因子进行汇总再次进行因子分析,经试验,如果想得出成对的因子,那么需要连续进行因子分析,然而这样的情况下,得出的因子早就失去了意义导致结果不准确。另一方面由于葡萄酒的因子与葡萄的因子对葡萄酒质量评分影响的权重是不同的,所以简单的归一化处理也会对结果造成很大误差。为得到较为准确的预测,那么便需要利用人工智能算法来在算法结构上进行优化,然而这样一来便无法得出具体的关系,所以我们决定将人工智能算法用于以上我们得出的结论的准确性的检验与论述。37问题42基于BP人工神经网络对于结果的检验与讨论371模型优势基于BP神经网络的时间序列预测模型与传统模型不同的是此模型只需以历史数据作为输入,通过抑制与激活神经结点,自动决定影响性能的参数及影响程度,自动形成模型,无需进行模型假设,再加上神经网络对复杂的非线性系统具有曲线拟核能力,预测能力强,所以是合适的对比检验模型。其流程图如图10图10神经网络流程图我们以红葡萄酒为例进行分析。我们取27组红葡萄酒中的23组作为训练组,以其理化指标向量作为输入端,以可信度较高的第一组打出的总评分为输出端对其进行训练。经过反复训练调试,我们训练出性质如图11、图12的一组神经网络,并且其对于4组检验数据,结果误差不超过002,性质较为可靠,可以用于预测及对于上题结果准确性的检验。图11神经网络训练进度图12训练时误差变化在随机产生10组有关红葡萄酒理化指标的数据,求出其根据问题41的方式所得预测值以及根据BP人工神经网络所得出结果,进行比较仍存在较大误差,可能来源于因子分析将自变量的维度降低产生的误差,以及拟合时产生的误差。但是从BP人工神经网络预测的效果来看,在忽略品酒师的个人偏好差异以及其他等客观因素如温度对气味及口感的影响,可以用葡萄酒的理化指标来对葡萄酒的质量进行评价,而由于葡萄酒酿造过程不同会导致由葡萄理化指标转化为葡萄酒的理化指标的不同,二者不能得到特别准确的关系,导致用葡萄的理化指标来预测其所酿葡萄酒的质量难度较大,不易实现。38问题4模型改进381关于芳香物质的修正葡萄酒的芳香物质是具有挥发性的、能够产生一定气味的含香物质的总称。经查阅相关资料得知,葡萄酒的呈香物质大约有800多种,这些物质不仅气味各异而且它们之间还通过累加、协同、分离以及抑制等相互作用,使香气千变万化多种多样。葡萄和葡萄酒香气由几百种挥发性化合物组成,成分丰富,种类复杂,而且各组分浓度差别大,从NG/L到MG/L不等,极性和沸点也有较大差别。香气成分是决定葡萄酒风味、质量与典型性的主要因素,也是品酒员对葡萄酒进行评分的香气分析指标的关键性因素。研究葡萄酒中的芳香物质,对优质葡萄与葡萄酒质量评价系统的建立有重要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论