基于GA系统、多元回归与BP神经网络的葡萄酒评价体系(共35页)_第1页
基于GA系统、多元回归与BP神经网络的葡萄酒评价体系(共35页)_第2页
基于GA系统、多元回归与BP神经网络的葡萄酒评价体系(共35页)_第3页
基于GA系统、多元回归与BP神经网络的葡萄酒评价体系(共35页)_第4页
基于GA系统、多元回归与BP神经网络的葡萄酒评价体系(共35页)_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2013高教社杯全国(qun u)大学生数学建模竞赛承 诺 书我们(w men)仔细阅读了全国大学生数学(shxu)建模竞赛章程和全国大学生数学建模竞赛参赛规则(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞

2、赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期

3、: 年 月 日赛区评阅编号(bin ho)(由赛区组委会评阅前进行编号):12013高教社杯全国大学生数学(shxu)建模竞赛编 号 专 用 页赛区评阅编号(bin ho)(由赛区组委会评阅前进行编号):赛区评阅记录(jl)(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号): 基于(jy)GA系统(xtng)、多元回归与BP神经网络的葡萄酒评价体系(tx)摘要葡萄酒评价涉及到多种指标,通常以品酒员评分作为观测值,其主观性较强。因此,分析酿酒葡萄和葡萄酒的主要理化指标,探究其之间的关联性,并找出理化指标与葡萄酒品质之间的关

4、系,建立理化指标葡萄酒品质的模型,从而以客观的理化指标来评价葡萄酒品质,避免了品酒员主观判断。本文采用GA灰色系统理论1、主成分分析、多元线性回归与BP神经网络2等方法,解决了下列四个问题: 问题一,采用灰假设检验,逐一分析两组品酒员每一评价指标的差异性,再结合指标权重,对葡萄酒总体的差异性予以评价。其具有无需分析原数据分布态,结合分项权重分析数据总体差异性的优点。对于数据可信度的判断,采用灰色可信度方法,逐一分析每一品酒员在每一样品中与平均值的灰色关联度,之后综合同组中所有品酒员的灰色关联度,得到该组的灰色可信度。数值越大说明越可信。结果表明,总体情况下两组评酒员在红葡萄酒的评价中无显著差异

5、,在白葡萄酒中存有显著差异,两组评酒员在红、白两种葡萄酒的评价中均为第二组的更可信。问题二,采用主成分分析法,将酿酒葡萄的理化指标降维,结合葡萄酒评价指标,建立酿酒葡萄评价模型,并用灰色关联分析和信息熵法分别分析酿酒葡萄理化指标和葡萄酒评价指标的权重,最后利用基于三角白化权灰色聚类模型,对葡萄酒按优、良、中、差、劣分为5类。结果表明红葡萄中9,23,20号样品为优,12,25,18,15,11号样品为劣;白葡萄中5,9,17,10,28,22,23号样品为优,12,16号样品为劣。问题三,先对酿酒葡萄和葡萄酒的芳香物质进行筛选,并采用主成分分析法,将酿酒葡萄和葡萄酒的理化指标、芳香物质指标降维

6、。以葡萄酒理化指标和芳香物质指标的主成分与酿酒葡萄理化指标和芳香物质指标的主成分进行多元线性回归,分析其之间的联系。问题四,结合问题三中酿酒葡萄与葡萄酒理化指标的主成分,采用BP神经网络,以理化指标为输入层,葡萄酒评分的总分为输出层,用20组样品进行训练,并对剩余样品进行预测。分析预测值与实际值之间的偏差,从而分析利用酿酒葡萄与葡萄酒理化指标来评价葡萄酒品质的可行性。结果表明,利用BP神经网络训练后的预测结果与实际值之间误差在可控范围内,利用酿酒葡萄与葡萄酒理化指标来评价葡萄酒品质是可的。利用MATLAB、SPSS、EXCLE等软件,分析了葡萄酒评价的一系列问题,建立了一套利用葡萄酒与葡萄理化

7、指标评价葡萄酒质量的模型,扩展模型试用范围,提高精确度,将会使其在实际应用有更大的参考价值。关键词:GA灰色系统理论(lln) 主成分分析 多元(du yun)线性回归 灰色(hus)聚类 BP神经网络1问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件给出了葡萄酒的评价结果,以及这些葡萄酒的和酿酒葡萄的成分数据。要求讨论下列问题,并建立数学模型:分析附件1中两组评酒员的评

8、价结果有无显著性差异,哪一组结果更可信?根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。分析酿酒葡萄与葡萄酒的理化指标之间的联系。分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2理论简介2.1灰色系统理论简介灰色系统理论是由邓聚龙教授创立的,该理论主要以不确定性系统为研究对象,通过计算系统与系统数据之间或系统内部数据之间的灰色关联度,对系统进行分析、建模、预测和决策。灰色系统理论广泛应用与对不确定性系统的关联分析、权重分析、聚类分析和回归分析,其在分析过程无需判断原数据的分布规律,具有稳定性强、信息利用率高等优点。2.2 B

9、P神经网络简介人工神经网络,是一种在生物神经网络的启示下建立的数据处理模型,其核心是通过调整神经元之间的权值,来对输入的数据进行建模。BP神经网络是人工神经网络的精华,其通过增加多个隐含层的网络,实现了多层神经网络的自我学习,被广泛的用于分类识别、逼近、回归、预测等领域,具有学习性强,误差小,处理线性问题能力强等特点。3模型假设2.1模型假设葡萄酒品质只与酿酒葡萄品质有关,不考虑酿造过程中环境、技术的影响。不考虑理化二级指标。所有指标与葡萄的评级呈正相关。评酒员评分客观独立,互不影响,也不受其他样品酒的影响。2.3符号定义对于(duy)文中的常用(chn yn)数学符号进行规定,如表1所示(注

10、:文中具体公式(gngsh)通常以红葡萄酒为例,未出现符号会在对应公式中予以说明):表1符号定义表符号符号说明X红葡萄酒的评分Y白葡萄酒的评分A红葡萄理化指标B白葡萄理化指标C红葡萄酒理化指标D白葡萄酒理化指标i 第一组品酒员j 第二组品酒员k 葡萄、葡萄酒序号t品酒员序号s评价指标序号4模型建立与求解4.1问题一分析问题一要求分析两组品酒员对27种红葡萄酒与28种白葡萄酒10项指标评分的差异性,并判断那一组更可信,分析数据后得出以下结论:品酒员的评酒分数很大程度上受到自身感官影响,具有很强的主观性与不确定性,与此同时品酒员在对不同评价指标上的尺度也是因人而异,因此一种葡萄酒的评价结果应取10

11、位品酒员评分的平均值,其差异性应主要体现在不同评价指标上。红白两种葡萄酒特性差异较大,其评价结果的差异性分析需要分别进行讨论。品酒员评分可信度以单一的葡萄酒总分作为样本难以体现出多项评价的特点。由于评价指标的权重都有所不同,因此应该分析品酒员对每瓶酒上的每个指标在相应权重下的可靠性,综合后得到一组品酒员评价结果的可靠性,再判断哪一组更可信。4.1.1数据预处理分析原数据后,发现数据中存有异常与缺失的情况,这会对数据分析造成一定影响,因此需要将数据正常化再进行分析。第一组红葡萄酒品尝评分中,样品酒20色调四号品酒员的评分缺失。同时第一组白葡萄酒品尝评分中,样品酒3持久性七号品酒员的评分异常,分别

12、如表2、3所示:表2第一组红葡萄酒20色调数据缺失品酒员一号二号三号四号*五号六号七号八号九号十号色调664668668表3第一组白葡萄酒3持久性数据异常品酒员一号二号三号四号五号六号七号*八号九号十号持久性75756777567经观察,两组数据中其余九位品酒员之间的评分相差无几。因此在样本数据之间的差别不大时,可以采用均值替换法,补充、修正数据,如公式(1)所示: (1)注:m代表(dibio)缺失、异常数据序数均值替换法原理为取整现有正常数据的平均值来修补缺失(qu sh)、异常的数据。经计算补充(bchng)、修正数据都为6。4.1.2灰假设检验简述问题一中,品酒员对葡萄酒的评分不确定性

13、较强,数据量较少,其概率分布并不清晰、确定,采用传统概率统计方法得出的结果不一定精确,因此选择采用灰假设检验3。灰假设检验是以灰色系统理论为基础,通过计算数据之间的灰关联度绝对差(灰差)来分析两组数据之间的差异性。灰色系统理论主要研究不确定问题,以此为基础的灰假设检验可检验概率分布未知,样本数少的数据,从而避免了原先的问题。按灰假设检验的基本原理,以红葡萄酒的为例,设任意一种指标的两组数据Xi与Xj,计算出对应的灰关联度h (h=i,j),如式(2)-(5) (2) (3) (4) (5)式(4)中为分辨系数,0,1。定义灰关联度绝对差(灰差)d,如式(6) (6)灰差的取值区间在1,0之间,

14、其值作为判断两数据之间差异性的标准,值越大表明差异性越明显。分辨系数的取值会影响灰差d的大小,使灰差达到最大的分辨系数*定义最优分辨系数,如式(7): (7)为定量表达两组数据之间的差异性,结合假设检验与数据权重的思想,定义属性权重,其于灰差的函数关系如式(8) (8)式中为权重系数,本问题中权重系数为指标在总分中的比例。灰假设检验H0为两组数据之间无明显差异,其否定域为f 0.5,因此接受原假设,红葡萄酒的评价结果无明显差异。白葡萄酒的平均属性权重为0.4237 0.5,因此拒绝原假设,白葡萄酒的评价结果有明显差异。4.1.4灰色可信度评价结合灰假设检验中关于灰关联度的应用,对于两组品酒员评

15、价结果可信度的分析,可用灰关联度为标准。计算每位评酒员在某样品酒的评分与该酒平均分的灰关联度,量化品酒员评分与平均值之间的差异,其差异越小,可靠性越大,数据就越可信。取一红葡萄酒,其平均分与每位品酒员评分Xt之间存在灰关联度,如公式(9)所示 (9)式中,X0为始点零像化数组。计算出一组中所有品酒员的灰色关联度并求和,得到该组评分的总灰色关联度,值越大表明评价结果越稳定,该组的评价结果就越可信。由matlab软件编程实现(程序见附录程序2),如表(7)所示表7红、白葡萄酒总灰色关联度葡萄酒种类与组别红葡萄酒白葡萄酒第一组第二组第一组第二组总灰色关联度62.121669.242756.72966

16、7.8770从表7中可以看出,第二组品酒员在红、白两种葡萄酒中,总灰色关联度都是最高的,说明第二组品酒员的评价结果更加稳定,可信度较高。因此之后的问题分析中,葡萄酒的评分就采用第二组品酒员的评价结果。4.2问题二的分析问题二要求根据酿酒葡萄的理化指标与葡萄酒的评分,对葡萄酒进行分类评级,分析后得出以下结论:理化指标与评分属于两种完全不同的评价体系,其指标间的意义、量纲不同,且在数值上差异悬殊,这会导致指标在参与评价过程中所起的作用不均衡,容易产生偏差。因此应对每一种指标的情况进行评估后再将其综合起来,以此来分类评价。理化指标无对应的权重,而导致所有理化指标在评价过程中的作用是一致的,因此需要对

17、理化指标与评分进行总体权重分析。与此同时,葡萄酒10项评分的权重由评酒员主观判断,不具备客观性,因此也要重新定权。在同一体系下,指标默认理化指标与评分这两种体系的作用是同一级的。芳香物质这一理化指标(zhbio)主要表现为葡萄酒或葡萄(p to)的香气,而在葡萄酒的评分项目中已有香气这一项,同时芳香物质数据缺失十分严重,难以统一利用(lyng),其对葡萄酒的评价难以有显著的作用,因此不将其纳入评价体系中。理化指标种类众多,某些指标之间关联性较强,这会导致在评价过程中信息的重叠,同时过多的指标会使权重减小,从而弱化了评价过程中理化指标的作用。因此需要对理化指标进行主成分分析,减少评价过程中指标的

18、数目。4.2.1数据预处理1. 数据选取对于酿酒葡萄的理化指标而言,只采用一级指标。同时对于多次测量的指标采取平均的方法,共取出30种理化指标。2. 异常数据检查与修正在原始数据中,有的数据明显比两侧的数据过大或过小,显然是不合理数据。因此利用MATLAB中的箱线图我们可以直观的看到异常数据的出现,如图1、2所示: 图1红葡萄vc含量 图2白葡萄百粒质量 其基本原理为,通过统计数据中最小值、第一四分位数、中位数、第三四分位数与最大值,对进行数据粗略地检查,分析是否存有异常数据。如图1、2所示,两种指标中,均有指标过大,明显不符合常理,对于这两个异常数据采取与4.1.1中一样的“先剔除,后替换”

19、的策略,对异常数据进行修正。3. 数据可信度分析表中的理化指标,发现大部分葡萄酒样品中,还原糖的值大于总糖,这不符合化学常理,因此将还原糖这一项指标剔除。通过上述的数据处理,得到27*29、28*29的酿酒葡萄理化指标矩阵。4.2.2酿酒葡萄理化指标的主成分分析根据酿酒葡萄理化指标数量纲不同,数据量多的特点,宜采用主成分分析法4中的因子分析,基本理论如下:利用公式(10)计算相关系数矩阵 (10)在(10)式中,rij(i,j=1,2,p)为原变量(binling)的xi与xj之间的相关系数,其计算公式如(11)所示: (11) 因为(yn wi)R是实对称(duchn)矩阵(即rij=rji

20、),所以只需计算上三角元素或下三角元素即可。计算特征值与特征向量首先解特征方程,通常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列,即;然后分别求出对应于特征值i的特征向量。这里要求=1,即,其中eij表示向量ei的第j个分量。3) 计算主成分贡献率及累计贡献率,一般取累计贡献率达8595%的特征值所对应的第一、第二,第m(mp)个主成分。4) 计算主成分载荷,其计算公式如(12)所示 (12)得到各主成分的载荷以后,还可以按照(11)式进一步计算,得到各主成分的得分 (13)利用spss软件,对红葡萄酒中的29中指标进行主成分的因子分析,得到红葡萄的特征值和累计方差,如表8所示:

21、表8红葡萄的特征值和累计方差主成分提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %17.59726.19726.1975.32418.35818.35824.72316.28642.4833.94913.61831.97632.8469.81352.2963.27211.28243.25842.7529.48961.7852.8629.86853.12552.1327.35369.1382.7569.50562.63061.7426.00875.1462.7219.38172.01171.3714.72979.8751.9716.79878.80881.1624.007

22、83.8811.4715.07383.881在累计(li j)方差(fn ch)达到83.881%,得到8个主成分,表明这八个主成分表现了红葡萄理化(lhu)指标中83.881%的信息,满足主成分分析原则。(红、白葡萄的正交结果见附录表1)根据主成分正交因子的分析结果,得到对应八种主成分的指标组合,如表9所示:表9红、白葡萄主成分正交因子组合主成分红葡萄白葡萄1葡萄总黄酮总酚DPPH自由基单宁可溶性固性物总糖干物质含量2可溶性固性物总糖干物质含量总酚葡萄总黄酮单宁3苹果酸褐变度a*L*b*4可滴定酸固酸比可滴定酸固酸比PH值5果皮质量果穗质量果皮质量6黄酮醇果梗比7柠檬酸褐变度8vc含量白藜芦

23、醇9苹果酸10柠檬酸结合葡萄酒评分体系,共26个指标,构建起酿酒葡萄的评价模型,(以红葡萄为例,其基本结构如图1所示(理化指标用编号如下表所示):酿酒葡萄的评价模型酿酒葡萄理化指标葡萄酒评分主成分1主成分8主成分7主成分6主成分5主成分4主成分3主成分2外观整体评价口感香气1312101117211669192026221573澄清度色调纯正度质量浓度纯正度质量持久性浓度图1酿酒葡萄评价模型树状图酿酒葡萄理化指标编号123456氨基酸总量蛋白质vc含量花色苷酒石酸苹果酸789101112柠檬酸多酚氧化酶活力褐变度DPPH自由基总酚单宁131415161718葡萄总黄酮白藜芦醇黄酮醇总糖可溶性固

24、性物PH值192021222324可滴定酸固酸比干物质含量果穗质量百粒质量果梗比2526272829出汁率果皮质量L*a*b*4.2.3灰色(hus)关联度与信息熵法权重(qun zhn)分析为确定(qudng)酿酒葡萄理化指标在评价体系中的权重,结合灰色系统理论,以灰色关联度为基础,建立权重分析模型,具体步骤如下:选定母指标:根据之前的主成分分析,葡萄总黄酮为累计方差最大的主成分中关联最大的因子,其含量最大程度上体现了葡萄的质量。因此葡萄总黄酮含量是评价葡萄的最重要的指标之一,选用葡萄总黄酮含量A13(k)这一理化指标作为母指标。对于指标值进行规范化处理:由于各个指标的量纲不同、数值上差异悬

25、殊,为对这些指标数据进行综合评价,采用规范化处理,每个指标的原始数据除以其对应的平均值,得到一个新的数据As(k),如公式(14)所示: (14)构建权重分析模型:计算灰色关联系数as(k),得出每一组指标与母指标葡萄总黄酮之间的关联值,如公式(15)所示: (15)式中综合各个关联值,得到每组指标与母指标之间的关联度,根据关联度求出各指标的权重,并对其进行归一化处理,如公式(16)所示: (16)对于葡萄酒评分而言,原10项单指标分值权重是由专家主观确定的,若简单套用则其在总体酿酒葡萄评价模型中会导致部分指标权重过大,影响整体的评价结果。为此采用信息熵法,对葡萄酒评分进行重新定权,具体步骤如

26、下:根据红葡萄酒的评分X,构造决策矩阵X,如公式(17)所示: (17)对决策矩阵规先范化后归一化处理,得到规范、归一化矩阵R,如公式(18)为: (18)其中(qzhng)规范化、归一化公式如公式(19)所示:, (19)利用(lyng)公式(20)计算10项评分(png fn)指标的权重s,() (20)利用matlab编程(见附录程序3、4),分析计算出16种理化指标的权重与10项评分的权重,得到红葡萄总体评价指标权重,如表10所示(白葡萄的权重见附录表2):表10红葡萄总体评价指标权重理化指标权重理化指标权重vc含量0.0279黄酮醇0.0281苹果酸0.0286总糖0.0325柠檬酸

27、0.0280可溶性固性物0.0322褐变度0.0277可滴定酸0.0305DPPH自由基0.0337固酸比0.0324总酚0.0347干物质含量0.0323单宁0.0335果穗质量0.0291葡萄总黄酮0.0387果皮质量0.0301澄清度0.0501纯正度20.0501色调0.0493浓度20.0500纯正度0.0499持久性0.0502浓度0.0499质量20.0501质量0.0501平衡/整体评价0.05024.2.4基于三角白化权函数的灰色聚类评价模型葡萄评价而言,其含有酿酒葡萄的理化指标与葡萄酒的评分等多个特征指标,难以从单一指标进行分析评价。可以认为葡萄的总体指标是灰色的,因此将葡

28、萄进行分类是一个白化过程。采用三角白化权函数的灰色聚类方法1,可以有效的解决这个问题,步骤如下:按照评价模型划分所需的灰类n,之后将各指标的取值范围划分为n个,例如将s指标(a1,an+1)划分为n区间:a1,a2,am-1,am, an-1,an,an,an+1其中am(m=1,2,n,n+1)的值一般可根据实际评估要求来确定。结合酿酒葡萄综合评价体系,(红葡萄酒为例)对26种指标,以优、良、中、差、劣分为五个灰类,六个区间值如表11(白葡萄见附录表4)所示:表11红葡萄灰度区间(q jin)指标名称灰度区间劣差中良优vc含量0,0.090.09,0.200.20,0.290.29,0.40

29、0.40,0.57苹果酸0,6.566.56,8.368.36,10.4310.43,14.1314.13,19.83柠檬酸0,0.350.35,0.870.87,1.311.31,1.821.82,2.6褐变度72,237237,484484,696696,937937,1307DPPH自由基0.15,0.250.25,0.350.35,0.440.44,0.540.54,0.7总酚6,1313,16.516.5,1919,2424,31单宁3,88,1111,1515,2020,27葡萄总黄酮2,66,1010,1414,1919,26黄酮醇2,2424,5757,8585,117117,

30、165总糖150,165165,186186,204204,225225,257可溶性固性物181,192192,208208,222222,238238,262可滴定酸4,5.15.1,6.26.2,7.17.1,8.28.2,9.8固酸比22,2929,3333,3636,3939,46干物质含量18,2020,2222,2424,2626,30果穗质量63,190190,325325,433433,575575,795果皮质量0.1,0.140.14,0.190.19,0.230.23,0.280.28,0.35澄清度3.05,3.213.21,3.373.37,3.53.5,3.663

31、.66,3.9色调3.2,4.074.07,5.075.07,5.935.93,6.96.9,8.4纯正度3,3.373.37,3.773.77,4.114.11,4.54.5,5.1浓度4.7,5.115.11,5.465.46,5.965.96,6.416.41,7.1质量10.1,11.511.5,11.9311.93,12.2212.22,1313,14.2纯正度3.3,3.553.55,3.773.77,3.963.96,4.174.17,4.5浓度4.5,4.874.87,5.275.27,5.615.61,66,6.6持久性5.35,5.85.8,5.95.9,66,6.16.1

32、,6.4质量12,1313,1414,1515,1616,17平衡/整体评价8,8.38.3,8.68.6,8.868.86,9.159.15,9.6定义(dngy)每一个灰类对应一个转折点,其中(qzhng) =( am+am+1)/2,(m=1,2,n)。对灰类n或1,构造相应的上下限测度白化权函数,,, ,。设x为指标s的一个观测值,当xa1,或x,as+1时,可分别由公式(21)或(22),计算出其关于灰类1或n的值(x)或(x),公式如下所示: (21) (22)对灰类m( m2,3,n-1),构建(u jin)三角白化权函数,,其公式(gngsh)如(23)所示: (23)确定(q

33、udng)各指标的权重s计算葡萄k关于灰类m(m=1,2,n)的综合聚类系数,如公式(24)所示: (24)由max=,判断葡萄k属于哪个灰类。结合上述的基本理论,在matlab中编程(程序见附录程序4),得到红葡萄和白葡萄的聚类结果,如表12.13所示:表12红葡萄灰色聚类结果灰类葡萄样品优9,23,20良5,3,17,2,21中19,27,24,6,4,26,差1,22,8,14,13,16,10,7劣12,25,18,15,11表13白葡萄灰色聚类结果等级葡萄样品优5,9,17,10,28,22,23良20,27,25,19,21中6,18,14,15,1,3,7.4,24差2,13,8

34、,26,11劣12,16注:红、白酿酒葡萄(p to)的综合聚类系数见附录表44.3问题(wnt)三的分析问题三要求(yoqi)分析酿酒葡萄与葡萄酒的理化指标之间的联系,分析后得出以下结论:对于葡萄酒和葡萄的理化指标过多,逐一分析难度较大。因此先将理化指标进行主成分分析,降维再对其进行关联性分析葡萄与葡萄酒中的芳香物质,种类繁多,但其主要体现在葡萄与葡萄酒的香气。因此芳香物质的总和可作为葡萄与葡萄酒的单一一种主成分进行。在对葡萄酒和葡萄的理化指标完成降维后,计算主成分得分,并结合芳香物质,对其进行多元线性回归分析,分析出理化指标之间的量化关系。4.3.1葡萄酒理化指标的主成分分析利用SPSS对

35、红葡萄酒理化指标进行主成分分析,得到红葡萄酒理化指标主成分分析,如表14所示:表14红葡萄酒理化指标主成分分析成份12总酚.984酒总黄酮.984DPPH半抑制体积.956单宁.939L*-.868花色苷.820-.381a*-.259.758b*.750白藜芦醇.492.595(注:白葡萄酒理化成分分析见附录表5)因此红葡萄酒理化指标主成分分析后,得到了两个主成分,其中对主成分1影响较大为总酚、酒总黄酮、DPPH半抑制体积和单宁,对主成分2影响较大为a* 、b*。4.3.2葡萄酒与葡萄理化指标的主成分得分根据之前分析得到的主成分,得到葡萄关于8个主成分因子的得分以及葡萄酒关于2个主成分因子的

36、得分,如表15、16所示:表15红葡萄理化指标主成分得分样品序号主成分因子主成分1主成分2主成分7主成分815.257394.95882.227277.6452-14.426430.266120.525289.120263.416212.221118.175281.04127-8.509254.61071.882197.220表16红葡萄酒理化指标主成分得分样品序号主成分因子主成分1主成分21146.054-202.918277.171-81.5972616.9845.9352711.550-5.311通过计算(j sun)主成分得分,量化样品降维后的数值,为之后的相关性分析与多元(du yu

37、n)线性回归打下基础。4.3.3葡萄酒与葡萄(p to)理化指标相关性分析与多元线性回归红葡萄理化指标的主成分得分,结合红葡萄芳香物质,共9个主成份,红葡萄酒主成分得分,结合红葡萄酒芳香物质,共3个主成份,利用MATLAB编程,进行相关性分析(程序见附录6),计算其相关系数,如表17所示:表17红葡萄与葡萄酒主成分相关系数葡萄葡萄酒主成份1主成份2芳香物质主成份10.0306-0.08400.1585主成份20.0940-0.0338-0.0904主成份30.1704-0.22960.0933主成份4-0.09380.03910.1372主成份5-0.22440.19680.1296主成份60

38、.1768-0.1145-0.1294主成份70.00610.0624-0.1187主成份80.0983-0.0286-0.0968芳香物质-0.15210.18800.0940(注:白葡萄酒理化成分分析见附录表6)分析表17,可明显发现红葡萄酒中主成份1、主成份2、芳香物质与红葡萄主成份5、主成份3、主成份1相关程度最高。具体分析即为红葡萄酒的总酚、葡萄总黄酮、DPPH半抑制体积、单宁、L*(D65)、花色苷与红葡萄的果皮质量、果穗质量、百粒质量有很强的相关性;红葡萄酒的a*、b*、白藜芦醇与红葡萄的苹果酸、褐变度、多酚氧化酶活力有很强的相关性;红葡萄酒的芳香物质主要与红葡萄的葡萄总黄酮、总

39、酚、DPPH自由基、单宁有关。利用MATLAB,对葡萄酒的主成分与葡萄的主成分进行多元线性回归5,(程序见附录程序7),得到回归线性方程(白葡萄回归方程见附录公式1),如下所示:Y1=1.616*x1 + 4.5531*x2 + 4.7776*x3 - 2.429*x4 - 0.22033*x5 - 5.3504*x6 + 0.45253*x7 + 4.172*x8 + 0.084943*x9 - 0.06802;Y2=2.7548*x4 - 3.4274*x2 - 4.8481*x3 - 0.38933*x1 + 1.0367*x5 + 7.8965*x6 + 1.7237*x7 - 7.8

40、418*x8 - 0.048502*x9 + 0.5289;Y3=4.7145*x1 + 23.292*x2 + 9.2472*x3 - 4.654*x4 + 2.9228*x5 - 14.0124*x6 + 13.9712*x7 - 12.6061*x8 + 0.047419*x9 + 1.2093.4.4问题四的分析问题四要求分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,分析后得出以下结论:为分析(fnx)酿酒葡萄和葡萄酒的理化指标(zhbio)对葡萄酒质量的影响,需确定分析(fnx)的量化数据。结合问题三中对于酿酒葡萄和葡萄酒的理

41、化指标的降维处理,可以其主成分作为分析指标。同时以葡萄酒评分的总分作为葡萄酒质量。由于理化指标对于葡萄酒质量的影响是不明确的,其部分指标可能会与葡萄酒质量呈非线性关系。因此需要建立一个合理的,可实现非线性预测的模型。4.4.1 BP神经网络模型选用BP神经网络2作为葡萄和葡萄酒的理化指标评价模型,以问题三种分析出的各样品在酿酒葡萄和葡萄酒理化指标主成分的得分作为输入层,以葡萄酒评分总分代表葡萄酒质量作为输出层,随机遴选20组样品值作为训练数据,剩余的数据作为预测验证模型,建立起隐含层神经元为5个的3层BP神经网络模型,如图3所示:图3三层BP神经网络结构示意图网络中目标误差为0.00004,最

42、大迭代步为100步。利用MATLAB,编程得到基于葡萄酒与葡萄理化指标的葡萄酒评价模型(程序见附录程序8),并且通过对剩余样品的预测,得到红、白葡萄酒预测输出值如表18、19所示,并绘制BP网络预测输出曲线,如图4所示。表18红葡萄酒预测输出值1234567实际输出78.6074.9080.3073.0072.2062.7074.60期望输出66.2066.1181.8255.6664.8159.5251.97表19白葡萄酒预测输出值12345678实际输出76.1569.3782.8269.0977.0377.6877.9174.37期望输出77.0077.0076.0074.0080.00

43、77.0080.0072.00 (a)红葡萄酒 (b)白葡萄酒图4 BP网络预测(yc)输出曲线从图中发现(fxin),利用BP神经网络训练20组样品后,期预测值与实际(shj)值的偏差并不大,白葡萄酒的曲线甚至基本吻合,可见BP神经网络建立模型是合理可行的。同时,对两组BP网络预测输出数据进行t检验,结果得到红葡萄的p=0.018=0.05,故拒绝原假设认为红葡萄酒和红葡萄理化指标可以用来预测红葡萄酒质量,白葡萄酒的p=0&y(3,k)=varargin4(1,k) y(4,k)=1-y(3,k)/varargin4(1,k); %计算属性权重else y(4,k)=0; %计算属性权重en

44、dend函数使用方法:y=graytesting(A,B,0.5,C)%A、B为10*i的矩阵,代表i种样品酒的10个不同指标的评分。A、B分别为第一二组的评分数据,0.5为分辨系数,C为1*10的矩阵,代表十个不同指标的权重系数程序2function y=grayreliability(varargin) %灰可信度分析n,m=size(varargin1);s=n/10;for i=1:s for j=1:m for k=1:10 B(k+(i-1)*10,j)=(varargin1(k+(i-1)*10,j)-varargin1(1+(i-1)*10,j);%数据零像化处理 end en

45、denda=0;b=0;for i=1:s for j=1:10 b=0.5*(B(10+10*(i-1),j)-B(10+10*(i-1),11); for k=1:10 C(i,j)=B(k+10*(i-1),j)-B(k+10*(i-1),11)+a; a=C(i,j); end C(i,j)=1/(1+abs(C(i,j)-b); %计算(j sun)灰色关联度 endendy=sum(C);end函数(hnsh)使用方法:y=graytesting(A)%A为270*11或280*11的矩阵(j zhn),代表红、白两种葡萄酒的评分情况表1红葡萄主成分分析正交结果:旋转成份矩阵理化指

46、标成份12345678葡萄总黄酮.905.020-.055.080-.010.070.021.007总酚.895.161.071.165-.128.154-.005.051DPPH自由基.829-.143-.016.209.000.352.037.128单宁.812.085.240-.180-.020.207.139-.054出汁率.736.053.055.088.021-.126-.090.114花色苷.687.066.584.160-.095.100.073.195蛋白质.547-.223-.121.426.022.325.255.296L*-.528-.355-.162.314.208.

47、206-.229-.348可溶性固性物.035.945.106-.032.012-.043-.068-.010总糖.027.927.005.062-.130-.055-.049-.034干物质含量.094.894.151-.129-.147-.028.203-.055氨基酸总量.094.672-.304-.072-.304.355.210.164苹果酸.119.130.829-.006-.259-.213.104.075褐变度.266-.100.826.078-.175.249.062-.012多酚氧化酶活力-.025.189.700.084.233.329-.053.030可滴定酸-.083

48、.374-.109-.820.174-.127-.153.001固酸比.068.100.260.788-.083-.086.193.213PH值.327.078-.492.683-.051.068-.103.026a*-.443-.042-.267-.494-.198-.302-.274.144果皮质量.034-.011.037-.220.898.092-.059-.215果穗质量-.059-.273-.114.205.828-.157.055.180百粒质量-.075-.225-.207-.178.753-.231-.258.009黄酮醇.207.195.159-.019.005.822.1

49、74.138果梗比.242-.145.258.072-.322.747.006.156b*.023.408.213-.369-.009-.559.357.260白藜芦醇.359-.343-.086.132-.370.463-.011-.308柠檬酸-.051.003.393.089-.084.041.855-.086酒石酸.166.131-.282.278-.131.088.774.146vc含量.274-.048.075.172-.031.169.010.879白葡萄(p to)主成分分析正交结果:白葡萄的特征值和累计(li j)方差主成分提取平方和载入旋转平方和载入合计方差的 %累积 %合

50、计方差的 %累积 %15.43318.73318.7334.04913.96213.96225.10217.59436.3273.29111.35025.31133.65712.61248.9393.04310.49535.80642.0647.11856.0572.7429.45745.26351.8476.36862.4252.4188.33853.60061.5735.42467.8491.9896.86060.46071.4535.01272.8611.9386.68167.14181.2664.36477.2251.7636.08073.22191.1774.06081.2841.7

51、085.89179.112101.0163.50384.7871.6465.67584.787在累计(li j)方差达到84.787%,得到10个主成分,表明这10个主成分表现了白葡萄理化指标中84.787%的信息,满足主成分分析原则。旋转成份矩阵理化指标成份12345678910可溶性固性物.924-.022.129.173-.048.057.043-.105-.021.107总糖.887-.111.103-.002-.036-.081.125.054-.026-.039干物质含量.699.092.122.101-.397-.216-.046.220.120.158果穗质量-.614.129

52、-.082-.121.498-.213-.062.254.086-.059总酚-.179.891.084-.031.190-.135.175.031.175.020葡萄总黄酮-.215.875.082-.068.253-.206.000.052.114.063单宁.456.741.029-.126-.108-.128-.115-.038-.067-.159黄酮醇-.009.640-.083.171-.060.084.449.206-.038.442a*.007.001-.883.284-.074.086-.043.169-.041.028L*.092.137.851-.106-.267.057

53、.158.066.078-.027b*.306-.158.794-.127-.327.050.252.070.150.025DPPH自由基.271.416.580-.085.185.011-.050.004-.248-.109可滴定酸.062.072.238-.862.181.117.077.048.188-.202固酸比.116-.059-.256.847-.145-.124-.067-.034-.099.257PH值.275-.001-.060.795.047.082.055.098.044-.293果皮质量-.032.164-.138-.068.909-.084-.045-.085.11

54、1.103百粒质量-.336.125-.061-.171.789-.233.005.117-.131-.056果梗比-.074-.310-.055-.156-.211.780-.060.126-.027.043vc含量-.214.045.143-.201-.138.649.061-.323-.221-.230酒石酸.385-.109.025.395-.049.562-.085.018.347.317褐变度-.051.007.179.021-.128.043.819-.054-.161.242花色苷-.322-.116-.169.116-.116.156-.688-.015-.112.370蛋白

55、质-.002.403.099-.174.036-.533.547.098.040-.001白藜芦醇-.068-.004-.119-.032-.050-.050-.027.928.024-.031多酚氧化酶活力-.216-.282-.341-.070-.203-.066-.184-.547-.138.272苹果酸-.044.222.110-.218-.032-.094-.079.124.833.235出汁率-.541-.176-.102-.198.108.083.107-.278.543-.306氨基酸总量.433.139.324.173.109-.120-.209.348.466.133柠檬酸

56、.193.038-.051.084.068-.020.079-.103.180.753程序(chngx)3function y=grayweight(varargin) %灰色(hus)权重分析n,m=size(varargin1);for i=1:m for j=1:n B=sum(varargin1); C(j,i)=varargin1(j,i)/B(1,i)*n; %数据(shj)规范化 endendfor i=1:m for j=1:n D(j,i)=abs(C(j,i)-C(j,varargin2); endendfor i=1:m for j=1:n E(j,i)=(min(D(:

57、,1)+varargin3*max(D(:,1)/(D(j,i)+varargin3*max(D(:,1); %计算灰色关联值 endendR=mean(E);r=sum(R);for j=1:m y(1,j)=R(1,j)/r; %计算灰色权重endend函数使用方法:y=graytesting(A,k,0.5)%A为27*16或27*18的矩阵(j zhn),代表(dibio)红、白两种葡萄的主要理化(lhu)指标,k为母指标序列,0.5为值 程序4function W,result=information(x)m,n=size(x)U=x*diag(1./max(x);V=zeros(m

58、,n);for i=1:n for j=1:m y=U(:,i); s=sum(y); V(j,i)=U(j,i)/s; endendE=zeros(1,n);S=zeros(m,n);for i=1:n for j=1:m S(j,i)=V(j,i).*log(abs(V(j,i); end e=S(:,i); E(i)=-1/(log(n).*sum(e)endw=zeros(1,n);for i=1:n w(i)=1-E(i)endsss=sum(w);W=zeros(1,n);for i=1:10 W(i)=(1-E(i)/sss;endq=zeros(m,1)%q为加权后的总得分fo

59、r i=1:m b=0; for j=1:n b=b+W(j).*(x(i,j)(1) end q(i)=b;endrusult=1:m;q表2白葡萄总体(zngt)评价指标权重理化指标权重理化指标权重苹果酸0.0252PH值0.0342柠檬酸0.0210可滴定酸0.0285褐变度0.0216固酸比0.0287总酚0.0269干物质含量0.0350单宁0.0259果梗比0.0304葡萄总黄酮0.0242果皮质量0.0290白藜芦醇0.0227L*0.0334总糖0.0347a*0.0123可溶性固性物0.0372b*0.0291澄清度0.0492纯正度20.0501色调0.0499浓度20.0

60、502纯正度0.0502持久性0.0494浓度0.0502质量20.0502质量0.0503平衡/整体评价0.0503表3白葡萄(p to)灰度区间指标名称灰度区间劣差中良优苹果酸0,22,44,66,99,10柠檬酸0,11,33,44,55,5.5褐变度14.5,165165,405405,575575,835835,1168总酚4,66,1010,1313,1515,17单宁1.5,33,44,55,77,9葡萄总黄酮0.5,33,55,7.57.5,88,9.6白藜芦醇0,0.60.6,1.21.2,2.42.4,3.33.3,4.1总糖153,160160,175175,195195

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论