




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置
2、报名号的话): 所属学校(请填写完整的全名): 阜阳师范学院 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 年 月 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号): 基于统计分析的葡萄酒评价模型 摘要 葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些
3、物质都是人体必须补充和吸收的营养品。目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。对于本题,我们主要采用SPSS软件对模型进行求解。问题一:首先,我们对附录1中数据进行处理,利用excel分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。其次,我们在excel中,求出两组葡萄酒评价结果的平均值的标准差,通过对比两组相应葡萄酒评价结果的平均值的标准差
4、,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。最后,我们通过比较其相应的标准差的柱状图和分布图来确定哪个组更可靠。问题二:首先,通过分析附件2酿酒葡萄的成分数据,在这里我们采用聚类分析法,根据酿酒葡萄的理化指标和葡萄酒的质量在SPSS中实现对这些酿酒葡萄进行分级。问题三:首先,我们利用SPSS计算出酿酒葡萄与葡萄酒的理化指标的相关系数。由于葡萄的理化指标较多,通过整理数据,在Excel中得到某个葡萄酒的理化指标与若干个酿酒葡萄的理化指标的相关系数,并且规定相关系数大于等于0.6表示两者相关性显著;最后,在SPSS中分别求出回归方程。问题四:首先,我们利用SPSS分别计算出葡萄酒的理化
5、指标与葡萄酒质量的相关系数、葡萄的理化指标与葡萄酒质量的相关系数。然后,通过分析其相关系数,分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响。关键词: EXCEL 聚类分析法 SPSS 偏相关分析 回归分析 相关系数 相关分析原理 偏相关系数 回归分析原理 一、问题重述与分析 1.1问题重述 葡萄酒作为体现时尚品味的元素,同雪茄,咖啡,名茶一样备受追捧。有些世界限量级的顶级名酒被一些商业会所搜罗,并通过举行品酒会,以体现会所实力。作为吸引会员的一项主要活动,为此品酒活动就这样诞生了。物质社会的今天,确定葡萄酒质量时一般通过聘请一批有资质的品酒员进行品评。每个品酒员在对葡萄酒进行品尝后对其分类指标打
6、分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿葡萄酒检测的理化性质指标会在一定程度上反映葡萄酒和葡萄质量的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒和葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?1.2问
7、题分析 1.2.1针对问题一针对问题一中的两组评酒员的评价结果有无显著性差异,首先,我们对附录1中数据进行处理,利用excel分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。其次,我们在excel中,求出两组葡萄酒评价结果的平均值的标准差,通过对比两组相应葡萄酒评价结果的平均值的标准差,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。最后,我们通过比较其相应的标准差的柱状图和分布图来确定哪个组更可靠。1.2.2针对问题二针对问题二中的酿酒葡萄的理化指标和葡萄酒的质量,首先,我们通过对附件2中酿酒葡萄的成分数据的处理,利用EXCEL软件求出相应的均值,然后,我们采用聚类分析法
8、,根据酿酒葡萄的理化指标和葡萄酒的质量在SPSS中实现对这些酿酒葡萄进行分级。1.2.3针对问题三,我们分两个问题去解决1、针对问题中分析酿酒葡萄与葡萄酒理化指标之间的联系,我们先计算酿酒葡萄和葡萄酒理化指标之间的相关系数,通过SPSS实现。由于酿酒葡萄的理化指标远远多于葡萄酒的理化指标,通过整理数据,在excel中得到一个葡萄酒的理化指标与多个酿酒葡萄的理化指标之间的相关系数的数据,再通过SPSS软件,利用相关分析,计算出酿酒红葡萄与红葡萄酒的理化指标之间的相关系数。根据两者的相关系数从而筛选出与葡萄酒理化指标相关性显著的酿酒葡萄的理化指标。2、针对问题中分析酿酒葡萄与葡萄酒理化指标之间的联
9、系,最后我们利用上面整理好的数据,采用回归分析原理,在SPSS中得到酿酒葡萄与葡萄酒的理化指标之间的联系。1.2.4针对问题四首先我们知道,葡萄酒的理化指标若理想,葡萄酒的质量就较高;但葡萄的理化指标理想,葡萄酒的质量不一定高。因此我们在SPSS中,运用偏相关分析,分别计算出葡萄酒的理化指标与葡萄酒质量的相关系数、葡萄的理化指标与葡萄酒质量的相关系数。然后通过对相关系数的比较,分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响。从而论证葡萄和葡萄酒的理化指标能否评价葡萄就的质量。二、模型假设1、 假设制作葡萄酒的工艺是一样且稳定的;2、 假设两组评酒员是随机分配的;3、 假设评酒员对每种葡萄酒的评价
10、结果是大致符合正态分布的;4、 假设酿造葡萄酒的环境是相同的;5、 假设酿酒葡萄与葡萄酒中的芳香物质主要成分是:低醇、酯类、苯等,其余成份忽略;6、 假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒;7、 假设只考虑红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,忽略去皮红葡萄可酿制白葡萄酒;8、 假设酿酒葡萄中存在的而葡萄酒中不存在的理化指标也会影响葡萄酒的质量;9、 假设质量高的葡萄酒一定由质量好的酿酒葡萄制成,但是质量好的酿酒葡萄不一定能酿制成质量高的葡萄酒;10、假设本文所引用的数据、资料均真实可靠。三、符号说明符号意义红葡萄酒评价结果的平均值白葡萄酒评价结果的平均值红葡萄酒均值的标准
11、差白葡萄酒均值的标准差酿酒红葡萄的理化指标红葡萄酒的理化指标酿酒白葡萄的理化指标白葡萄酒的理化指标四、模型建立与求解 4.1问题一:两组评酒员的评价结果有无显著性差异,选择哪一组更可靠1.针对问题一中的两组评酒员的评价结果有无显著性差异,我们对附录1中数据进行处理,利用excel分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值,。2、针对问题一中选择哪组结果更加可靠,我们再利用excel求出两组葡萄酒评价结果的平均值的标准差,通过对比两组相应葡萄酒评价结果的平均值的标准差,从而确定出第几组的结果更可靠。标准差(Standard Deviation) ,也称均方差(mean squa
12、re error),是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。标准差也被称为标准偏差,或者实验标准差,公式如:简单来说,标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。3.根据EXCEL软件处理的数据作出两组红葡萄酒和白葡萄酒的均值和标准差,的柱状图以及红葡萄酒标准差分布图和白葡萄酒标准差分布图如下所示.用EXCEL软件处理的数据如表所示:表一 葡萄酒的数据图红葡萄酒品尝评分白葡萄酒
13、品尝评分均值标准差均值标准差第一组第二组第一组第二组第一组第二组第一组第二组样品162.768.10 9.64 9.05 73.30 76.43 10.54 5.09 样品280.374.00 6.31 4.03 73.10 74.87 12.51 7.00 样品380.474.60 6.77 5.54 64.80 75.60 12.02 11.94 样品468.671.20 10.39 6.43 79.40 74.35 6.69 6.49 样品573.372.10 7.87 3.70 71.00 78.51 11.24 5.13 样品672.266.30 7.73 4.60 65.90 75
14、.39 13.07 4.77 样品771.565.30 10.18 7.92 77.10 78.77 5.82 6.49 样品872.366.00 6.63 8.07 74.30 77.99 14.58 5.58 样品981.578.20 5.74 5.07 82.00 73.57 9.60 10.31 样品1074.268.80 5.51 6.01 72.90 74.61 9.63 8.39 样品1170.161.60 8.41 6.17 72.30 73.05 13.31 9.37 样品1253.968.30 8.92 5.01 68.40 72.40 12.76 11.83 样品1374
15、.668.80 6.70 3.91 71.40 76.69 13.55 6.84 样品147372.60 6.00 4.81 72.00 75.13 10.69 3.98 样品1558.765.70 9.25 6.43 72.40 76.17 11.47 7.35 样品1674.969.90 4.25 4.48 63.30 67.30 10.76 9.07 样品1779.374.50 9.38 3.03 77.50 76.95 6.26 6.20 样品1859.965.40 6.87 7.09 71.00 75.91 11.78 5.50 样品1978.672.60 6.88 7.43 72.
16、20 78.25 6.81 5.10 样品2078.675.80 5.10 6.25 77.80 73.83 8.02 7.07 样品2177.172.20 10.77 5.96 78.80 73.31 12.01 8.02 样品2277.271.60 7.11 4.93 76.40 77.47 13.14 7.32 样品2385.677.10 5.70 4.98 75.90 79.03 6.61 7.41 样品247871.50 8.65 3.27 74.00 77.73 13.34 6.21 样品2569.268.20 8.04 6.61 85.30 74.09 19.11 10.32 样
17、品2673.872.00 5.59 6.45 81.30 74.30 8.54 10.14 样品277371.50 7.06 4.53 74.20 75.65 14.18 5.96 样品2881.30 77.21 8.97 5.04 图1 两组红葡萄酒均值比较的柱状图图2 两组白葡萄酒均值比较的柱形图图3 两组红葡萄酒标准差比较的柱状图图4 两组白葡萄酒标准差比较的柱状图 3. 红葡萄酒标准差分布图图5 两组红葡萄酒标准差比较的条形图 4. 白葡萄酒标准差分布图 图6 两组白葡萄酒标准差比较的条形图根据EXCEL软件处理的数据作出的红葡萄酒标准差分布图和白葡萄酒标准差,的分布图可以明显的看出:
18、(1)根据作出的红葡萄酒标准差分布图得出两组评酒员对红葡萄酒的评价结果有显著性差异;(2)根据白葡萄酒标准差分布图,白葡萄酒标准差分布图波动较小,得出第二组的评酒员的评定比较稳定,数据比较可靠。4.2问题二:基于聚类分析建立酿酒葡萄分级模型我们根据可信组评酒员给每种酒样品的打分来确定葡萄酒的质量;再用聚类分析对酿酒葡萄进行分类,对每类的葡萄酿造的葡萄酒进行统计,对应地得到这类葡萄所对应的级别。在聚类分析中,聚类要素的选择是十分重要的,它直接影响酿酒葡萄分级结果的准确性和可靠性。在分级和分区研究中,被聚类的对象常常是多个要素构成的。不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的
19、,这就会对分类结果产生影响。因此当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。我们所研究的酿酒葡萄的理化指标和葡萄酒的质量指标(变量)之间存在程度不同的相似性(亲疏关系以间距离衡量)。于是根据酿酒葡萄的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另一类,直到把所有的样品(或指标)聚合完毕,这就是分类的基本思想。 在聚类分析中,通常我们将根据分类对象的不同分为Q型聚类分析和R型聚类分析两大类:R型聚类分析是对变量进行
20、分类处理,Q型聚类分析是对样本进行分类处理。R型聚类分析的主要作用是: (1)、不但可以了解个别变量之间的关系的亲疏程度,而且可以了解各个变量组合之间的亲疏程度。(2)、根据变量的分类结果以及它们之间的关系,可以选择主要变量进行回归分析或Q型聚类分析。1.针对问题二中的酿酒葡萄的理化指标和葡萄酒的质量,通过对附件2中酿酒葡萄的成分数据的处理,利用EXCEL软件求出相应各组数据的平均值。2.针对以上所求得的平均值,我们采用聚类分析法,利用SPSS软件作出聚类谱系图能明确、清楚地表达其数值分类结果,根据酿酒葡萄的理化指标和葡萄酒的质量在SPSS中数值分类结果实现对这些酿酒葡萄进行分级。
21、 红葡萄的平均联接(组间)树状图: Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine
22、 C A S E 0 5 10 15 20
23、 25 Label Num +-+-+-+-+-+ VAR00017 17 VAR00018 18 VAR00016 16
24、60; VAR00022 22 VAR00001
25、60; 1 VAR00020 20
26、0;VAR00019 19 VAR00021 21 VAR00011 11
27、0; VAR00013 13
28、 VAR00010 10
29、160; VAR00012 12 VAR0
30、0002 2 VAR00026 26
31、60; VAR00015 15 VAR00025 25 &
32、#160; VAR00004 4
33、0; VAR00009 9 VAR00006 6
34、0; VAR00008 8 &
35、#160; VAR00029 29
36、60; VAR00030 30 VAR00014 14 &
37、#160; VAR00005 5
38、0; VAR00007 7 VAR00024 24
39、60; VAR00027 27
40、; VAR00023 23 &
41、#160; VAR00028 28 VAR00003 3 图7 红葡萄的平均联接(组间)树状图白葡萄的平均联接(组间)树状图: Dendrogram using Average Linkage (Between Groups)
42、 Rescaled Distance Cluster Combine C A S E 0 &
43、#160; 5 10 15 20 25 Label Num +-+-+-+-+-+
44、60; VAR00011 11 VAR00013 13 VAR00015 15
45、60;VAR00002 2 VAR00012 12 VAR00009 9 VAR00028
46、60;28 VAR00030 30
47、60; VAR00010 10 VAR00020 20 VAR00016 16
48、60; VAR00018 18 VAR00022
49、60;22 VAR00001 1
50、0; VAR00006 6 VAR00007 7
51、0; VAR00014 14 VAR00023 23 VAR00027
52、 27 VAR00024 24 VAR00026 26
53、160; VAR00019 19 VAR00021 21
54、 VAR00029 29 VAR00017 17
55、0; VAR00004 4 VAR00008 8 VAR00005
56、160; 5 VAR00025 25 VAR00003 3 图8 白葡萄的平均联接(组间)树状图表二 红葡萄质量分级表红葡萄分级酒样品第一级样品 17,18,16,22第二级样品 21,19,20,1第三
57、级样品 26,2,12,10,13,11第四级样品 8,6,9,4,25,15第五级样品 7,5,14,30,29第六级样品 3,28,23,27,24表三 白葡萄质量分级表红葡萄分级酒样品第一级样品 11,13,15,2,12,9第二级样品 6,1,22,18,16,20,10,30,28第三级样品 14,7第四级样品 26,24,27,23第五级样品 17, 29,21,19第六级样品 3,25,5,8,44.3 分析酿酒葡萄与葡萄酒的理化指标之间的联系4.3.1 计算酿酒葡萄与葡萄酒的理化指标的相关系数偏相关系数1. 相关分析相关分析(correlation analysis),相关分析
58、是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。应用相关分析与回归分析要注意两个问题:在资料上,相关分析要求两个变量都必须是随机的;而回归分析则要求因变量必须是随机的,自变量则不能是随机的,而是规定的值,这与在回归方程中用给定的自变量值来估计平均的因变量值是一致的。防止虚假相关和虚假回归。在对两个时间数列进行相关分析和回归分析时,常因各期指标值受时间因素的强烈影响而损伤了所需要的随机性;也有时两个时间数列表面上似有同升同降的变动,实际上并无本质联系。对这类资料求出的高度相关系数或回归联系,往往是一种假象。为此,
59、在用相关分析法研究复杂的社会经济现象时,需要有科学的理论指导和正确的判断。相关分析就是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。2.偏相关的有关概念 在研究多个变量之间的相关关系时,由于变量间常常是相互影响的,因而两个变量间的简单相关(直线相关)系数往往不能正确确定两个变量间的真正关系,有时甚至是假象。只有在排除其他变量影响的情况下,计算它们之间的偏相关系数(partial correlation coefficient),才能真正地解释他们之间的内在联系。偏相关系数是在多元相关分析中说明当某个自变量在其他自变量固定不变时,分别同因变量线性相关程度指标。偏相关
60、系数的取值范围亦在-1到+1之间。2.建立模型(1)偏相关系数的计算公式:当有一个控制变量时,变量与的偏相关公式(或称零阶相关系数)为:=当有两个控制变量,时,变量与的偏相关公式如下:=(2)对相关系数的检验方法再偏相关分析中,由于两个变量之间相关系数是在固定(控制)了一个或某几个变量后进行的,考虑到这种因素及抽样误差的影响,其检验统计量为:=3.模型求解:(1)分析酿酒红葡萄与红葡萄酒的理化指标之间的偏相关系数:通过SPSS软件,利用相关分析,计算出酿酒红葡萄与红葡萄酒的理化指标之间的相关系数,如表所示:表四 红葡萄偏相关系数矩阵花色苷鲜重总酚单宁葡萄总黄酮白藜芦醇花色苷单宁J总酚J酒总黄酮
61、白藜芦醇J花色苷鲜重1.0000.7280.6880.566-0.0600.9230.7200.7740.7090.200总酚0.7281.0000.7550.895-0.0190.6130.8170.8750.8830.459单宁0.6880.7551.0000.688-0.0500.6610.7180.7430.7010.315葡萄总黄酮0.5660.8950.6881.0000.0210.4410.6840.8150.8230.567白藜芦醇-0.060-0.019-0.0500.0211.000-0.0350.0490.0760.0470.014花色苷0.9230.6130.6610.
62、441-0.0351.0000.7440.7650.6650.124单宁J0.7200.8170.7180.6840.0490.7441.0000.9210.8370.331总酚J0.7740.8750.7430.8150.0760.7650.9211.0000.9040.486酒总黄酮0.7090.8830.7010.8230.0470.6650.8370.9041.0000.399白藜芦醇J0.2000.4590.3150.5670.0140.1240.3310.4860.3991.000我们规定两者的相关系数绝对值大于0.6时,认为两者的相关性显著。从而筛选出与红葡萄酒理化指标相关性显著
63、的酿酒红葡萄的理化指标。从表中可以发现:(1) 红葡萄的花色苷鲜重与酒中花色苷的相关性非常显著,与总酚、单宁、酒总黄酮的相关性较为显著;(2) 红葡萄的总酚与酒中花色苷、总酚、单宁、酒总黄酮的相关性较为显著;(3) 红葡萄的单宁与酒中花色苷、总酚、单宁、酒总黄酮的相关性较为显著;(4) 红葡萄的葡萄总黄酮与酒中总酚、酒总黄酮的相关性较为显著,与花色苷、单宁的相关性显著;(5) 红葡萄的白藜芦醇与酒中花色苷的相关性为负,与其他的指标相关性不显著;(6) 红葡萄酒中的白藜芦醇J与红葡萄中的5个理化指标的相关性不显著。(2)分析酿酒白葡萄与白葡萄酒的理化指标之间的联系:同上,通过SPSS软件,利用相
64、关分析,计算出酿酒白葡萄与白葡萄酒的理化指标之间的相关系数,如表所示:表五 白葡萄偏相关系数矩阵总酚单宁葡萄总黄酮白藜芦醇总酚J单宁J酒总黄酮白藜芦醇J总酚1.0000.5140.9430.0560.5470.4280.744-0.136单宁0.5141.0000.548-0.0560.5730.5740.346-0.02葡萄总黄酮0.9430.5481.0000.0650.5880.4950.697-0.101白藜芦醇0.056-0.0560.0651.0000.037-0.062-0.095-0.213总酚J0.5470.5730.5880.0371.0000.8780.564-0.138
65、单宁J0.4280.5740.495-0.0620.8781.0000.423-0.162酒总黄酮0.7440.3460.697-0.0950.5640.4231.000-0.031白藜芦醇J-0.136-0.002-0.101-0.213-0.138-0.162-0.0311.000我们规定两者的相关系数绝对值大于0.5时,认为酿酒白葡萄中的某项理化指标与白葡萄酒中的某种成分的相关性显著。从而筛选出与白葡萄酒理化指标相关性显著的酿酒白葡萄的理化指标。从表中可以发现:(1) 酿酒白葡萄中的总酚与酒中总酚、单宁、酒总黄酮的相关性显著;(2) 酿酒白葡萄中的单宁与酒中总酚、单宁、酒总黄酮的相关性显
66、著;(3) 酿酒白葡萄中的总黄酮与酒中总酚、单宁、酒总黄酮的相关性显著;(4) 酿酒白葡萄中的白藜芦醇与酒中单宁、酒总黄酮的相关性为负;(5) 酒中白藜芦醇J与白葡萄中的4个理化指标的相关性为负。4.3.2分析酿酒葡萄与葡萄酒的理化指标之间的联系回归分析模型(多元线性回归)1.多元线性回归分析概念多元线性回归分析是多元回归分析(multiple regression analysis)中最为简单而又最常用的一种分析方法。其原理与直线回归分析的完全相同,但是要涉及到一些新概念,在计算上要复杂得多,当自变量较多时要借助于电脑进行计算。许多非线性回归(no-linear regression)问题都
67、可转变为线性回归来解决。进行多元线性回归分析的基本任务是根据各自变量的实现观察值建立依变量与各自变量之间的线性回归方程,以揭示依变量与各自变量之间的具体线性联系形式,其目的在于所建立的线性回归方程进行预测和控制。2.模型建立(1)多元线性回归方程的建立设变量,有组观察数据,其中为自变量,为依变量。第组观察值(=1,2,)可表示为(,),是+1维空间中的一个点。如果依变量同时受到个自变量的影响,且这个自变量都与成线性关系,则这+1个变量的关系就形成元线性回归。因此,一个元线性回归的数学模型为 式中,为个待估参数;为可精确测量或可控制的一般变量,也可以是可观察的随机变量;为可以观察的随机变量,随而
68、变,并受实验误差影响;为随机变量,相互独立,且服从同一正态分布N(0,) 。一个元线性回归方程可给定为:=(式中,是的最小二乘法。)3.模型求解3.1红葡萄的理化指标与红葡萄酒的理化指标的回归分析(1)在SPSS中,利用回归分析,计算出酿酒红葡萄中的花色苷鲜重与红葡萄酒中的花色苷,单宁J,总酚J,酒总黄酮的多元线性回归方程:(2)同理,我们在SPSS中得到其他(总酚,单宁,葡萄总黄酮,白藜芦醇)与红葡萄酒的理化指标的多元线性回归方程:(:酒-花色苷 :酒-单宁 :酒-总酚 :酒-黄酮 :花色苷 :单宁 :总酚 : 葡萄总黄酮 :白藜芦醇)3.2白葡萄的理化指标与白葡萄酒的理化指标的回归分析同3
69、.1,我们也利用回归分析,得到酿酒白葡萄与白葡萄酒的理化指标的多元线性回归方程:( :总酚 :单宁 :葡萄总黄酮 :白藜芦醇:酒-总酚 :酒-单宁 :酒-酒总黄酮 : 白藜芦醇J)4.4 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。4.4.1利用相关分析原理,算出酿酒葡萄的理化指标与葡萄酒质量的偏相关系数,分析分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。1模型建立 利用SPSS软件,运用相关分析,分别计算出葡萄酒的理化指标与葡萄酒质量的相关系数、葡萄的理化指标与葡萄酒质量的相关系数。然后通过对相关系数的比较,分析葡萄和葡萄酒的理
70、化指标对葡萄酒质量的影响。2. 模型求解 (1)葡萄酒的理化指标与葡萄酒质量的相关系数 红葡萄酒的理化指标与葡萄酒质量的相关系数红葡萄酒质量花色苷单宁总酚酒总黄酮白藜芦醇DPPH半抑制体积L*(D65)a*(D65)b*(D65)红葡萄酒质量1.0000.1530.4860.4930.5180.5110.550-0.4540.1860.245从图中可以看出,除了色泽L*(D65)对红葡萄酒的质量有较显著的负相关,其余都与红葡萄酒的质量有正相关,尤其是单宁、总酚、酒总黄酮、白藜芦醇、DPPH半抑制体积。由此可以分析出,红葡萄酒的理化指标对红葡萄酒的质量有较大的影响。白葡萄酒的理化指标与白葡萄酒质
71、量的相关系数白葡萄酒质量总酚单宁酒总黄酮白藜芦醇DPPH半抑制体积Lab白葡萄酒质量1.0000.0650.106-0.194-0.1640.191-0.171-0.1350.175从图中可以看出,白葡萄酒中的理化指标和白葡萄酒的质量的相关系数相对较小,即白葡萄酒中的理化指标和白葡萄酒的质量的相关性不是很显著。由此可以分析出,与红葡萄酒的相关系数相比,白葡萄酒中的理化指标对白葡萄酒的质量的影响较小。(2)葡萄的理化指标与葡萄酒质量的相关系数 酿酒红葡萄的理化指标与葡萄酒质量的相关系数红葡萄酒质量氨基酸总量蛋白质VC含量花色苷酒石酸苹果酸柠檬酸多酚氧化酶活力E褐变度总酚红葡萄酒质量1.0000.1490.518-0.0700.2720.288-0.348-0.205-0.230-0.0130.647 对SPSS计算结果中的相关系数的分析,在红葡萄的理化指标中,有些与红葡萄酒的质量成正相关,像蛋白质、总酚与红葡萄酒的质量有显著的相关性,但其余成分的相关性不明显;也有一些与红葡萄酒的质量成负相关,但只有个别与其相关性显著。由此可以分析出,与红葡萄酒的理化指标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 金融合同信托合同(一)8篇
- 粮油购销合同范本与粮食买卖合同3篇
- 官方的二手房买卖定金合同10篇
- 隧道劳务施工合同3篇
- 电商设计职业规划
- 学校食堂卫生管理规范
- 健康促进照护课件
- 2025辽宁体育运动职业技术学院辅导员考试试题及答案
- 2025赣西科技职业学院辅导员考试试题及答案
- 2025眉山职业技术学院辅导员考试试题及答案
- 2023污水处理用复合碳源技术规范
- 4-6岁一盘粽子-超轻粘土课件
- 解读《2023年中国血脂管理指南》
- 承插型盘扣式钢管脚手架典型产品构配件种类及规格
- 马铃薯(土豆)深加工项目可行性研究报告
- 《眼底病图谱》教学课件
- 公司声誉风险管理办法(2022年修订)
- 新能源汽车故障诊断与排除课件:项目三 高压互锁故障诊断
- 负荷计算及负荷
- 《中国文化的根本精神 精装 》读书笔记思维导图
- 2023年湖南高考英语听力练习试题「含原文答案」
评论
0/150
提交评论