2012年“高教社”杯全国大学生数学建模竞赛A题获奖论文.pdf_第1页
2012年“高教社”杯全国大学生数学建模竞赛A题获奖论文.pdf_第2页
2012年“高教社”杯全国大学生数学建模竞赛A题获奖论文.pdf_第3页
2012年“高教社”杯全国大学生数学建模竞赛A题获奖论文.pdf_第4页
2012年“高教社”杯全国大学生数学建模竞赛A题获奖论文.pdf_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2012 高教社杯全国大学生数学建模竞赛高教社杯全国大学生数学建模竞赛 承承 诺诺 书书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮 件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问 题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他 公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正 文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反 竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行 公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表 等) 。 我们参赛选择的题号是(从 A/B/C/D 中选择一项填写) : A 我们的参赛报名号为(如果赛区设置报名号的话) : 62 所属学校(请填写完整的全名) : 大连海事大学 参赛队员 (打印并签名) :1. 周园杰 2. 高宪溢 3. 陈清坤 指导教师或指导教师组负责人 (打印并签名): 张运杰 日期: 2012 年 9 月 9 日 赛区评阅编号(由赛区组委会评阅前进行编号): 2012 高教社杯全国大学生数学建模竞赛高教社杯全国大学生数学建模竞赛 编编 号号 专专 用用 页页 赛区评阅编号(由赛区组委会评阅前进行编号): 赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号): 1 葡萄酒的评价葡萄酒的评价 摘要摘要 本文主要讨论葡萄酒的评价问题。通过建立初等数学模型、多元统计即逐步 回归模型、一元线性回归模型,分别对评酒员的评价结果、酿酒葡萄的分级、酿 酒葡萄与葡萄酒的理化指标之间的关系以及各理化指标对葡萄酒质量的影响等 问题进行了求解。 对于问题一,我们建立了初等数学模型。采用 t 检验的方法对两组评酒员的 评价结果的差异性进行了检验,用 matlab 作为计算工具,很方便的得到了两组 评价结果的关系。同时,我们根据附件 1 提供的数据分别求出了两组评酒员对各 红、白葡萄酒样品评价总分的平均值,以此作为各葡萄酒样品的总分,进而求出 两组评酒员对各葡萄酒样品总分的方差, 从此可以得到两组评酒员评价结果的分 散程度。方差小,说明分散程度低,进而判断结果可信;方差大,说明分散程度 大,判断结果不可信。 对于问题二,我们建立了多元统计即逐步回归模型。葡萄酒的质量我们用评 酒员评价的总分来表示, 并在此问假设葡萄酒的质量仅由酿酒葡萄的理化指标决 定。但是附件 2 给出了酿酒葡萄的很多理化指标,处理起来较为繁琐,因此我们 想到了建立多元统计即逐步回归模型。运用此模型,把这些理化指标中对葡萄酒 质量影响较大的几项筛选出来,建立葡萄酒质量与这些理化指标间的函数关系, 通过葡萄酒质量的高低可以反映出这些指标在酿酒葡萄中含量的多少, 以此作为 分类标准对酿酒葡萄就行分类。计算过程由 matlab 完成。 对于问题三,我们建立了一元线性回归模型。我们假定葡萄酒中的各项理化 指标分别由酿酒葡萄中的相对应的理化指标决定,因此可以建立一一对应关系。 首先根据所给出的数据画出相对应的指标间的走势图, 这样可以初步的看出二者 大致的关系, 进而可以通过matlab使用曲线拟合的方法将二者的数据进行拟合, 可以得到准确的对应关系。 对于问题四,我们仍采用多元统计即逐步回归模型。由于在问题二中,我们 已经讨论过酿酒葡萄的理化指标对葡萄酒质量的影响,在此问中,只讨论葡萄酒 的理化指标对葡萄酒质量的影响, 方法与问题二中的方法相同。 结合全篇的分析, 我们可以论证能否通过葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 最后, 我们对整个过程中建立的模型进行了分析与反思, 找出了优点与不足。 关键字:t 检验 逐步回归 一元线性回归 曲线拟合 2 问题的的重述问题的的重述 葡萄酒 i是用新鲜的葡萄或葡萄汁经发酵酿成的酒精饮料。通常分红葡萄酒 和白葡萄酒两种。前者是红葡萄带皮浸渍发酵而成,后者是葡萄汁发酵而成的。 葡萄酒的成分相当复杂,它是经自然发酵酿造出来的果酒,它含有最 多的是葡萄果汁,占百分之八十以上,其次是经葡萄里面的糖份自然发酵 而成的酒精,一般在百分之十至百分之十三,剩余的物质超过 1000 种,比 较重要的有 300 多种。葡萄酒其他重要的成分如酒酸,果性,矿物质和单 宁酸等。虽然这些物质所占的比例不高,却是酒质优劣的决定性因素。质 优味美的红酒,是因为它们能呈现一种组织结构的平衡,使人在味觉上有 无穷的享受。 葡萄酒不仅是水和酒精的溶液,它有丰富的内涵: A80%的水。这是生物学意义上的纯水,是由葡萄树直接从土壤中汲 取的。 B9.5-15%的乙醇,即主要的酒精。经由糖份发酵后所得,它略甜, 而且给葡萄酒以芳醇的味道。 C酸。有些来自于葡萄,如酒石酸、苹果酸和柠檬酸;有些是酒精发 酵和乳酸发酵生成的,如乳酸和醋酸。这些主要的酸,在酒的酸性 风味和均衡味道上起着重要的作用。 D酚类化合物。每公升 1 到 5 克,它们主要是自然红色素以及单宁, 这些物质决定红酒的颜色和结构。 E. 每公升 0.2 到 5 克的糖份。不同类型的酒含糖份多少不同。 F. 芳香物质(每公升数百毫克),它们是挥发性的,种类很多。 G. 氨基酸、蛋白质和维生素(C,B1,B2,B12,PP)。它们影响着葡 萄酒的营养价值。 葡萄酒的评价,是在确定葡萄酒质量时,通过聘请一批有资质的评酒员进行 品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总 分,从而确定葡萄酒的质量。同时,酿酒葡萄的好坏与所酿葡萄酒的质量有直接 的关系, 葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的 质量。 通过对给出的葡萄酒的品尝评分表、指标总表及芳香物质分析,我们将要解 决以下几个问题: 1. 通过对葡萄酒的品尝评分表数据的分析,建立对应的数学模型,分析 两组评价结果是否存在显著性差异,并判断出何组的结果更可信。 2. 利用第一问中的模型, 进一步完善模型并根据酿酒葡萄的理化指标和 葡萄酒的质量对这些酿酒葡萄进行分级。 3. 利用有关数据,分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响, 并论证能否 用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 问题的分析问题的分析 本题研究的是根据葡萄酒的各项理化指标以及芳香物质等大量数据对葡萄 3 酒的质量作出评价以及研究各指标间的关系等。 1)问题一是对附件 1 两组品酒员的评价结果进行分析,判断他们的评价结 果有无显著性差异以及哪一组更可信。 对于这个问题, 通过建立简单的数学模型, 得出两组品酒员评价结果的总体趋势, 便可以清晰地看出两组评价结果有无明显 差异,通过计算方差等数学指标,分别得出两组对每个样品的评价结果的分散程 度,分散程度小,说明结果更可信。 2)问题二给出了酿酒葡萄的各项理化指标,由于指标较多,处理起来较为 繁杂,必须建立合理的数学模型,从较多的理化指标中,筛选出对葡萄酒质量影 响程度较大的指标, 把筛选出的酿酒葡萄中这些指标含量的多少作为对酿酒葡萄 分级的标准,进行合理分级。 3)问题三分析酿酒葡萄与葡萄酒的理化指标间的关系。显而易见,葡萄酒 中的相关理化指标受酿酒葡萄中对应的理化指标影响最大。 我们首先做出两者相 对应的理化指标的关系趋势图, 观察两者的走势, 从而可以得到两者的大致关系, 然后可以通过曲线拟合的方法,确定两者的函数关系。 4)问题四葡萄酒的质量可以用附件 1 品酒员评价的总分来表示,通过建立 合理的数学模型, 找到酿酒葡萄和葡萄酒中对葡萄酒质量影响关系较大的理化指 标,进行分析。通过以上多重分析并结合品酒员对葡萄酒质量的评价结果可以论 证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 提出基本假设提出基本假设 1)葡萄酒的质量用品酒员评价的总分来表示。 2)问题二中假设葡萄酒的质量只受酿酒葡萄理化指标的影响。 3)问题三中假设葡萄酒中的理化指标由酿酒葡萄中相对应的理化指标的决 定,而与其他指标无关。 4)假设各二级理化指标对葡萄酒质量的影响很小,可忽略不计。 5)问题四中假设酿酒葡萄的理化指标与葡萄酒的理化指标分别作用影响葡 萄酒的质量。 基本符号说明基本符号说明 i j R:第i组第j号红葡萄酒样品的总分平均值; i j w:第i组第j号白葡萄酒样品的总分平均值; 2 Ri :第i组红葡萄酒样品的总分平均值的方差; 2 wi :第i组白葡萄酒样品的总分平均值的方差; 4 i X:白酿酒葡萄第 个理化指标; i P:红酿酒葡萄第 个理化指标 ; i Q :红葡萄酒第 个理化指标; i Z:白葡萄酒第 个理化指标; i Y:白酿酒葡萄的理化指标影响下的葡萄酒的总分即质量; i K:红酿酒葡萄的理化指标影响下的葡萄酒的总分即质量; i M:白葡萄酒的理化指标影响下的葡萄酒的总分即质量; i N:红葡萄酒的理化指标影响下的葡萄酒的总分即质量; 模型的建立和求解模型的建立和求解 问题一:初等模型问题一:初等模型 1 1)初步分析数据)初步分析数据 根据附件 1 数据, 分别求出两组评酒员对本组内各葡萄酒样品评分的平均值, 作出表 1-1.本问题需要解决的问题是两组评酒员的评价结果有无显著差异以及 判断哪一组更可信,那么我们根据两组评酒员的评价总分,建立数学模型进行求 解。 表表 1-1 两组葡萄酒样品的总分平均值两组葡萄酒样品的总分平均值 第一组红 1j R 第二组红 2 j R 第一组白 1j w 第二组白 2 j w 酒样品 1 82 77.9 82 77.9 酒样品 2 74.2 75.8 74.2 75.8 酒样品 3 85.3 75.6 85.3 75.6 酒样品 4 79.4 76.9 79.4 76.9 酒样品 5 71 81.5 71 81.5 酒样品 6 68.4 75.5 68.4 75.5 酒样品 7 77.5 74.2 77.5 74.2 酒样品 8 71.4 72.3 71.4 72.3 酒样品 9 72.9 80.4 72.9 80.4 酒样品 10 74.3 79.8 74.3 79.8 酒样品 11 72.3 71.4 72.3 71.4 酒样品 12 63.3 72.4 63.3 72.4 酒样品 13 65.9 73.9 65.9 73.9 酒样品 14 72 77.1 72 77.1 5 酒样品 15 72.4 78.4 72.4 78.4 酒样品 16 74 67.3 74 67.3 酒样品 17 78.8 80.3 78.8 80.3 酒样品 18 73.1 76.7 73.1 76.7 酒样品 19 72.2 76.4 72.2 76.4 酒样品 20 77.8 76.6 77.8 76.6 酒样品 21 76.4 79.2 76.4 79.2 酒样品 22 71 79.4 71 79.4 酒样品 23 75.9 77.4 75.9 77.4 酒样品 24 73.3 76.1 73.3 76.1 酒样品 25 77.1 79.5 77.1 79.5 酒样品 26 81.3 74.3 81.3 74.3 酒样品 27 64.8 77 64.8 77 酒样品 28 81.3 79.6 平均值 i R(或 i w) 74 76.41852 74.26071 76.53214 方差 2 Ri (或 2 wi ) 25.14963 9.693361 26.08667 9.695753 2 2)初等模型的建立)初等模型的建立 根据对问题的分析以及初步的数据处理结果, 我们决定采用简单并易于理解 的初等模型对问题一进行求解。对于评酒员的评价结果有无显著差异,我们可以 用 t 检验得出结果,并分别求出各组红葡萄酒与白葡萄酒总分的方差,观察两组 评价结果的分散程度,从而确定哪一组的评价结果更为可信。 3 3)模型的求解)模型的求解 是否有显著差异性检验: 对两组评酒员的评价结果是否有无显著性差异, 我们通过用 t 检验来进行判 定: 双总体 t 检验 ii是检验两个样本平均数与其各自所代表的总体的差异是 否显著,其基本表达式为: 在这里, , 分别为两样本平均数; , 分别为两样本方差; 为相关样 本的相关系数。 我们使用 matlab 的 t-test 函数进行求解: h,p,ci = ttest(A,B,0.05) 6 其中 h 表示结果的正确与否,如果为 1,表明差异显著,反之则不显著, 而 p 表示我们设定的显著差异的标准,一般0.05 认为差异显著,0.01 认 为是差异极显著。通过 matlab 编程求解,得出以下结果: 两组评酒员对红葡萄酒样品评价的 t 检验结果:h=1 p=0.0437 两组评酒员对白葡萄酒样品评价的 t 检验结果:h=1 p=5.9186e-032 由检验结果我们看出 h 均等于 1,说明第一组与第二组评酒员的评价结果具 有显著性差异。 结果可信度分析: 首先根据初步分析数据中得到表1-1分别作出红葡萄酒样品总分平均值与白 葡萄酒样品总分平均值折线图如图 1-2 及图 1-3 所示: 图图 1-2 红葡萄酒样品总分平均值折线图红葡萄酒样品总分平均值折线图 图图 1-3 白葡萄酒样品总分平均值折线图白葡萄酒样品总分平均值折线图 我们从图 1-2 和图 1-3 的折线图可以看出, 不管是对红葡萄酒还是白葡萄酒, 第二组评酒员给出的分数趋势较第一组的平稳,浮动变化较小,因此我们初步判 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 酒样品1 酒样品3 酒样品5 酒样品7 酒样品9 酒样品11 酒样品13 酒样品15 酒样品17 酒样品19 酒样品21 酒样品23 酒样品25 酒样品27 第一组红 第二组红 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 酒样品1 酒样品3 酒样品5 酒样品7 酒样品9 酒样品11 酒样品13 酒样品15 酒样品17 酒样品19 酒样品21 酒样品23 酒样品25 酒样品27 第一组白 第二组白 7 定第二组评酒员给出的评价结果更可信。然后,通过方差公式: 2 2 1 () n i i X XX n 求出两组评酒员对红、 白葡萄酒的评分的方差值 (见表 1-1) , 进行分别比较发现, 第二组的方差值明显小于第一组,说明第二组评酒员的评价结果分散程度小,因 此我们判定第二组的评价结果更为可信。 问题二:统计回归模型的逐步回归法问题二:统计回归模型的逐步回归法 1 1) 初步分析数据初步分析数据 此问题中,各葡萄酒样品的质量用评酒员评价的总分来表示。由于在问题一 中已得出第二组的评价结果更可靠, 因此我们用第二组的总分来表示葡萄酒样品 的质量。 由于酿酒葡萄的理化指标较多, 必定会有几项指标对葡萄酒的质量有较大影 响。我们首先对各酿酒葡萄样品的各项理化指标含量求平均值,此步骤在 Excel 中完成。再通过建立合理的数学模型,在较多的理化指标中筛选出对葡萄酒质量 影响大的几项重要指标, 以这几项指标在酿酒葡萄中的含量作为分级标准对酿酒 葡萄进行分级。 2 2) 逐步回归模型的提出与建立逐步回归模型的提出与建立 iiiiii 附件 2 中给出了酿酒葡萄较多的理化指标, 但是我们希望从中挑选出对因变 量即葡萄酒的质量影响显著的那些来建立回归模型。变量选择的标准,应该是将 所有对因变量影响显著的自变量都选入模型, 而影响不显著的自变量都不选入模 型,从便于应用的角度应使模型中的自变量个数尽可能少。逐步回归就是一种从 众多自变量中有效地选择重要变量的方法。 逐步回归的基本思路是,先确定一个包含若干自变量的初始集合,然后每次 从集合外的变量中引入一个对因变量影响最大的,再对集合中的变量进行检验, 从变得不显著的变量中移出一个影响较小的,依次进行。直到不能引入和移出为 止。引入和移出都以给定的显著性水平为标准。 在本题中,采用逐步回归模型进行求解。 3 3) 模型的求解模型的求解 逐步回归模型的求解是通过 matlab 中的 stepwise 函数来完成的。 白酿酒葡萄对葡萄酒质量的影响: 将附件 2 中的白色酿酒葡萄的理化指标 i X与第二组白葡萄酒样品的总分 i Y 分别作为自变量与因变量作为 stepwise 的参数,即 stepwise( i X, i Y),运行后,界 面如下图所示: 8 图 2-1 Stepwise Regression 最终界面(按 All Stepwise 所得) 从图 2-1 可以看出,最终入选的自变量(蓝色的行)只有 30 X,即色泽 b*,这 表明,仅含 30 X模型是合适的,由 30 X的回归系数和回归常数利用逐步回归模型 最终得到的模型为: Y=0.3930 30 X+71.3449 从以上模型可以看出,白酿酒葡萄各个理化指标中,色泽 b*是影响白葡萄 酒质量的重要指标,且 b*含量越多,白葡萄酒的质量越好,从而可以根据白酿 酒葡萄中 b*的含量的多少作为标准给白酿酒葡萄进行分级。 红酿酒葡萄对葡萄酒质量的影响: 将附件 2 中的红色酿酒葡萄的理化指标 i P与第二组白葡萄酒样品的总分 i K 分别作为自变量与因变量作为 stepwise 的参数,即 stepwise( i P, i K),运行后,界 面如下图所示: -20-1001020 X23 X24 X25 X26 X27 X28 X29 X30 Coefficients with Error Bars Coeff. t-stat p-val -0.00927279 -1.5522 0.1332 -0.00250235 -0.2422 0.8106 0.240074 0.4066 0.6878 -0.0254315 -0.2521 0.8030 1.26039 0.1258 0.9009 -0.370621 -1.2000 0.2414 0.363995 2.0297 0.0532 0.392955 3.1280 0.0043 12 2.5 3 3.5 Model History RMSE 9 图 2-2 Stepwise Regression 最终界面(按 All Stepwise 所得) 从图 2-2 可以看出, 最终入选的自变量 (蓝色的行) 只有 6 P(苹果酸) 、 8 P(多 酚) 、 13 P(葡萄总黄酮) 、 21 P(固酸比) 、 29 P(色泽 a*) ,这表明,仅含 6 P(苹 果酸) 、 8 P(多酚) 、 13 P(葡萄总黄酮) 、 21 P(固酸比) 、 29 P(色泽 c*)模型是 合适的, 由以上几项的回归系数和回归常数利用逐步回归模型最终得到的模型为: i K=-0.3616 6 P-0.1018 8 P+0.4080 13 P+0.2294 21 P-0.7685 29 P 从以上模型可以看出,红酿酒葡萄各个理化指标中,苹果酸、多酚、葡萄总 黄酮、固酸比、色泽 a*是影响红葡萄酒的重要指标,为了综合考虑这五项指标, 按 (2) 式重新计算一次总分, 即为在这五项指标的综合影响下的葡萄酒的质量, 分数越高,葡萄酒的质量越好,也就说明对应的酿酒葡萄样品质量越好,从而对 酿酒葡萄进行分级。 4 4) 分类结果分类结果 酿酒葡萄的分类及分类标准如下表格所示: 白酿酒葡萄分类结果:白酿酒葡萄分类结果: 等级 白葡萄样品标号 白葡萄分类标准 A+ A+ 80 A 21 28 A 7980 A- 14 23 4 5 A- 7879 B+ 11 17 26 20 B+ 7778 B 24 10 27 6 3 18 9 7 2 B 7677 B- 15 13 25 22 12 1 B- 7576 C+ 8 C+ 7475 -50510152025 X3 X4 X5 X6 X7 X8 X9 X10 Coefficients with Error Bars Coeff. t-stat p-val -0.127734 -0.6641 0.5142 0.00853697 1.0004 0.3291 0.0156838 0.1242 0.9024 -0.361621 -3.4958 0.0022 -0.195553 -0.3557 0.7258 -0.101835 -2.4776 0.0218 0.000249888 0.1418 0.8886 8.23965 1.4189 0.1713 123456 1 2 3 4 Model History RMSE 10 C 19 C 7374 C- 16 C- 7273 D+ D+ 7172 D D 7071 D- D- 70 红酿酒葡萄分类结果:红酿酒葡萄分类结果: 等级 红葡萄样品标号 红葡萄分类标准 A+ A+ 80 A 23 A 77.580 A- 2 9 A- 7577.5 B+ 16 3 20 B+ 72.575 B 14 17 19 24 22 5 21 26 B 7072.5 B- 1 15 6 12 4 25 27 13 10 B- 67.570 C+ 7 8 18 C+ 6567.5 C C 62.565 C- 11 C- 6062.5 D D 60- 问题三:问题三: 一元线性回归模型一元线性回归模型 1 1) 初步分析数据初步分析数据 由假设已知,葡萄酒的理化指标只由酿酒葡萄中相对应的理化指标决定。我 们首先根据附件 2 中所给出的酿酒葡萄与葡萄酒的理化指标, 画出相对应的理化 指标间的关系走势图,初步的观察二者大致的关系。其曲线走势图如下图所示: 白葡萄酒白葡萄酒 (以葡萄酒中的单宁与总酚和酿酒葡萄中的单宁与总酚走势图为 例,其他指标走势图将以附件形式给出) 图 3-1 葡萄酒中单宁与酿酒葡萄中单宁含量走势图 0 1 2 3 4 5 6 7 8 9 酒单宁 葡萄单宁 11 图 3-2 葡萄酒中总酚与酿酒葡萄中总酚含量走势图 红红葡萄酒葡萄酒(以葡萄酒中的总黄酮与 DPPH 和酿酒葡萄中的总黄酮与 DPPH 走势图为例,其他指标走势图将以附件形式给出) 图 3-3 葡萄酒中的总黄酮与酿酒葡萄中的总黄酮含量走势图 图 3-4 葡萄酒中的 DPPH 与酿酒葡萄中的 DPPH 含量走势图 0 2 4 6 8 10 12 14 16 18 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 酒总酚 葡萄总酚 0 5 10 15 20 25 30 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 酒总黄酮 葡萄总黄酮 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 /通用格式 酒 葡萄DPPH 12 2 2)一元线性回归模型的提出与建立)一元线性回归模型的提出与建立 通过对以上走势图的观察分析,可以初步看出,葡萄酒中的理化指标与酿酒 葡萄中的相应指标基本上呈线性关系,从而提出一元线性回归模型。 对于此问题,可以使用 matlab 对相对应的指标进行曲线拟合 iv,从而可以得 到二者的准确关系以及表达式。 3)3)模型求解模型求解 在matlab中,可以使用polyfit函数对数据进行拟合,其基本表达式为: p=polyfit(x,y,1) 其中,x、y分别表示两变量,1为一阶拟合,也可以使用二阶及以上拟 合。 在本问题中,使用一阶拟合效果最好。 再使用polyval函数,可以求解得到多项式的系数。一下为曲线拟合得 到的结果: 白葡萄酒白葡萄酒 (以葡萄酒中的单宁与总酚和酿酒葡萄中的单宁与总酚拟合曲线 为例,其他指标拟合曲线将以附件形式给出) 图3-5 葡萄酒中的单宁与酿酒葡萄中的单宁拟合曲线 图3-6 葡萄酒中的总酚与酿酒葡萄中的总酚拟合曲线 123456789 1 1.5 2 2.5 3 3.5 4 4.5 4681012141618 0 0.5 1 1.5 2 2.5 3 3.5 13 红红葡萄酒葡萄酒(以葡萄酒中的总黄酮与 DPPH 和酿酒葡萄中的总黄酮与 DPPH 拟合曲线为例,其他指标拟合曲线将以附件形式给出) 图3-7 葡萄酒中的总黄酮与酿酒葡萄中的总黄酮拟合曲线 图3-8 葡萄酒中的DPPH与酿酒葡萄中的DPPH拟合曲线 4)4)结果分析结果分析 通过对以上指标的拟合曲线观察分析可以得出,葡萄酒中的理化指标与酿酒 葡萄中的相对应的理化指标间近似为线性关系。 问题四:统计回归模型的逐步回归法问题四:统计回归模型的逐步回归法 (一)(一) 酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响 1 1)模型的提出与建立)模型的提出与建立 酿酒葡萄的理化指标对葡萄酒质量的影响已经在问题二中进行 了论述,此问只需求解葡萄酒的理化指标对葡萄酒质量的影响,仍采 用统计回归模型的逐步回归法。 0.10.20.30.40.50.60.70.8 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0510152025 0 2 4 6 8 10 12 14 14 2)2) 模型求解模型求解 白葡萄酒的理化指标对葡萄酒质量的影响白葡萄酒的理化指标对葡萄酒质量的影响 将附件 2 中的白葡萄酒的理化指标 i Z与第二组白葡萄酒样品的总分 i M 分别作为自变量与因变量作为 stepwise 的参数,即 stepwise( i Z, i M),运行后, 界面如下图所示: 图4-1 白葡萄酒Stepwise Regression最终界面(按All Stepwise所得) 从图 4-1 可以看出,最终入选的自变量(蓝色的行)只有 5 Z,即 DPPH,这 表明,仅含 5 X模型是合适的,由 5 X的回归系数和回归常数利用逐步回归模型最 终得到的模型为: M=21.0814 5 Z+76.5321 (1) 红葡萄酒的理化指标对葡萄酒质量的影响红葡萄酒的理化指标对葡萄酒质量的影响 将附件2中的红葡萄酒的理化指标 i Q与第二组白葡萄酒样品的总分 i N分 别作为自变量与因变量作为stepwise的参数,即stepwise( i Q, i N),运行后,界面 如下图所示: Coeff. t-stat p-val -0.312182 -0.2478 0.8063 -0.846176 -0.5083 0.6157 -0.561425 -1.4591 0.1570 -1.47342 -0.7144 0.4816 21.0814 0.9927 0.3300 -1.64699 -0.8581 0.3990 -2.29816 -0.8094 0.4259 0.452204 0.8713 0.3919 12 3.17 3.171 3.172 Model History RMSE -200204060 X1 X2 X3 X4 X5 X6 X7 X8 Coefficients with Error Bars 15 图4-2 红葡萄酒Stepwise Regression最终界面(按All Stepwise所得) 从图 4-2 可以看出,最终入选的自变量(蓝色的行)有 6 Q(DPPH)和 8 Q(色 泽 a*),这表明,含有 6 X(DPPH)和 8 X(色泽 a*)的模型是合适的,由其的回 归系数和回归常数利用逐步回归模型最终得到的模型为: i N=19.665 6 Q+0.1015 8 Q+61.0043 (2) 3)3) 结果分析结果分析 由问题可以得出葡萄酒的质量与两种酿酒葡萄理化指标的关系为: 白酿酒葡萄: i Y=0.3930 30 X+71.3449 红酿酒葡萄: i K=-0.3616 6 P-0.1018 8 P+0.4080 13 P+0.2294 21 P-0.7685 29 P 葡萄酒的质量与两种葡萄酒理化指标的关系为: 白葡萄酒: i M=21.0814 5 Z+76.5321 红葡萄酒: i N=19.665 6 Q+0.1015 8 Q+61.0043 由上式可以看出, 酿酒葡萄与葡萄酒的理化指标对葡萄酒的影响均是多由上式可以看出, 酿酒葡萄与葡萄酒的理化指标对葡萄酒的影响均是多 元线性关系。元线性关系。 (二)论证能否用二者理化指标评价葡萄酒质量(二)论证能否用二者理化指标评价葡萄酒质量 结论:结论: 在一定程度上可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量, 但并不是唯一的评价指标。 证明:证明: 上文已经经过讨论得出结论酿酒葡萄与葡萄酒的理化指标对葡萄酒 的影响均是多元线性关系。 酿酒葡萄与葡萄酒的理化指标均在一定程度上 0102030 X2 X3 X4 X5 X6 X7 X8 X9 Coefficients with Error Bars Coeff. t-stat p-val 0.0830563 0.1497 0.8823 -0.0904313 -0.1054 0.9170 0.245271 0.4306 0.6707 0.230443 0.8062 0.4284 19.6651 3.8982 0.0007 0.0172446 0.3569 0.7244 0.101523 2.0931 0.0471 0.0552952 0.6229 0.5395 123 3 3.5 4 Model History RMSE 16 影响葡萄酒的质量, 因此用二者的理化指标来评价葡萄酒的质量有一定的 道理。但是在附件一中我们看到评酒员对葡萄酒质量的打分有很多标准, 理化指标只是其中的一部分, 芳香物质的影响即感官指标亦是影响葡萄酒 质量的一大因素, 因此不能单纯的用二者的理化指标绝对的说明葡萄酒质 量的好坏,如果条件允许,应综合多方面考虑。但是在条件有限以及简化 程序上考虑, 葡萄和葡萄酒的理化指标还是可以在一定程度上反映出葡萄 酒的质量。 模型的评价模型的评价 模型的优点: (1) 问题一中我们采用了最为简便的初等模型, 通过 t 检验以及对数据方差的 分析,很清楚明了的可以得出结论,从而很大程度上简化了计算过程且清 晰易懂。 (2) 本文选用的多元统计模型的逐步回归方法使处理酿酒葡萄与葡萄酒的理 化指标的过程变得非常简便, 可以从众多的指标中筛选出几项重要的指标 进行分析,且模型易建立,求解起来也很方便。 (3) 本文使用的一元线性回归模型对数据进行了拟合, 从而清楚的得到了两者 数据的关系,模型简单,处理方便。 模型的缺点:在用多元统计模型的逐步回归方法时,忽略了理化指标中的二级指 标的影响,可能会稍有一些误差。 参考文献参考文献 1:百度百科,葡萄酒, 2:百度百科,双总 t 检验, 3:姜启源,谢金星,叶俊.数学模型,北京:高等教育出版社,2011. 4:卓金武.MATLAB 在数学建模中的运用,北京:北京航空航天大学出版社,2011. 17 附录:附录: 附录一:附录一:问题三中指标走势以及曲线拟合图问题三中指标走势以及曲线拟合图 1) 白酿酒葡萄与白葡萄酒理化指标走势关系图: 0 2 4 6 8 10 12 1357911 13 15 17 19 21 23 25 27 酒总黄酮(mmol/L) 葡萄总黄酮 0 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10111213141516171819202122232425262728 酒醇 葡萄醇 0 0.1 0.2 0.3 0.4 0.5 13579111315171921232527 酒DPPH 葡萄 0 0.1 0.2 0.3 0.4 0.5 13579111315171921232527 酒DPPH 葡萄 18 2) 红酿酒葡萄与白葡萄酒理化指标走势关系图: -8 -6 -4 -2 0 2 4 6 8 10 13579111315171921232527 酒a*(D65) 葡萄 0 5 10 15 20 25 13579111315171921232527 酒b*(D65) 葡萄 0 5 10 15 20 25 30 1 2 3 4 5 6 7 8 9 101112131415161718192021222324252627 酒单宁 葡萄单宁 0 5 10 15 20 25 30 35 1 2 3 4 5 6 7 8 9 101112131415161718192021222324252627

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论