2012年数学建模a题论文_第1页
2012年数学建模a题论文_第2页
2012年数学建模a题论文_第3页
2012年数学建模a题论文_第4页
2012年数学建模a题论文_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、葡萄酒的评价摘要本文以葡萄酒的评价为研究对象,对葡萄酒的质量进行分析。通过运用配对样本t检验、K-均值聚类和对比分析的方法,解决了与葡萄酒相关的问题。对于问题一:分析两组评酒员的评价结果有无明显差异,且哪组更可信。由于附件一中的数据过于庞杂,所以对数据进行了平均值处理。然后利用配对样本t检验的显著性值来比较,最终可以得出第二组更为可靠。 对于问题二:根据所酿酒葡萄的理化指标和质量对酿酒葡萄进行分级。因为附件二中的理化指种类标过于繁多,所以对理化指标做了随机选取性处理。然后利用K-均值聚类分析的方法,将葡萄进行分类。最后,可以得出酿酒葡萄的等级。对于问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联

2、系。在众多指标数据中随机选取酿酒的红、白葡萄和红、白葡萄酒的理化指标数据。然后利用SPSS软件对所选数据进行散点图的绘制。最后通过运用MATLAB软件绘制拟合曲线。通过散点图与拟合曲线图的比较可以得到酿酒葡萄与葡萄酒的理化指标之间的联系。 对于问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。在繁杂的数据中利用随机选取的方法对数据进行挑选,并与其相对应的质量一起利用MATLAB软件进行拟合曲线的绘制。最后通过对拟合曲线的分析,可以得出理化指标对质量的影响。关键词:葡萄酒 平均值 聚类分析 拟合曲线 一、问题重述1.1问题背景确定葡萄

3、酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。1.2 问题条件附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。1.3需要解决的问题问题一: 两组评酒员的评价结果有无显著性差异,哪组更可信;问题二: 根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级;问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系;问题四:分析酿酒葡萄和葡萄酒的

4、理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量;2、 模型假设 1.假设每位评酒员都是公平、公正的;2.假设给两组评酒员的各样品都是同样的;3.假设所给的所有数据都真实有效;4.假设酿酒的工艺差别等其他外界条件不影响葡萄酒的质量;5.假设所有评酒员在除去自身品酒水平以外,其他条件相同; 三、符号说明为了便于问题的求解,我们给出以下符号说明:符号符号说明1总体均值差2总体差的样本均值3修正样本标准差4配对总体差显著性5每组红、白葡萄酒各自方差6每组红、白葡萄酒各样品的平均值四、问题分析葡萄酒在生活中也是常见的一种酒。因为每个人的喜好不同,所以葡萄酒会有各种不同的

5、种类。对这些不同种类的葡萄酒的质量我们请评酒员对此做出了评价。对于问题一:分析附件一中两组评酒员的评价结果有无显著性差异,且哪组更可信。对于这个问题,我们选择采用SPSS软件中的配对样本t检验这种方法。首先应对附录一中的各个数据进行整理。求出附录一中四个表的10个评酒员对各个样品酒评价分数的平均值,并将这四组平均值进行分类后和样品酒编号对应起来放在Excel表中。最后利用SPSS软件对这两组数据中的显著性进行观察,从而判断评出酒员的评价结果有无显著性差异。对于哪组更可信这个问题可以通过比较最终结果表中的方差来判断。对于问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。对于这个

6、问题,我们选择采用SPSS软件中的K-均值检验这种方法。首先应对在附件二中对数据进行舍取,并将整理后的数据放在Excel中。最后利用SPSS软件对这组数据进行K-均值聚类。最后通过整理聚类后的结果列出等级表。对于问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系。对于这个问题,我们选择对比分析的方法。首先将附件二中酿酒的红、白葡萄和红、白葡萄酒的理化指标整理出来后放入Excel中,利用SPSS软件对所选数据进行散点图的绘制。再通过运用MATLAB软件绘制拟合曲线。最后通过对散点图和拟合曲线的对比分析得出结果。对于问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的

7、理化指标来评价葡萄酒的质量。对于这个问题,我们选择对比分析的方法。首先将酿酒的红、白葡萄和红、白葡萄酒的理化指标中选取出的理化指标整理出来后放入Excel中,利用MATLAB软件对所选数据绘制拟合曲线,最后通过对散点图和拟合曲线的对比分析得出结果。五、模型的建立与求解经过以上对题目和问题的分析和准备,将进一步阐述模型的实际建立过程和求解。5.1 异常数据处理在假设中提到数据要真实有效,所以在处理数据前要对所给数据进行检查。当数据中出面漏写、填多等失误时,采取平均值法。就是将该项的平均值求出后填入所失误的位置,以此来减少误差。在对第一组白葡萄酒的数据中的样品3进行评价时,第七个评酒员在持久性的评

8、价中出现了异常。对异常数据进行处理:1其中,为样品3中持久性的平均值; 为第几个评酒员。在对第一组红葡萄酒的数据中的样品20进行评价时,第四个评酒员在色调的评价中出现了异常。对异常数据进行处理:2其中,为样品20中色调的平均值;为第几个评酒员。5.1.1模型一的建立与求解题中的附录一给出了27样红葡萄酒和28样白葡萄酒,且有每组10个评酒员分别对红、白葡萄酒进行评价的分数等数据。利用这些数据对这两组数据进行处理,从而判断有无显著性差别和哪组更好。5.1.2 显著性模型的建立(1)数据处理、求取平均值先对附录一中的第一张表格(第一组红葡萄酒)进行处理。这组红葡萄酒共有27种样品,且这10个评酒员

9、分别需要对这27种红葡萄酒进行评分,所以可以先对各样品中小指标的分数进行求和,算出每个人对各样品的评价分数。然后将这些分数和对应的样品放入Excel表中。并将这10个评酒员对各个样品的分数进行求和取平均值,从而得到27个与样品对应的平均值。用同样的方法可以得到其他三个表中的平均值。 其中,两组葡萄酒的平均值为表1:表一 两组葡萄酒的平均值样品酒第一组红葡萄酒()第一组白葡萄酒()第二组红葡萄酒()第二组白葡萄酒()162.78268.177.9280.374.27475.8380.485.374.675.5468.679.471.276.9573.37172.181.5672.268.466.

10、375.5771.577.565.374.2872.371.46672.3981.572.978.276.81074.274.368.879.81170.172.361.671.41253.963.368.372.41374.665.968.873.914717272.677.11558.772.465.778.41674.97469.976.31779.378.874.580.31859.773.165.476.7197872.272.676.42078.677.875.876.62177.176.472.279.22277.27171.679.42385.675.977.177.42478

11、73.371.576.12569.277.168.279.52673.881.37274.3277364.871.5772881.379.6(2)数据导入在算出四张表中每个样品所对应的平均值后,将第一组的红葡萄酒和第二组的红葡萄酒中的葡萄酒样品、每个样品所对应的平均值放在一个新的Excel表格中,并注释好每一列的名称。用同种方法也可以得到第一组白葡萄酒和第二组白葡萄酒的新表格。5.1.2 模型的求解先将第一组红葡萄酒与第二组红葡萄酒所建的新表格导入SPSS软件中。通过运用SPSS软件中的配对样本t检验可以对两总体均值差的原假设写成:1其中、代表配对样本的总体,都是未知的。选择检验统计量并给出统

12、计量的分布。假设总体服从正太分布,检验统计量是统计量,其构成为:2在总体差的样本均值和修正样本标准差中:34当原假设为真时,。SPSS软件会根据样本观测值自动计算统计量的观测值,并根据统计量的分布自动计算统计量观测值发生的概率(值)。其中,第一组与第二组红葡萄酒的显著性概率为表2;第一组与第二组白葡萄酒的显著性概率为表3:(代码见附录一)表2 第一组与第二组红葡萄的显著性CorrelationSiq第一组白葡萄平均值&第二组白葡萄平均值270.6930.000表3 第一组与第二组白葡萄的显著性CorrelationSiq第一组白葡萄平均值&第二组白葡萄平均值280.2650.1

13、73观察表可知:在表1中可得,因为当值(配对总体差显著性)小于0.05时,说明配对总体间均值有显著差异,反之无明显差异。由此可以得出:a. 对于红葡萄酒的评分有显著性差异;b. 对于白葡萄酒的评分无显著性差异;5.1.3优劣性评价模型的建立与求解在通过SPSS软件得出值得同时,也会出现这两组中红、白葡萄各自的方差。比较这些方差可以选出哪组更可信。其中,两组各自红葡萄酒的方差为表4、两组各自白葡萄酒的方差为表5。表4 两组各自红葡萄酒的方差meamNStd.DeviationStd.Error mean第一组红葡萄酒平均值72.952277.35031.4146第二组红葡萄酒平均值70.5152

14、73.97800.7656表5 两组各自白葡萄酒的方差meamNStd.DeviationStd.Error mean第一组白葡萄酒平均值74.26285.2010.983第二组白葡萄酒平均值76.721282.51370.4750观察表可知:第一组红葡萄酒的方差;第二组红葡萄酒的方差;第一组白葡萄酒的方差;第二组白葡萄酒的方差;由此数据可知:;因为只有在方差越小时它的可行度才越高,所以我们得出第二组的更可信。5.2模型二的建立与求解在同样稳定的制造工艺下,不同的酿酒葡萄会酿出不同质量的酒。因此可以对酿酒葡萄的质量进行等级分类。5.2.1模型的建立(1) 数据舍取从香气、外观、口感、保鲜度这四

15、个角度考虑,选取了白黎芦醇、果皮颜色、黄酮醇、单宁这四个具有代表性的指标作为检验的数据。(表见附录二)(2)数据的导入在进行数据的舍取整理后,将这些新数据放入Excel中,并标注好表头。最后将该表导入SPSS软件中。5.2.2模型的求解在SPSS软件中运用K-均值聚类检验,首先对导入数据进行处理,从而得到酿酒葡萄的分类等级。通过聚类分析的原理:定义与之间的距离为两类最近样品的距离:5设类与合并成一个新类记为,则任一类与的距离为:67最短距离法进行聚类分析的步骤如下:(a) 计算样品的两两距离,得一距离阵记为,开始每个样品自成一类,这时。(b)找出最小距离,设为,则将和合并成一个新类,记为,即。

16、(c)按上式计算新类与其他类的距离。(d)重复(b)、(c)两步,直到所有元素并成一类为止。如果某一步距离最小距离不止一个,则对应这些最小距离的类可以同时合并。模型求解结果:按评分从高到底,将红、白葡萄酒依次分为优秀、良好、较差这三个等级。红葡萄等级如表6所示:(代码见附录三;表见附录四)表6 红、白葡萄等级优秀的葡萄酒良好的葡萄酒较差的葡萄酒红葡萄样品1,5,6,7,12,15,16,18,20,22,24,26,272,4,9,10,11,13,17,19,21,23,253,8,14,白葡萄样品1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19

17、,20,21,22,23,24,25,26,28275.3 模型三的建立与求解因酿酒葡萄的理化指标与葡萄酒的理化指标的不同,可以研究这两类的理化指标有什么联系。5.3.1模型的建立1) 数据的选取与整理在附件二中酿酒的红葡萄的理化指标和红葡萄酒的理化指标从附件中导出来放入Excel表中。同理,将酿酒的白葡萄和白葡萄酒的理化指标放入另一个表(其中单宁的指标表见附录五)。2) 散点图的绘制将处理好的两张理化指标表分别导入SPSS软件中,通过GeaphsLegacy DialogsIneractiveScatterplot对这两张表进行散点图绘制。3) 拟合曲线的绘制将处理好的两张理化指标表分别导入

18、MATLAB中,在workspace中出现data数据即为理化指标表中的数据,然后利用MATLAB绘制拟合曲线图。5.3.2模型的求解基于散点图和拟合曲线的基础上,将酿酒的红、白葡萄和红、白葡萄酒的理化指标绘制好的散点图与拟合曲线放在一起进行比较分析。其中,红葡萄酒的白黎芦醇为图1;花色苷为图2;总酚为图3;单宁为图4;白葡萄酒的单宁为图5;总酚为图6;白黎芦醇为图7。图1 酿酒的红葡萄与红葡萄酒的白藜芦醇指标对比图2 酿酒的红葡萄与红葡萄酒的花色苷指标对比图3 酿酒的红葡萄与红葡萄酒的总酚指标对比图4 酿酒的红葡萄与红葡萄酒的单宁指标对比图5 酿酒的白葡萄与白葡萄酒的单宁指标对比图6 酿酒的

19、白葡萄与白葡萄酒的总酚指标对比图7 酿酒的白葡萄与白葡萄酒的白藜芦醇指标对比分析图可知:图1:酿酒的红葡萄与红葡萄酒的白藜芦醇之间的相关性较差;图2:酿酒的红葡萄与红葡萄酒的花色苷之间的相关性较强;图3:酿酒的红葡萄与红葡萄酒的总酚之间的相关性较强;图4:酿酒的红葡萄与红葡萄酒的单宁之间的相关性较强;图5:酿酒的白葡萄与白葡萄酒的单宁之间的相关性较差;图6:酿酒的白葡萄与白葡萄酒的总酚之间的相关性较差;图7:酿酒的白葡萄与白葡萄酒的白藜芦醇之间的相关性较差;综上可得:酿酒葡萄与葡萄酒在理化指标不同时,它们的相关性也不一定相同。5.4 模型四的建立与求解可以通过各种理化指标与质量的关系,来判断指

20、标和质量之间的关系。5.4.1模型的建立(1)数据舍取由于酿酒的红、白葡萄与红、白葡萄酒的理化指标过多,所以选取了所有理化指标中的单宁和总酚这两个指标作为研究对象。将选取的指标与对应的质量放入同一张表中(其中白葡萄表见附录六)。(2)数据的导入根据(1)得出的四张表分别导入MATLAB中,在workspace中出现data数据即为导入表中的数据,然后利用MATLAB绘制拟合曲线图,将红、白葡萄酒和酿酒葡萄分别与对应的质量作对比。5.4.2模型的求解在指标与质量的基础上,将酿酒的红、白葡萄和红、白葡萄酒的单宁、总酚指标与质量绘制的拟合曲线并放在一起进行比较分析。其中,红葡萄的单宁与质量为图8、总

21、酚与质量为图9;白葡萄的单宁与质量为图10、总酚与质量为图11;图8 红葡萄酒的单宁和酿酒红葡萄的单宁分别与质量的对比图9 红葡萄酒的总酚和酿酒红葡萄的总酚分别与质量的对比图10 白葡萄酒的单宁和酿酒白葡萄的单宁分别与质量的对比图11 白葡萄酒的总酚和酿酒白葡萄的总酚分别与质量的对比分析图可知:图8:红葡萄酒的单宁和酿酒红葡萄的单宁分别与质量有影响;图9:红葡萄酒的总酚和酿酒红葡萄的总酚分别与质量无影响;图10:白葡萄酒的总酚和酿酒白葡萄的总酚分别与质量有影响;图11:白葡萄酒的总酚和酿酒白葡萄的总酚分别与质量无影响;综上图可得:不能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量六、模型评价与

22、改进6.1优点1 本文运用SPSS软件处理部分数据,快速简便,且结果准确。2 本文在大量的数据中进行了舍取,这减少了运算量。3 本文采用了多种方法相结合的方式对问题进行逐步分析求解。 6.2缺点1 本文对于数据的选取具有随意性,没有进行检验。2 本文的对题的解法有些简便,且不够严谨。6.3改进1 取更多的数据用来减少误差率。参考文献1胡竹菁.平均数差异显著性检验统计检验力和效果大小的估计原理与方法J.心理学探新,2010,30(01):68-73.2李文彬,贺建军,郭观七,冯彩英,潘理.基于相关分析的多目标优化Pareto优劣性预测J.电子学报,2017,45(02):459-467.3孔锐,

23、张国宣,施泽生,郭立.基于核的K-均值聚类J.计算机工程,2004(11):12-13+80.附录附录一:配对样本t检验打开数据Step1:选择AnalyzeCompare MeansPaired-Samples T T进入对话框;Step2:选择配对的第一个变量“第一组红葡萄平均值”; 点击对话框箭头,将其导入; 选择配对的第二个变量“第二组红葡萄平均值”; 点击对话框箭头,将其导入;Step3:选择Options进入对话框; 在置信区间“Confidence interval”框中指定置信水平,默认值95%; 点击Continue回到主对话框; 点击OK完成设置。附录二:指标数据的选取样品

24、编号白藜芦醇果皮颜色黄酮醇单宁红葡萄样品13.1953.2017.67808.023红葡萄样品24.8894.8927.455012.411红葡萄样品34.7644.76164.992758.173红葡萄样品43.4123.4126.967911.264红葡萄样品5.637.646.65022.642红葡萄样品62.2032.207.72724.045红葡萄样品7.623.629.86483.703红葡萄样品85.9495.95115.554642.484红葡萄样品94.9074.9158.540722.785红葡萄样品1012.30712.3128.747517.787红葡萄样品1126.8

25、5126.8525.575126.426红葡萄样品12.696.702.48021.291红葡萄样品1310.86310.8640.758620.828红葡萄样品146.3136.31134.637549.088红葡萄样品15.211.219.71793.380红葡萄样品164.5564.568.19005.767红葡萄样品17.711.7143.812115.078红葡萄样品18.416.426.51612.449红葡萄样品193.8213.8231.264912.969红葡萄样品201.5451.559.62624.239红葡萄样品217.8477.8547.219620.971红葡萄样品

26、224.2894.2913.80037.460红葡萄样品239.9689.9744.747621.561红葡萄样品242.9352.9314.38036.750红葡萄样品252.1292.1330.211211.490红葡萄样品262.0862.0913.91666.030红葡萄样品271.5691.5715.98096.373白葡萄样品1.155.15.3977.236白葡萄样品23.0383.041.66272.579白葡萄样品31.3571.361.63331.449白葡萄样品4.530.531.3188.793白葡萄样品51.1621.163.17051.832白葡萄样品61.7271

27、.738.08643.847白葡萄样品71.2351.244.79522.422白葡萄样品8.137.145.60801.960白葡萄样品9.087.09.7518.308白葡萄样品10.246.251.1776.556白葡萄样品11.822.821.85891.168白葡萄样品12.752.758.43083.311白葡萄样品13.095.09.2103.133白葡萄样品14.095.101.3006.497白葡萄样品154.0234.0211.87346.640白葡萄样品161.5721.575.31402.819白葡萄样品171.0261.036.01352.688白葡萄样品181.82

28、01.822.77712.139白葡萄样品191.7821.78.85351.473白葡萄样品20.157.166.16332.159白葡萄样品21.845.85.7158.802白葡萄样品22.969.978.92963.622白葡萄样品231.6501.6512.41065.237白葡萄样品24.483.483.21381.393白葡萄样品25.850.858.61953.440白葡萄样品261.4261.434.30892.387白葡萄样品271.1551.1550.496617.602白葡萄样品282.9212.925.73233.858附录三:K-均值聚类检验打开数据Step1:选择

29、AnalyzeClassifyK-Means Cluster进入对话框;Step2:选择聚类变量“白藜芦醇、果皮颜色、黄酮醇、单宁”; 点击对话框箭头,将其导入; 在Number of Cluster3;Step3: Mehtod勾选lterrate and classify; 点击Save按钮,进入对话框; 全部勾选后点击Continue回到主对话框; 点击OK完成设置。附录四:红、白葡萄的等级红葡萄酒的等级红葡萄酒样品白葡萄酒的等级白葡萄酒样品11111512161317141121511516116171181812019122110124111126112127113221142411

30、5291162101172111182131192171202191212211222231232251243312538126314128227附录五:酿酒的红、白葡萄和红、白葡萄酒的单宁理化指标样品白葡萄酒单宁(mmol/L)平均值白酿酒葡萄单宁(mmol/kg)平均值红酿酒葡萄单宁(mmol/kg)平均值红葡萄酒单宁(mmol/L)平均值11.6198925882.94738818222.0190333611.0295263521.233422832.23914027923.3613119911.0782122432.0093796472.9900774620.3728709413.25

31、93397642.0166825293.1477124418.638436556.47739635351.5946627612.62587306714.485773445.84934847161.2888285884.50200672215.172985067.35374223571.3740288824.7288925775.6191862754.01389070681.5127836471.67221883422.488991312.0275869491.8438476474.43385340724.3622745612.93314435102.0580655296.78059372916

32、.687701595.566970353111.4154118823.3118583364.5430096844.588384118122.3073793833.2123468067.1689611766.457922131.5152179412.1287868999.8219843146.384893176141.3204744122.3879050713.940541086.073303529152.5303185882.75086415525.417006773.984679176161.2790914122.22805358710.086173144.831813529171.5492

33、980592.24666335315.730337879.169725647181.3302115885.7826145795.3881585024.447195059191.9631280592.21749946713.700023535.980800353202.6763762353.1413273388.1149324115.863954235211.2036282941.95229335713.6130372710.08988882221.8974021186.46257682712.155104317.105444235231.3302115883.38869449324.2569392210.88833729244.4728852948.50630464

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论