2012数学建模A题论文-葡萄酒评价.doc_第1页
2012数学建模A题论文-葡萄酒评价.doc_第2页
2012数学建模A题论文-葡萄酒评价.doc_第3页
2012数学建模A题论文-葡萄酒评价.doc_第4页
2012数学建模A题论文-葡萄酒评价.doc_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1葡萄酒的评价摘要本文主要运用统计分析方法,解决与所酿葡萄酒有关的问题。对于问题一,,分别对白酒和红酒的两组数据进行差异性检验。构建一个能反应葡萄酒本身质量的量,对两组数据分别进行相关性分析,得到第二组评酒员的结果更可信。对于问题二,先做聚类分析,再做线性回归分析,得到白、红葡萄分为4级和3级。对于问题三,利用问题二中聚类得到的7个主成分,把每种葡萄酒的理化指标与酿酒葡萄之间的7个主成分进行相关性分析,得到7个回归方程,即为酿酒葡萄与葡萄酒的理化指标之间的联系。对于问题四,首先建立模型:12W=a*Y+b*Y。其中a,b分别为酿酒葡萄和葡萄酒对葡萄酒质量的贡献率,1Y,2Y分别为两种因素的贡献值。然后,通过确定芳香物质是否对葡萄酒的评分有影响来论证能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。问题一中,本文运用excel做两组数据的显著性差异检验,得到两组评酒员在评论白酒和红酒都存在显著性差异,且通过了F检验。接着本文通过确定各指标的权重,构建一个能反应各葡萄酒实际平分的量,把两组数据与之做相关性分析,发现第二组与之相关性更大,故第二组评酒员的结果更可信。问题二中,本文通过SPSS做理化指标的聚类分析,得到7个主成分;再做指标与评分的线性回归分析,得到白葡萄的分级结果为4级:一级:白酿酒葡萄14,22;二级:白酿酒葡萄4,5,9,19,23,25,26,28;三级:白酿酒葡萄24,27;四级:白酿酒葡萄1,2,3,6,7,8,10,11,12,13,15,16,17,18,20。红葡萄酒为3级:一级:红酿酒葡萄2,9;二级:红酿酒葡萄3,4,10,22,24;三级:红酿酒葡萄1,5,6,7,8,11,12,13,14,15,16,17,18,19,20,21,23,25,26,27。问题三中,本文运用excel将葡萄酒的一级指标分别与7个主成分进行相关性分析然后对每种主要成分利用SPSS进行线性回归分析得到以下7个回归方程:r1134r21367r3137r4136r6137r71Y=-39.542+1.727+21.850+3.9463Y=4.044+0.026-0.156-0.005-0.1954Y=2.807+0.021-0.030-0.1895Y=2.700+0.024-0.169-0.0056Y=0.069+0.001-0.006-0.0077Y=70.028-0.188+xxxxxxxxxxxxxxxxx2347r8123560.841+0.280-0.187+1.7048Y=58.545-0.021-1.028+1.666+27.045-0.0049xxxxxxxxx即为每种酿酒葡萄与葡萄酒理化指标之间的联系。问题四中,建立模型:12W=a*Y+b*Y。对模型运用线性回归的方法,得到2红色葡萄酒中红色酿酒葡萄和葡萄酒对葡萄酒质量的影响方程为:12W=0.078Y+0.947Y-1.735。白色葡萄酒中酿酒白葡萄对葡萄酒质量的影响力为:y=1.01x-0.854;白葡萄酒的理化指标对葡萄酒的质量无影响。考虑到葡萄酒的评分与芳香物质有关,于是通过单独确定芳香物质是否对葡萄酒的评分有影响来论证能否用葡萄喝葡萄酒的理化指标评价葡萄酒的质量。最终得到能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:聚类分析主成分分析多元线性回归spssexcel3一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件中给出了某一年份一些葡萄酒的评价结果以及该年份这些葡萄酒的和酿酒葡萄的成分数据。建立数学模型讨论下列问题:1.(1)分析附件1中两组评酒员的评价结果有无显著性差异;(2)两组评酒员哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、模型假设1.假设所给附件中,数据均准确可靠。三、符号说明11,2,3,4igi:四组数据的偏度值。21,2,3,4jgj:四组数据的峰度值。012:H,则假设两组品酒员的两组评价结果无显著差异。11:H,2不相等,则假设两组品酒员的两组评价结果有显著差异。4:相关系数。Y:回归方程。四、问题分析4.1第一问需要根据附件1中给出的两组评酒员的评价结果数据,判断两组评价结果有无显著性差异,在判断哪一组结果更可信。本文用Excel对两组评价结果进行方差分析,直接比较输出结果即可得出有无显著性差异的结论。但是能够进行方差分析的先决条件是数据满足正态分布,所以实现要验证四组将进行方差分析的四组数据是否满足正态分布。对于可信度的判断,本文将从选取葡萄酒样品的一级指标进行权重分析,将权重与一级指标进一步计算得到新的权值,再将这组权值与两组评酒员的评价结果的平均值进行相关分析,对得到的相关系数作比较即可判断可信度的高低。为了更全面的考虑其可信度,本文也会对其标准差进行对比,双重验证其可信度。4.2用相关分析法和主成分分析法将用于计算的酿酒葡萄理化指标进行了筛选,最终确定的7个主成分所包含的成分指标基本可以代表所有测定的成分指标。用SPSS求出红酿酒葡萄和白酿酒葡萄的多元线性回归方程,用聚类分析法绘制树状聚类图,再利用回归方程,对酿酒葡萄进行分级。4.3要分析酿酒葡萄与葡萄酒的理化指标之间的联系,用SPSS将葡萄酒的一级指标分别与酿酒葡萄的7个主成分进行相关性分析,建立回归方程,既能说明酿酒葡萄与葡萄酒的理化指标之间的联系。五、模型的建立与求解5.1对第一问求解5.1.1(1)分析判断附件一中两组评酒员的评价结果有无显著性差异,利用双因素方差分析,以红酒为例,将问题转述为:分析第一组和第二组评酒员对27种红酒样品的评价结果有无显著差异性。要利用双因素方差分析,首先数据要满足正态分布。判断数据是否满足正态分布可以根据其偏度和峰度来衡量。偏度:31311niigXXs峰度:42411niigXXs偏度反应分布的对称性。10g称为右偏态,此时数据位于均值右边的比位于左边的多;10g称为左偏态,情况相反;而1g接近于0则可认为分布是对称的。峰度是分布形状的另一种度量。正态分布的峰度为3,若2g比3大很多,表5示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一。用Matlab计算出四组数据的偏度与峰度:对于红葡萄酒,第一组评酒员的评价结果110.9214g,213.5464g;第二组评酒员的评价结果120.1343g,222.5521g;对于白葡萄酒,第一组评酒员的评价结果130.3717g,232.8229g;第二组评酒员的评价结果140.8295g,243.8269g。11,2,3,4igi为四组数据的偏度值,21,2,3,4jgj为四组数据的峰度值。四组偏度值均趋近于0,四组峰度值均趋近于3,所以可以认为方差分析要使用到得四组数据均服从正态分布。、5.1.1(2)现在可以进行差异性的分析。先准备表格(见表1)。表1红葡萄酒品尝评分表红葡萄酒样品123424252627第一组62.780.380.468.67869.273.873第二组68.17474.671.271.568.27271.5白葡萄酒样品123425262728第一组8274.278.379.477.181.364.881.3第二组77.975.875.676.979.574.37779.6然后提出假设012:H(两组品酒员的两组评价结果无显著差异)11:H,2不相等(两组品酒员的两组评价结果有显著差异)最后在Excel内进行计算,输出结果见表2。表2红葡萄酒样品评价结果的方差分析的Excel输出结果差异源SSdfMSFP-valueFcrit行88.67852188.678526.1406570.0200274.225201列1444.7292655.566513.8477740.0005071.929213误差375.47152614.44121总计1908.87953可得出结论:6.1406574.225201FF,拒绝原假设0H,说明对于红葡萄酒,两组评酒员的评价结果有显著性差异。6同理对两组评酒员对28种白酒样品的评价结果的差异性进行分析。进行方差分析的Excel输出结果见表3。表3白葡萄酒样品评价结果的方差分析的Excel输出结果差异源SSdfMSFP-valueFcrit行89.00643189.006436.8903550.0140934.210008列545.83432720.216081.565010.125441.904823误差348.77362712.91754总计983.614355可得出结论:6.8903554.210008FF,拒绝原假设,说明对于白葡萄酒,两组评酒员的评价结果有显著性差异。现综合对两组评酒员对葡萄酒的评价结果的差异性进行分析,其方差分析的输出结果见表4。表4两种葡萄酒评价结果综合方差分析的输出结果差异源SSdfMSFP-valueFcrit行0.01781810.0178180.0010670.9740644.019541列2322.5595443.010352.575150.0003391.570884误差901.91225416.70208总计3224.489109可得出结论:0.0010674.019541FF,接受原假设,说明两组评酒员虽然对于红葡萄酒和白葡萄酒的品评上虽存在显著差异,但综合来看两组评酒员的综合评价结果并无显著性差异。5.1.2判断结果的可信度先对红葡萄酒的评价结果的可信度进行分析。在葡萄酒的理化指标中,选取一级指标进行权重分析,其中多次测量的数据取其平均值。通过简单计算可以得到各一级指标的所占权重如表5。表5红葡萄酒理化指标中各一级指标权重表花色苷单宁总酚酒总黄酮白藜DPPH色泽平均值263.89907.26606.26504.89703.63000.223041.087050.373022.0810标准差230.03482.90442.52542.98502.89410.127521.368713.26887.5975变异系数0.87170.39970.40310.60950.79720.57060.52010.26340.3441权重0.18240.08360.08430.12750.16680.11940.10880.05510.0720将每种葡萄酒样品一级理化指标的数值分别与其一级指标所占权重相乘再相加,得到一组由27个数值新构成的权值。再将这组权值与两组评酒员的评价结果的平均值进行相关分析,数据表见附录一。运用Excel数据分析,得到结果为,对于红葡萄酒,第一组的评分结果与评分权值的相关系数为11=0.139605,第二组的评分结果与评分权值的相关系数为712=0.156308,11120,第一组的评分结果与评分权值相关性比第二组的强,但由于是负相关,相关性越弱越好,所以可以认为,第二组对白葡萄酒的评分结果更可信。为更全面的说明评分结果的可信性,本文对评分结果的稳定性也做了调查。第一组对红葡萄酒的评分结果的标准差为11=7.360933,第二组为12=3.977988;第一组对白葡萄酒的评分结果的标准差为21=4.804037,第二组为22=3.170939。1112,2122,可见第二组评酒员评价结果的稳定性高于第一组评酒员的评价结果。在其评价结果的稳定性上再次证明了第二组评酒员评价结果的可信度。综上所述,可以得出结论,即第二组的评分结果更可信。5.2对第二问求解5.2.1相关性分析在数据分析的过程中,需要分析两个或两个以上变量之间的因果关系,本文采用相关性分析方法,它不需要区分自变量和因变量,两个或者多个变量之间是平等的关系,通过相关分析可以了解变量之间的关系密切程度。分析附件二的酿酒葡萄的理化指标,将一级指标作为研究对象,一级指标共27组数据。对29列数据进行相关性分析,得出的数据见附录二。选取相关系数要求大于0.2,相关系数大于0.2的酿酒葡萄指标按相关性大小依次为黄酮,总酚,DPPH,PH,蛋白质,单宁,出汁率,酒石酸,固酸比,花色苷,黄酮醇,果皮质量,果穗质量。5.2.2主成分分析进行主成分分析是将多项指标重新组合成一组新的互无关系的几个综合指标,已达到尽可能多的反映原指标信息的分析方法。应用SPSS对20个酿酒葡萄的指标经主成分分析后,得到7个主成分,累计贡献率为85.288%。SPSS输出结果见表6,整理数据得到表7,经分析比较,得酿酒红葡萄指标的主成分分析结果见表8。表6酿酒红葡萄主成分分析SPSS输出结果ComponentInitialEigenvaluesExtra

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论