




已阅读5页,还剩15页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): S12038 所属学校(请填写完整的全名): 河南科技大学 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 年 月 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要本文主要讨论分析了酿酒葡萄的理化指标、葡萄酒的理化指标和葡萄酒质量之间的相互关系,并比较了两组评酒员评价结果的差异。本文运用多种数学模型,阐述了酿酒葡萄和葡萄酒的理化指标以及葡萄酒的质量之间的联系,具有一定的实际意义。针对问题一:要比较两组评酒员的评价结果有无显著性差异,先做假设检验,对于某一特定酒类,取各组组员评价结果的平均值作为该酒类的最终得分,故用统计量t来做检验。我们先用spss对两组数据做了正态分布检验,得到这些数据符合正态分布,再用excel来求得t值,与t分布表的相应值比较后,t的绝对值落在否定域内,所以两组评价结果存在显著性差异。再通过对比两组样本数据的方差,得出方差较小的第二组的评价结果更可信。针对问题二:因为酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,所以采用相关性分析方法,用相关系数来表明两者关系的密切程度。通过spss求得葡萄酒的质量与酿酒葡萄各个理化指标之间的相关系数,比较其大小,得到与葡萄酒质量有显著相关性的九大指标,把这些指标作为分类依据,用聚类分析模型对这些酿酒葡萄进行分类,再根据每一类葡萄得分的平均值来进行等级划分。结果中红葡萄第一等级包含样品1、2、9、23。白葡萄第一等级包含样品25、26、10、2、4、12、14.针对问题三:首先要对这些指标做降维处理,为了能使选出的指标具有代表性,包含的信息多,本文采用聚类分析法对这些理化指标进行分类,从每一类中挑选出具有代表性的指标。然后利用典型相关性模型,得到第一、第二典型变量的计算公式: A=0.224x1+0.317x2+0.709x3-0.443x4,B=-0.089y1-0.289y2-0.896y3-0.363y4通过对表达式的分析,找到这些理化指标之间联系的强弱。针对问题四:先对酿酒葡萄和葡萄酒的理化指标做降维处理,用相关性分析法,分别找出对葡萄酒质量影响比较大的酿酒葡萄和葡萄酒的理化指标。先对这些指标的数据做标准化处理,消除因量纲不同而带来的不利影响。然后使用通径分析法,得到葡萄酒的质量与这些理化指标之间的线性函数关系,再通过比较每个线性函数的R的平方的大小,得出线性方程拟合的效果并非很好。之后通过求解芳香物质与葡萄酒质量的关联系数,从另一方面说明芳香物质对葡萄酒的质量有一定影响力,故不能只用这些理化指标来判定葡萄酒的质量,这些理化指标只是对酒的质量有一定影响,芳香物质的影响也不可忽略。关键词:显著性差异 t分布 方差 相关性分析 聚类分析 降维 典型相关性 标准化 通径分析 关联系数一、 问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、 模型假设1、假设每组品酒员是随机分配。2、假设第一问中数据的方差不变。3、假设品酒员对葡萄酒的主观评分可以作为葡萄酒质量的评定。三、 符号定义, 分别为两样本平均数;, 分别为两样本方差;,R 为相关样本的相关系数;N 样本数A 红葡萄酒质量体系 B 酿酒红葡萄质量体系四、 问题分析问题一、由于不同的评酒员在对不同的葡萄酒进行品尝评分时,会对葡萄酒的外观、香气、口感有不同的偏好,从而导致了不同的品酒员对葡萄酒的品尝得分不同。为了分析两组品酒员对葡萄酒评价结果有无显著性差异,本文首先对每组各个品酒员对葡萄酒的品尝得分求平均值,并对所得数据进行正态分布检验。如果符合,就分别对红、白葡萄酒评分数据进行配对t检验。为了判断哪组品酒员的评价结果更具有可信性,我们采用方差分析方法,对每组品酒员对各类红、白葡萄酒的评分求总体方差。总体方差小,则说明该组品酒员的评价结果波动性小,稳定性好。故其评价结果也就更可信。问题二、首先从问题一中选出可信度较高的一组数据作为葡萄酒的质量评分,然后用酿酒葡萄的理化指标和葡萄酒的质量评分作相关性分析。结合显著性检验,选取关联度较大的若干理化指标。最后,根据筛选的理化指标,应用聚类分析方法对各类酿酒葡萄进行等级分类。问题三、由于酿酒葡萄和葡萄酒的理化指标具有很多个,且很多指标具有相似的影响效果,可以归为一类指标。因此不必把每个理化指标都作为研究的对象。因此本文采用聚类分析法把具有相似性质的理化指标进行分类,然后在每一类中选取一个指标作为代表,采用典型相关分析,得到两组理化指标之间的相关联系。 问题四、酿酒葡萄和葡萄酒的理化指标都有很多种,而且每种指标的含量以及对葡萄酒质量的影响大小都不尽相同。为了简化问题,我们要对这些理化指标进行筛选,去掉那些基本上与葡萄酒质量没什么关系的理化指标,所以用相关系数这一量来初步筛选,作出降维处理。然后用筛选得到的指标与葡萄酒的质量得分进行通径分析,相关分析只是简单地估测了2个变量之间的关系,而通径分析能够准确的反映出葡萄酒中两个变量之间的直接作用,估测出各指标对酒质量的相对重要性,其影响力的大小可以用通径系数来衡量。葡萄酒的质量与理化指标和芳香物质都有关系,为了论证这些理化指标能否用来评价葡萄酒的质量,我们又找到了芳香物质与葡萄酒质量的关联度,通过关联度的大小来表示芳香物质对酒质量影响的大小,若关联度较大,则不能用理化指标来评价葡萄酒的质量,反之,则能。五、 模型的建立与求解5.1问题一模型的建立5.1.1显著性差异的判断为了从整体上判断两组品酒员的评价结果有无显著性差异,本文把附表一的数据进行整合,算出各组组员对某一酒样平均评价得分,数据如下:表一 品酒员对各葡萄酒的平均评价总分葡萄酒样品组一对各红葡萄酒的平均评价总分组二对各红葡萄酒的平均评价总分组一对各白葡萄酒的平均评价总分组二对各白葡萄酒的平均评价总分162.768.18277.9280.37474.275.8380.474.678.375.6468.671.279.476.9573.372.17181.5672.266.368.475.5771.565.377.574.2872.36674.472.3981.578.272.980.41074.268.874.279.81170.161.672.371.41253.968.363.372.41374.668.865.973.9147372.67277.11558.765.772.478.41674.969.97467.31779.374.578.880.31859.965.473.176.71978.672.672.276.42078.675.877.876.62177.172.276.479.22277.271.67179.42385.677.175.977.4247871.573.376.12569.268.277.179.52673.87281.374.3277368.264.8772881.379.6运用spss软件进行分别对各列数据进行单样本k-s检验,结果如下:单样本 Kolmogorov-Smirnov 检验红酒组数1N27正态参数a,b均值73.056标准差7.3426最极端差别绝对值.157正.088负-.157Kolmogorov-Smirnov Z.817渐近显著性(双侧).516a. 检验分布为正态分布。b. 根据数据计算得到。单样本 Kolmogorov-Smirnov 检验红酒酒组数2N27正态参数a,b均值70.393标准差3.9972最极端差别绝对值.099正.099负-.099Kolmogorov-Smirnov Z.516渐近显著性(双侧).953a. 检验分布为正态分布。b. 根据数据计算得到。单样本 Kolmogorov-Smirnov 检验白酒组数1N28正态参数a,b均值74.11标准差4.777最极端差别绝对值.115正.083负-.115Kolmogorov-Smirnov Z.607渐近显著性(双侧).855a. 检验分布为正态分布。b. 根据数据计算得到。单样本 Kolmogorov-Smirnov 检验白酒组数2N28正态参数a,b均值76.532标准差3.1709最极端差别绝对值.122正.076负-.122Kolmogorov-Smirnov Z.648渐近显著性(双侧).796a. 检验分布为正态分布。b. 根据数据计算得到。可以看出各组数据均符合正态分布。相关样本的检验公式为:在这里,分别为两样本平均数; ,分别为两样本方差; 为相关样本的相关系数。假设方差不变的情况下,在=0.05的显著性水平上,进行配对t检验。表二即是两组品酒员对红葡萄酒评分的t检验结果:表二t-检验: 成对双样本均值分析变量 1变量 2平均73.0555555670.39259259方差53.9141025615.97763533观测值2727泊松相关系数0.696687096假设平均差0df26t Stat2.569661734P(T=t) 单尾0.008131498t 单尾临界1.705617901P(T 2.021,故认为两组品酒员对红葡萄酒的评价结果有显著性差异。表三t-检验: 成对双样本均值分析变量 1变量 2平均74.1142976.53214方差22.8190510.05485观测值2828泊松相关系数0.209075假设平均差0df27t Stat-2.48347P(T=t) 单尾0.009757t 单尾临界1.703288P(T2.021,同样认为两组品酒员对白葡萄酒的评价结果也具有显著差异。综上所述,两组品酒员对葡萄酒的评价结果具有显著性差异。5.1.2可信程度的判断由上题t检验的结果,可以得出,第一组品酒员对各样品红、白葡萄酒的评分结果的方差为53.91、22.82.第二组品酒员对各样品红、白葡萄酒的评分结果的方差为15.98、10.05。因为53.9115.98、22.8210.05,所以第二组品酒员评分结果方差较小,对各葡萄酒的评分数据波动小,故第二组品酒员对葡萄酒的评分结果更可信。5.2 问题二模型的建立与求解5.2.1 根据酿酒葡萄理化指标和白葡萄酒质量对酿酒葡萄进行分级5.2.1.1相关性分析因为第二组品酒员对葡萄酒的评价结果比较可信,因此运用第二组品酒员的评分结果作为判断葡萄酒质量高低的标准。然后运用spss软件对酿酒葡萄的27个理化指标和红、白葡萄酒的质量得分进行相关性分析,筛选了9个(4个指标显著相关,5个指标极显著相关)与红葡萄酒质量评分显著相关的质量指标,结果如下:表四 酿酒葡萄各理化指标与红葡萄酒质量评分的相关性系数蛋白质相关系数.574*Sig.(双侧).002N27花色苷相关系数.421*Sig.(双侧).029N27DPPH自由基相关系数.584*Sig.(双侧).001N27总酚相关系数.644*Sig.(双侧).000N27葡萄总黄酮相关系数.658*Sig.(双侧).000N27黄酮醇相关系数.442*Sig.(双侧).021N27PH值相关系数.629*Sig.(双侧).000N27固酸比相关系数.381*Sig.(双侧).050N27果皮颜色红相关系数-.437*Sig.(双侧).023N27相关系数,它指出了两个变量之间相关的亲密程度和方向。这个数值的绝对值越大越说明两个变量的关系越亲密,它的绝对值为0-1之间。相关系数的正负符号说明相关性的方向,如果为正值,则这两个变量之间是正相关(一个变量的增高引起另一个变量的增高),如果为负号,则为负相关(一个变量的增高引起另一个变量的降低 )。*表示显著差异, *表示极显著差异。Sig.(双侧)是一个相关显著性系数,它指出上面所说的相关系数是否具有统计学意义。在显著差异情况下,sig. =0.05,相关性具有统计学意义。在极显著差异情况下,Sig.(双侧)0.5,则表明该线性回归方程拟合得较好,即红葡萄酒对葡萄酒质量评分有较大影响表十三 回归统计结果(2) Model Unstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)-8.118E-15.148.0001.000X1Zscore(花色苷)-.781.323-.781-2.415.026X2Zscore(单宁).452.490.452.922.368X3Zscore(总酚)-.217.657-.217-.330.745X4Zscore(酒总黄酮).462.449.4621.029.316X5Zscore(白藜芦醇).212.234.212.906.376X6Zscore(DPPH半抑制体积)-.167.732-.167-.228.822X7Zscore(色泽L)-.680.310-.680-2.190.041上表为spss给出的偏回归系数、截距、标准回归系数、标准误差及相对应的检验结果,据此可得线性回归方程为: 酿酒红葡萄对葡萄酒质量评分的回归统计结果:表十四 回归统计结果(1)ModelRR SquareAdjusted R SquareStd. Error of the Estimate1.754.568.376.78995399由上表可以看出=0.5680.5,则表明该线性回归方程拟合得较好,酿酒红葡萄对葡萄酒质量评分有较大影响。表十五 回归统计结果(2)Unstandardized CoefficientsStandardized CoefficientstSig.ModelBStd. ErrorBeta1(Constant)-7.619E-15.152.0001.000X1Zscore: (单宁)-1.166.572-1.166-2.038.057X2Zscore(总酚)-4.979E-02.686-.050-.073.943X3Zscore(酒总黄酮).266.450.266.591.562X4Zscore(白藜芦醇).115.233.115.493.628X5Zscore(DPPH).249.643.249.388.703X6Zscore(L)-1.099.621-1.099-1.770.094X7Zscore(A)-.127.297-.127-.430.673X8Zscore(B)-.212.245-.212-.867.398上表为spss给出的偏回归系数、截距、标准回归系数、标准误差及相对应的检验结果,据此可得线性回归方程为:白葡萄酒对葡萄酒质量评分的回归统计结果:表十六 回归统计结果(1)ModelRR SquareAdjusted R SquareStd. Error of the Estimate1.392.554-.2021.09642875由上表可以看出=0.5540.5,则表明该线性回归方程拟合得一般好, 白葡萄酒对葡萄酒质量评分有比较大的影响。表十七 回归统计结果(2)ModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)1.051E-14.207.0001.000X1Zscore(单宁)-3.417E-03.473-.003-.007.994X2Zscore(总酚)8.074E-04.519.001.002.999X3Zscore(酒总黄酮)-.259.279-.259-.927.366X4Zscore(白藜芦醇)-.129.234-.129-.552.587X5Zscore(DPPH半抑制体积).277.322.277.860.401X6Zscore(色泽L)-.255.854-.255-.298.769X7Zscore(色泽a)-.127.515-.127-.247.808X8Zscore(色泽b)-.1731.084-.173-.160.875上表为spss给出的偏回归系数、截距、标准回归系数、标准误差及相对应的检验结果,据此可得线性回归方程为:酿酒白葡萄对葡萄酒质量评分的回归统计结果:表十八 回归统计结果(1)ModelRR SquareAdjusted R SquareStd. Error of the Estimate1.562.315.160.91659743由上表可以看出=0.3150.5,则表明该线性回归方程拟合得不是很好,即酿酒白葡萄对葡萄酒质量评分的影响不大。表十九 回归统计结果(2)ModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)4.603E-15.173.0001.000X1Zscore(酒石酸).267.205.2671.303.206X2Zscore(葡萄总黄酮)3.400E-02.205.034.166.870X3Zscore(可溶性固形物)9.811E-02.254.098.386.703X4Zscore(果穗质量)-.402.283-.402-1.422.169X5Zscore(百粒质量).225.200.2251.120.275上表为spss给出的偏回归系数、截距、标准回归系数、标准误差及相对应的检验结果,据此可得线性回归方程为:综上所述,基本上都大于0.5,所以酿酒葡萄和葡萄酒的理化指标对葡萄酒质量有较大影响。5.4.2 芳香物质与葡萄酒质量的关联分析从白葡萄酒众多芳香物质中,挑选出几个数据齐全,且葡萄和葡萄酒共有的基础芳香物质(3-甲基-1-丁醇-乙酸酯、己酸乙酯1、乙酸己酯2、1-己醇、癸酸乙酯、丁二酸二乙酯、反式-4-癸烯酸乙酯、2-癸酸)然后对其和白葡萄酒质量评分进行灰色关联系数运算(详细程序见附录)。关联系数由下式计算 4 :, 其中:为相对在的关联系数,为在点与差的绝对值,为数列与在点的二级最小差数绝对值,为数列与在点的二级最大差数绝对值,为灰色分辨系数,取值01,一般取0.5。r11 =0.5952 ,r12 = 0.6288,r13 =0.3918,r14 = 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年教师招聘之《小学教师招聘》通关练习试题(综合卷)附答案详解
- 考试题及答案大全集
- 汽车救援员技能巩固考核试卷及答案
- 光学计量员职业考核试卷及答案
- 润滑油脂灌装制桶工内部技能考核试卷及答案
- 集输工成本预算考核试卷及答案
- 静脉输血考试题及答案
- 经理升职考试题及答案
- 课件文案精简
- 今年监理考试题及答案
- 《新能源汽车发展历程》课件
- 《全球时尚品牌概述》课件
- 四川宜宾环球集团有限公司招聘笔试题库2025
- 护罩钣金合同协议
- 2025中国新型储能行业发展白皮书
- 风电项目建设流程
- 2025年乡村医生考试题库:常见疾病诊疗与社区医疗管理试题试卷
- 小学教育学(第5版)课件 曾文婕 第0-4章 绪论、小学教育源流-小学教师
- TCANSI 133-2024 液化天然气(LNG)燃料动力船舶槽车气试加注作业安全要求
- 力学篇01秒解动态平衡-高考物理答题技巧与模型
- 项目管理技能与经验分享
评论
0/150
提交评论