




已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2014高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(a/b/c/d中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(填写完整的学校名): 参赛队员(打印并签名)1: 王春慧2: 刘双3: 车珂指导教师机会或指导教师负责人(打印并签名): 数学建模组 日期: 2014 年 08 月 22 日2014高教社杯全国大学生数学建模竞赛评 分 专 用 页评阅编号(由数学系建模组委会评阅前进行编号):评阅记录:评阅点整体版面字体段落公式图表页眉页脚文献目录总分评分备注 评卷人: 葡萄酒评价模型摘要本文要求我们制定一种合理的评价模型分析酿酒葡萄和葡萄酒的理化指标之间的联系以及评价葡萄酒的质量。针对问题一,主要利用检验法分析两组评酒员的评价结果有无显著性差异。通过数据的整理分别计算出每组评酒员对红葡萄酒和白葡萄酒的评价总分,初步利用matlab 对评分拟合图进行显性判断,利用spss 软件进行数据处理,从而得到标准差、显著性概率等,通过指标的判断利用t 检验得出两组评酒员对于红葡萄酒的评价没有显著差异,对白葡萄酒的评价有显著差异。整体来说第二组的结果更可信。针对问题二,引用k-均值聚类法对酿酒葡萄的理性指标进行分类,且考虑问题一的结论,使用第二组的评分作为影响葡萄质量的一个综合指标对酿酒葡萄的分类结果进行等级划分,把红酿酒葡萄和白酿酒葡萄分别分为5级。针对问题三,采用了多元线性回归分析的方法,对附录2数据进行整理,通过分析酿酒葡萄与葡萄酒的理化指标之间的联系。在求解过程中利用spss 软件,对酿酒葡萄理化指标xm与每一个葡萄酒理化指标yn进行回归分析并采用逐步回顾法,得到一系列yn与xm之间的线性关系式。 针对问题四,在研究两组变量之间相关关系的多元统计方法的基础上,保留葡萄酒指标,提出葡萄酒指标中某些认为可以被用于表示对应葡萄酒指标的部分。进而利用主成分分析筛选后的指标建立多元线性回归模型,探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。经检验样本组的线性回归模型评价值与评分值的显著性差异检验,用葡萄和葡萄酒的理化指标来评价葡萄酒的质量是可行的。关键词:t 检验;k-均值聚类;主成分分析;多元线性回归 ;matlab一、问题重述葡萄酒的质量评价一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和酿酒葡萄的质量。要求根据附件1(某一年份一些葡萄酒的评价结果),附件2(该年份这些葡萄酒的成分数据)和附件3(该年份酿酒葡萄的成分数据)建立数学模型回答下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析问题一要求比较两组评价结果是否存在差异,并建立合理的评价模型以判断两组结果在可信程度方面的优劣。从问题中可以看出评酒员对于葡萄酒样本的品尝评分属于感官评价,主观性较强。这里我们在不考虑认为误差的情况下对附件1的数据进行处理得出两组评酒员对红白葡萄酒的评价汇总表,并把表中数据运用检验法进行分析可以得出最终结论是两组评酒员对于红葡萄酒的评价没有显著差异,对白葡萄酒的评价有显著差异。第二组的结果更可信。问题二要求制定一种合理的评价指标体系,并运用该体系对酿酒葡萄进行分级。(题中提到的酿酒葡萄,是指以酿造葡萄酒为主要生产目的的葡萄品种)而这里的体系建立是要考虑两方面的指标,分别是酿酒葡萄的理化指标和葡萄酒的质量。因此我们引入k-means 聚类方法,综合考虑第二组对葡萄酒的评分均值对酿酒葡萄的理化指标进行分类分级,两种酿酒葡萄都分成5级。问题三要求分析酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,即分析两者间的联系。酿酒葡萄和葡萄酒分别存在多个量化指标,可采用相关分析方法,但考虑到该方法只是孤立考虑单个变量之间的相关,而没有考虑变量组内部间变量间的相关。酿酒葡萄经发酵酿成葡萄酒的化学过程,使得两组变量间有许多简单相关系数,是问题显得复杂,难以从整体描述。因此,考虑采用研究两组变量之间相关关系的多元统计方法,识别并量化酿酒葡萄与葡萄酒的理化指标两组变量之间的关系,考虑两组变量的线性组合,并研究它们之间的相关系数。问题四要求分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。在问题三的基础上,针对酿酒葡萄和葡萄酒理化指标之间的联系和它们与葡萄酒质量之间的相关性利用主成分分析进行指标的筛选。随后可以建立一个线性回归模型得到对葡萄酒质量的评价。可以初步认为在建立线性回归模型时对样本进行随机选择,选中的样本作为示例样本组件线性回归方程,未选中的样本作为检验样本组对模型的可行性进行验证。三、模型假设3.1 模型假设(1) 忽略葡萄的质量受产地、栽培条件、病虫害、树龄,自然因素等因素的影响。即仅考虑酿酒葡萄和葡萄酒的理化指标、葡萄的芳香物质对葡萄酒质量的影响。(2) 假设本问题附件中数据均真实有效,具有系统分析价值。并能真实客观地反映酿酒葡萄与葡萄酒的状况。(3) 问题中所给的数据以及评酒员评分均依据统一准则,结果准确客观(不考虑人为误差)。(4) 假设葡萄酒中的未检测的物质不影响最终结果。四、符号说明4.1符号说明n :样本总数xi :是来自总体n1,12 的一组样本i=1n1yj :是来自总体n2,22 的一组样本j=1n2xm :为酿酒葡萄的第m项理化指标m=130xim :为酿酒葡萄的第i个样品的第m项指标yn :为葡萄酒的第n 项理化指标n=18,9yin :为葡萄酒的第j个样品的第n项指标五、模型的建立与求解5.1模型一的建立问题一要求分析两组评酒员的评价有无显著性差异,并判断两组结果在可信程度方面的优劣。我们通过以下过程完成:首先根据红白葡萄酒的感官评价先对某一评酒员所给分数进行加和再求总分均值通过matlab 初步对两组进行显著性分析得出得到两组评分对红酿酒葡萄的拟合图和对白酿酒葡萄的拟合图;其次,为了进一步判断两组人员评价结果的显著性差异大小,我们引入t 检验统计量进行检验模型的基本理论。并且判定两个组别每一种的平均值的差异是否显著。进而通过该模型判断两组评酒员的评价结果在可信度方面的优劣。5.11问题一的方差分析对于白葡萄酒和红葡萄酒,两个组别分别给出了各自的感官评价,对于同一个葡萄酒样本,不同的评酒员的打分存在差异,但一定假设范围内的差异是允许的。对于同一个品种,我们先对某一评酒员所给分数进行加和,再将十位评酒员所给总分加和并求均值,将此均值作为该葡萄酒样品的最终得分,接下来对其他样品及其他品酒组中数据作相似处理,利用matlab初步对两组别给出的总均分进行显著性分析。首先由附件一整理数据如表1表1各组葡萄酒样品评分样品号第一组红葡萄酒第二组红葡萄酒第一组白葡萄酒第二组白葡萄酒162.768.18277.9280.37474.275.8380.474.685.375.6468.671.279.476.9573.372.17181.5672.266.368.475.5771.565.377.574.2872.36671.472.3981.578.272.980.41074.268.874.379.81170.161.672.371.41253.968.363.372.41374.668.865.973.9147372.67277.11558.765.772.478.41674.969.97467.31779.374.578.880.31860.165.473.176.71978.672.672.276.42079.275.877.876.62177.172.276.479.22277.271.67179.42385.677.175.977.4247871.573.376.12569.268.277.179.52673.87281.374.3277371.564.8772881.379.6通过上述数据(程序见附录1)可以得到两组评分对红酿酒葡萄的拟合图和对白酿酒葡萄的拟合图如下:横坐标代表酒样品号;纵坐标代表组员对每一种酒的评分均值。分析:依据图1可知两组人员评分曲线的契合度较好,从综合评分的角度来看对于红葡萄酒两组人员的评价没有显著性差异。依据图2可知两组人员评分曲线的起伏差距较大,可以初步认定对于白葡萄酒两组人员的评价结果具有显著性差异。5.1.2模型检验为了进一步判断两组人员评价结果的显著性差异大小,我们引入t 检验统计量进行检验模型的基本理论。t 检验来判定两个组别每一种的平均值的差异是否显著,因为t 检验适用于小样本,总体标准差 未知的正态分布总体,是用于小样本的两个平均值差异程度的检验方法。它使用t 分布来推断差异发生的概率,从而判定两个平均数的差异是否显著。t 检验的基本理论:设 x1,x2,xn1 是来自总体n1,12 的一组样本,y1,y2,yn2是来自总体n2,22 的一组样本,两组样本相互独立,为检验两个总体的均值是否有显著差异,给出假设:h0:1-2=0h1:1-20当方差未知但相等时,所用统计量为:t=x-ysw1n1+1n2tn1+n2-2其中:sw2=1n1+n2-2n1-1s12+n2-1s22=1n1+n2-2i=1n1xi-x2+j=1n2yj-y2拒绝域:tt2n1+n2-2 ptt1-2n1+n2-2=1- 5.13模型的求解根据所给附件1整理得数据见附录2中的两个表格,通过spss 对两表中红葡萄酒的评价汇总表进行比较均值中独立样本t 检验。输出结果(表2,表3):表2. 组统计量组别n均值标准差均值的标准误评价总分12773.49267.557931.4545222771.2636.252021.2032表3. 独立样本检验方差方程的leven检验均值方程的 t 检验fsig.tdfsig.(双侧)均值差值标准误差值差分的 95% 置信区间下限上限评价总分假设方差相等1.3880.2441.181520.2432.229631.88768-1.558286.01754假设方差不相等1.18150.2350.2432.229631.88768-1.561456.02071由表可得出结论:sig.=0.2445%,接受原假设h0,注意到t=1.181对照t=x-ysw127+127=1.6395其中f=1.388 ,显著性概率=0.2435% ,因此结论是两组方差差异不显著,从数据中可以看出第一组的标准差7.55793 比第二组的标准差6.25202 大,且第一组均值的标准误差 1.45452 比第二组的 1.2032 大,所以对于红葡萄酒来说第二组的评价更可信。同理,对于白葡萄酒利用spss 进行检验分析得到如下结果(表4,表5)表4. 组统计量组别n均值标准差均值的标准误评价总分12874.25365.209710.9845422876.70363.284920.62079表5.独立样本检验方差方程的levene检验均值方程的 t 检验fsig.tdfsig.(双侧)均值差值标准误差值差分的 95% 置信区间下限上限评价总分假设方差相等4.2890.043-2.105540.04-2.451.16392-4.78352-0.11648假设方差不相等-2.10545.5390.041-2.451.16392-4.79349-0.10651由表可得出结论:sig.=0.0435%,接受原假设。其中f=4.289,显著性概率=0.0435% ,因此结论是两组方差差异显著,从数据中可以看出第一组的标准差5.20971 比第二组的标准差3.28492 大,且第一组均值的标准误差 0.98454比第二组的 0.62079 大,所以对于白葡萄酒来说第二组的评价更可信。 综上可得,两组评酒员对于红葡萄酒的评价没有显著性差异,对白葡萄酒的评价有显著差异,第二组的评价结果更可信。5.2模型二的建立问题二要求我们建立模型,可以根据酿酒葡萄自身的理化指标和酿造后葡萄酒的质量情况,对酿酒葡萄进行分级。为解决该问题,我们通过以下步骤来评价与分级酿酒葡萄。先对酿酒葡萄27 种指标之间的关系研究,目的是构建评价模型的指标体系;然后建立综合评价模型,并通过该模型对步骤一得到的指标进行多指标综合评价,以对酿酒葡萄进行分级。根据问题一可知第二组对葡萄酒的评价结果较为可信,考虑到分级的优劣程度可以把对葡萄酒的评分均值作为影响葡萄质量的一个综合指标。为了对酿酒葡萄的理化指标进行分级,引入k-均值算法,把30个一级理化指标进行分类。5.2.1红酿酒葡萄的分级k-均值算法首先随机从数据集中选取k 个点作为初始聚类中心,然后计算各个样本到聚类中的距离,把样本归到离它最近的那个聚类中心所在的类。计算新形成的每一个聚类的数据对象的平均值来得到新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束,聚类准则函数已经收敛。本算法的一个特点是在每次迭代中都要考察每个样本的分类是否正确。若不正确,就要调整,在全部样本调整完后,再修改聚类中心,进入下一次迭代。如果在一次迭代算法中,所有的样本被正确分类,则不会有调整,聚类中心也不会有任何变化,这标志着已经收敛,因此算法结束。通过附件2整理数据利用spss 软件得到分类结果见附录3,进一步处理得到表6如下:表6 红酿酒葡萄的聚类结果酒样品号评分值聚类结果酒样品号评分值聚类结果168.14374.632744666.32471.242172.21765.34572.1586641068.85978.241368.851161.641472.651268.341669.951565.741774.551865.442471.551972.642568.252075.84267252271.642771.552377.14根据表6的聚类结果,结合评分均值,可得到红酿酒葡萄的分级为:一级:3号样品二级:21号样品三级:5,10,13,14,16,17,24,25,26和27号样品四级:1,2,4,7,8,9,11,12,15,18,19,20,22和23号样品五级:6号样品5.2.2白酿酒葡萄的分级同样的方法对白酿酒葡萄的理化指标进行处理,原始结果见附录4。处理后的数据表如下:表7 白酿酒葡萄的聚类酒样品号评分值聚类结果酒样品号评分值聚类结果177.92275.81872.32476.911171.42581.511373.92675.511667.32774.211780.32980.411876.721079.811976.421272.412279.421578.412476.152076.612879.652579.511477.142674.312179.24277712377.44375.63根据表8的聚类结果,结合评分均值,可得到白酒酿酒葡萄的分级为:一级:14,21和23号样品二级:24和28号样品三级:2,4,5,6,7,9,10,12,15,20,25,26和27号样品四级:3号样品五级:1,8,11,13,16,17,18,19和22号样品5.3 模型三的建立 问题三要求分析酿酒葡萄与葡萄酒的理化指标之间的联系。这个问题对酿酒葡萄和葡萄酒的理化指标两组变量的关系分析提出了要求,对此我们用以下步骤解决:首先建立典型相关分析模型,其目的是分析酿酒葡萄与葡萄酒的理化指标之间的典型相关关系;然后根据上面的分析给出酿酒葡萄与葡萄酒的理化指标之间的联系。5.3.1 红葡萄酒设 xm1m30为红酿酒葡萄的第m项理化指标,30项理化指标依次为:氨基酸总量、蛋白质、vc含量、花色苷、酒石酸、苹果酸、柠檬酸、多酚氧化酶活力e、褐变度、dpph自由基1ic50、总酚、单宁、葡萄总黄酮、白藜芦醇、黄酮醇、总糖、还原糖、可溶性固形物、ph值、可滴定酸、固酸比、干物质含量,果穗质量、百粒质量、果梗比、出汁率、果皮质量、l*(d65) 、a*(d65)、b*(d65)。设yn(1n9)为红葡萄酒的第n项理化指标,y1y9的指标名称依次为:花色苷 、单宁、总酚 、酒总黄酮 、白藜芦醇 、 dpph半抑制体积 、l*(d65) 、a*(d65)、b*(d65)。对每一个固定的n值,利用红葡萄酒的观测数据yin (i=1,2,27)和红酿酒葡萄的观测数据xim进行分析,然后通过spss 编程进行多元线性回归分析,得到yn和这些 xm的线性关系。如y1的系数表如下表8(所有程序结果见附录5)表8.系数表coefficientsamodelunstandardized coefficientsstandardized coefficientstsig.bstd. errorbeta1(constant)14.33527.1770.5270.603x42.3680.1980.92311.96102(constant)438.407163.3262.6840.013x42.6560.2091.03512.70x26-6.7622.575-0.214-2.6260.015a. dependent variable: y1所建立关系如下:y1=438.407+2.656x24-6.762x26y2=3.449+0.024x4+0.001x1y3=1.684+0.253x11+0.008x4y4=-0.951+0.398x11y5=37.275+0.348x13-0.7x2-0.75x6+0.03x4+0.31x5+0.148x14y6=-0.024+0.017x11y7=61.908-0.144x4+3.561x29-0.124x15-1.223x5y8=69.169-0.094x4-4.818x29y9=-8.859+0.129x17-0.737x6+0.831x55.3.2白酿酒葡萄设 xm (1m30)为白酿酒葡萄的第m项理化指标,设yn(1n8)为白葡萄酒的第n项理化指标,y1y8的指标名称依次为:单宁、总酚 、酒总黄酮 、白藜芦醇 、 dpph半抑制体积 、l*(d65) 、a*(d65)、b*(d65)。对每一个固定的n值,利用白葡萄酒的观测数据yin (i=1,2,28)和红酿酒葡萄的观测数据xim进行分析,然后通过spss编程进行多元线性回归分析,得到yn和这些 xm的线性关系。(程序结果见附录6)建立关系如下:y1=-0.11+0.124x12+4.705x27y2=-2.556+0.173x13+0.016x17y3=2.928+0.359x11+0.061x21-2.939x19+0.007x2y5=51.049-0.43x22+0.012x26y6=101.965-0.086x22+0.026x26y7=-1.587-0.128x25+0.02x26y8=5.197-0.127x26+0.266x22+0.291x25在求解过程中发现,对于白葡萄酒的3个理化指标:白藜芦醇(z )、dpph半抑制体积(z6)和色泽 a*(d65)(z ),与白酿酒葡萄的任意理化指标的相关系数均小于 0.5,即它们不能用白酿酒葡萄的理化指标线性表示。我们猜想,这些指标可能与芳香物质有关系,例如,酒精浓度对白藜芦醇的影响很大。5.4模型四的建立问题四要求分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证是否可行。由于酿酒葡萄和葡萄酒的多个理化指标为自变量,因变量只有一个,故首先建立多元线性回归模型,后进行显著性差异检验。具体步骤如下: 首先对样本进行筛选,选择22组数据进行分析;然后在问题三分析酿酒葡萄与葡萄酒的理化指标间联系的基础上对样本指标进行初步筛选;其次利用筛选后的指标与葡萄酒质量评价结果,建立多元线性回归模型;最后根据剩下的样本对的酿酒葡萄和葡萄酒的理化指标,对葡萄酒质量求解得到的多元线性回归方程进行验证。分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。与问题三类似,这也是一个多元线性回归问题,因此可用问题三的方法。设红葡萄酒和白葡萄酒的质量指标为ph和pb ,以问题一的评分值衡量。红葡萄酒的ph与理化指标xm 1m30,yn1n9有27组样本数据,留出后5组数据用于结果检验,利用前22组数据计算ph与xm ,yn之间的相关系数,考虑到xm与yn是否存在相关性,需要对39组数据进行主成分分析利用spss 得到分析表如下表9解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %111.97630.70730.70711.97630.70730.70725.36713.76144.4685.36713.76144.46834.43211.36555.8334.43211.36555.83343.8539.87965.7123.8539.87965.71252.3966.14471.8552.3966.14471.85561.995.10476.9591.995.10476.95971.6934.34281.3011.6934.34281.30181.463.74485.04591.0832.77687.821100.8782.25290.073110.8452.16892.241120.6271.60893.849130.5891.5195.359140.4781.22496.583150.3961.01697.599160.380.97498.573170.2530.64999.222180.1310.33599.557190.0820.21199.768200.0620.1699.928210.0280.072100226.31e-161.62e-15100235.69e-161.46e-15100243.87e-169.93e-16100253.76e-169.64e-16100262.84e-167.27e-16100272.20e-165.63e-16100281.45e-163.72e-16100293.85e-179.88e-1710030-1.15e-17-2.94e-1710031-7.71e-17-1.98e-1610032-1.29e-16-3.30e-1610033-2.14e-16-5.50e-1610034-2.57e-16-6.59e-1610035-3.39e-16-8.69e-1610036-4.05e-16-1.04e-1510037-6.03e-16-1.55e-1510038-6.52e-16-1.67e-1510039-7.59e-16-1.95e-15100提取方法:主成份分析按照主成分分析的理论,如n个主成分的累计贡献率达到了83 ,则这n个主成分能够反映出足够的信息。由表9可看出,前7个主成分的累计贡献率已经达到了81.3 ,故选取前7个特征值,即7个相互独立的新的综合性指标,就能够比较全面地反映出红酿酒葡萄的理化指标。对39组自变量与7个主成分,7个主成分与ph做线性规划,计算可得ph与xm ,yn的线性关系如下:ph=0.00737y1+1.5047y3+5.084y8+0.01706x1+0.063x2+5.1475x5 -0.186x7+1.1046x11+0.054x12+3.2013x19+0.264x20-0.11x22+0.0281x23-0.02902x24+0.3223x25+0.126x26-4.15x27 -0.0246x28-1.444x30-16.0103 将留出的后5组数据,分别代入上述方程,得到红葡萄酒的ph计算值,与数据中原有的ph实际值进行比较,起到模型检验的效果,如下表所示表10红葡萄酒 表11白葡萄酒红葡萄酒白葡萄酒实际值计算值实际值计算值77.183.577.476.9971.570.676.182.9468.273.179.574.667270.474.377.9171.573.87777.3179.678.51同理的到白葡萄酒的分析结果线性关系如下:pb=67.3129+0.1975x30+1.1432y2+0.1272x20+0.2336x12+0.019x16-0.1291x29-0.095x6-0.0171x8 从表10表11可以看出,拟合的函数存在一定的误差,通过酿酒葡萄和葡萄酒的理化指标可对葡萄酒的质量做出一个大概的估计,但要想只通过理化指标来精确评价葡萄酒的质量比较困难,因为葡萄酒的质量可能还与其他指标相关。综合问题三和问题四的结果,我们可以看出葡萄酒的各项指标与酿酒葡萄的各项成分指标具有相关性,并存在线性回归方程,酿酒葡萄某一成分的含量的增加或较少都会引起葡萄酒指标含量的变化,即酿酒葡萄对葡萄酒的理化指标具有一定联系,而葡萄酒的理化指标与葡萄酒质量(外观、香气、口感、平衡及整体)综合评分同样具有相关性,并存在线性回归方程,即葡萄酒的理化指标与葡萄酒质量具有一定的联系,综合以上两点,葡萄酒的理化指标以及酿酒葡萄的理化指标,共同影响葡萄酒质量的好坏。六、模型的评价与推广对于问题一影响葡萄等级的因素很多,无法完全用数学模型表示实际的口感,所以模型还有待完善。检验模型在相应的过程中要求总体服从正态分布,因此在模型推广中收到限制。在对传统模型理解的基础上,取模型之长,利用检验对模型进行验证,大幅度提高的结论的准确性。 对于问题二我们使用k-均值算法,该算法确定的k 个划分到达平方误差最小。当聚类是密集的,且类与类之间区别明显时,效果较好。对于处理大数据集,这个算法是相对可伸缩和高效的,计算的复杂度为 o(nkt),其中n是数据对象的数目,t 是迭代的次数。 对于问题三模型对理化指标进行筛选后逐步回归分析,数据拟合程度较好。减少了庞大数据所造成的相关性不明显的情况。但酿酒葡萄理化指标分类少,不能更全面地涵盖酿酒葡萄与葡萄酒的理化指标之间的联系。 对于问题四,通过逐步回归分析将指标集中指标筛选剔除,余下能充分反映线性关系的小部分指标来得到相应结果。显然,逐步回归分析之前的指标集中的指标数越多,模型的效果会越好。因此,对于模型的改进,考虑加入附件3中葡萄和葡萄酒的芳香物质的指标。 综上所述可知在考虑酿酒葡萄和葡萄酒的问题中,本次论文建模多次使用多元统计分析和相关性分析,使得大量理化指标数据的使用效果较好。同时可以用多元线性回归分析解决生活中类似问题的解答,例如:香烟的化学成分与香烟质量之间的关系,企业客户的分类问题,为企业扩大规模和服务产品的策划设计提供了依据 参考文献1 姜启源,谢金星,叶俊,数学模型,北京:高等教育出版社,2011-2492682 余建英,何旭宏,数据统计与spss 应用,北京:人民邮电出版社,20033 邓维斌,胡大权,spss19 统计分析实用教程,北京:电子工业出版社20124 王正林,龚纯,何倩,精通 matlab 科学计算(第2版)北京:电子工业出版社,2009.85 王力宾,多元统计分析:模型、案例及spss 应用,北京:经济科学出版社,20106 李业丽,秦臻,一种改进的k-means算法,北京印刷学院学报,2007.4 7 刘辉,t 检验模型检验葡萄酒的评价差异,黑龙江生态工程职业学院学报,第26卷:第一期,2013.18 盖晓华,郭学军,葡萄酒的评价及分类,南阳理工学院学报,第4卷:第4期,2012.79 百度百科,酿酒葡萄,/view/2684347.htm,2014年8月22日附录:附录1x=0:1:27;y1=62.7,80.3,80.4,68.6,73.3,72.2,81.5,72.3,81.5,74.2,70.1,53.9,74.6,73,58.7,74.9,79.3,59.9,78.6,78.6,77.1,77.2,85.6,78,69.2,73.8,73;y2=68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72,71.5;plot(y1,-r)hold onplot(y2,-g)legend(第一组,第二组,0)a=0:1:28;b1=82 74.2 85.3 79.4 71 68.4 77.5 71.472.9 74.3 72.3 63.3 65.9 72 72.4 74 78.8 73.1 72.2 77.876.4 71 75.9 73.3 77.1 81.3 64.8 81.3;b2=77.9 75.8 75.6 76.981.5 75.5 74.2 72.3 80.4 79.8 71.4 72.473.9 77.1 78.4 67.3 80.3 76.7 76.4 76.679.2 79.4 77.4 76.1 79.5 74.3 77 79.6;plot(b1,r)hold onplot(b2,g)legend(第一组,第二组,0)附录2表1.第一组对红葡萄酒和白葡萄酒的评价汇总表第一组红葡萄酒第一组白葡萄酒样品编号外观分析香气分析口感分析整体评价评价总分外观分析香气分析口感分析整体评价评价总分18.721.924.47.762.711.225.435.79.782.0210.124.036.69.680.310.923.9312.080.49.685.3412.019.328.98.468.611.624.034.49.479.4512.723.029.08.673.37.423.930.88.971.0610.922.730.08.672.29.620.729.38.668.2719.821.531.38.981.59.824.633.79.477.589.724.729.58.472.39.621.631.48.871.4911.582.512.123.428.78.772.91010.823.531.18.874.27.625.831.79.274.3118.623.429.78.470.19.622.731.38.772.3125.115.925.07.927.08.263.3138.974.67.420.329.78.565.91411.920.432.08.773.08.623.531.18.872.01511.515.424.27.658.79.023.731.08.772.41610.523.332.022.932.59.374.01711.723.534.99.279.311.525.632.39.478.8186.918.027.37.960.19.773.11911.924.033.59.278.69.322.631.78.672.2209.926.533.69.279.211.024.533.39.077.82111.523.033.49.233.49.276.42211.924.032.39.077.211.071.02311.427.336.910.085.69.723.533.59.275.92412.123.711.221.931.38.973.32510.421.728.88.330.58.877.12611.423.530.08.973.812.325.833.89.481.3279.921.632.59.073.08.520.028.08.364.82812.725.034.29.481.3表2. 第二组对红葡萄酒和白葡萄酒的评价汇总表第二组红葡萄酒第二组白葡萄酒样品编号外观分析香气分析口感分析整体评价评价总分外观分析香气分析口感分析整体评价评价总分110.719.929.18.434.99.477.99.174.010.922.733.09.275.8310.222.632.98.974.69.723.033.69.375.649.922.530.08.871.210.476.9510.820.931.58.972.110.625.735.69.681.568.766.39.023.733.6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 营销自动化软件定制创新创业项目商业计划书
- 四季盆景展示园创新创业项目商业计划书
- 法律手工制品店铺创新创业项目商业计划书
- 汽车安全管理信息系统创新创业项目商业计划书
- 输油管安全知识培训内容课件
- 农产品农业产学研合作创新创业项目商业计划书
- 职业教育课程版权合作拓展创新创业项目商业计划书
- 2025年工业互联网平台生物识别技术在工业生产过程质量监控中的应用前景分析
- 2025年数字人民币跨境支付技术挑战与支付清算安全防护
- 民法典物权篇课件
- 施工合同赶工协议
- 《人工智能原理及其应用》王万森编著电子工业出版社课后习题答案37
- DB1331T 063-2023雄安新区地埋管地源热泵系统工程技术规程
- 汽车销售劳动合同书
- 湖北武汉历年中考作文题与审题指导(2000-2024)
- 中学学生会检查细则说明表格
- 新初一家长培训会课件
- 大中型企业安全生产标准化管理体系要求编制说明
- 《社会治理概论》教学大纲
- 人教版初中九年级全册英语单词表(完整版)
- 2024ESC心房颤动管理指南解读-完整版
评论
0/150
提交评论