大连海事大学第132队论文(A题)1_第1页
大连海事大学第132队论文(A题)1_第2页
大连海事大学第132队论文(A题)1_第3页
大连海事大学第132队论文(A题)1_第4页
大连海事大学第132队论文(A题)1_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名)大连海事大学参赛队员(打印并签名):1.林鑫2.任东亚3.黄潇瑶指导教师或指导教师组负责人(打印并签名):张运杰日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号)赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要:本文主要需要解决的问题是将葡萄酒从评酒师感官方面的定性评价通过一定的数据处理与数学模型的建立转化为由酿酒葡萄和葡萄酒理化指标做基础的定量的葡萄酒评价方法。考虑到红葡萄酒和白葡萄酒之间的差异性,我们对它们分别进行讨论。针对题目中的问题,我们通过如下的方法去解决:(1)第一问是对评酒员评分的差异性的分析与可信度的分析。我们通过传统统计学的平均数与标准差的计算方法,计算各葡萄样品评酒员所打分数的平均值与每组评酒员之间所打分数的标准差,再进行作图比较,得出我们想要的结论。第二问是根据酿酒葡萄的理化指标对酿酒葡萄进行分级。我们首先通过计算各理化指标的Pearson相关系数矩阵,分析各指标之间的Pearson相关系数,得到高度相关的理化指标。再通过聚类的方法,将这些理化指标聚合成一类因子。最后通过对各因子与葡萄酒质量的数据拟合,得出一定的函数关系式,结合前苏联对葡萄酒的评价模型与张大鹏检验模型对关系式进行检验。第三问是分析酿酒葡萄和葡萄酒理化指标之间的联系。我们首先选取一些含量大且对葡萄酒质量有较大影响的理化指标。对这些指标进行数据拟合与修正,得出我们想要的函数关系式。第四问是分析葡萄酒和酿酒葡萄中理化指标之间对葡萄酒质量的影响,并论证它们能否用来对葡萄酒质量进行评价。首先,我们结合第二问与第三问的结论,建立第四问的拟合模型。再通过该模型计算各葡萄酒样品的相对值并与评酒员所打分数进行比较论证其可行性。关键词:平均数标准差聚类统计学原理Pearson相关系数数据拟合代表性分析Pearson相关系数前苏联评价模型张大鹏检验模型背景及意义:在葡萄酒发展的历史中,没有一个特定的公式或模型通过测量计算葡萄酒与酿酒葡萄的理化指标来对葡萄酒质量进行评价。而是通过评酒师的打分对葡萄酒进行分级评价,这种评价方法受偶然因素与评酒师人为因素影响较大,故存在一定的误差。我们对题目所给数据的分析以及试图建立这样一个评价模型,对于葡萄酒发展以及评价具有一定的推动作用。但我们的模型仍然存在一定的误差,所以对于这类模型的建立,葡萄酒制造业还需要通过一定时间去研究。问题的重述葡萄酒在人类物质生活领域发挥着其独特的作用,但是对于葡萄酒的质量评价葡萄酒界一直没有一个统一明确的方法。一般的评价仅仅通过聘请资深评酒员品评,然后对其分类指标进行打分,从而求和获得其总分以判断葡萄酒的优劣。在实际生产过程中,葡萄酒的优劣与酿酒葡萄的好坏有着直接关系。酿酒葡萄的好坏往往可以通过其检测得出的理化指标进行区分。现在得到了红葡萄酒样品27组、白葡萄酒样品28组的理化指标(附件2)、芳香物质含量(附件3)以及两组评酒员对于它们的评价(附件1),另外我们还得到了这些样品对应的酿酒葡萄的理化指标(附件2)以及芳香物质含量(附件3)。我们将通过数学模型的建立与数学方法的运用完成以下的几个问题:(1)利用附件1的数据,比较分析两组评酒员的评价结果是否有显著差异并判断出更值得信任的一组评酒员。(2)利用附件2与附件3,结合附件1的部分数据,通过酿酒葡萄的理化指标和对应葡萄酒的质量对酿酒葡萄进行分级。(3)利用附件2与附件3,寻找酿酒葡萄与葡萄酒的理化指标之间的数学关联性。(4)寻找酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的数学关联性,并论证能否用这个关联性对葡萄酒进行评价。基本假设与符号约定为了讨论问题的方便起见,我们做如下假设:假设两组评酒员在同一时间同一地点的理想条件下进行品酒工作,且相互之间不受相互之间的主观影响。假设附件2中各理化指标之间没有直接关联性且不相互影响,一个指标的变化不会同时引起多个指标的变化。题目所给的理化指标(附件2)与芳香物质(附件3)太过复杂,因此,我们将在必要的时候选取主要的指标进行分析或者通过聚类的方式,将物质属性相类似的指标加和后进行分析。(4)最后所得结果仅适合于本题背景,不排除其他环境中模型有较大的误差。在此,我们也约定文中所用符号如下:y评酒员所打分数代表值r样本之间的Pearson相关系数f酿酒葡萄样品酚类因子的值h酿酒葡萄样品花色类因子的值t酿酒葡萄样品糖类因子的值酿酒葡萄样品芳香类因子的物质的量(各芳香类物质的量的和)n酿酒葡萄样品各芳香类物质的物质的量葡萄酒样品花色苷含量的值酿酒葡萄样品花色苷含量的值葡萄酒样品单宁含量的值酿酒葡萄样品单宁含量的值葡萄酒样品总酚含量的值酿酒葡萄样品总酚量的值葡萄酒样品酒总黄酮含量的值酿酒葡萄样品酒总黄酮含量的值葡萄酒样品的理化指标酿酒葡萄的理化指标Q葡萄酒的质量度量值w个人外观喜好系数k个人口感喜好系数d个人甜度喜好系数x个人香味喜好系数3.问题的分析与求解的基本思路我们的目标有三个,首先比较两组评酒员评价结果有无显著性差异并得出可信的一组数据,其次对酿酒葡萄进行分级,然后建立酿酒葡萄与葡萄酒理化指标之间的函数关系,最后论证能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。(1)第一个问题的思路比较直接,根据题目条件,首先我们求得两组评酒员对各组葡萄所评总分,然后通过求得每个葡萄样品各组评酒员打出的平均分进行纵向比较,再次我们求出每组葡萄样品两组评酒员之间相互的标准差进行横向比较,最后得出我们的结论。(2)第二个问题的数据量庞大,我们则通过聚类的方法(计算各理化指标间的Pearson相关系数)将各相关性比较高的理化指标进行聚为一类因子,再分析这些因子与评酒员所打的分数之间的关系,拟合出较适合的函数模型。最后,通过拟合的函数模型所求的各酿酒葡萄的函数值与前苏联葡萄酒评价公式以及张大鹏葡萄酒评价公式所得的值进行比较,对各酿酒葡萄进行分级。(3)第三个问题由于各理化指标关系的复杂性,我们选择了红葡萄样品中比较有代表性的4个指标以及白葡萄样品中比较有代表性的3个指标进行分析。通过对这些指标的数据拟合,我们得出酿酒葡萄各理化指标与葡萄酒各理化指标之间的函数关系式,从而分析得到总的大致函数关系式。(4)对于第四个问题的解决,我们在第二与第三个问题的基础上,拟合出酿酒葡萄和葡萄酒理化指标与葡萄酒质量之间的关系式,即总评价式,其值为Q。然后再重新计算各酒样品的Q值并排序,再与第一问可信一组评酒员对酒样品所打的平均分排序后的结果进行比较,论证总评价式的可行性。4.模型的建立与求解4.1两组评酒员评价的差异性与可信度分析在解决这一问题中,我们用到了两个统计学概念——平均数与标准差:假设有一组数值,...,(皆为实数)其平均值为:此组数值的标准差为:根据我们对附件1数据的整理,我们得出两组评酒员和每组酒样品的平均分与标准差(见附表1),通过Excel画图功能,我们绘制得到它们的散点图:4.1.1-1两组评酒员(A1、A2)对红葡萄酒样品的评价平均值散点图4.1.1-2两组评酒员(B1、B2)对白葡萄酒样品的评价平均值散点图我们通过观察图上数据发现如下特点:4.1.1第一组评酒员在对红葡萄酒的评价中其打的分数明显低于第二组评酒员,而在对白葡萄酒的打分中则明显高于第二组评酒员。所以我们认为第一组评酒员更加偏爱于白葡萄酒,第二组评酒员更加偏爱于红葡萄酒。评酒员各有所爱,因此我们无法判断哪组评酒员更可信。4.1.2-1每组评酒员之间(A1、A2)对红葡萄酒样品的评价标准差散点图4.1.2-2每组评酒员之间(B1、B2)对白葡萄酒样品的评价标准差散点图我们通过观察图上数据发现如下特点:4.1.2无论是红葡萄酒还是白葡萄酒,第二组评酒员所评分数的标准差普遍小于第一组评酒员,说明第二组评酒员相互之间的评价不存在较大分歧。根据《OIV国际葡萄酒评比标准》[1]中不同的评酒员对同一酒样的评尝有较大差异时要求对样品进行第二次评判,所以第一组评酒员需要对酒样品进行第二次评判的可能性大于第二组。4.1.3综合以上讨论,我们认为第二组评酒员评价结果更可信,在本文后续的问题计算中,我们默认评酒员的分数即为第二组评酒员对各酒样品所打的分数总分的平均值。4.2对酿酒葡萄的分级在我们对附件2数据的观察中,我们酿酒葡萄的理化指标中的各项指标数据量非常庞大,首先,我们将各理化指标中多次测量的值用它们的平均数表示(见附表1)。其次,我们采用聚类的方法对它们进行归纳。在聚类的过程中,我们通过计算各理化指标的Pearson相关系数并比较,得出聚类的大致目标。在统计学中,Pearson相关系数,通常用r或是ρ表示,是用来度量两个变量X和Y之间的相互关系(线性相关)强弱的。两个变量之间的Pearson相关系数定义为这两个变量的协方差与二者标准差积的商,即上式定义了总体相关系数。若用样本计算的协方差和标准差代替总体的协方差和标准差,则为样本相关系数,一般用r表示:另外一个与上式等效的定义相关系数的公式是通过标准化以后变量均值的积定义的。假设样本可以记为,则样本Pearson相关系数为其中,和分别为标准化变量,样本均值和样本标准差。4.2.1对酿酒红葡萄的分级对酿酒红葡萄理化指标的聚类我们运用Excel中CORREL函数计算得到各酿酒红葡萄理化指标的Pearson相关系数r。结合统计学原理[2]与本题实际情况,我们选取r=5作为度量值,r>5则两个指标呈高度相关,5>r>0呈低度相关,r<0呈负相关。通过分析酿酒红葡萄各理化指标Pearson相关系数矩阵(详见附表2),我们得到花色苷与褐变度高度相关,我们归结为花色类因子,总酚、DPPH自由基、葡萄总黄酮、单宁高度相关,我们归结为酚类因子,还原糖、总糖、可溶性固形物高度相关我们归结为糖类因子,VC、固酸比、氨基酸等没有太大的相关性,故而单独考虑。以下是我们得到的红葡萄理化指标的聚合分析图酿酒红葡萄理化指标聚类后的数据拟合我们通过Matlab软件对各大类因子加权值与各样品评酒员所打分数y进行数据拟合,然后得到它们的一次函数关系式(程序语句见附表7程序语言):酿酒红葡萄酚类因子函数为:酿酒红葡萄花色类因子函数为:酿酒红葡萄糖类因子函数为:我们对附件3芳香类物质数据处理时,通过化学原理中求物质的量的公式:求得各酿酒红葡萄葡萄样品中各种芳香类物质物质的量的和既(见附表6),再拟合出酿酒红葡萄芳香类因子函数为:因为VC、固酸比等数据单独为一类因子,我们认为其对酿酒红葡萄的优劣评价不大,所以我们不对其进行专门的考虑,所以我们将各因子函数进行叠加,得到评酒员所打分数与酿酒红葡萄理化指标之间的函数关系:所以我们建立了如下的线性数学模型:由此我们根据各酿酒红葡萄的理化指标求得其y值为:酒样号y值酒样号y值酒样号y值1525.461117.902173.882347.80127.0122104.543174.131332.5623257.81453.1414396.312488.92574.361563.292597.15634.0916167.022636.167184.941754.8027186.228549.531859.679243.7119105.9710172.702078.32对此,我们将酿酒红葡萄分为四个等级:一级(y>200的酒样号):8、1、14、2、23、9二级(200>y>150的酒样号):27、7、3、10、16三级(150>y>60的酒样号):19、22、25、24、20、5、21、15四级(y<120的酒样号):18、17、4、26、6、13、11、124.2.2对酿酒白葡萄的分级对酿酒白葡萄理化指标的聚类同理于4.2.1的分析方法,通过分析酿酒白葡萄各理化指标Pearson相关系数矩阵(详见附表2),我们得到干物质质量、还原糖、总糖、可溶性固形物高度相关,我们归结为糖类因子,总酚、黄酮醇、葡萄总黄酮、单宁高度相关,我们归结为酚类因子,VC、固酸比、氨基酸、花色苷等没有太大的相关性,故而单独考虑。以下是我们得到的红葡萄理化指标的聚合分析图酿酒白葡萄理化指标聚类后的数据拟合与同理,我们通过Matlab软件对各大类因子加权值与各样品评酒员所打分数y进行数据拟合,然后得到它们的一次函数关系式(程序语句见附表7程序语言):(1)酿酒白葡萄酚类因子函数为:(2)酿酒白葡萄糖类因子函数:(3)同理(3)的过程,我们通过Matlab软件(程序语言见附表7)拟合出酿酒白葡萄芳香类因子函数为:因为VC、固酸比、花色苷等数据单独为一类因子,我们认为其对酿酒白葡萄的优劣评价不大,所以我们不对其进行专门的考虑,所以我们将各因子函数进行叠加,得到评酒员所打分数与酿酒白葡萄理化指标之间的函数关系:所以我们建立了如下的线性数学模型:由此我们根据各酿酒白葡萄的理化指标求得其y值为:酒样号y值酒样号y值酒样号y值1186.2311242.7421197.702174.8912299.5322272.463212.6713252.0123254.304227.6214593.6124342.795287.3315677.2425295.306224.2516200.4926237.477239.5317193.0227646.708182.3118270.1328409.659217.3619217.3710262.0020237.44对此,我们将酿酒白葡萄分为四个等级:(1)一级(y>300的酒样号):15、27、14、28、24(2)二级(300>y>250的酒样号):12、25、5、22、18、10、23、13(3)三级(250>y>200的酒样号):11、7、26、20、4、6、19、9、3、16(4)四级(y<120的酒样号):21、17、1、8、24.2.3酿酒葡萄分级模型的检验我们通过查找资料得出,前苏联人曾用总糖×PH2来评价酿酒葡萄品质,张大鹏曾用(总糖+还原糖)×果皮花色苷来评价有色鲜食品种品质[3]。根据我们对葡萄理化数据的分析,我们对这两种检验方法进行符合本题背景的改进,得到下列检验模型:对酿酒红葡萄分级模型的检验根据上述的检验模型既酿酒红葡萄优劣指数Y模型,我们求得各样品Y值如下:酒样号Y值酒样号Y值酒样号Y值168.95111.332115.88230.40125.652211.19321.37139.092330.40416.591428.482424.63517.621511.26258.8468.191610.76269.22714.711711.50276.27856.36188.20934.551918.76106.52203.53对此,我们根据检验模型Y将酿酒红葡萄分为四个等级:一级(Y>30的酒样号):1、8、9、2、23(2)二级(30>Y>14的酒样号):14、24、3、19、5、4、21、7(3)三级(14>Y>8的酒样号):17、15、22、16、26、13、25、18、6(4)四级(Y<8的酒样号):10、27、12、20、11相比较4.2.1中我们根据拟合的分级模型对酿酒红葡萄质量的分级,我们发现在一级酒样中,原模型与检验模型存在较多的一致性,但对二、三、四级酒样的分级差异明显性也不大。所以,我们认为我们拟合的原模型具有一定的可行性。对酿酒白葡萄分级模型的检验根据上述的检验模型既酿酒白葡萄优劣指数Y模型,我们求得各样品的Y值如下:酒样号Y值酒样号Y值酒样号Y值16.591118.63217.57216.541216.36224.1032.29132.37234.8743.261411.742418.72515.36153.672510.0567.28161.12264.1171.64173.312714.6582.25187.27283.0091.81193.54107.23207.04对此,我们根据检验模型Y将酿酒白葡萄分为四个等级:(1)一级(Y>14的酒样号):24、11、2、12、5、27(2)二级(14>Y>5的酒样号):14、25、21、6、18、10、20、1(3)三级(5>Y>3的酒样号):23、26、22、15、19、17、4、28(4)四级(Y<3的酒样号):13、3、8、9、7、16相比较4.2.2中我们根据拟合的分级模型对酿酒白葡萄质量的分级,我们发现在一级酒样中,原模型与检验模型存在较多的一致性,但对二、三、四级酒样的分级差异明显性也不大。所以,我们认为我们拟合的原模型具有一定的可行性。4.3酿酒葡萄与葡萄酒理化指标之间的联系由于理化指标类型众多,我们仅选取有代表性的理化指标进行数据拟合,得到一些关系函数式。4.3.1对酿酒红葡萄与红葡萄酒理化指标的分析在此,对于红葡萄而言,我们选取花色苷、酒总黄酮、单宁与总酚四个代表性的理化指标进行数据拟合。通过Matlab软件拟合,我们求得以下函数关系式:(下标为p的为葡萄酒理化指标,下标为l的为酿酒葡萄的理化指标,具体程序语言与图像见附表7)酿酒红葡萄与红葡萄酒花色苷含量之间的关系:(2)酿酒红葡萄与红葡萄酒单宁含量之间的关系:(3)酿酒红葡萄与红葡萄酒总酚含量之间的关系:酿酒红葡萄与红葡萄酒酒总黄酮含量之间的关系:我们通过对这几个函数图象的观察,发现在计算的样品数据范围内这些理化物质在红葡萄样品中的含量越高,那么在红葡萄酒样中的含量也越高,且具有一定的递增关系,我们不难得出其总的关系也是递增的。所以其可以大致推断为:对上述四式分析后,我们得出a大约为1.5故酿酒红葡萄与红葡萄酒理化指标的关系式为:4.3.2对酿酒白葡萄与白葡萄酒理化指标的分析在此,对于白葡萄而言,因为白葡萄色泽浅,所以讨论花色苷没有太大的实际意义,因此我们选取酒总黄酮、单宁与总酚三个代表性的理化指标进行数据拟合。通过Matlab软件拟合,我们求得以下函数关系式:(下标为p的为葡萄酒理化指标,下标为l的为酿酒葡萄的理化指标,具体程序语言与图像见附表7)(1)酿酒白葡萄与白葡萄酒单宁含量之间的关系:(2)酿酒葡萄与葡萄酒总酚含量之间的关系:(3)酿酒葡萄与葡萄酒酒总黄酮含量之间的关系:我们通过对这几个函数图象的观察,发现在计算的样品数据范围内这些理化物质在红葡萄样品中的含量越高,那么在红葡萄酒样中的含量也越高,且具有一定的递增关系,我们不难得出其总的关系也是递增的。所以其可以大致推断为:对上述四式分析后,我们得出a大约为0.42故酿酒红葡萄与红葡萄酒理化指标的关系式为:4.4分析酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的关系我们在4.2中得出了酿酒葡萄的理化指标对葡萄酒质量的函数关系式,而在4.3中我们运用多次数据拟合的方法得出了葡萄酒理化指标和酿酒葡萄理化指标之间的函数关系式,所以,我们取4.3中所得系数与4.2中的函数关系式相乘,既得出我们想要联系酿酒葡萄理化指标与葡萄酒理化指标以及葡萄酒质量三个量之间的函数关系式:(1)红葡萄酒质量总评价式:(2)白葡萄酒质量总评价式:4.5论证上述总评价式的可行性4.5.1红葡萄酒总评价式的可行性分析我们根据总评价式计算得各红葡萄酒样品的Q值并按照降序排列所得的酒样号为:1至5:8、1、14、2、236至10:9、27、7、3、1011至15:16、19、22、25、2416至20:20、5、21、15、1821至27:17、4、26、6、13、11、12我们再根据评酒员对各红葡萄酒样品的打分按照降序排列所得的酒样号为:1至5:9、23、20、3、176至10:2、14、19、21、511至15:26、22、24、27、416至20:16、10、13、12、2521至27:1、6、8、15、18、7、11通过比较我们发现阶段性1至15名、15至27中两组数据有很多相似之处。其中有5组跳跃数据(既两组中阶段性不吻合的数据),数据吻合度为81.5%,故而通过红葡萄酒总评价式评价红葡萄酒质量还是较为可行的。4.5.2白葡萄酒总评价式的可行性分析我们根据总评价式计算得各白葡萄酒样品的Q值并按照降序排列所得的酒样号为:1至5:24、11、2、12、56至10:27、14、25、21、611至15:18、10、20、1、2316至20:26、22、15、19、1721至28:4、28、13、3、8、9、7、16我们再根据评酒员对各白葡萄酒样品的打分按照降序排列所得的酒样号为:1至5:5、9、17、10、286至10:25、22、21、15、111至15:23、14、27、4、1816至20:20、19、24、2、321至28:6、26、7、13、12、8、11、16通过比较我们发现阶段性1至15名、15至28中两组数据有很多相似之处。其中有6组跳跃数据(既两组中阶段性不吻合的数据),数据吻合度为78.6%,故而通过白葡萄酒总评价式评价白葡萄酒质量还是较为可行的。4.5.3综合分析由于葡萄酒行业历年为有一个统一的关于酿酒葡萄和葡萄酒理化指标与葡萄酒质量之间的评价关系式,而是通过人工品尝打分对葡萄酒进行评价,也是出于不同人对于不同酒各方面(比如口感、外观等)的喜好不同。所以,通过数学模型评价葡萄酒质量并不能很好地解决个人对于葡萄酒质量的要求,但从总体上评价葡萄酒的质量还是具有可行性的。4.6模型的改进对于4.5.3所论述的个人差异性,我们可以设置一定的个人喜好系数来对我们的总评价式进行改进:花色类因子含量影响葡萄酒的外观,则我们可以设置个人外观喜好系数为W;酚类因子含量影响葡萄酒的口感,则我们可以设置个人口感喜好系数为k;糖类因子含量影响葡萄酒的甜度,则我们可以设置个人甜度喜好系数为d;芳香类因子含量影响葡萄酒的香味,则我们可以设置个人香味喜好系数x。(w、k、d、x的值依据个人情况的不同而各不相同)所以我们得到改进后的评价模型为:(1)红葡萄酒质量总评价式:(2)白葡萄酒质量总评价式:5结束语本文采用数据拟合的方法,寻找数据间的函数关系,便于后续对葡萄酒质量评价的研究。本文所用的数据分析方法虽然简单,但却是一个成熟的数据处理方法,它可以简明、有效地通过观测数据来建立相应的函数关系。同时,为了简化数据我们引入了两个新颖、实用、有效的处理方法:聚类法:在对本题第二问的求解中,我们通过计算各种理化指标之间的Pearson相关系数矩阵,观察各指标间的Pearson相关系数,寻找高度相关的理化指标,对其值进行加和处理。通过将小的理化指标聚合成大的类因子指标,简化了数据类型,降低了数据维数。(2)代表性物质分析法:在对本题第三问的求解中,我们忽略了一部分在葡萄酒以及酿酒葡萄理化指标中含量较小的理化指标,只针对对葡萄酒质量影响大且含量大的理化指标进行数据拟合与分析,在简化数据类型的同时也使该题的分析具有一定的方向性与导向性。本文引入的这两种处理方法,不仅有效地处理了数据类型众多带来的困难,而且在讨论的过程中,我们也从不同的角度验证了它们的合理性和有效性。当然,本文仍有很多需要进一步讨论之处。例如,在对特殊数据的处理方面,我们只是在处理中删去了一部分疑似错误的数据而没有建立一个完整的分析数据是否错误的体系;在对葡萄酒的评价中,我们的模型还有待实践的检验。这说明人类在对葡萄酒凭借认为感官定性评价转变为对葡萄酒理化指标的定量评价的路程仍然漫长。参考文献[1]《OIV国际葡萄酒评比标准》/bencandy.php?fid=692&id=186286[2]《统计学》P304贾俊平等著中国人民大学出版社2009年第4版[3]《关于葡萄品质的评价指标》李记明等(西北农业大学葡萄酒学院·陕西杨凌·712100)[4]《基于物理化学性质的葡萄酒质量的可视化评价研究》王金甲等(燕山大学学报第34卷第2期2010年3月)[5]《酿造过程中葡萄酒氨基酸的变化》曾新安等(华南理工大学轻工与食品学院,广东广州510640)[6]《统计方法在葡萄理化指标简化中的应用》谢辉等(新疆农业科学院园艺作物研究所,乌鲁木齐830091)附件附表1:两组评酒员对红、白葡萄酒样品评分的数据处理表第一组红第一组白第二组红第二组白酒样号平均数A1标准差A1平均数B1标准差B1平均数A2标准差A2平均数B2标准差B2162.79.638829.60368.19.04977.95.087280.36.30972.414.18744.02875.87.005380.46.76978.38.15274.65.54275.611.937468.610.39479.46.68771.26.42676.96.45573.37.8757111.24572.13.69581.55.126672.27.72968.412.75966.34.59675.54.767771.510.17977.56.25865.37.91774.26.494872.36.63471.413.55668.06972.35.579981.55.7472.99.63278.25.07380.410.3091074.25.8474.314.58368.86.01579.88.391170.18.41272.313.30961.66.16871.49.3711253.98.92563.310.76168.35.01272.411.8341374.66.703665.913.06868.83.9173.96.839147367210.68772.64.81277.13.9851558.79.2572.411.47265.76.4378.47.3511674.94.2547413.34169.94.48367.39.0681779.39.38178.812.00774.53.02880.36.2011859.96.87173.112.51265.47.0976.75.4981978.66.88372.26.81272.67.42776.45.1032078.65.10377.88.02575.86.2576.67.0742177.110.77576.413.14272.25.95979.28.0252277.27.1157111.77671.64.92679.47.3212385.65.6775.96.60777.14.97777.43.40624788.65473.310.54171.53.27476.16.2082569.28.03977.15.8268.26.61379.510.322673.85.59481.38.538726.44674.310.14427737.05564.812.01771.54.528775.9632881.38.9779.65.038附表2:酿酒葡萄各理化指标Pearson相关系数矩阵样表由于此表数据比较大,所以改存为Excel表格,压缩在电子版论文数据处理表sheet1中,以备查用。附表3:酿酒葡萄各理化指标的简化数据表(平均值)由于此表数据比较大,所以改存为Excel表格,压缩在电子版论文数据处理表sheet2中,以备查用。附表4:酿酒葡萄芳香类物质总物质的量数据处理表样品号白葡萄红葡萄样品号白葡萄红葡萄葡萄样品12.523.05葡萄样品162.413.84葡萄样品21.702.61葡萄样品171.983.19葡萄样品32.622.03葡萄样品183.832.97葡萄样品43.752.32葡萄样品193.612.69葡萄样品55.423.12葡萄样品203.147.99葡萄样品61.443.57葡萄样品212.883.60葡萄样品72.562.12葡萄样品224.015.29葡萄样品82.042.12葡萄样品232.979.77葡萄样品92.832.10葡萄样品245.552.93葡萄样品103.812.10葡萄样品254.6760.72葡萄样品114.173.00葡萄样品262.7125.55葡萄样品124.694.81葡萄样品2711.3035.87葡萄样品134.153.32葡萄样品289.46葡萄样品1418.352.42葡萄样品1519.952.77附表5酿酒红葡萄理化指标聚类后的各因子含量数据处理表样品号花色类因子糖类因子酚类葡萄样品11527.88672.3155.53葡萄样品2986.89662.9464.51葡萄样品3424.58787.5853.26葡萄样品4152.59630.8224.08葡萄样品5264.12618.0642.77葡萄样品6162.13714.3432.96葡萄样品7494.52725.1818.48葡萄样品81546.99622.3146.63葡萄样品9664.95591.9875.63葡萄样品10503.77509.8531.12葡萄样品1199.26657.6513.41葡萄样品12164.56770.9123.32葡萄样品13165.20613.4631.98葡萄样品141131.30640.7136.77葡萄样品15210.79602.9143.05葡萄样品16590.63598.9230.69葡萄样品17189.00722.4440.13葡萄样品18199.10718.3718.24葡萄样品19318.67641.0340.96葡萄样品20113.29629.6329.23葡萄样品21283.54681.8037.70葡萄样品22491.69685.2536.73葡萄样品23599.65629.0178.83葡萄样品24289.61649.6731.66葡萄样品25190.59501.0126.55葡萄样品26140.83566.4614.83葡萄样品27626.39616.7824.18附表6:酿酒白葡萄理化指标聚类后的各因子含量数据处理表酒样品酚类因子糖类因子酒样品酚类糖类葡萄样品111.24582.27葡萄样品1528.69577.83葡萄样品210.33662.17葡萄样品1615.68600.91葡萄样品315.40652.10葡萄样品1717.16590.66葡萄样品411.26652.86葡萄样品1826.78590.92葡萄样品514.50703.60葡萄样品199.95634.56葡萄样品629.49626.58葡萄样品2016.90699.32葡萄样品726.62602.22葡萄样品217.78671.25葡萄样品815.25550.09葡萄样品2224.51625.53葡萄样品913.78684.01葡萄样品2323.43699.86葡萄样品1019.17703.35葡萄样品2430.40712.23葡萄样品1117.43551.56葡萄样品2521.67728.91葡萄样品1224.44694.57葡萄样品2618.46737.61葡萄样品1321.16537.09葡萄样品2783.24652.60葡萄样品1411.41656.31葡萄样品2820.77711.27附表7:正文中各拟合函数的Matlab源程序语言:5.7.1酿酒红葡萄样品各类理化指标因子的拟合函数语言酚类因子:x=[55.533,64.507,53.261,24.084,42.774,32.958,18.477,46.628,75.632,31.121,13.414,23.322,31.978,36.766,43.048,30.694,40.12518.239,40.960,29.229,37.699,36.727,78.829,31.656,26.551,14.82624.183];y=[68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72,71.5];p=polyfit(x,y,1);x1=linspace(0,120,110);y1=polyval(p,x1);figure(1)plot(x,y,'.',x1,y1)函数为:y=0.175x花色因子:x=[424.58,152.59,264.12,162.13,194.52,503.77,99.26,164.56,165.20210.79,590.63,189.00,199.10,318.67,113.29,283.54,491.69599.65,289.61,190.59,140.83,626.39];y=[74.6,71.2,72.1,66.3,65.3,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2];p=polyfit(x,y,1);x1=linspace(0,500,110);y1=polyval(p,x1);figure(1)plot(x,y,'.',x1,y1)函数为:y=0.35x糖类因子:x=[672.31,662.94,787.58,630.82,618.06,714.34,725.18,622.31,591.98,509.85,657.65,770.91,613.46,640.71,602.91,598.92,722.44,718.37,641.03,629.63,681.80,685.25,629.01,649.67,501.01566.46,616.78];y=[68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72,71.5];p=polyfit(x,y,1);x1=linspace(0,1000,200);y1=polyval(p,x1);figure(1)plot(x,y,'.',x1,y1)函数:y=0.085x芳香类因子:红葡萄:x=[3.05,2.61,2.03,2.32,3.12,3.57,2.12,2.12,2.10,2.10,3.00,4.81,3.32,2.42,3.84,3.19,2.97,2.69,3.60,2.93];y=[77.9,75.8,75.6,76.9,81.5,75.5,74.2,72.3,80.4,79.8,71.4,72.4,73.9,77.1,78.4,80.3,76.7,76.4,79.2,76.1];p=polyfit(x,y,1);x1=linspace(0,5,10);y1=polyval(p,x1);figure(1)plot(x,y,'.',x1,y1)函数为:5.7.2酿酒白葡萄样品各类理化指标因子的拟合函数语言糖类因子:x=[582.67,663.84,653.74,654.18,706.77,634.66,607.01,555.70684.76,704.53,553.42,703.00,537.30,657.61,589.70,606.23,596.67593.70,635.42,705.48,671.96,634.46,712.27,715.44,737.53,741.91703.10,717.00];y=[77.9,75.8,75.6,76.9,81.5,75.5,74.2,72.3,80.4,79.8,71.4,72.4,73.9,77.1,78.4,67.3,80.3,76.7,76.4,76.6,79.2,79.4,77.4,76.1,79.5,74.3,77,79.6];p=polyfit(x,y,1);x1=linspace(0,1000,20);y1=polyval(p,x1);figure(1)plot(x,y,'.',x1,y1)函数为:y=0.15x酚类因子:x=[5,11.239,10.326,15.404,11.263,14.498,29.490,26.616,15.253,13.785,19.173,17.429,24.440,21.157,11.405,28.685,15.684,17.159,26.778,9.947,16.896,7.780,24.512,23.434,30.398,21.667,18.458,83.238,20.768];y=[77.9,75.8,75.6,76.9,81.5,75.5,74.2,72.3,80.4,79.8,71.4,72.4,73.9,77.1,78.4,67.3,80.3,76.7,76.4,76.6,79.2,79.4,77.4,76.1,79.5,74.3,77,79.6];p=polyfit(x,y,1);x1=linspace(0,30,32);y1=polyval(p,x1);figure(1)plot(x,y,'.',x1,y1)函数为:y=3.2x芳香类因子:x=[2.52,1.70,2.62,3.75,5.42,1.44,2.56,2.04,2.83,3.81,4.17,4.69,4.15,2.41,1.98,3.83,3.61,3.14,2.88,4.01,2.97,5.55,4.67,2.71,9.46];y=[77.9,75.8,75.6,76.9,81.5,75.5,74.2,72.3,71.4,72.4,73.9,77.1,78.4,67.3,80.3,76.7,76.4,76.6,79.2,79.4,77.4,76.1,79.5,74.3,79.6];p=polyfit(x,y,1);x1=linspace(0,10,32);y1=polyval(p,x1);figure(1)plot(x,y,'.',x1,y1)函数为:5.7.3酿酒红葡萄和红葡萄酒各类理化指标之间关系的拟合函数语言分别对第二组红葡萄样品与红葡萄酒各理化指标数据进行拟合得出如下拟合函数:花色苷:x=[157.94,79.69,120.61,46.19,60.77,44.20,7.79,32.34,65.32,140.26,52.79,60.66,59.42,40.23,115.70,23.52,89.28,74.03,172.63,144.88,49.64,58.47,34.19];y=[398.77,183.52,280.19,117.03,90.82,138.71,11.84,84.08,200.08,251.57,122.59,171.50,234.42,71.90,198.61,74.38,313.78,251.02,413.94,270.11,158.57,151.48,138.45];p=polyfit(x,y,2);x1=linspace(0,200,100);y1=polyval(p,x1);figure(1)plot(x,y,'.',x1,y1)函数为:y=2.5x单宁:x=[22.02,23.36,20.37,8.64,14.49,15.17,5.62,22.49,24.36,16.69,4.54,7.17,9.82,13.94,25.42,10.09,15.73,5.39,13.70,8.11,13.61,12.16,24.26,14.42,9.32,3.78,10.31];y=[467.98,255.10,192.36,90.61,138.43,59.46,52.40,394.19,217.66,66.53,8.06,41.20,91.74,135.26,66.93,80.75,103.19,39.17,109.34,35.34,138.89,112.40,203.61,143.14,72.51,71.24,60.98];p=polyfit(x,y,2);x1=linspace(0,30,50);y1=polyval(p,x1);figure(1)plot(x,y,'.',x1,y1)函数为:总酚:x=[21.68,10.70,17.62,10.67,9.21,30.11,9.48,6.07,12.06,14.39,14.66,11.90,11.21,15.34,7.38,17.43,12.68,16.19,16.44,29.70,8.75,11.50,7.35,8.90];y=[78.14,36.65,56.84,28.44,22.41,90.71,30.90,6.22,20.14,38.65,54.62,34.75,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论